发布时间:2023-01-22 01:14:41
序言:写作是分享个人见解和探索未知领域的桥梁,我们为您精选了8篇的数据挖掘论文样本,期待这些样本能够为您提供丰富的参考和启发,请尽情阅读。
目前现有的针对烟草营销策略的研究,多采用数据挖掘的思想,基于数据挖掘的营销策略是对终端客户进行分类,根据用户的销量和诚信记录把用户分为多个等级,但这种分级策略只能反应用户的销量信息,把这个分类作为营销策略依据太单薄,只能起一定的辅助作用。更深入地研究是根据客户的资料和历史订单数据对现有商户进行聚类,获取到自主的商户分类,但盲目的聚类会导致商户的分类没有实际意义,或获取的结果是无助于营销目的的。
2技术关键
本系统采用基于营销目的的商户聚类,技术关键包括三部分内容:数据预处理中的特征选择、基于限制目标的商户精确聚类和基于聚类结果的多层关联规则算法的研究。
2.1特征选择
假定获取的数据的维数为n,通常情况下n是很大的一个数,为简化模型,也为了防止模型陷入过拟合(维数灾难),需要进行降维处理,即仅把对项目改造判定起关键作用的因素挑选出来。本系统采用PCA算法来进行降维处理,过程如下:
1)计算标准化后的矩阵Z的样本的协方差矩阵Cov;
2)计算协方差矩阵Cov的本征向量e1,e2,…,en的本征值。本征值按大到小排序;
3)投影数据
到本征矢张成的空间之中,利用贡献分析取前m个向量Y1,Y2,…,Ym。
2.2基于营销目标限制的商户精确聚类算法
现有聚类算法一般没有约束条件,只根据相似度来进行聚类,为了能够体现约束条件,需要在聚类相似度或者样本距离之间把限制条件增加进去,这样在样本聚类的时候即可使得具有相同营销特性的样本或者客户被划分到同一个类中。烟草终端商户的大部分属性是分类属性,例如:地区、类别等,此外还有数字型属性、日期型属性,由于存在不同类型的属性,常规的聚类算法无法使用,为此,采用把数字属性和日期属性划分区间的思路,这样可以转化成分类属性的方式来进行聚类。进而可建立如下商户模型:分类对象X∈Ω,X=[A1=x1]∧[A2=x2]∧…∧[Am=xm],其中xj∈DOM(Aj),1≤j≤m,为简便起见,将对象X∈Ω用向量(x1,x2,…,xm)表达,如果属性Aj的值不存在,则Aj=ε。令Χ={X1,X2,…,Xn}为n个分类对象的集合,用集合方式表达分类对象,则Xi={xi,1,xi,2,…,xi,m},如果属性Aj的值不存在,则集合中不出现xi,j,容易得到|Xi|≤m。如果存在Xi,j=Xk,j,1≤j≤m,则Xi=Xk。为方便聚类,利用聚类汇总来压缩原始数据,从而达到提高算法效率的目的。一个类C可以由如下三元组(n,I,S)来表示。其中n为类C中的对象数量,I={i1,i2,…,iu}是C内所有属性值的集合,S={s1,s2,…,su},其中sj为ij在类C中的数量,ij∈I,1≤j≤u。集合S按升序排列,即s1≤s2≤…≤su,这同时也暗示集合I的元素按其在C中的数量按升序排列。三元组(n,I,S)被称作类C的聚类汇总CS,CS的三个成员分别记作CS.n、CS.I和CS.S;对于CS.I的任一元素ij∈CS.I,则记作CS.I.ij,对于sj∈CS.S,则记作CS.S.sj,其中1≤j≤u。
2.3基于烟草营销的多层关联规则的研究
针对本项目,对关联规则定义进行扩展,对形如:XY的关联规则,不再限定X和Y为一个项目集,而把X和Y定义为条件的合取范式,每个条件Ai=True/False为布尔表达式。此时的Ai为一个项目集,它的含义与原来的X和Y的含义相同,如果把结果中的条件布尔表达式写成Cj=True/False,则关联规则有如下形式:(A1=True/False)∧(A2=True/False)∧…∧(An=True/False)(C1=True/False)∧(C2=True/False)∧…∧(Cm=True/False)关联规则的开采问题可以分解成以下两个子问题:
①从数据集合或交易集合D中发现所有的频繁项目集。
②从频繁项目集中生成所有置信度不小于用户定义的最小置信度minconf的关联规则。即对任一个频繁项目集F和F的所有非空真子集S,SF,如果sup(F)/sup(F-S)≥minconf,则(F-S)S就是一条有效的关联规则。按上述方法发现所有类似的规则。这两个步骤中第2步要相对容易,因此项目的研究将更关注第1步,由于最大频繁项目集已经隐含了所有频繁项目集,所以可以把发现频繁项目集的问题转化为发现最大频繁项目集的问题。针对烟草营销的客户,进行关联规则挖掘时,是在上一步的基础上,即针对每一个商户群进行规则挖掘。在获取到最大频繁项目集后,顺序生成频繁项目集,然后获取到可用的关联规则。此时获取的关联规则是底层关联规则,然后再采用概念树的方法对获取的底层关联规则进行汇总。概念树由烟草领域专家根据属性的领域知识提供,按特定属性的概念层次从一般到具体排序。树的根结点是用any表示最一般的概念,叶结点是最具体的概念即属性的具体值。
对于一个多种网络形式并存的复杂网络,假设复杂网络作为一个网络社区,在复杂网络中存在的网络类型数即社区数。我们用一个无向遍历图GV,E来表示整个网络社区,如果网络中有两个节点有两条不重合的网络路径,则说明这两个节点处于一个网络环路当中,网络中的数据流需要经过网络环路到达特定的节点。当在某个时间段里需要传送的数据流个数大于网络节点数时,则说明该网络的数据流密度较大,为了能够准确地在复杂网络中挖掘出所需的数据流,则需要根据数据流密度来划分整个网络社区,寻找数据流处于哪个社区,再确定数据流所在社区的环路。在这里我们通过设计算法确定网络数据流密度,来对复杂网络进行社区划分,再对社区进行无向环路遍历,并通过遍历得到该社区网络的所环路,确定所需查询的数据流位于哪个环路。以下为复杂网络中需要用到的符号说明。
2增量子空间数据挖掘算法
为了能够有效地在复杂网络中挖掘出目的数据流,使用了复杂网络数据流密度的分析方法在对复杂网络进行社区划分后,通过对社区网络进行无向环路遍历并得到社区网络的所有环路。接下来挖掘算法先后挖掘出目的数据流所属的社区以及环路,最终确定目的数据流的具置。
2.1基于社区网络遍历的数据流挖掘
当数据流i与社区k的相关度最大时,说明数据流i位于社区k的可能性就最大。但是当多个数据流的大小区别不大时,以数据流的大小作为指标来定义相关度会导致挖掘精度较低。这里我们也引入数据流的特征集和数据流中的分组队列长度来计算相关度。
2.2基于多增量空间的数据流挖掘
在采用基于社区网络遍历的数据流挖掘方法得到数据流的所属社区后,我们接着采用基于多增量空间的数据流挖掘方法来挖掘出数据流的所属环路。先将社区网络的环路进行多增量空间扩展,即先得到
目标数据流所经过的环路,再得到数据流所经过的节点与时间的相关系数,这样就可以在时空上确定目的数据流位于环路的哪个节点中。
3实验结果
为了验证本文提出的基于复杂网络数据流密度的增量子空间数据挖掘算法的效果,我们通过matlab7.0软件进行算法仿真,其中仿真的复杂网络由多种网络形式组成,网络节点有200个,数据流大小为500bytes,节点的接收能耗为10nJ/bit,发射能耗为50nJ/bit,进行信号处理和功率放大的能耗为10nJ/bit。其他节点干扰而产生的能量消耗为5nJ/bit。在对本文算法进行分析的过程中,我们采用了对比分析的方法,Lopez-Yanez等人提出一种基于时间序列数据挖掘的新的关联模型,该模型是基于伽玛分类,是一种监督模式识别模型,目的是为了挖掘已知模式中的时间序列,以预测未知的值。由Negrevergne等人提出的一种PARAMINER算法:一个通用的模式挖掘算法的多核架构。多核架构采用的是一种新的数据集缩减技术(称之为EL-还原),在算法中通过结合新的技术用于处理多核心架构的并行执行数据集。为了验证本文算法的挖掘有效性,我们分别在增多节点数量和社区网络数的情况下获取算法的数据挖掘精度。实验采用的精度为NMI[16],实验结果如图3和图4所示。在不同节点数量下基于复杂网络数据流密度的增量子空间数据挖掘算法的挖掘精度更高,挖掘精度高于85%,而文献[14]的挖掘精度在77%以上,挖掘精度在76%以上。因为、提出的关联模型、提出的多核架构没有准确把握数据流在不同时间段里与环路位置的相关情况。而本文算法采用社区网络遍历和多增量空间的方法可以有效地确定这种相关性。图4为不同社区数下的算法挖掘精度,从图中可以看出,当社区网络的种类增多时,会对算法的挖掘精度造成影响,本文算法的挖掘精度在社区数为10时是95.7%,当社区数增加到50时为87.5%。而基于时间序列数据挖掘方法的挖掘精度在社区数为10时是88.6%,在社区数为50时是77.4%,而PARAMINER算法在社区数为10时是86.7%,社区数为50时是78.2%。因此从数据分析来看,本文算法的数据挖掘精度在社区数增多时仍能保持在较高水平。
4结论
在上述系统设计的基础之上,我们提出了网店客户购买数据挖掘系统的模型,该模型由三个层次组成,其逻辑架构如图一所示。
2、系统设计与实现
2.1系统开发与运行环境硬件环境:CPUIntelI3380M/RAM2G/硬盘320G软件配置:操作系统:Windows7SP1开发工具:2005/VisualC#数据库管理系统:MSSQLServer2008辅助软件:SPSSClementine11.1;SQLServer2008AnalysisServices(SSAS)
2.2主要技术与系统实现通过对上述对客户购买数据挖掘系统模型的分析可知,该系统主要由用户接口模块、数据清洗模块、数据格式转换模块、数据库生成模块和数据挖掘引擎模块等组成。1)用户接口模块本系统最终目的还是为为客户的决策提供支持,因此友好的界面设计是用户与系统交互的基础。简洁而易于理解的界面有利于提高用户对系统的使用效率。2)数据预处理模块客户访问数据进入数据预处理模块进行清洗,去除无关的信息,剥离出对数据挖掘有价值的数据。数据预处理模块对原始访问数据进行分析,将用户购买数据记录逐条的分割成十个字段,分别为:u_id(访问者编号),u_date(到访日期),u_time(到访时间),u_orderid(订单编号),u_product(客户购买的商品),u_bowser(使用的浏览器类型),page(首次到访页面),place(客户所在地区),payment(支付方式),logistic(物流方式),同时删除访问数据中与以上字段不相干的数据。然后将经过预处理的数据存入中间文件。3)XML转换模块该模块程序使用.NET的相关的方法编写,主要功能将预处理过的客户购买数据转换成标准化XML格式的数据文件进行存储。该程序的主要实现原理是对经过预处理的中间文件中的数据记录逐个分割并存入数组,然后将数组的内容按照XML的格式写入文件,完成转换。4)数据库导入模块利用.NET的相关方法并结合数据库管理工具建立支持数据挖掘的客户购买数据库,编写相关程序将已经转换成XML格式的客户访问数据逐条的导入到数据库并形成日志数据表方便进行后续的数据挖掘。5)数据挖掘引擎模块数据挖掘引擎是实现客户购买数据挖掘系统的实现关键。优秀的数据挖掘算法不仅可以使数据挖掘的结果更加准确,也可以提高数据挖掘的效率。本系统主要用到的算法是该模块利用数据挖掘算法对数据进行挖掘,主要包括算法的优化、日志数据表的删除操作以及挖掘结果集的保存与删除操作等。这里主要用到的算法是K-Means算法。主要是利用该算法发现最相似的客户聚类,通过对聚类的分析来得出网店众多的顾客一般的购买行为模式,从而可以适当地调整网站营销的策略中的来提高网络营销的效果,进而增加销售量。
3、小结
首先要确保数据来源的宽度,及时、准确地从社会获取尽可能多的外部信息,并建立起稳定的常态交互机制,提供源源不断的新鲜“原料”,否则相关的模型建立将会非常困难。这些可以通过与社会其它单位协作,资源共用、数据共享加以实现。其次要重视数据的“挖掘加工能力”。在模型的创建过程中,确定各个变量之间的逻辑关系、对结果的影响权重,实现对客户信用风险的智能研判,保证预判结果的准确性。
2利用数据挖掘技术建立客户信用评价模型的实现方法
数据挖掘技术是通过分析大量数据,从中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析等。(1)数据挖掘方法。根据客户信用价值评价指标模型要求,在进行综合评价前,应先确定指标体系中各个指标的评价值,可采用数据挖掘技术中聚类方法加以分析。聚类分析是将个体或对象分类,使得同一类中对象之间的相似性比与其他类的对象的相似性更强。目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化。通过对聚类算法的分析,针对电力客户信用分类的特征,提出了电力客户信用评价算法.得到了不同客户群的聚类中心以及客户的隶属度矩阵,为客户群的特征分析提供了量化依据,从而得到满意的客户聚类及分类结果。(2)数据挖掘算法。首先可采用K-means聚类算法对电力客户样本进行分类,利用该算法,给定客户分类个数k,按照样本间距离最近的原则,将n个电力客户划分到k个分类中去。k个聚类中心代表了聚类的结果;进而采用层次分析法将一个复杂的评价系统,按其内在的逻辑关系,以及评价指标为代表构成一个有序的层次结构,然后针对每一层的指标,运用专家或管理人员的专业知识、经验、信息和价值观,对同一层次或同一域的指标进行两两比较对比,并按规定的标度值构造比较判别矩阵。从而确定指标权重;最后根据聚类以后得出的各个类的中心点,计算得出的k类电力客户的信用得分,可以判断其所属的信用等级。
3数据挖掘技术在电力客户信用管理中的应用效果和意义
对于风电功率的预估,本文提出了一种短期的用于一至十五分钟内的预测方法。其中输入数据来自风力发电机的历史寄存器,数据种类有电压、电流、有功功率等。并且对两种预测方法进行了比较。预测出的风力数据作为风力涡轮机预测模型的输入值。风力发电机模型是参考了空气力学、传动系统、感应发电机等参数,并通过唯像模型建立的。风力涡轮模型则建立于一种现象学模型,这种模型将风的空气动力学、传动系统和感应发电机的参数都考虑了进来。另一种预测风电功率方法是使用数据挖掘技术来进行预测。风电发电系统中的数据库就应用到了这些技术。为了提高算法的效率,使用了风速估计器,以估计空气分子的布朗运动。并与没有用风速估计器时平均发电功率进行比较。
二、风功率预测模型和现象学模型
(一)人工神经网络
每一个人工神经网络模型都有架构、处理单元和训练方面的特性。在时间序列预测的人工神经网络模型中,其中很重要的一种是集中延时神经网络。它属于动态神经网络的一般类型,在这种神经网络中,动态只出现于静态的、有多个层级的前馈神经网络的输入层中。集中延时神经网络的一个显著特征是它不要求有动态反向传播来计算神经网络的梯度,原因是抽头延迟线只在神经网络输入数据时才出现。由于这个原因,这种神经网络比其他动态网络的训练进行得更快。
(二)随机时序
风功率模型和现象模型是使用最多的预测方法。如果假设预测变量Xt是已知值的线性组合,那么自回归模型则能用于预测未知值。通过查看自相关函数和偏自相关函数,用于找到模型的顺序和结构,从而确定模型适当的结构和式子顺序。根据赤池信息准则,施瓦茨准则或贝叶斯信息标准以及校正后的决定系数,我们就能选出最好的模型。
三、算例分析
(一)提出的预处理方法
在考虑风速的复杂动态的情况下,为了更好地描述ARMA模型,本文提出了一种新的数据预处理方法。这种方法是以模型的形式呈现的,我们将这种模型称之为函数的ARMA。
(二)实例仿真
利用SVM工具箱在matlab7.1平台上完成回归模型建立的工作,利用我国某风电场连续100个数据(每10s取一个数值)的实测风能功率输出值,建立训练和预测样本。尽管神经网络在预测风速时误差已经很小,但由风力涡轮机模型和函数的ARMA模型组成的复合模型在各方面性能更好。导致这一结果的原因是焦点延时神经网络(以下简称FTDNN)预测曲线的高度非线性。
四、结论
事实上,数据挖掘的产生是有其必然性的。随着信息时代的到来,各种数据收集设备不断更新,相应的数据库技术也在不断地成熟,使得人们积累的信息量不断增加,为了提高效率,当务之急就是要从海量的数据中找出最有用的信息,这就催生了数据挖掘技术。
2网络入侵检测的重要性与必要性分析
网络入侵检测,就是对网络入侵行为的发觉。与其他安全技术相比而言,入侵检测技术并不是以建立安全和可靠的网络环境为主,而是以分析和处理对网络用户信息构成威胁的行为,进而进行非法控制来确保网络系统的安全。它的主要目的是对用户和系统进行检测与分析,找出系统中存在的漏洞与问题,一旦发现攻击或威胁就会自动及时地向管理人员报警,同时对各种非法活动或异常活动进行识别、统计与分析。
3数据挖掘在网络入侵检测中的应用分析
在使用数据挖掘技术对网络入侵行为进行检测的过程中,我们可以通过分析有用的数据或信息来提取用户的行为特征和入侵规律,进而建立起一个相对完善的规则库来进行入侵检测。该检测过程主要是数据收集——数据预处理——数据挖掘,以下是在对已有的基于数据挖掘的网络入侵检测的模型结构图进行阐述的基础上进行一些优化。
3.1综合了误用检测和异常检测的模型
为改进前综合误用检测和异常检测的模型。从图2可以看出,它是综合利用了误用检测和异常检测模型而形成的基于数据挖掘的网络入侵检测模型。其优点在于通过结合误用检测器和异常检测器,把所要分析的数据信息减少了很多,大大缩小了数据范围。其劣势在于当异常检测器检测到新的入侵检测后,仅仅更新了异常检测器,而没有去及时地更新误用检测器,这就无形中增加了工作量。对于这一不足之处,笔者提出了以下改进意见。
3.2改进后的误用检测和异常检测模型
笔者进行了一些改进,以形成一种更加有利的基于数据挖掘的入侵检测模型,基础上进行了一定的优化。一是把从网络中获取的网络数据包发送到数据预处理器中,由它进行加工处理,然后使用相应的关联规则找出其中具有代表性的规则,放入关联规则集中,接下来用聚类规则将关联规则所得的支持度和可信度进行聚类优化。此后,我们可根据规定的阈值而将一部分正常的数据删除出去,这就大大减少了所要分析的数据量。此时可以把剩下的那些数据发送到误用检测器中进行检测,如果误用检测器也没有检测到攻击行为,则把该类数据发送到异常检测器中再次进行检测,与上面的例子一样,这个异常检测器实际上也起到了一个过滤的作用,以此来把海量的正常数据过滤出去,相应地数据量就会再一次变少,这就方便了后期的挖掘。这一模型系统的一大特点就是为了避免重复检测,利用对数据仓库的更新来完善异常检测器和误用检测器。也就是说,根据异常检测器的检测结果来对异常检测器和误用检测器进行更新,若测得该行为是正常行为,那么就会更新异常检测器,若测得该行为是攻击行为,那么就更新误用检测器来记录该次的行为,从而方便下次进行重复的检测。
4结束语
剔除旧图书一般指对破旧、过时的或者失去价值的图书进行清理。比如因年代久远变得陈旧或内容滞后而失去参考价值的图书、有新版或修订版的图书、残缺破损不利于阅读的图书、复本过多的图书、在规定时间内未流通的图书、借阅率低的图书,都可以作为剔旧图书而入藏旧书库。在实际工作中,对于残缺破损的或有新版、修订版的图书,剔除工作相对简单,复本过多的图书和借阅率低的图书的剔旧工作相对困难。利用数据挖掘技术可以科学地分析图书的复本数,统计图书在一定周期内的借阅次数,从而得出借阅率。但单从借阅率低、复本数多等方面考虑剔除旧图书是不科学的。有些优秀的图书往往会被反复续借,并长期在某一特定用户手中,其借阅次数不一定很多,但借阅时间很长。这些图书并不一定能在借阅次数上体现其优势,因此,还需要统计图书的平均借阅时间,并依此设定平均借阅阈值,去掉未达到阈值的图书,找到馆藏中借阅时间较长的图书。以镇江高等专科学校图书馆为例,统计中文图书的借阅率,并进行分析。设定借阅时间为2013年1月至2014年6月,借阅率小于0.3。通过数据挖掘得到如图1所示的统计结果。在图1中,我们可以看到,《晨读十分钟》复本数为12,借阅次数为2,借阅率低,可以适当降低复本数。同样,《语文学科知识与教学能力》复本数为6,借阅次数为1,借阅率也比较低,可以降低复本数。
2数据挖掘应用于合理布局馆藏书架
图书排架就是将已经加工整理的图书按照某种标准和次序陈放在书架上的过程。镇江高等专科学校图书馆是根据图书分类号来排架的,其优点是,读者能够比较方便准确地找到所需要的图书,并在查找自己所要的图书的同时关注相似的图书。缺点:1)读者需要准确知道欲借图书的索书号。2)图书馆必须为各类新进图书预留合理的书架空间,否则会导致图书的重新整架甚至倒架,增加图书管理人员的工作量。3)读者进入图书馆借书,很可能就在某类自己感兴趣的图书中查阅,很少同时关注其他类别的图书。因此,需要对图书馆系统中的数据进行挖掘分析,了解各类图书的利用率和更新指数,统计各类图书借阅情况。可以根据图书的利用率合理排架,即将利用率高的图书陈放在容易查找的书架上。可以根据图书的更新指数预留书架空间。可以根据某一时期图书借阅次数排行榜找出最受欢迎的图书,开设《好书介绍》栏目,甚至可以针对特定群体进行好书介绍和推荐。设立专门的书架为图书展读处,最好设立在读者进入图书馆的必经之地,吸引读者注意。图书馆也可以主办各类读书节活动吸引读者。以镇江高等专科学校图书馆为例,图书利用率统计结果详见图2。从图2可以看出,B类(哲学类)、H类(语言、文字类)、I类(文学类)、K类(历史、地理类)、Q类(生物科学类)等图书的利用率高,可以将放置这几类图书的书架放在容易查找、方便上架的地方。
3结束语
数据挖掘技术在企业的信息化建设中所担任的角色是实现数据信息到商业知识的转化。首先需要明确数据挖掘技术的处理对象,明白商业活动的主题;其次,需要对商业的主题进行分析,并搜集与之相关的数据利用各种技术对数据进行整理分析,并载入适合的数据挖据的算法中,建立模型,再从模型中提取出有用的商业信息,再根据分析所得结果调整算法,以数据和信息的可靠性为依据对结果进行判断;再次,将获得的商业知识融合到企业的信息平台,利用人机界面对企业的决策活动予以支持。另外值得注意的是,由于数据挖据技术属于高层次的技术,又关系到企业的业务机密,因此,需要极为专业的技术人才专业管理。
2如何实现数据挖掘在企业的信息化建设中的应用
在企业进行业务的操作过程中往往会产生大量需要处理的数据,这就为数据挖掘的应用提出了要求,数据挖掘的运用使企业的大量的数据得到了梳理,分析信息的能力提高,在企业今后的市场开拓记忆日常的运行中发挥了重要的作用,促进企业的竞争力的提高,那么,数据挖据具体在企业的信息化建设中如何应用呢,下文将予以介绍。
2.1利用数据挖掘技术实现客户信息的有效管理
具体来说就是通过对客户信息进行分析,为客户建立一个合适的购物模式,以满足客户的需求为重,这是处理好企业与客户之间的关系的关键。有相关数据显示,企业在获得一个新的客户过程中所花费的成本比维系一个老客户的成本高出6倍-9倍之多,一个老客户的流失是以10个新客户的获得为代价的,由此可见,对于企业来说老客户的维护工作至关重要。通过数据挖掘技术可以得到老客户的大量的信息,并对其交易记录、统计信息进行分析后,可以有目的性的对流失的客户进行分析,找出客户流失的原因并为新客户的建立提供模型和经验,有效地对意向客户和流失客户进行判断,起到企业与客户的关系的改善的作用。
2.2利用数据挖掘技术进行市场营销的分析与管理
在市场营销中,数据挖掘的作用在于可以促进市场的分工,以“客户过去的消费行为可以说明今后的消费倾向”为假设,然后对客户的信息进行分析,确定某一群体客户的消费兴趣,消费的趋向于需要,进而对消费者的下一次或者下一步的消费行为作出判断,然后再以此为基础,将识别出来的客户作为一个消费群体,以此制定营销计划,这与传统的不以消费者的实际需求为参考而进行大规模营销的手段相比较,在成本的节约方面贡献极大,可以带给企业更多的利润。在市场营销中的应用上,各种数据挖掘算法都得到了广泛的应用,每种不同的操作手段都可以引导商家做出满足消费者需求的决策与判断。
3结束语
免责声明以上文章内容均来源于本站老师原创或网友上传,不代表本站观点,与本站立场无关,仅供学习和参考。本站不是任何杂志的官方网站,直投稿件和出版请联系出版社。