数据挖掘论文
数据挖掘在电子商务中的应用
10093116 沈健明
(南昌航空大学 经济管理学院,江西 南昌 330063)
摘要:随着数据挖掘技术的发展和电子商务的普及,将数据挖掘技术应用到电子商务中可以解决电子商务中数据量庞大的问题,从而获得真正有价值的信息。通过分析电子商务应用数据挖掘的必要性和可行性, 概述数据挖掘的一些挖掘技术, 重点介绍了数据挖掘在电子商务中的实际应用, 包括营销、电子商务系统规划和系统安全、客户关系管理以及网络广告方面的应用。
关键词:数据挖掘技术;电子商务;客户关系管理
Data Mining in E-commerce
Shen Jianming
(School of economy and management NanChang HangKong University,
nanchang,JiangXi 330063)
Abstract: With the development of data mining technique and wide use of E-comm- erce, the application of data mining technique in E-commerce can solve the problem of large number of data in it, and dealer can also get the truly worthy information. By analy zing the necessity and feasibility of data mining in business applications, this art icle represents some mining technolo gies in data mining, focusing on data mining in the pract ical applicat ion of e-commer ce, including the applicat ion in marketing, e-c ommer cesystem planning and system security , customer relat io nship manag ement and advert isment network.
Key words: date mining; E-commerce;application; customer relat ionship management
引言
电子商务是网络时代的一种全新的商务模式,其由于Internet 的迅速普及和发展而引起了越来越多的学者关注,研究人员希望充分发挥电子商务优势,从而获取更大的经济效益。在电子商务中采用数据挖掘的方法和思想,帮助电子商务网站把真正有价值的知识从海量的信息提取出来,从而更好地为电子商务网站的客户提供更方便的服务以及指导企业决策已经成为了当前研究的热点。数据挖掘是一种全新的信息技术,其是伴随着数据库技术的发展而出现的,其融合了统计学、人工智能以及数据库等众多学科内容,借助从大量的数据中挖掘出未知、有用和有效的信息,从而更好地为电子商务网站服务。随着计算机技术、因特网技
术、通讯技术的发展推动着电子商务的迅速发展, 电子商务过程产生大量的电子数据, 通过运用数据挖掘技术可以发现和提取这些信息中隐含的未知的有价值的信息, 形成知识。如何对这些数据进行分析和挖掘, 以充分了解客户的喜好、购买模式, 甚至是客户一时的冲动, 进而设计出满足于不同客户群体需要的个性化网站, 增加自己的竞争力, 似乎已变得势在必行。若想在竞争中生存和获胜, 你就得比你的竞争对手更了解客户。数据挖掘是从大量的数据中自动地抽取潜在的、有价值的知识、模型或规则的过程。在网络时代, 数据挖掘技术当然也自然而然地被应用到对电子商务网站的海量数据进行分析和处理中来。在对电子商务网站进行数据挖掘时, 所需要的数据主要来自两个方面: 一是客户的背景信息。这部分信息主要来自客户的登记表; 二是浏览者的点击流。这部分数据主要用于考察客户的行为表现。但是, 有时客户对自己的背景信息十分珍重, 不肯把这部分信息填写在登记表上, 这就会给数据分析和挖掘带来不便。在这种情况之下, 就不得不从浏览者的表现数据中来推测客户的背景信息, 进而再加以利用。
一、 数据挖掘在电子商务中应用的必要性和可行性
电子商务就是采用数字化电子方式进行商务数据交换和开展商务业务活动。电子商务由于应用了计算机网络技术, 特别是因特网之后, 以其本身的优势对传统的商务活动产生巨大的冲击。具体的优势主要有: ( 1) 服务不受时间的限制, 一般可以实现的商务活动。( 2) 能实现全球的资源共享, 特别B2B 的电子商务模式的发展, 使得在全球采购原材料和全球销售变得 更加简单和方便。( 3) 大大降低了成本。首先可以免去高昂的房租, 可减去旅行费用,减少广告宣传费用, 也能减少时间成本。( 4) 方便进行客户关系管理和维护。( 5) 电子商务中能够减少库存, 方便供应链管理。电子商务一般都是由一些系统组成, 在电子商务过程中产生了大量的数据, 有了这些数据就有了进行数据挖掘的基础。电子商务活动中产生数据有其自身的特点, 把数据挖掘技术和电子商务相结合, 选用适合电子商务数据的挖掘方法, 可以提高数据挖掘的效率, 让数据挖掘更好地为电子商务服务。在电子商务中进行数据挖掘具有以下条件:( 1) 收集信息更加便利, 例如通过网上电子购物系统可以记录客户的行为, 包括哪些客户将哪些商品放进购物车, 哪些商品被最终购买。( 2) 收集信息的准确性、完整性提高。电子商务中有各种系统进行数据的收集, 一般地, 用计算机自动记录的数据比手工收集的数据出现的噪音和错误要少得多。( 3) 在电子商务系统上构建数据挖掘较为简单。因为电子商务已经实现自动化, 网络数据挖掘系统也容易和电子商务系统相结合。
二、数据挖掘技术在电子方法及在电子商务中的应用
(1)数据挖掘的概念
数据挖掘( Data Mining ) ,又称数据库中的知识发现( Know ledge Discovery in Database ,KDD) ,是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。比较典型的数据挖掘方法有关联分析、序列模
式分析、分类分析、聚类分析等。它们可以应用到以客户为中心的企业决策分析和管理的各个不同领域和阶段。数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间的关系的过程,使用这些模型和关系可以进行预测,它帮助决策者寻找数据间潜在的关联,发现被忽略的因素,是解决当今时代所面临的数据爆炸而信息匮乏的问题的一种有效方法。它是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其它模型化处理,从中提取辅助商业决策的关键性数据,是一种深层次的数据分析方法。
(2)数据挖掘分析方法及应用
1. 关联分析
关联分析, 即利用关联规则进行数据挖掘,关联分析的目的是挖掘隐藏在数据中的相互关系。它能发现数据库中的顾客在一次购买活动中购买商品A 的同时购买商品B 之类的知识。关联规则在电子商务中主要有以下两个方面的应用:第一,发现群体用户访问页面之间的关联规则,即挖掘访问页面之间的关联关系,从而对电子商务嘲站的设计进行优化。主要通
过对Web 日志进行预处理,挖掘Web 日志文件中的有效信息,从而利用关联分析整理原始日志文件得到的事务数据库,最后挖掘出访问频繁的项集。第二,研究发现客户有可能一起购买的商品组合集合,把这些商品组和集合的页面链接放在一起向客户推荐。集中可能同时购买的商品链接,这是典型的购物篮分析事件,把可能同时购买的商品链接放在一起有利于销售量的提高。
2. 序列模式分析
序列模式分析和关联分析相似, 但侧重点在于分析数据间的前后序列关系。它能发现数据库中形如在某一段时间内, 顾客购买商品A , 接着购买商品B , 而后购买商品C , 即序A-B-C 出现的频度较高之类的知识。序列模式分析描述的问题是在给定交易序列数据库中, 每个序列是按照交易时间排列的一组交易集。序列模式分析数据挖掘在电子商务中的应用。电子商务的组织者可以方便地利用发现序列模式对客户行为进行预测,从而能够更有效第为客户提供更具个性化的服务。我们可以通过序列模式分析挖掘Web 日志,从而有效发现客户的访问序列模式。例如:当访问者链接到电子商务网站时,通过发现访问者的访问序列模式后,网站管理员可以将访问者未访问但极有可能访问的页面推荐到相对显眼的位置便于访问者对页面进行访问。此外,序列模式分析还可以向客户推荐其购买某件商品后有可能购买的
另外一些商品。
3. 分类分析
设有一个数据库和一组具有不同特征的类别( 标记) 。该数据库中的每一个记录都赋予一个类别的标记, 这样的数据库称为示例数据库或训练集。分类分析就是通过分析示例数据库中的数据, 为每个类别做出准确的描述或建立分析模型或挖掘出分类规则, 然后用这个分类规则对其它数据库中的记录进行分类。电子商务中分类分析的作用,我们可以通过分类分析得到电子商务刚站的客户分类模式,对不同类客户的爱好、特点有详细的了解,根据不同类客户的爱好以及特点开展针对性更强的商务活动,为他们提供更具个性化的服务;此外,可以通过分类分析对新客户进行分析,将新客户归纳到相应类别,提供针对性更强的服
务信息。
4. 聚类分析
聚类分析输入的是一组未分类记录, 并且这些记录应分成几类事先也不知道。通过分析数据库中的记录数据, 根据一定的分类规则, 合理地划分记录集合, 确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。采用不同的聚类方法, 对于相同的记录集合可能有不同的划分结果。电子商务中聚类分析的作用,管理员可以通过聚类分析将浏览行为相似的客户聚合分析,从而能够更加深入地了解客户需要,为客户提供更加优质的服务。采用聚类分析我们能够发现客户访问频率最高的页面,假如客户经常性第访问关于手机的页面,那么我们可以通过Web 自动将关于手机新产品信息的邮件发送给特定的客户聚类。
三、 数据挖掘在电子商务中的具体应用
在电子商务中应用数据挖掘技术可以直接跟踪数据, 分析顾客的购买行为并辅助商家快速做出商业决策。
(1) 在电子商务营销方面的应用
它是以市场营销学的市场细分原理为基础,其基本假定是消费者过去的行为是其今后消费倾向的最好说明。通过收集、加工和处理涉及消费者消费行为的大量信息, 确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求, 进而推断出相应消费群体或个体下一步的消费行为。
1. 产品生命周期策略分析。
通过对购买时间上的挖掘也就是通过对商品的访问和销售情况进行分析, 从而获得客户的访问规律, 确定顾客消费的生命周期, 在特定的时间开展促销活动, 制定商品的优惠策略。
2. 市场细分。
通过客户聚类分析可以找出顾客需求的相同之处, 使得属于同一类别的客户之间的需求距离尽可能小, 而不同类别的客户群体之间的距离尽可能大。通过对聚类的客户特征的提取, 把客户群分成更细的市场, 提供针对性的服务。
3. 制定合理的产品策略和定价策略。
可以利用关联分析, 如分析网上顾客的购买行为, 分析客户购买产品的相关度, 对某些品牌的喜好和忠诚, 价格接受范围, 及包装要求方面来帮助管理者规划市场, 确定商品的种类、价格和新产品的投入等等。
4. 制定产品营销策略, 优化促销活动。
通过对商品访问情况和销售情况进行挖掘, 企业能够获取客户的访问规律, 确定顾客消费的生命周期, 根据市场的变化, 针对不同的产品制定相应的营销策略。
(2)在电子商务网站系统和安全方面的应用
1. 通过文本挖掘, 对客户邮件内容进行挖掘
首先将电子邮件中非结构化的数据转化成结构化的数据, 再选取最能区分出垃圾邮件的一些特征, 对垃圾邮件进行过滤, 再利用词典的正向匹配, 逐词遍历的方法进行, 经过特征提取和模式匹配工作后, 就可以进行智能决策, 对挖掘进行归纳和评价, 并依可视化的形式将挖掘结果以直接明了地呈给决策领导。
2. 对网站系统中搜索引擎的应用
电子商务网站中一般都有搜索引擎来帮助客户进行查询商品和信息, 通过数据挖掘在搜索引擎方面的应用可以提高查全率和查准率。通过数据挖掘和机器学习技术对索引数据库的信息进行整理, 实现文档的自动分类, 还可以用文本总结技术对web 页面中提取重要的信息, 形成文档摘要, 使用户可以全面了解文档。检索结果聚类, 把检索结果进行聚类, 由客户选择自己感兴趣的一组, 将大大减少浏览的页面数量。
3. 改善系统性能, 提高网站的安全性
( 1) 提高反应速度。在Web 服务器上每天记录了大量有关客户访问页面的文件。数据挖掘可以通过客户的拥塞记录发现站点的性能瓶颈,从而提示管理者改善有关的策略, 提高网站的稳定性, 优化客户的购物环境, 保证电子商务购物快速进行。
( 2) 挖掘网页之间的关联性。如果客户在一次访问行为中, 访问了页面page1 时, 一般也会访问页面page2。进行Web 上的数据挖掘, 构建关联模型, 我们可以更好地组织站点, 建立网站之间的关联性。
4. 提高站点点击率
通过挖掘客户的行为记录和反馈情况为站点设计者提供改进的依据,进一步优化网站组织结构以提高网站的点击率。比如利用关联规则的发现, 可以针对不同客户动态调整站点结构, 使客户访问的有关联的文件间的链接更直接, 让客户容易地访问到想要的页面,就能给客户留下好的印象, 增加下次访问的机率。
5. 增强安全。
同时对网站上各种数据的统计分析有助于改进系统性能, 增强系统安全性。通过对经常攻击系统数据的IP 地址等进行分析来对某些IP 地址的用户进行限制。通过对攻击系统的数据类型进行分析来设置防火墙, 提高安
全性。
(3) 在客户关系管理方面的应用
1. 分析客户的购买行为:在客户与企业进行交易的时候,主要是由客户来引起的,即客户在购买的某种商品以后他会相应的购买一些其他的产品。比如客户在购买篮球以后通常会购买篮球鞋。因此,根据根据客户关联购买行为,企业可以在客户购买某产品的同时,或在该产品被购买的一段时间t1(对某种产品客户的再购买时间)
产品。这就需要利用数据挖掘技术中的关联分析来寻找产品之间的有效关联规则。
2. 获取新客户: 用数据挖掘技术可以揭示客户的行为习惯, 发现一些不同情况下有相似行为的新客户, 帮助商家识别这些潜在的客户群, 并提高市场活动的响应率。同时还可以帮助营销人员完成对潜在客户的发现和筛选工作, 把潜在客户的名单和这些客户感兴趣的营销、促销措施系统结合起来, 为每个客户提供个性化的服务, 以不断地获取新客户。通过挖掘寻找潜在的客户群体。客户对于企业来说,其重要性超过了其他因素。因此大多数企业都希望在稳定住老客户的同时不断增加新的客户量。利用数据挖掘技术对客户信息进行挖掘可以帮助销售商找到潜在的客户群体。通过对这样的客户实施一定的策略,使他们成为注册客户,对一个电子平台来说就是定单和效益的增加。寻找潜在客户的方法很多,比如我们可以通过测量客户的适宜度来寻找潜在的客户。方法是通过对比某客户和已经存在的客户的相同特点的吻合程度来判断这个新客户的适宜度。并根据适宜度是不是超过预先设置的值来确定这个新客户是不是一个潜在的客户。
3. 挽留老客户: 通过数据挖掘对流失的客户群进行针对性的研究, 分析其特征, 再根据分析结果到现有客户资料中找到可能转移的客户, 然后根据分析模型和结果设计预防客户流逝的方案,比如对将要流失的客户给予一定的优惠条件等等。提供优质个性化服务,提高客户忠诚度,在电子商务中,传统客户与销售商之间的空间距离对客户来说己经不复存在,客户从一个电子商务网站转换到竞争对手那边,只需点击几下鼠标即可。网站的内容和层次、用词、标题、奖励方案、服务等任何一个地方都有可能成为吸引客户、同时也可能成为失去客户的因素。通过对客户访问信息的挖掘,就能知道客户的浏览行为,从而识别用户的忠实度、喜好、满足度,了解客户的爱好及需求,动态地调整Web 页面以满足客户的需要。在Internet 上的电子商务中一个典型的序列,恰好就代表了一个购物者以页面形式在站点上导航的行为,所以可运用数据挖掘中的序列模式发现技术进行挖掘。
4. 提高客户的购买能力: 通过分析现有客户的购买行为和消费习惯数据, 用数据挖掘的算法对不同的销售方式的个体行为进行建模; 其次用建立预测模型对客户将来的消费行为进行预测分析, 最后用建立的分析模型对新的客户数据进行分析, 以决定向客户提供哪一种产品。在这其中可以通过关联分析, 找出相关产品的相关性来决定推销哪一种产品。提高站点点击率,完善电子商务网站设计 通过挖掘客户的行为记录和反馈情况为站点设计者提供改进的依据,进一步优化网站组织结构以提高网站的点击率。
5. 防范客户的欺诈行为: 利用数据挖掘技术对一些有欺诈行为的客户群样本进行训练, 可采用神经网络算法进行建模, 然后对现有客户进行分析, 探查出具有欺诈倾向的客户, 也可以采用数据挖掘孤立点分析技术, 在对客户群进行分析时找到那些与其他的客户不同的客户群来进行防范。因为欺诈的行为很少, 为了防止出错, 还可以对前面判断出来的欺诈行为进行再次判断, 进一步提高判断的准确性。
(4)在网络广告方面的应用
由于在网络广告的停留观看的用户可能成为潜在客户, 因此商家愿意花费资金来做网络广告。一般商家愿意付很少的钱在曝光率上, 但是愿意花大价钱在点击率上, 因此提高点击率成为网络广告的重点。用户在访问网站时大量的信息被遗留, 这些信息被保存在一个数据库中, 通过对这些数据的挖掘可以为
广告提出行之有效的方案, 实现商家渴望的个性化市场营销。在这些信息基础之上用数据挖掘的概率知识库和模糊知识库的方法, 对实时获取的在线信息进行概率分析, 通过对广告访问者潜在的信息特征进行模糊划分, 决定哪些是本厂产品的真正顾客。分析出顾客对某种广告的反应程度, 决定下次广告的安排。通过聚类分析对某些客户群提高定向广告等等。通过对电子商务过程中的各种数据和信息的挖掘能够为商务活动的具体实施提供决策基础,使得电子商务能够真正的更快更好更高效的发展。
结束语
数据挖掘是一个新兴的领域, 具有广阔应用前景,电子商务是现代信息技术发展的必然结果,也是未来商业运作模式的必然选择。电子商务领域具有丰富的信息资源,为数据挖掘的应用开辟了广阔的应用舞台。数据挖掘将为电子商务提供有力的技术支持,极大地促进电子商务的发展与普及,推动电子商务的应用进程。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。 电子商务的数据挖掘将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的最活跃的分支之一。它帮助决策者寻找数据问题潜在的关联,发现被忽略的因素,因而被认为是解决当今时代所面临的数据爆炸而信息贫乏问题的一种有效方法。它能自动预侧客户的消费趋势、市场走向,指导商家提高销售额,改善企业客户关系,提高网站运行效率,改进系统性能,具有良好的发展和应用前景。这将不断的推动数据挖掘技术的深入发展和广泛应用,创造出更多的社会和经济价值。
参考文献
[1] 邓鲲鹏. 数据挖掘与电子商务[ J] . 商场现代化,2007( 25) : 94.
[2] 赵东东. 电子商务中的Web 数据挖掘系统的设计[J].微计算机信息2007(2).
[3] 何波,王越. 基于数据挖掘的Web 个性化信息推荐系统[J]. 计算机工程与设计,2006(2).
[4] 姚淼. 数据挖掘在电子商务中的应用[J].高校图书情报论坛,2009.8(1).
[5] 杨青杰. 胡明霞. 数据挖掘技术在电子商务中的应用研究[J].商场现代化,2008(16).
[6] 丁胜锋, 陈东莉. Web 数据挖掘及其在电子商务中的应用研究[ J]. 商场现代,2008( 10).
[7] 张海笑.数据挖掘中分类方法的研究[J].山西电子技术.2005(2) :
[8] 王向辉等.数据挖掘技术及其在决策支持系统中的应用[J].计算技术与: 自动化,2004(4).
[9] 赵东东.电子商务中的Web 数据挖掘系统的设计[J].微计算机信息,2007(23):168—169.
[10] 周丽利,李耀辉,董颢霞,等.基于Web 的数据挖掘在电子商务中的应用
[J].微计算机信息,2006(22).
目录
摘要: .............................................................................................................................................. 1
Abstract: . ........................................................................................................................................... 1
引言 .................................................................................................................................................. 1
一、 数据挖掘在电子商务中应用的必要性和可行性 ................................................................. 2
二、数据挖掘技术在电子方法及在电子商务中的应用 . .............................................................. 2
(1)数据挖掘的概念 . ............................................................................................................ 2
(2)数据挖掘分析方法及应用 . ................................................................................................ 3
1. 关联分析 . ...................................................................................................................... 3
2. 序列模式分析 . .............................................................................................................. 3
3. 分类分析 . ...................................................................................................................... 3
4. 聚类分析 . .................................................................................................................... 4
三、 数据挖掘在电子商务中的具体应用 . .................................................................................... 4
(1) 在电子商务营销方面的应用 . ...................................................................................... 4
1. 产品生命周期策略分析。 . .......................................................................................... 4
2. 市场细分。 . .................................................................................................................. 4
3. 制定合理的产品策略和定价策略。 . ........................................................................ 4
4. 制定产品营销策略, 优化促销活动。 . .................................................................. 4
(2)在电子商务网站系统和安全方面的应用 ..................................................................... 5
1. 通过文本挖掘, 对客户邮件内容进行挖掘 ............................................................. 5
2. 对网站系统中搜索引擎的应用 . .................................................................................. 5
3. 改善系统性能, 提高网站的安全性 . ...................................................................... 5
4. 提高站点点击率 . .......................................................................................................... 5
(3) 在客户关系管理方面的应用 . ...................................................................................... 5
(4)在网络广告方面的应用 . ................................................................................................ 6
结束语 .............................................................................................................................................. 7
参考文献........................................................................................................................................... 7