基于大数据的图书馆个性化服务用户行为分析研究
LibrarWorkAndStud y y
基于大数据的图书馆个性化服务用户行为分析研究
檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧
陈 臣
檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧檧
随着个性化服务发展和以客户为中心管理思想的渗透,大数据已成为图书馆个性化服务研究的热点。摘 要 近年来,
文章介绍了大数据的概念,讨论了基于大数据的用户行为分析,给图书馆用户个性化服务带来的机遇和挑战。然后,从用户行为分析的角度出发,构建了基于大数据的图书馆个性化服务用户行为分析体系。该体系可发现大数据时代读者的服务需求,有效保障图书馆的服务质量。
关键词 大数据;图书馆;个性化服务;用户行为分析分类号 G252.0
,Abstractciththedevelomentofersonalizedservicesandenetrationofcustomerentricmanaementideasbidatahasbecomeahottoicof W- pppggp ,ersonalizedservicesresearchforlibrarinrecentears.Thisaerintroducestheconcetofbidataanddiscussestheimactandchalleneofuser pyypppgpg
,,behavioranalsisonersonalizedservicesoflibrarbasedonbidata.Andthenfromtheersectiveoftheuserbehavioranalsisitutsforwardthe ypygppyp
,userbehavioranalsissstemconstructionforlibrarbasedonbidata.Thesstemcanfindtheuserservicereuirementsandrotecttheualitof yyygyqpqy
theuserserviceforlibrarunderthebidataera. yg
;;;UewordsKidataeraLibrarPersonalizedservicesserbehavioranalsis Bgyyy
ClassNumber252.0 G
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲
1 引言
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲
伴随云计算技术、大数据存储技术、无线通信技术和传感器网络技术的快速发展,图书馆数据中心基础设施架构和用户服务模式发生了根本性变革,读者已摆脱了阅读时间、地域、服务对象、阅读内容和终端类型的束缚,实现了以用户为中心的个性化阅读服务。
大数据时代,数据已成为图书馆系统组成和服务能力保障的重要因素,如何利用大数据资源对读者服务需求、阅读行为、社会关系、服务方法和业务模式进行准确识别和感知,是图书馆保证服务决策科学、推动服务模式创新、增强用户需求洞察力和改善读者阅读体验的前提,也是图书馆明确服务竞
、客户关系管理)开展精准争环境特点、改善CRM(
[]1
个性化服务和提高自身服务竞争力的保证。
DOI:10.16384/j.cnki.lwas.2015.02.007
者行为数据主要由阅读服务需求产生、阅读活动相关信息采集、阅读内容与服务模式选择、开展阅读活动和用户阅读反馈5个活动步骤产生。图书馆可依据读者阅读活动的生命周期规律,对读者行为大数据信息进行采集、处理、计算、分析和决策,为用户服务模式选择和过程提供大数据决策支持。
图书馆对读者阅读服务需求数据的采集,主要关系图书馆用户需求调研数据、读者反馈的阅读需求信息、读者对网站内容的查询与搜索历史记录、用户对服务内容的选择与删除等行为数据。阅读活动相关信息的采集包括读者个体特征数据、阅读习惯、阅读终端的类型与工作模式等数据。阅读内容与服务模式选择主要涉及图书馆用户服务模式、用户服务的方法与内容、阅读应用的类型与工作方式、阅读活动的方式选择和变化趋势等数据。开展阅读活动主要由网站的访问日志、阅读内容的搜索与下载、服务器对读者阅读行为的记录、阅读的频率、读者总在线时间、阅读内容的搜索与浏览、阅读内容的分类、阅读社会关系和好友互动、移动阅读终端的位置信息、第三方网站上与阅读相关的行为等数据组成。阅读反馈行为主要由读者阅读体验感受、用户满意度评定、读
[2]
者忠诚度等数据组成。
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲2 读者行为数据的定义和行为分析应关注的问题櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲2.1 大数据时代图书馆读者行为数据的定义
“用户的行为管理学大师菲利普科特勒认为:
轨迹主要包括产生需求、信息收集、方案比选、购
”因此,买决策、购后行为5个阶段。大数据时代读
总第228期 Serial228
基于大数据的图书馆个性化服务用户行为分析研究 陈 臣:
:henChenStudonUserBehaviorAnalsisforPersonalizedServicesofLibrarBasedonBiDataC yyyg
2.2 读者行为分析应关注的重要问题
2.1 大数据噪音干扰影响用户行为分析的有2.效性
为保证用户行为分析过程全面、准确、经济、快速,图书馆必须尽可能地扩大用户行为数据采集的范围和数量。但是,随着用户行为数据采集范围和深度的增长,所采集的读者个人数据中包含着许多无效行为数据,这些数据的存在大幅降低了用户行为数据的价值密度和可用性,也增加了读者行为分析的复杂度和成本。因此,图书馆必须通过数据清洗过程,过滤掉与用户行为分析无关的垃圾数据,以减少大数据噪音对用户行为分析的影响力。其次,针对同一组读者行为大数据资源,图书馆对行为数据分析的方法、角度、模型和工具,也是影响用户行为分析准确性、效率和经济性的重要因素。第三,软硬件系统性能和操作人员素质,是组成图书馆大数据处理与分析平台的三个基本要素。实现大数据处理平台软件系统、硬件设施和操作人员的最优化结合,是用户行
[3]
为分析安全、高效、经济、可控的基本保证。2.2.2 为读者个性化服务提供用户行为数据分析支持
确保读者个性化阅读体验具有较高满意度和服务公平性,是图书馆读者个性化服务应重点关注的两个问题。图书馆应依据对读者个体行为分析的结果,完成读者阅读模式、阅读内容、服务平台和阅读终端的个性化定制,保证在服务过程中依据客户的等级和阅读需求,平等地分配服务资源和保证服务过程的公平性。此外,还应结合读者个体特征和阅读需求,为读者提供个性化的阅读内容推荐和广告服务,努力减少读者所需资源搜索和知识获取的时间。同时,通过对读者个体行为数据的挖掘、分析,准确判定读者阅读行为的诚信度和安全性。及时发现非法用户在阅读过程中存在的欺骗、破坏和攻击行为,保证图书馆基础
[4]
设施资源、服务系统和服务过程的安全性。2.2.3 读者行为分析过程存在的技术挑战
与传统I图书馆在大数据环境T环境相比,
下采集的用户行为数据具有海量、多类型、快速递增和实时处理的特点。因此,用户行为分析对大数据平台的海量数据存储、管理和实时高速处理能力提出了较高要求。其次,读者行为数据主要由传感器网络、系统监控设备、服务系统和读者反馈系统采集与生成,用户行为数据具有非结构化、
模糊定义和杂乱的特征,不能对数据结构和涵义
进行规范化表示。第三,读者行为数据的挖掘、分析和决策活动是一个长期和逐步累积的过程,要求大数据平台可依据用户行为分析过程生命周期规律,保证分析系统在行为数据的存储、资源组织、信息整合和知识发现过程中,具有较强的可扩展性和动态更新能力。第四,读者行为分析过程对用户阅读隐私保护、数据的安全管理与可用性保障、决策与服务系统安全、读者阅读体验QOS
[5]
(服务质量)保证提出了较高要求。2.2.4 以读者个性化服务需求指导用户行为分析全过程
首先,图书馆应通过对服务器日志、监控系统、评论与反馈系统、在线客服务系统数据的监控与采集,包括海量存储与读者阅读活动开展相关的时间与频率、网站访问路径、访问与阅读的内容、服务资源关注度、阅读评论和满意度反馈等数据,并利用所采集的用户行为数据提炼、刻画出读者的行为。其次,图书馆应通过对阅读终端类型、阅读终端地理位置、用户位置移动数据、用户特征数据、个性化服务历史数据、用户需求反馈数据的实时计算与综合分析,科学判定读者的个性化服务需求和最佳服务方式,在保证服务资源最优化分配和服务效率最高的前提下,满足用户个性化阅读的需求。第三,通过对读者行为数据的实时分析,掌握读者个性化阅读需求的变化趋势,并对读者服务策略和保障模式进行动态化调整与完善。此外,准确判断异常读者阅读活动中的危险行为,以及提高图书馆安全防范能力和降低服务风险,也是图书馆读者行为分析的重要内容和
[6]目标。
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲3 基于大数据的图书馆个性化服务读者行为分析方法和策略
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲3.1 基于大数据的图书馆个性化服务读者行为分析方法与步骤
基于大数据的图书馆个性化服务读者行为分析,是指图书馆基于事件存储大数据库数据的支持,通过对用户海量数据进行采集、过滤、分析和定义,从中发现读者行为数据中蕴涵的行为关系、用户需求和知识,是对读者的行为进行分析、判定、定义和匹配的过程,也是图书馆掌握读者阅读习惯和
,2015年2月 Februar2015y
LibrarWorkAndStud y y
发现服务需求,提高个性化服务精确性和用户满
意度的关键。读者行为分析与判定流程如下图所示
:
析和预测读者需求,提高用户忠诚度和服务满意度的关键。图书馆应从用户服务全局出发收集读者的行为数据,采集来自服务器运行监控设备、传感器网络、用户阅读终端设备、系统运行日志、读者论坛与博客、读者服务反馈系统、
、搜索引擎、网页c用户阅读行为监控设备ookies
的数据,尽量减少用户行为数据采集的盲点和提高数据的完整性、精确性、及时性和有效性。其次,所采集的数据应具有海量和实时性特点,依据读者阅读需求对用户行为分析的内容、选取数据和应用对象进行调整,避免用户行为分析过程中可能会对用户服务产生的消极影响,最终实现从理解读者阅读行为到掌握读者阅读需求的转变。第三,图书馆应与移动运营商、谷歌、脸书、百度等第三方服务商,以服务协作和大数据资源共享的方式,努力拓展读者行为数据采集的广度和深度。在实现以用户为中心的读者行为数据选择、过滤、共享和互补前提下,
[8]
提高数据应用分析和增强数据的可用性。3.2.2 保证读者行为数据的安全性和可用性
读者行为数据具有海量、全面、高价值和实时性的特点。图书馆通过对用户行为数据的分析,可以准确判断用户阅读活动的时间、个人地理位置信息、阅读终端类型、系统登录帐号、阅读社会关系和阅读内容等。因此,图书馆应加强对读者行为数据的安全性和可用性管理,保证用户保密信息和隐私数据的安全。
但是,移动终端工作模式和使用环境的不确定性,严重影响了图书馆大数据阅读服务的安全性,因此,必须加强阅读终端的安全性管理。首先,图书馆应依据阅读终端的安全设计标准、移动性、开放性,以及阅读终端与读者阅读行为的关联
,并性,为不同类型的阅读终端划分相应“安全度”
通过严格限制阅读终端的使用对象、安全模式、应用环境和通信方式来保证设备安全。其次,应将读者行为数据划分为用户隐私数据、读者特征数据、行为日志数据和公开数据四个安全等级,执行相应的安全存储、管理和使用策略。并依据用户行为数据生命周期发展规律,加强数据收集、存储、使用、转移和删除五个环节的安全管理。第三,应坚持用户需求精确感知、行为关系全面挖掘、服务模式发展准确预测和用户行为科学分析的原则,实现读者行为数据的良性监控和采集,避免采集与
[]9
用户阅读服务保障无关的个人隐私行为数据。
大数据时代图书馆读者行为分析与判定流程图
读者行为分析过程可分为用户行为事件初步过滤、用户行为定义、用户行为分析与判定、用户行为的匹配、行为存储大数据库的更新、行为分析与判定过程的完善6部分内容。在用户行为事件分析、判定前,图书馆应全面、规范地采集读者行为数据,并对数据进行科学的分类、综合分析、行为定义和人工匹配,构建具备海量存储、高效管理和查询功能的用户行为事件存储大数据库。
当图书馆完成对用户行为数据的采集后,首先,应依据对用户行为的分类和管理员经验,对用户行为数据进行价值过滤和人工筛选,以提高行为数据的价值密度和可用性。其次,对用户行为发生的时间、地点、方式、作用对象和结果进行定义,采用高效算法对存储于用户行为事件大数据库中的资源进行分析、判定,并对用户行为的类型进行详细定义。第三步,应将已定义的用户行为和用户行为存储大数据库中的数据进行比对,进一步完善、规范用户行为存储大数据库的资源。同时,利用用户行为存储大数据库资源,对用户行为分析与判定的规则实施反馈作用,完成对用户行为分析、判定规则的动态修改与完善。第四步,图书馆可依据对读者行为分析与判定的结果,明确读者阅读需求及其变化趋势,为读者提供个性
[7]化的阅读推送式服务。
3.2 基于大数据的图书馆个性化服务读者行为分析策略2.1 构建科学的读者行为预测大数据环境3.
科学采集高价值读者行为数据,是准确分
总第228期 Serial228
基于大数据的图书馆个性化服务用户行为分析研究 陈 臣:
:henChenStudonUserBehaviorAnalsisforPersonalizedServicesofLibrarBasedonBiDataC yyyg
3.2.3 重点突出读者阅读行为数据挖掘的知识
关联分析
知识关联分析就是从海量数据中发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。通过读者阅读行为数据的知识关联分析,可以发现读者不同行为之间的联系,以及读者的阅读习惯和服务需求,是图书馆以用户需求为中心制定服务策略的前提。
图书馆应在三维空间开展用户阅读行为数据的交叉关联分析,所涉及的主要内容包括读者阅读活动频率、阅读的时间与地点、阅读内容分布规律、阅读习惯和爱好、阅读关键词关联度、阅读社会关系交集、热点内容的关注度等。同时,行为数据的选择要坚持以服务保障为中心和高价值的原则,特别加强对用户阅读活动的热点内容、主要阅读模式和个性化服务需求反馈行为数据之间的关联分析。此外,基于用户阅读行为数据挖掘的知识关联分析,应加强对读者阅读行为的跟踪和监控。在加强对用户显性行为特征数据监控的同时,还应突出利用显性行为数据挖掘,而获得隐性行为信息(读者阅读需求、阅读热点、阅读行为关联性等)的关联分析,增强用户行为知识关联分析
[10]
的广度、深度和有效性。3.2.4 以精准预测读者行为和服务需求为目的
首先,图书馆应根据读者的阅读行为、浏览内容、爱好习惯、论坛与博客评论、阅读社会关系等数据,进行读者群的精准划分和读者阅读情感定
客户关系管理)位,并执行相应的C和服务营RM(
销策略,来提高读者大数据阅读的愉悦感和满意度。其次,读者的阅读情绪和满意度反馈,也是关系大数据时代读者知识获取效率和图书馆服务质量的重要因素。因此,图书馆应依据读者的阅读行为、发表的言论、好友间的信息交流、阅读情绪和满意度反馈等数据,描绘近期读者阅读情绪和需求的轨迹,来准确预测读者未来的阅读情感变化、情感倾向、阅读需求和阅读行为发展等,并制
(服务质量)定相应的QO保证策略,提升读者的S
服务体验和阅读忠诚度。第三,图书馆应利用对未来读者阅读需求和行为的准确预测结论,依据二八定律将顾客划分为20%的黄金客户和80%的普通客户。通过对读者行为和服务需求的精准预测,为2高效、动态和0%的黄金客户定制安全、高度定制化的产品与服务,来提高80%阅读收益
的有效性。同时,不断重塑黄金客户的阅读行为
和提高其阅读满意度、忠诚度,增强大数据时代图
[11]
书馆的整体服务收益率。
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲4 结语
櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲櫲
随着大数据应用的深入和用户服务需求的增长,图书馆大数据环境和用户行为分析过程将更加复杂多变。因此,图书馆应保证用户行为数据的产生与采集、数据的获取和管理、读者的行为分析、服务系统管理与服务的过程,符合用户阅读行为和服务质量保障的生命周期发展规律,实现统一平台、统一系统、统一管理和统一决策。同时,还必须从大数据视角出发,努力获得新的市场洞察、预测和分析能力,才能保证用户行为分析科学、全面、精确和可用,才能为基于大数据的图书馆读者个性化大数据服务提供可靠的数据
[12]
支持。
参考文献:
[]]王 珊,等.架构大数据:挑战、现状与展望[计算机学报,1J.():01134741751.121-
[]:谭 磊.大数据挖掘[北京:电子工业出版2NewInternetM].
社,1013:8203.2-
[]涂子沛.大数据:正在到来的数据革命,以及它如何改变政府、3
商业与我们的生活[桂林:广西师范大学出版社,M].2012.[]等.基于云计算的移动互联网大数据用户行为分析引陶彩霞,4
]():擎设计[电信科学,J.23013371.2-
[]]沈来信,计王 伟.基于T5reeib的大数据实时分析研究[J.-L
():算机科学,01369296.121-
[]]秦 萧,等.大数据时代城市时空间行为研究方法[地理科6J.
():学进展,10139352361.12-
[]]应 璇,孙济庆.面向大数据的用户检索行为研究[情报杂7J.
():志,101424043,176.12-
[]廖龙龙,叶 强,路 红.面向移动感知服务的数据隐私保护8
]():技术研究[计算机工程与设计,J.210136951955.1-[]/[://009Nature.BiData[EBOL].201447].httnawww.---gp ////ure.comnewssecialsbidataindex.html.tpg
[]冯 铭,王保进,蔡建宇.基于云计算的可重构移动互联网用10
():]户行为分析系统的设计[计算机科学,701186876.7J.2-[]]唐 杰,杨 洋.移动社交网络中的用户行为预测模型[11J.
():中国计算机学会通讯,2012515.22-
[]((英)维克托·迈尔·舍恩伯格,英)肯尼思·库克耶.大数12
据时代:生活、工作与思维的大变革[盛杨燕,周 涛,M].译.杭州:浙江人民出版社,2012.作者简介:
,男,工程师,陈 臣(兰州商学院信息中心,甘肃,兰974-)1
州,30020。7
,2015年2月 Februar2015y