基于深度学习的线上农产品销量预测模型研究_刘晶
网络出时版间:01620--18 5613::600 络网版出地址:htpt://ww.cnkwinet./kcsm/detai/l151.96.T1.2P1608150.1366092.h.mlt
先出优 计 版算机 用 研 究应 第 3 卷
3基于深学度习的上农产品线量预测销模型研
究刘
津 天004013)摘
*晶 1a 2,,和群 1a,朱述清香1 b*,安雅 程1,许
a
楠 1b刘,
凯
1
(1a河北工.大学业a.计 机算科学与软件院学b.经济;管理学,院津 3天040012;河北.省数据大计算点重实室,
要:针对验线农上品产售销在的存息信不称对问题提出一种,合结度深学习法算势和涉农电优销售商据特点的数冠皇
模
(i型pmeirla rocn wmdeolI,MC) 。先首立因建评价指标素将销,分为四量类别;个次其,用采两层自码编网提络样取本特 ,并征成生的新特征量;然向利后用带标样签集本训练分类器并对标签无练训本分类;最样,利后 用BP 调整个网 微参数得到络使损失函数值到最小达最优的参数,现实线上产品的农量分类销预。测经仿分真析验,证了IC M模的型 分类准确高率 8达%8明,高显其他于未将数进行据特征习的学层浅类器,证明了分 IMC 具较有的增量好学自习能力和 次层认知力。能 关词键深:学度习农产;品量销测;预产农销品评量价标;指IM 模C型中图 分号:类PT181
nlOie agnriulcurtalpr docut asles frecaostm odl researeh cabed os deepnlearn ngi
LiuJ ng1a,i2 ,H eShuqu 1na, hu ZinQgiang1xb,* An aYcenh1ag,Xu anN1b Li,u Ki1aa(
1.a. Sc hoolo Cfopmuter cSeince &nEgieernni, g. bShcoo of Econolimcs &M nagament, Heeeb iniUvrestyiof eThncoogl, Tiynjian300 01,4Ch ni;a . Heb2i eProincv KeyeLab rotaryo f oBig Daat Claucalion, tiTnajin 034001, Ciha) Absnratc: Int ordre t oolvs thee roplbe mof ifornatiomnas mymertyof agric ulurat prlduotc sonli-ne, cmboine wdti thh advenaagesto f deep elrnian gand hetc arhatceisrtis cfo rantscatoi dnta aad puntforw ardthe s ales redpitcig nomdel I-pemril CaownrM oedlsh(or tof rCM) I.Fi rts es,tabilhesdfact ro veluataion ndie, sxaels acn ebdi vdie idton ofur lvele. secSodlyn, adpteo dtow aylrsea touncodeern etowk ro ettxrat fecatru, and egeneatrdethe new featur evceort Then,.the cl saifsei ri srtinad weih talebldesampl es et an the dlasscifeiri suse dto classif thy unleabele drtanini sgmaple. sFinlaly,th eo tipal mpaarmeets ro fht wheol eetwnor kprameaerstwe r efnietun-deby singu ht ebcawkadrp opargtaoi nagorlithmgot themi nmiie vzluaeo tfheloss ufnctin, oanda hciveedon inelsale sof a rgcultuiralpr odcts ulascsfiicaitn orepdit. cy sBmulatioina anlyiss the,clas ificasion atcurcayc of tehI C mMoeldveri fesi s ahgiha s 8%8 IC,Ma ccrauc isys igificannty hlihgr ehatnother s allhw olascsfiier. sI ptoresvtha t CMI ha as ebtte abriitlyof inc emenrat lsef-lelrnaing adnthe abi lti oyf ht cogenitive leevl.Key Wo rd:s dep eealnrnig ag;riclturalu rpouct sdalesfo ercast; argiuclurtlap roduc tasel evsaluatoniin edx ;CM Imdo
el )由a于农品产自属性问身,题数其据样存在本样多化的情况 ,给测预来带较大难,所困以型模应备多样具化数据处能理力b; 随着)涉电子商农务的发展,销量其录规记越模来大越而传统 浅,学层习法在处理方大规模数据预测时度普遍较精低,此因 何提高如基于数大据涉的电子农商务量销测预确度成精亟待解为决的问题。 深学习度一是种拟模脑多层人感结知来认构识数据式模的学 算法,具有习强的极特征学能力习。年来近作为据数掘挖 一的新个领兴域,在理图像处文、、本言语等非构结化据数等方
引0言
着随网络的展发农电涉子务商迅速崛,起于农产品属于由
熟生鲜
腐类产品,具有严易格保的质限期制,因,准确此预 的涉测农子电商务品销产量为成主研流方向。目究前,关商于品销量 预方法测的究,主要是研基于 G(1M1,)的预测1[]2[]、B 神P经络网预测3[]基、时间序列于相的预测关分[析]、4 于基持支 向量预测机5[以]主成及分分析6]等方法。 这[方法些都不同方在面取得 了好较的果, 效将其应但于用农涉品的商测预有许多仍端:弊
---------------------------
-基金
项:目津市天软学科金项基(1目4653003D); 河北省会科学基社金资助目项HB(15L11G) ;2河北科省计技资划项助(1目4506330D )作者简:介刘(1晶997) -,女,北河省皇岛秦人,研副员究博士,主要研究,方向为据挖掘、电数商务等子相研究关和;述群1991()- 女,,士,硕要研 主方向为智能究信处理与息务商能智朱清香(;9621)-, 女通(作者讯), 授,硕士,主要研教方究为向理信息管系统相关等研究;雅程安(9921)-, ,女硕, 士要主研方向究为能信智处息与商理务能;智楠(1977-许) ,教副,博士授,要主究研方向为务财理管;凯刘(1929)- 硕,士主要,究研方向为智信能息理处与 务商能.智
优先出
计 算版 机应 用 研 究
第
33
卷
面现出体了极为越卓的性能,其对但农涉商的电用应研究刚 刚才步起本文根。农据品产特建性了立影因响素指标权重及计算 型,模应用深度习算学法建了涉构电农商量销测预型-模皇冠模 型I(pemrailCro w Mndelo简称 ,IM) C,并经实验明证,模 型该有具好较自学习更新知的能识和层力次知识习能力,可学有效 实现农电子商务涉销分量类测预
。通过断迭代不确定最参数优- IM C模型 1.3 逐。层婪贪训方练
,法终最得的到预测分器类
Hi
tnn o于深信基网度络( eeD pBeiel
fets,N简 称BN)提D
出的非监
贪婪督逐层训算法练目是训前练层深网络比先进的较 一种法[9]方其。主要想思文如[献]9述,所各将个层单独训单练 到得权重系数的用来初化始最终
的深网络权度系数,重然后“微 调整个”络网使各层,的参达到全数最优,避免陷局局入部 优的限制最
。
1
理论方法
与
1.1 动编码器自a(to-enuoced,rAE A)E 是度学深习法算中一种有快速学习具能力的法,方其 本质 是用人工运经神络(ANN网)的层结构特次点,一种是具 有对多非线层网性结络利用逐层构心贪监无督训练预系和统参性数 化优方法实现,高从维杂复入数据输中提分取层特征得, 到始数据分原式布征表特示的度深学神习经络网结,构处在理大型高维 据时表数出较高的现效。假设一率无类个标别签的训练数据样本 ,通过v式1()将 v变 换激为活的后y,v 与y 满 足 式() 1。(1) 中其s 一是非个性线数函,例 si如mogid函数 。 参为数集。合然公式(后)2经公将式1(激活后的 )y 向反编 码输将值 v 入的构重示表 z,y为与 z 满 式足(2 。 )2) (中 其关系的 W为1= 为参数合。公集式() 1()2参中数 1W、、 ,最后通过不 断化优更 新和得 最
到
2
本选样及模型取计设
21. 本特征数样选据取 于由涉农电子商销务量影响因较为复杂素本文,主从农 产要属性参数、买品个人家素和因推广渠道三个面来方取用选于 表征量销响影因素的征特量变为。规范表化形示式根据,公 (式)整理得到6各个属的性表代值数。
21.1 .产品属性参农数的择 选农产属品性参数要有主货地发、收藏量好、率、价评、格 量。销a)为简 化计,本文算要研主究京北和江苏两发个货地的 农产品销量区况。其权值分布情表如 1所示
。 表 发货1权值分地布城市 京北 adr_dd e.61 00.93
小化
构误差重J EAJA。 定E为 (3义 )其 L中为重 构误差函数。 如即能果够好的对良始数据进原行重,构便可为 AE认 对 保留原数始据的部分特大信征息较好的学有习能力现今 A。 已E在众经多域得以领用应如,手识写别,并等取已得好的较成 ,本绩创新文性将的其应用于农电涉商量销类分测研究预。 .12 oSfmatx分 器类 oSfmaxt 类分是器 ogisticl分类回 在多归类分题问上的拓展, 输出将果进结行一化归处,理输出结使和为果 1,其输 出值表每示类结果现出概的。 相率较其他分类于,器 oStfmax不仅 能达 到类的分效,还能果得每个到结果具体概率值的给。输定入 训样练集本合 L, 用采假设函的数法方分析个每 j 属于不同 类分类概的率 值:下 于。定是义设函假数形式
如江
苏b
)将藏量收行区间划分进,其值分权如布 表 所2示。
表 收藏量区2间权值分布收 藏量区间c ol100 co0l0. 210 2.1 .0340.2
c)4评好按率间区分,其权划分值如布 3:表
表 3 好评区率间值权布 分好率区评间
r
d)价
格间区权分值布表如 4示所
。表4 价格 间权区值布
其分:中
为求要取模型参数的定义代价。数:函(5
)格价间区 p
1(p) 0.1元 0.45
7优出先
版
算计 机应用 研究
第33 卷
11 9.= p14. 9
.20 09.19
s
0
21 34
.212. 买个家人因:素买 家个人因素主有要别性年、、收货龄、成地交时。数间 据处如理:下 a)性(s别x)e 男性:家买 0.用 1示表,性买女家 0用9.表 示。 )本b选取文子商务电主的消要群费体,其年主龄分布要在 02岁 ~4 0岁间之样。本中龄年间分区如表 5 所类示
表。5 年龄区 权值分布 间龄年间 区2
根据 s生 成四类出向量输Z={低 销量=1,销中=量2畅, =销,3爆火4}。=2 .2I CM模 型计设基 于人对神经网工的研究提络出度学深习概念,深度学 习的是一含有种层多知感器构的结学习法。算结合易数交据的 形及其本质特征式 提,出I CM模型解 决常预测见模增量型习能 力学差泛、化能差力的题,问同发时了改善现层分认知能的关 键力素因 由。电于商据数具大规模有性,因特,此选的用挖掘技术对销 数售只作据式归形纳。取采半监督习学模型首,先经动编 自器码无从签标的易交据中发数其现在的存有特共用于描性述样本 特,征然利后用标有样签本练分类训,器并利反向用播不传断 化各优层数参最,形成终一可个用于实销量分际预测的模类 型I M。 2.C2.1 IMC模 网型络结和训构方法练 IM C型模用采含两个隐藏有的层编码网络,自编码自络网输入节 点结构与用以预分类的测特向征结构一致。针量自对编码 络只学网不分类的习特性,模型的顶层加入 在oftSamx 分类器, 网络结构如 图 所示1
。p
c)本文 研究供的货收有八个是地根据商产地选取品电商子务 发较展成为的北熟京、江苏围绕北及的京津京冀务圈和商围绕 江的江浙苏经济圈,沪此外选还辽取宁和东广两个距离发 货较地远地区。的权其值分布如 表6 所示。表
6 年 区龄权值间分 城布市 京 天津北河北 江 上苏海 江浙 宁 广辽东 ad_dhs 0.25 .011 .03 0.13 021. 1.10 0.00 04.30
ddad_e ad_shd (yP1=|)x 低销 P量(y=2x) |中量销P( =3|y) x畅 P(销y4=x)|火 爆
t
es
x)d成交间(时)t:工作 用日 .39 0表,非示作日用工0. 1 6表。示 .21. 推广3道 良渠的推广渠好可道达以事到半倍功效的,各推广果道权 值渠布分表 7 所如示
。表 7 推价广渠权值分布道 推渠广 道索引搜 社擎交平台 件、信邮 息无p r_co h.25 00.4 701.9 0.90
aegp r_oh
coc
flv_ar
+
1+1
1
+图
1 IC M型网模结络
ICM构 模网型
络的练训骤为步: a输入训练样本经两层)AE 行进无督预训练监 b)。 步骤将 )a得到无标的签出输结作果为 ofStma x分类输器 入并,用有使标样签本集练训 Sftmaox分 器类 c。)计 AE 算核数、函构误重函差、数Sofmax t分器的类代价 数以及整个函网络每对个参数偏导的函数。值d 针对步骤 a)~))c得到的网参数络用初来始整个深度化网络参 ,然后数用反向利播算传法出求最参数优进行有,督监 练。训
2.1.4
特向征量成 合上综述所用 V 示输入表征特量,则向向量可示表为 V[ p=、a d_ddea、dds_、t、hse、xag、pero_chcol、、afv_],向r量度维 为9。将 量销s)(按值划分,域表如 所示。8表 8
销量 区间分表类 量区销间s
优出版
先计 算 机应 研用究
第3 3 卷
22.2.具体 算实现法 CMI算 具体法现步骤如图实2 所 ,实现步示骤为: a)维数将为9 的整理过 的据数向量V 为作入,输训 练第 层自一动码器编得,参到数 b。 )将 输出值c 将 )为第作隐二层输的训练入得参到数 。 隐和层元单的 隐和层单的输元出 组成值的向量
行, R在i386 平台实 编码仿真。 3现.1性能 真仿工作首验证 先CM 模型在I不同样数本的下能变化性 势趋。为更好地解了I C M模型传统浅层与分模类的型区,别将 进行特未征学习原的始数经 据VSM支持(量向机和 )ofStam 分x 器分别类证验分类精其。 度 将1 0具有不同规组模学的习集的经3 分类种型分类模得到后精度对比如图 4所。示。 分类精度(%)
1. 002. .0 4.6 0.8
0
成的组量
向为作分器类 Sftomx 分a类器输的入量,向用经利
标签
处理的原后始数据本样据 数H 训练类分器,到得参 行优化数微(调inf-teuingn ) 。e)据先验根识知,定类标签设
d)
使加用入 FGB 的S PB反 向播优传算法对化整网个进
络
利用,预经0.
I0CM浅 层 SV M 浅 层ofSmtx
a训练后得到的
分器进行分类预类。将测分结类果与际值实行 比进较若满,足类精分则度出分类结输,否果则转 d到 )。
开始
0
00
3600
9
0
012
00
510 0习学规模集
1
800
21
00
2
04
0270
30000
图4不 同数规模据各法算预测度对比图精使用训练
本AE样,得到1和输出向A量
1
图 4 从可中以得随出着据规模的不断数长,增ICM模 型表现出 较的高准确率凸显,对交易了据数二的特征次习能学,力 基交于易数据模持续规长增多变性的特和点I,M 模型C农对产品销 预测量有显明优势。 3的2 .性能优化 如 9表 所,I示C M未优化之只前 70%有左右的精确,优度化 后精确度其提高近了18%, 且而确精随度着代次迭数增加
的满不
足将
1A为输作入向量训AE练2得到,和输出量向A2
训H练Sofmax,t到得对A,分类2
微调,更新整个网
络参的数
精
确
度判 满定 输出足类分果结 束
结而
步提逐高所以证,明反向微了对调度深模的准确型的率高提是有 效。性
9 表分类预测精确度化表变分类器
迭代次数A 1E 迭代次数AE 2 代次迭 数调迭代微次 精确度%
数1
0 图 2算法 程流 图1001 00 10
0
无无10 0100 1 0
0 无无无 1 00 001
无 无 无 10无0
70
9. 878.80 2.87 8853.3 8.195
3
仿
和真证验
模的型仿和真验基于证宝淘产农品鸡的蛋交数易进行,
据
01
共0含包5 00 组0数据,依所据建的构预模测,型要需别整理分 两类习学集一个是特征,学习用于集训变换练核数函数参值,另一个是 类学分习用于集训 练oStfamx 类模型参分数1:)征特学习 ,集为证保适普性用随采抽机的方取式从体总本中样取选3 000组 样数据本, ;集2分)学习集,选类取样本总数 为1000组 ,并为每特征向个量设置类标签别,别标签与表 类8 一致。 随选取机 050组 数用于训练据 Sotmfa x类分器其余 ,50 0组 样数本用以验证据模的分型类测预能。具体仿性流真程图 3如所 示 。
满足 训不 练样本自编码网 络特学习征 核函和最数 损小失数函 标签 样带 训练本 分器类精度 判定 试测 本样 满 足 果 输结出
3
.3 化能力泛 化泛力也是考量模能性能型的重方要。面用新数使集对据 CIM 型进行模测试数,据含有 集10 0数组据每,组容量 2为 0条,中其1 5~0组 数为工作日时据段的数据样本;51~100组数 据 为工作非日时数的样据本将。数分据别设置一在和个个隐两 层自动码器上编进行预分类测数据的预,测度如精图5 示。
所
图3 系 统仿真作操程
流图 5 模型预测准率确计统
仿真
作工 Wi在nods 7w 46 位系统 nteIl-I3CP 计U算上机运
先出优
计 版算 应机 用 研 究
第
33
卷从真结仿果看交易,数在只据一个有隐藏的自层编动器码分 时在处类 1理~5 0数据组时集性的能明显要于低5 1~010 的组数据 ,原集因销是量成交录在记工作非日要高于作工日,结 显果示 CM I型在模处含有理不同录记数数的据时准确集率比稳 定。较此因适当增加自,编网络码的藏层隐数可以目提模高的 型泛性能化改善,于对由交易数据知学习认力差引起能分的类预 测度精低偏的题。问
[4
]洪 , 鹏余明世 基于时.间序列分析的动售自货销机量测[J]预 .算计科 机, 2学01, 524(A6: 12)212-.4 [] 5刘俊, 慕娥柠咛 ,刘丙.午 固模态有 SV M测预型模在售销零量预测中 的用应[]J.物 技术流,20 31, 23(1)1 :767-, 987. 6][ 海汪,波陈 雁,翔李艳秋. 基 于成分分主和 So析fmat 回x模归型人脸 识的方别法J[].合 肥工大业学报学: 自然科版, 学025,1 38(06: )79576-.3 [7 ]谭,娟 王春.胜基于 度深习学的交拥通预堵测型研究[模J. 计算机应] 用究研 2,105, 32(10):2 51-25949
.[8 H]inton , GOisnder o, TSHe Y. A fWas letarinnga goritlhmf or deep bleife etn[s]. NJueal rCmopuatton,i20 60 ,8(170:) 517-2515. [4] Be9gnio Y La,mbin P, lPpooivc Di, 1 eal G.rede yayer-lwise ratining ofd epen etorks[w]C//Adavcns en neuiarli norfmtain oproescsign sstye,m 2070:153-1 0. [160] 建刘,伟 刘媛 ,雄麟.罗 度学习深研究进[展J].计算机应 研用, 究2041 ,317):(192 -1193, 1940 2[1]1王 山海, 新幸,景杨海燕. 基于深 学习度神网络经的立词语孤识别的 研究音[]J 计.机算应研用究,2 10, 52(308: 2)29-02921,2 28 91[2] 国涛, 石振国王,吴小景. 于基 DB 的N件软靠可性预测模型研的[究]. J计算机应研用究 2,06, 10433(. [1)3]李阳辉 , 谢明 易,阳 基.于降自动编噪码器其及改进型模微的博情感分 析J][ 计算.机用研究,应2 061, 43(5)
.
4
结束
本语文根深据学度习优和涉势电商数据农点特构建 CIM模
型 ,用自动编码采器法方挖掘农品线产上易交据的数层深征特,采 用oSfmtx a类分进行器测预。自经码网络处编理数的据进 分行类时浅层与类算法分比相在处理,大模规据数集其时预测 能性明提高。并显验了,证微调分类精度对提的重高影响要,证明 了模具型较有的好量增学特习和多性层认知次力。能 文章未深并入究研ICM 型的模棒性,鲁对于 络网练而训, 通常言情况下分,器类的差无误法彻底消除,可采以用加分类入支持 的思度来想高分类准确度提
。
参文考献
:[1]殷春 武 .GM1, 1(在)品销量预商测上的用[J]. 中运商国, 20贸0 (21)8:24 -2647.[2] 岑詠霆 .量销测的预改进灰色型预测 GM(1 ,1模型研究[)].J工业 程与 工管理,20 3,1 81(1: 3)741- [3. 毕]涛,建魏 红芹. 进的 B改 神经网络P及其销量预测在中的应[J用] . 东理工大学学报:山 然科自学版 201,1,2 (65:)2 -93.
3