1,多元统计分析方法1
戴稳
胜国中人民大财学学院,金副授,墨教 尔本学精算中大,博士后 心Eaml: [email protected] :10-0250058400 01究领研域:顾客满测评意、风险管 理精算 与长:专数分据与建模析1
元统多计析方法原理与分应用M
lutviarait enAlyais
s中国人大学财金学民 戴院胜稳
2们的研究我作工是什?么我 们的究研作工什是么 ?为什么要需量化研究研究及注意的几点事 时 项么什多元是统计析分M(AV)?什 么多元是统分析计MVA)? (什么为们需我它要 为什?么们需我要?它 常通的析技术 分MV详A细绍及案介例: MAV详介细及绍例案:相
分关(析oCrrsepodnenc aealnyis) 相s关分(Cor析espornencd enaaysls)i 归/回元多回分归析(Rergssien o /ultiMle p归/回 多回元分归析Reg(essroinregr sseion 成主份因子/析(分actForan lyass) 主成i/份 因子析(F分ctaora alysns)i聚 分析(Clus类ter anlyasiss/gemenatiton) 聚分类(析Cluster…
3
研究工是什作?么
只它 ?:
数据分是析 ?状描述现? 制作表图?制 作表?图 写报撰告?撰 写报告?
特征
或 们我所 送的传意 识..
.们我的作工是提供解决 方 是解决案委托的问人题是 为们我的客户更挣的 T多heB nefets moieyn
4有简
性的一面....单. 简有性单一面..的...
当
们进行分我时
例析:如基的本分析定(的描述性、变关联表)量
外也有另杂复的性面 ..一.
大量附.的分析 运用许加多分的析术技
然
而们我要需看到复“杂性问背题的后简 然而单我需们要到“看表述 ” 述表
”复使杂题问简单
化为了
到这达目一的,你不不得究复研杂题 然后问提去出使人炼容明易白信息
的
5数
据述
阐般一知不认一定确实。 实的资真料才能提供确正的息信。美
國黑 vs人 .美國白人 之比例白
人 認 2為3.8% s.v 499.% a(veare)g人 調口局查(C neus suBreua):11. %8 vs.7 4%
高
校教师入极收高,成个税监为督重点对 象 的公员务色灰收很高入,工资基本不…用6
数据
胜过了轶闻轶
闻那些是人印令深象刻的件,事多数些特是例可,能 导致误。导研究料才能提供正资确结的论 。缆线电白与病
血闻传听:说缆电产线生电磁场会的发白血病诱。 研究五百万:元美经历年五研的究明表:暴露
电在缆线产生的电场磁白血跟根病本没关有[系E.W. Ca mipno ,Ed“itorila :pwerol nis, eacncreand fe a,” Newr Enlgad noJuranl of Mediinc,e 373,N .o 1 19(9).7]
传
:手闻磁机诱场脑部病变
是真发吗?的7
计统:让数据说话 -泰坦尼-克
号600 1410 020101 40 100001200 100 800 600 40004 0 00020 S D20 0 男性0 性 女200 0810 16000
5002
1
000900
200
00807 00
5010
60
5000
0086 0
0010
040
0 30
0005
20 1000
成0人 小
孩 0一等 二等 等 三船员
生死
数
人
女男人数
成人
孩子与
不
舱等
同
8生了发
什么
一等?舱 二舱 等等三 C舱舱 存活死亡 总 存数活 2比30 12 232 652. 115 86712 8 41.5 1784 52 780625. 212 9673 98 22.6
4
9
当天
的情如何?形男
性女性 数总 存活 374 死亡 3164 总数 138 7存活 2比1. 大人 小孩5 总 数7 751 8434 78 1存活66 1 25 4190126 149 死0 1亡43 4780 208 总数2 029 10992 02873. 2 2.53 存比活31 5. 2.5332 5.
似
乎真的是孺妇先优!
10
存树生状图多(分类树元)
1
统1计的用:作理变处异描变述异
据不可数一能成变不
体差个异(比如身高、重等体 )测量差
误统计助帮我处理变异 们(vriaatoi)n。1
2
论的不确结性定(Ucenrtiatyn
今)降日概率3雨% ..0... .术技分是否能帮助析股?炒信 模型用的用,能应降否银低行贷坏款概 率帐?风险
降率低9的%5信区间置为7%~134 % …
。
统计给了人一们种讨以论把并握不确性的语 定
13
言
量研究化流程业
务理 数据解采与准备 建集模 用评应 估据
数库
仓识知发 现 数据 掘挖
务 商智
能动
采集活
数
据 处
理信息 知识
应用
策决
数据
管理价链值
1
4如
你果能不量某化事情些那,你么就不能理解 ;它 果你不能如理它解那么,你就能 控制不; 如果你不能它制它控那,你就么能不 改进它。1
5
经营分的几大析标及对目应段手把
概况握-探-索数性分据、析OAPL把 握况--概探索数据性分析、LOA P了解异差--设检假验方差分析 、类、分类-聚判-别、神经类络网、策 树决等 解了相--相关、关关规联则 因原探索及目控标--回归、制因 子结探索--SE构、HLMM 构结索-探SEM、- 握趋把--时序势分 析一类殊问特-题-aPan lDtaa一 特殊类问题--aPnla
16
经
营分目标一析——解了概
况数字描述
均值化、中数、众数 位差极、方、差标准差、离散数系频数、 频率
1
7营经分析目一——了解概标
况多角描度述—OL—A P角多度描——述LOP
为A么什要角多度当心统计陷井
表?面料不一定可资信品牌 意满例 地率区挤程度与无拥手间洗屋房例比间的关相
18
品满牌意率
比两较品的满牌人意数比:
例满意 品牌 品A牌A品 B 牌牌品 3B742 6384 不意 满01 587 7满意率 不31.3 10.%%
9乎似牌品的顾B客比品A的牌客要满意些顾
19。
实情际如何况呢
?牌品A 品A牌 满 天津意 海 上京南 广 州北京合计 4792 2 2121 05 3814 3124 7满意不 2 621 20 01230 5510品牌B 品牌 满B 6意9 44804383 3 2 021 6043 不8意满 117 41 65512 961 787 2
00.
5 303.0.2 0.25 015. .1 0005. 0天津 海 南京 上州广北 0京.44 1.111 0.07090 05. 20.415 0086. 02.7
8品牌
A牌品B0
.691
.2033
0.
412
几
每乎个市城里品牌B,不满的意率都于高品 A牌!
12
地
区挤拥与无手间洗子房例比 的相间
关研究国哈尔英(Hul)l各地区市房屋状, 研
况究英哈国尔(Hul)l市各地房区状屋况, 现发据显示各数区拥挤地度(x程)与没洗 发现有据显示数各区拥地程度(挤 间手的房子例比(y)的相关间数系很低手间的 子房例比(( 0.8)0,但常按觉理得应比该较高。( 00.8,但)常理觉按得该比应较。高按 区地内寓公例比高低的地将分区两群 后,发现在各成群的相内关数系高(分别为极 后,发现在各内的相群系数极关高 0.(85及.09)1。0. 5及 8091.。)
22
地区
房屋状研况
r = 究.00
8 =r0 .5
8r
=09.
123
经营
析目标二分了:差异
假解设检验:一素两因平或水因素 方两分差析:一因多水平素或多素因交叉至
24
经
分析目标三营:类与聚分
类比客户区隔如、场市细分 ogLits回归、别、聚判 类oLigst归回、别判、类 聚类经神网、决策络树
5
2经
分析目标营四:把相握
相关系关数:定与类定量数据相的关量测关联 规:实则质一些条件概率
是
26
问题:
关相数系可靠?
吗通某公信推出司某业项务后试图发,通现时话长和人 数之的间关系。。。 ime:T用月通话时户长 Coutn:时长该的人
数相
系关数-:.230没 系?关Co
reratlion (Spreadshese1)tMar ke cdorrlateinso rae singifcanit t p a
27
真
与相论结
真:相。。。 是iTe和Cmunto2次是关系 关系相数只度量线性能关系T
ie
morCrlaeiotsn S(peadsrhee1t1 0*89cv
结论)是。。。 项业该对务通话长时极端客户吸 力引很大,对普客通户不感 冒
Cunto
28
经营
分目标析五:因素目标
回归-与预测-与制控 因子分 析有关未必有因果:
联一致研性 究果时因序列 间剂与量映反:最好实验是计
29
经营设分目析六标结构:探
结索构方程型模ESM顾:满客度意数指模型 结构方程模型EM:顾S满客意度数模指型 层多性线模型HLM多 线性模型层HM
30
L经
营析分标七:目握趋势
把时间序
列1
3
类特殊一问题P:naalDat
32
a什是多么元计分析?
统单一题分问(析nivaruaiet naayliss 例如)频 单一问题分析(率 布通分常作为数据的第步的描述分析一 关表(b联vairiat aenlayis)s总 作是为主的 关联要( 分表析段手而被场市研究反复者使用
把 一问题或个量与另变个关一交叉作表联 (例如对受者访景背量:变性别、年等龄 )例如对访者背景受量变:别性、年等龄 )论哪个行业无包,金融括业
如
果同时析的分量变过超个二被称为就 多元统计分
析3
3
我
通们常用的使多分元技术…析..
.关性相分析多元 归 主回分成析 分子因分 析类分析聚市场/细 分聚类分析 判别分析 e/ct .te. cetc
.4
多元3计统析技分
术个一研者究可不能了解有的所析技分术细 节但他们是该应能够正地选确适当的择方 法用多使元技
术
,你必知不详细的道数学式公-是你应但 用多元技术使,你不必知详道的数细公学式明白当它原的 理元多分析不并魔术棒,是不需我要开们动脑筋就解能决 问 - 它不会轻题告诉易答你
案如
数果据源很差多,分元就析难很发作用
挥3
5元多统方法计直的观解释多元
统计方的法几基本用途:个分
、类判、数据压别和缩综合价
评类对分应聚类于析 判分别—判—分别析 别——判判别分 数据析压—缩主成分 数—据缩—压主成分 综合评价——综—合种方多,但法是主成 综合评分—价综—合多方法种但是主,分成用得比 多较
63
预知备:识元多计统数的据矩阵
学符数号表的和我们使用示软的上的数据件表是一致
的
p指标个
⎛
11 xx12 x⎜ x 12 22 =⎜X⎜ ⎜ x⎜ ⎝ x1n 2n
1xp⎞ x2 p ⎟ ⎟ ⎟⎟ np ⎟x⎠
}37
预
:备多统计数元的据何几直
把观据数看作维空间中的n个p点把 据看作数 p空间中维n的可 运用空以中间投影、距的离概
38
预备念协方差阵co:airance mvatrxi
组一变量可以计,两两算间之协方的 差列排成一个矩阵,就成构这组随机变了 的量协方矩差 阵也以可这把随组机量变理解为个随机一向量
39
备预:关相数系阵一组
变,量以可算两两之间计的关相数 系oefcfcieni otf ocrerltian o排成一列个阵矩就构,了这组随成变量机的相关 数系阵 也可矩把以这组机变量理随解一为个随向机量
4
0备:预方和差据数携带信的息量
回方差忆分析 回F-忆验 检忆回 数F据内有部异,变所以能携够带息信这是
种判断一,很难给出合理量化
的差是方个不一的结果错
41
预备
:于方关
差个每量变观测的数据可以都计一个方算 差整数个集据一个总方有 数据压差之缩后可以得到变之换后的据数 那么所,得的数据的到总方差原和始据数的 方总差有大多差呢异?
2
4归分回析R ergssieno
34
回归
析是分什么?线性
回(归Liean Rregessron) 线性回i归L(neair eRrgssione
)画因出量(d变eepndnet avribale和)自变 画出因变量量(va rable)和自变i量(i ndpenedet navrabli)之e的关间 系vriaalbe)之间关的系 因变 = B*量自 变量 +数项 + 残差 常变自量+
44
回归
析分什么是
?线回性归程方:
式 Y C =+ x +be Y= 产出 d(epndene tavriabel /esrpnos eariavbe) 产l出 X = (输入变(i量ndepndeetnva raibel/ ergrseosr )输入量变 (regresor) s c=常 量(当 x=时0 )=0时xb 斜率= e=误 差残差(/eror r/ esridal) 误差u/ 差残(rerr oreisuald
)
5
4
多
元回与一元归性回线归 样,只一不有过多更的反应量
Y变 β=0 β1+X +1β 2 2 X + βpX p + +ε
Y
=X +εβ
数学原略理去
E[
]Y = X β
64
经
回归的典设
假1回归、模型对数参言是而线性的 2;、各自变量X的在重值抽样中复是固
定的; 各、变自量X 、对3定给的X随,干机项ui的扰均值为;零 、给定对X 随机的干扰项 4、对u定的X,给机随扰项ui的方差不干;变、 给定的X对随机干 项扰u 、对5给的X,随机干定项扰iu无相关;自 对给定、的X 随干机项扰 u6、回模归是型确设定的;正 、随机干7项扰u是i态正分的。 、布随干扰项机 u8、如果是随X机的则干扰,与各项是X立独的 、或如X果是随机 的,则干扰项与X 各不相关; 、观测9数必次定于大自量变的数个; 01、变量的取值必自须足有的变够异性 ;0、自变量的取1值须有足必的变够性异;1 1自变、量间之无确准的线关系,即无性重共 多47 线性;
多元回
归析分—操作
—用观测数据利bseovratino立建归回方 利用程观数据o测serbaviton建回归立程方 断回判方程的显著性signi归icafce n断回判方程归的著性signi显fcincae整个方程的显
性著 个别量的变著性
回归显断诊—所得到—方的程的有意义?真 归回诊——断所到得的方程的真有义? 意用回利方归进行预程测和控制
测:预定给自变量的取,估值因变计量的取值范围 制控希:望变因处于量个范某,寻围找合适的变自 取量
值4
8
多元
回在计算归中的能问可题β
ˆ= ( X′ X) − 1X ′
Y这对回是归数的系估计式 有公个逆矩阵计算一其在中要,该求逆阵矩在存在实际计 中算如,数果阵的变据量间存在之高度相 ,关 则 X 不′一定可逆
X94
多元
回分析归—多—重共性线简
单回分析有归不时靠 尤可在其各个变自量之间在存强很关相的 性候时计算,结果不稳定 很多项回式归 主分回归成
50
归回析分味着意什?么我们通
认为是独常立变量某在方面影些着 响独非立量
例变如度过的吸会导烟肺癌致的生
发在市场/社会研
中究它,通表现常是“出先有 市场在/社 会研中,究通常表它现出是“鸡还 是有蛋先的系关”:鸡还 先有蛋是的系”关
喜欢某件你产品因为它是很时髦还是你为因认 你为喜它欢才得它觉时髦她 ?你欢它喜才得觉它她时?髦你 欢一个公司喜因为它是好有的服务或者你?认为 这公司个的服很好只务因你为欢喜这公司家 或者公(司其方面的他素)因或者 公司其方面的因他)
素
5
1回归析分味意什着么
?虑考B te 得分a将可能更有意义通(常喜是好 的排序值、际影边响等力 B)ta值越大,e喜好的动越大或敏感波性越大 Bte值越大a喜好,的波动越大敏或感性大越( 响也影越)大 在融风金险中衡量某定资特产险与风场风市 的险感性敏
5
2
回分归析设.假.
X.1, 2X X,3 立的独- 没 有强的很相性关 如它们强相关果我们称为多元,线性共市场 究数研据常都通有很的强部内相性
例如,如关你喜果欢个一品
牌,你也向倾认为于 它髦时、耐、所有用场都合用、对适孩小和 年人成都合适等 背景资等料通常是相也的关- 例,如龄年收入和 收、入教育和程度.等 收入教育和程度.等
Mlutcilolineairyt 我们对来说一是个大问
题逐步归法回 成份主回归决解见(主成分析份补内充容
)3
5
步回逐分析归
5
4
多元线
性归建立的回归回方程包了含所 有自的量变但,实在问际中,题可有能 样的这情况:参回归加程的方个自变P 量样的情况:这参回归加方程的 中P,些自变量单独看有对因量Y有变用作中 ,有自些变单量看独对因变量Y( 相程度密关),切P但个自量变可又是能( 相程度关密切,但)P相 互影响的,作回在归,它时们对因变 所量起作用的有可被其能他变量代替自而,使 得这些变自在量回方归程变中得足无轻重 。这时这把自变些留在量回归方中程, 但增不计算加的上烦麻而,不且保证有 好的能归效回果为。了克服些缺点,这出 提多了元步回。
55
多逐逐步回归元求回要方归中程包含所有 因变量对作显用著的自 变量而不包含,作用不显著自变 量的,从建而最优回立归程方
。
65
逐筛选步变量方的:
法57
、1强进入法行(Ente): r强、进入法(E行tne) r预选先定的自变全量进部回入模归型 这是系统默认方式, 2。消、法(去Rmeve)o:、 去法(消emovRe) 据根设定的条剔除部件自分量变
58
。T检验
: = tˆ β判系数定
:2
ˆ − β 2 ( 2 β− β2 ∑)( X− X )= ~ t ( n − )2ˆ σ se( β ˆ 2 )
2
∑(Y − Yˆ = )ES ∑S(Y − ) YSS TRS ∑ (S Y Yˆ− )= 1−= 1 − TS ∑S (Y− Y )2 2
2R =
2
2检验F
:F
=
1
=ESS
SRS += TSSTS
ˆS∑ Y −( Y 2 )(Y− Y ) ∑
2
+
ˆ ∑ (Y
Y−) 2 (Y Y − ) 2∑
K
ˆ) 2( n − K −) ∑ 1(Y Y
− ∑Y( −ˆ Y
)2
5
93、向前引入
(法orwaFr): d向、引入前法(orwFrad) 变自由少量多到个一个引入一归回方程,将 与因量的相变关系数大最的一第个 变自选入方程量并进检行验,果如F 个值变量选入自方程并行进验,如检F果 Fa> ,拒绝0H; 将其余变的中量因与 拒绝H 量的相关变系数大最的第个自变量二选入方 ,程当F>值aF 拒,H绝0 ;如下此 绝H 方程,拒F 去当不断,引新入自的量,变直到不拒能绝 0,H再有变没被量入引止。为60
、4后向剔法除(Bcakard): w向后剔除、(法Bckward) a变自量由多少到个一个一从归 回方程剔中除首先,对,预选先自定变方 中剔除,首程先对预先,选自定 变全量部进行回,归然把后对因量影变响 显不的著自量从变方中剔除程并 行检验,进如F值果
。
16
、5逐引入—步除法剔(tSewpsi)e 、逐步:入引— 除法(Step剔isew )前引向法与向后剔除法入结的合
62。
归回分析假.设.
1.个1,但主是iid要~Nμ(σ, 11),个主但是要iid~ (μN残差
态分正,布且差方为常数
融数金据绝大数会违背多个规律这因此才 发展会A出RCH、AGRCH、因 才此会发展出ARC、GHARH、C GEARC等H型模 EARCG等H模型 这里不加述详,由融市场计量经济金解学 决
3
6一般析的套路
仔分观察数据 细-作 出些一布图散去看一看 关相形的 状行相关分执去寻找析Mutilcloinelriay 来帮助 执行相关分析去t找M寻ltucoliilenarty i你释解数据记 ,我们住假显著的设etBs 是重a要的- 但 是 住记,我们设假著的显eBas 他t只们与另能一我个无们法测量的子联系因在 一
6起4
应用
案:例政财收入元线多性归回数据
《中:国计年统》鉴和改革《放开十 数据: 《中国统计年》鉴七年的中国 地区经济,时限:1》7981995 七~年的中国区地济经 》时限:,918~
T7Y X1 X2X 3X 年4 份政收入 国民财生总产 税收亿(其 收入他社会 业人 (亿元从 )值亿() 元元)( 元) 数亿(万人)
用上述数
建据立元多线性归模型并回行 各进项验检
56
关相与性回归线直局限的
性
关性相与归直线回仅用描来 两变量述之间线性关的系 且,数其受特殊值的影点极 大响。
6
6
外
(推Exratplatoon)预测
以i回直线预归测原解变量所释含围范之的外数 据 x对应的所 值,其准确y多性不半高 以。38~岁孩身童高据数到的回归得直线,测预5 238岁孩童~高身据得数到回的归直线预测25, 成人岁高(预身测值为约8高)必然不呎准。确 岁人身高成( 测值预为8约呎 高 外)预测推需心运用,也小可以发新的展回归 法:方分
段回 样条归回
6归7
使用
均平数用平
均数数(比据如平均煤气月消耗)量 用评均数平数( 据如比平均月煤消气量耗) 估相性时关,其结果往高于往用使平未 的均据(如每日数煤消耗量气所得)关相性 的数据结( 如每日煤消气耗) 量。
果于平均数的基关性就用相个于时往往体过 高平均数数已据部消除了分平未前均数据的离散情 况。
6
8
有联关必未有果因两
变量关程度高,联必表未“示改解变释 两量变联程度高,未关必示“表变量的值,反 应量变值必然跟的改变”。着变 量的值,反应量变值必然跟着改的”
变各每国电视人数目机与均生活平平呈水高度 正关,相电视机数即多目则均平生活平高。但水送 量的大视机电卢旺达未必到能改其善民生人活 水平。 电视较机多的国家通较常裕,富较有的营好养、 水用医疗和等活水生也平高较。
69
因果系关的探
讨隐在藏量控制变,用实下来验讨探释变 解
量
与反变应量的果因关。系不
同剂量的精对老酒鼠温体影响的试验
无实验法情的况,如烟吸否引起是肺癌 、动吸烟被否是起引肺癌、住变电所附近是 否容易起血引等,则需癌要更多研究的 据证来认因果关确系。
7
0香烟的故
吸烟与肺事癌之系关的研,无法进究人行 实验体,因此使用多种方来确法立其果关 系因。相关分析:吸烟与肺
癌关性很高。 研究相一致:在许性多家对国同的不人做所的研 ,都呈究现吸烟与肺相关性癌很。 高高较量和较剂反强的应关:
联每天烟较多吸吸烟历史长或人的肺癌得比例高, 的戒的人风险烟降低
7。
1烟香故的事(续)
怀被的原疑(因case):u在间时上现出超了结前果被 疑的原因(ca怀us)e:在时间出现上超了前结果(effec t: )(ffecet)
死于肺:癌的男人性在吸数烟口人普遍后升上,间时差距 约3的年0死。于肺的癌女性数也人着随烟吸人口增加的增而30 。年于肺死癌的女性人数随也着吸烟人的口增而增加 加时,差间正好也距3是0。 年加时,差间正好也距3是0。 动物实年验结的表明果吸,烟产生焦的的确会油致。癌
这些
证据足以已明其因证果系,关 但其力不效 如一个计设好的良验所实供提的证。
据7
2
主
成分析 Prin分icalp CmponenotAn layssi
7
3案例
:上市司公元多价分评析X1
主业营收 务入 X 6东股权益X2 X 34 X营主润 利利总额润税后利润 X7 8XX 9X5 总产 X1资0
投资益 每股收收 每益权股 投资益益收率
合评综价分析时有还重评比分法熵值法、合 综序法数等 案本例以主成份分例,结析合子因旋分析转7
4
因子分 析Fcatora alnsys
i7
5
相
性分关 C析rorseonpendceAnalysis
76
聚
类分析Clus ter Aalyniss
7
7判别分析
disrimicnatna nlysas
i78
案
四:中例企业小破产型模X
12X总负债率 收益 指性标(现金收益 /纯收入(/财 (现总金益收 (/纯收入/产 总负债)) 3 X4X 期短支付能 生力效率性指 (流产资动产/ (标动流资产 (流/资产/动 标流(资动/ 产动负债流 纯)售额)
17个破销产业企1(类和2)个1正 运行常企(业2)类进行查调的结果 题问:八家企业需要别!判79
广义
别分析判 Gnerela discrmiinatna alysins
80
什么为用广义判要别分?析广义
别分判析块(G模DA)所之成为以广义判别分析 ,因为它是在别判析的问分题使中 了广义线性用模型(LG)的方M。法传 统判别分析的往往适合于对属因变性和量连续 预测型变建量立性线判别函。数在 广义别分判中析,别判析问分重新题改修 为一广种多元线性模义,这型因变量里组常通 (是哑)码编量,向可反映以每个样的组关系。 品案例波:顿房价士Price:。房;预价变量为 测Ctsa和1另个2定变量序。
81
分类树 Cla
ssficiatin oTeer
8
为2什么提出实际问
题:根据已知息信确事定分组物 判别、聚类也等决解一问题,这但对数 据有要都 求类分树技术对数据具无分体布要 分类求树就通过是某一条件筛将样选本不断 的为分部分,两至直根据定一准则找到 的最分佳为止类 常用术技:HCID,CA45,C5.0 .:例上同例83
多维度分标 Mu析ltiidensiomnalScal ngi
84
可靠性
与项目析分R liabieilyta d Inem tnalyAss
i85
SEM用案例:应 SE应M案例用 :某险保公司客满户意度研
整体形究象经
营工 作管理 围氛
社会 象
形0.5 5321
企业
文化
信
80诚.0 公0司形象
01 .55 66
对
司 重公选 有信心新择公司
继续 工作
福 利 空间
受视 程度重 薪酬 发 展
工
期作
75.00
望.60677
-2 .00 3601
018339
.376 05.5
诚忠8 063.0
1.58440.6
758
77.
7
4意度满
1.71
2265 920 .
6管 理制 度酬薪支 业 务持
作感受
7工
6.55 抱3怨
总体满 意培训
相
对其他司公 意度满
会社形 象工 作成发 展 就 感空间
工
作 氛围
抱
怨
沟通
解
86决
后 最inFla thouhgst..…
87
多元计分析统能不代替 .….
的简好 报的好研方案究设计 的好作执行运质量控和 制和你的你研究组清晰小思的路 更好的理你解通人普非目标(究研人如市员场 研究或员金研究融人员如)思考何和识认你所究研的 目标但 是多元计统析是分一种常重非的要究研方法, 你会将在工作接触中和用使它
8
8最后最后的 :多角视看问!题重视数据 源!
8来
为什么多角度? --9意隐注藏的变量表
面的资料不定可一 比信两个品较满意度
牌90
税收的案
91
例据数来的源要重
性专栏家安‧兰作德斯(An nL ndersa)以 “果如可以 新再重來你是否还要,子”調查其读者孩的 見,得到意一了令人瞩目个结论的:
7 %的0父认为母有小不孩得。值
另一个究给研有父母提所供了样的同会,机作了同 的样查,调果显结:示
19%的母父认有为小很孩值得
9。2
数
据来的源要性重续)
Ms(.L adern的s者多读是不喜欢数为人 父母的人,调查果结自然所偏有。颇 络网查调街头、截访拦也存问在同样 问的题
93
回顾
一:下量化究研流程业务
理 解据采集与数备 准建模 应用评 数估
仓库据
知 发识 现据 数掘挖
商务 能智
活
动
采集
据数
处 理
信息
识
应 用知
决策
数据理价管值
链94
量
化究研法论:方数据到由信
模式息
5
99
6