大数据的商业模式(华为 符海芳)
大数据的商业模式
华为中央研究院 符海芳
2013.10
大数据产业链
服务提供者
服务提供者:
三种角色的商业模式
“数据+服务” 是未来利益最大的商业模式
2013年Q3全球IT企业市值排行
Google:大数据最成功的玩家,最大化重复使用数据
大数据技术是核心引擎
索引整个互联网! Google 存储了 >100 PB 数据,>1T URLs索引
“人”的互联网化 数据拼图+智能服务
“人”的生存数字化 数据拼图+智能服务
大数据对传统产业的颠覆影响是什么?
•制造汽车、卖汽车 •汽车售后服务
•汽车使用者源源不断的生产数据
•采集“车”的周边信息
GE:domain 知识+数据分析+服务
•采集全数据的工业设备:
•下一代GEnX引擎,保留每次飞行的所有基础数据,实时传输回GE分析。1台引擎1年产生的数据量 > GE航空业务历史上所有的数据;
•设备涉及:能源、医疗、照明和家电、交通运输等
•大数据分析软件和平台:
•加州San Ramon软件中心,400+名工程师开发数字分析工具,分析机器产生的PB级大数据
•2013年6月,基于Hadoop的第1个大数据与分析平台,支持工业互联网并把大数据转化为实时信息,包括航空、医疗、能源生产与分配、交通运输及制造业。
•24 个工业互联网产品,收入达2.9亿美元,订单4亿美元。
•设备运维服务:
•亚特兰大GE能源监测和诊断(M&D)中心,收集全球50多个国家1000+燃气轮机的数据,每天收集10千兆字节的数据。可在线存储10年数据,每天连续运行100+个不同的数据算法;
IBM:行业专家+软硬一体+智慧商务
•强大行业专家和数据家资源:9个全球大数据分析解决方案中心,近9000名顾问和400名数学家,涉及石油勘探、医疗健康、零售、智慧城市等多个领域;
•大数据分析+ Watson智慧商务:13年5月发布Watson Engagement Advisor;在保险,金融,和市场调研领域发挥作用;Watson 版智能手机““Ask Watson””正在研发中;
•收购大举措:2005年起,160+亿美元收购35家与大数据和
分析相关的企业;2012年5/11笔涉及数据分析业务,2笔涉及云计算业务。2015年前支出145亿美元收购,主要涉及软件和解决方案能力;
•未来五年,销售技术和提供技术服务-》围绕智慧的分析洞察的端到端解决方案。
•2015年, “大数据”技术收入,200亿美元。
Inrix:交通信息领域的Google”
Inrix的交通信息服务平台
✓数据的搜集者与运营者 ✓典型的企业市场B2B模式
✓覆盖北美和欧洲,长度足以绕地球64圈 ✓近1亿台来自车辆的传感器
✓实时搜集用户在哪里去哪里的信息 ✓典型的大数据分析处理技术 ✓提供路线指引和行驶时间估计
车辆信息的聚合运营平台 + 大数据分析技术 + 良性循环的B2B模式
Inrix的交通大数据打破区域,面向全球
Inrix的交通信息覆盖范围非常广,北美100万英里的公路和欧洲28个国家100万公里,长度足以环绕地球64圈
●
●
●
●
车和人: ☐近一亿台车辆和设备来收集实时数据资源,一亿用户即传感器。规模的出租
车、运输车、卡车等资源,收集每个用户实时信息,包括现时在哪里,准备要到哪里去,行进速度如何等等,数据分析组合后再向用户提供实时的路况信息,包括理想的交通路线指引、行驶时间预计、路况提醒以及其他实时的应用等等。 路: ☐公路上的数十万个接受器,每小时收集数百万条数据,如汽车的行驶速度、
汽车加速或减速等。 停车场: ☐北美1.8万个停车场及欧洲4.2万个停车场的信息,为 ParkMe 和
Parkopedia 提供服务 隐性交通信息因素: ☐日历、季节、节假日、当前和未来天气数据、交通事故以及道路建设情况,
甚至还有学校活动、运动会、音乐会等信息,
DataSift 收集数据+整理分析+广告 ●社交数据公司:帮助开发者和第三方获取、汇总和分析来自于Twitter、YouTube 、Facebook 、WordPress、Klout等社交网络的数十亿访问数据,帮助品牌公司掌握突发新闻的舆论点,制定有针对性的营销方案。 融资总额达到3000万美元。
☐客户:品牌公司、传统企业、金融市场、新闻机构等
Twitter合作:购买Twitter多年的数据同步授权,访问所有Twitter管道数据,将子集卖给第三方,主要是企业客户。目前只有Gnip获得了同样的授权;DataSift是Twitter在广告上的主要合作伙伴之一;Twitter每两天半产生10亿条推文,即每天4亿多条,每秒钟近5000条推文,相当于每天需要处理2TB新数据;
Tumblr合作:数据流水,包括实时数据和历史数据;以帮助DataSift进行消费者参与度分析。与Tumblr共享收入; ●合作获得数据:数据合作+广告合作+分成 ☐☐
☐Bit.ly合作:帮助开发者了解人们所分享的内容和数目,清晰地看到哪些内容获得点击。DataSift每次售出一条Feed,Bit.ly将能够从中获得分成;
Datasift分析Twitter数据的流程和方法 Datasift大数据平台会对每
一条推文进行分析并推
送给客户:
●然后Datasift进一步分析数据,又为每条推文增加34类数据: ●●Klout:用户的Klout得分,推文涉及话题的Klout得分 Twitter Trend:实时的趋势话题;推文与话题匹配时,会被标上相应的话题标签。 更容易进一步分析趋势按照结构分为77个领域
(用户名、ID、描述、
位置、时区、粉丝数、
关注数等)
●●情绪(Sentiment):基于Lexlytics提供的高级文本分析软件,判断推文的正面或者负面情绪。识别重大话题并打分。 话题分析:对推文内容进行高级分类,如时尚、科技或
金融。
实体抽取(Entity Extraction):使用自然语言处理和模型的“熟”数据,非原始数据 推文包含链接(约20%的推文有链接),抓取●完整的链接网址(需要
把t.co,bitl.ly等短网
址还原),给页面加上
标题。 ●技术识别退文中提及的人物、地点、产品或企业,以及用户对它们的态度。
● 人口统计:用户被标记为男性或女性(或未知)
Thank you www.huawei.com