[技术分享]大众点评数据平台架构变迁

12-17

1.3 数据应用：

1. 报表数据以邮件的形式发送给用户

2. 用户可以使用自定义sql 的web 查询工具主动查询数据

2.0(2013.04)

2.1 数据：

1. 有了明确的模型分层：

ODS:存放从原系统采集来的原始数据

DW:保存经过清洗，转换和重新组织的历史数据，数据将保留较长时间, 满足系统最细粒度的查询需要

DM: 数据集市。基于部门或某一特定分析主题需要

RPT:直接面向用户的报表

2. 形成了流量、团购、信息三大基础模型及构建于三大基础模型之上的数据集市

3. 基于volocity 开发了canaan 计算框架。

4. 开发了一些自定义的UDF

2.2 架构：

1. 存储和计算都基于HIVE

2. GREENPLUM作为HIVE 的“cache”存在，供用户做一些小数据的快查询，报表存储。

3. 调度：和

canaan 框架进行整合，支持用户快速新增任务，并自动导入任务依赖。

4. 主数据：保存了数据仓库元数据信息，供用户查询和系统内部各个模块交互。

5. ACL：构建了数据仓库数据访问权限控制，包括用户权限申请、审批者审批、数据赋权等。

6. 传输：

参考阿里DataX 的设计，实现了点评的异构数据离线传输工具wormhole

可视化界面，用户通过界面操作，方便的将数据导入导出数据

和调度、主数据等系统打通

7. 监控：由于任务数量增长较快(2000+)，运维已经是个问题此外，因此，我们花了较大精力做了可视化的工作：

2.3 数据应用

1. 运营工具：用户自定义

SQL ，存储基于HIVE

2. 指标(KPI)：用户自定义SQL ，计算基于HIVE ，结果放到GREENPLUM 中，用户可以根据指标通过时间拼接成报表

3. HIVE WEB：非常便捷的HIVE WEB工具，可用性可以甩hive 原生的web 界面HWI 几条街了3.0(2013.12)

3.1 数据：

1. 有了明确的上层数据集市，各层数据集市打通，例如团购数据和流量数据打通

2. 形成了用户集市、商户集市两大主题

3. 和算法团队合作建设推荐系统

4. 提供框架和工具支持，引入外部数据开发者

3.2 架构：

1. 引入mysql 、hbase ，支持线上服务

2. 数据访问接口支持：API 、Query Engine、RPC Service

3. 引入shark 支持临时查询，出于稳定性考虑，牺牲性能，shark/spark集群和hadoop/hive集群物理隔离

4. 数据质量：用户指定以条件，对计算结果做检查

3.3 数据产品：

支持DashBoard

4.0(2014.12)

4.1 数据：

1. 持续扩充/完善数据模型

2. 数据规范化，主要包括：APP 日志、渠道

3. 完善数据开发平台，其他部门数据开发者100+

4.2 架构：

1. 建设Redis Cluster，支持实时推荐、用户画像等服务

2. Hadoop升级到YARN

3. 引入Storm 支持实时计算

4. 推出类Kafka 的分布式消息系统，结合日志框架，支持日志数据的快速/低成本接入

建设元数据中心

与《[技术分享]大众点评数据平台架构变迁》相关的范文

10-29 商务网站项目策划书

商务网站项目策划书 yIXININFoRmATIoNBUSINESSco,.LTD wIRAN No：210105w04 December18,20xx ★ PleaseProtectthecopy’scopyrightforAllReserve★ wESTRAGE.com商务网站项目策划书正文摘要从新经济背景、区域经济特点、网络经济与信息服务市场现状、模型分析等分析证明，实施本项目， ...

03-10 2014年高中教师新课程培训工作实施方案

　　一、培训目标　　20XX年暑期普通高中新课程全员培训，通过远程研修与校本培训相结合的模式，在学科课程专家和指导教师引领下，以教师为主体开展学科教学案例分析和问题研讨，帮助广大教师整体把握、准确理解课程标准和有效实施高中新课程，促进我省高中课程改革向纵深发展。　　二、培训对象与条件　　培训对象为全省普通高中学科教师，以学校为单位集体组织报名，全员培训，原则上不得缺额。根据《山东省普通中小学 ...

10-08 市物联网产业十二五发展规划

市物联网产业十二五发展规划按照市委、市政府关于“加快新兴产业发展，培育新的经济增长点”战略部署，为加快培育和发展我市物联网产业，特制定本规划。一、发展现状（一）国内外物联网产业发展态势。随着现代通信技术、计算机信息技术和传感技术的广泛应用，物联网相关产业得到了快速发展。国际电信联盟在20XX年度的互联网报告中，首先提出“物联网”概念并预言“无所不在的物联网通信时代即将到来”。美国把“宽带网 ...

11-03 新公司心得体会-变革进行时

新公司心得体会-变革进行时时光真快，转眼间偶加入公司3个月啦！经过很多努力、与高层沟通。反观加入公司3个月来，管理改善及提升氛围在时下是当春二三月，学习与流程执行在公司中高层如轻风微微的吹拂着“阳光”大地。20XX年真是给力的一年，让我看到一点点改变的希望！！当时偶还在前一公司，当时老总让我做总助的期间，偶当时没有答应，老总要求再考虑考虑。在此期间在一顾问朋友及前同事的推荐电话中，经过多方面了 ...

01-07 思科数据中心3.0解决方案

思科数据中心3.0解决方案　数据中心一直是重要的企业资产，也是IT用以保护、优化和发展业务的战略性重点机构，但如果您的数据中心出现了服务器、存储资源使用率低下，能源和人员成本占数据中心总运行成本的25%-30%，在IT预算中，70%花费都在维护方面，而不是使企业更具竞争力，这是当前cIo最需要迫切解决的问题。　　数据中心转型的需要　　当今的许多企业都在努力解决数十年来无计划发展的遗留问题，面对大 ...

11-30 高二历史研究性学习和总结

高二历史研究性学习和总结一、计划课题一：观看“古典与唯美”画展，写出自己的心得体会感想研究时间：20XX年12月至20XX年1月21日指导老师：曾素珍、许缨步骤进度学生活动教师指导目的 1 20XX年12月30日至20XX年1月12日参观“古典与唯美”画展 1、推荐参观二沙岛广东美术馆“古典与唯美”画展（20xx、11-20xx、2） 2、指导学生学习相关课文“19世纪以来的世 ...

11-23 广告毕业实习报告

　　实习单位介绍：　　世通华纳移动电视传媒集团有限公司（沈阳分公司）　　20XX年1月，世通华纳移动电视传媒集团有限公司正式成立，是中国领先的移动电视传媒集团.集团下设移动电视技术有限公司,移动电视节目制作公司和移动电视广告公司三大核心部门,通过在城市公交车、高级写字楼、商住楼等场所安装数字电视播出终端，构建中国城市新型的视听媒体——数字移动电视. 　　作为中国最大的移动电视运营商，世通华纳专 ...

01-25 "xx女性"我们价值观体系构建行动方案

“xx女性”我们价值观体系构建行动方案女性价值风貌折射整个城市的精神品格，展现时代的亮丽风景。在当前社会结构大变革、多元文化大冲撞的时代背景下，挖掘女性生活内涵，探讨女性角色地位、提炼女性精神价值，树立女性发展标杆，全面引领、推进女性核心价值观体系建设，具有重大的时代价值和现实意义。以“xx女性”为对象，通过开展价值观大讨论，梳理典型形象，构建精神文化实践载体，推进女性自我发展和自我完善，走社会 ...

11-14 综合管理部负责人竞岗报告

综合管理部负责人竞岗报告尊敬的各位领导，同事们，大家早上好。首先，我非常感谢公司提供给我的工作成长平台以及这次的竞聘机会。今天我上来竞选的是综合管理部的部门经理职位。在开始竞聘演讲之前，请允许我做一个简单的自我介绍。20XX年7月1日，我正式加入广东大中商品电子商务有限公司这个大家庭。在工作中，我从一名业务员做起，虚心向其他同事学习和请教，20XX年10月在业务部综合考核中排名第4名，并顺利 ...

02-04 移动通信公司工会创建职工之家工作纪实

创新工作模式拓展工会职能 -记全国国防邮电系统“模范职工之家”ＡＡ移动通信有限责任公司XX分公司工会 为构建和谐企业环境，近年来，ＡＡ移动通信有限责任公司珠XX分公司工会认真贯彻落实省公司工会和公司的各项方针政策，发挥工会优势，提高员工满意度，增强员工凝聚力。在公司领导和全体员工的支持下，公司工会工作不断取得佳绩，20XX年12月，被全国国防邮电系统授予“模范职工之家”称号。固本强基健全工会组 ...

随机推荐

猜你喜欢

[技术分享]大众点评数据平台架构变迁

·议初三政治总复习命题思路:精选材料精妙命题

·学习吴大观心得体会(医护人员)

·县志办第一季度工作总结

·民调工作制度

·期中考试小结班会

·清华大学生毕业留言

·甲鱼的宰杀方法,居家好男人必备

·如何做好办公室主任

·站立式起跑教学设计

·人教版四年级数学上册面积单元

·理事长在2014年全县农村信用社工作会议上的讲话

·骨干教师培训班数学第二阶段培训方案

·关爱儿童主题联谊活动方案

·房屋置换合同

·我在西南联大读书

·精装修管理

·建筑.装修企业资质等级标准

·春节团圆作文400字

·小木偶的故事教案

·生产运作论文