最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

滴滴敏捷数据中台实践

[复制链接]
跳转到指定楼层
楼主
发表于 2020-3-18 11:19:31 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2020-3-18 11:22 编辑

作者:滴滴首席工程师张茂森
场景描述:滴滴每天处理交通大数据超过4800TB,日均车辆定位数据超过150亿,每日处理路径规划请求400亿次,数据覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度。滴滴目前对15分钟后供需预测的准确度已经达到了85% 。
关键词:滴滴 数据中台

滴滴每天处理交通大数据超过4800TB,日均车辆定位数据超过150亿,每日处理路径规划请求400亿次,数据覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度。滴滴目前对15分钟后供需预测的准确度已经达到了85% 。
滴滴数据中台发展
业务发展驱动数据进化
滴滴数据中台建设围绕四个方面进行:
  • 业务信息化
  • 信息数据化
  • 数据资产化
  • 资产变现化
并且解决不同的问题。

中台数据体系建设的核心难点
产品方面:多场景,全链路的复杂需求
业务方面多团队,多目标的协作需求

滴滴精益数据管理体系
滴滴的数据中台从底向上构建了包括数据基础建设,敏捷数据资产,数据治理,数据交付体系。

两年来的建设成果:
  • 数据基础设施+系统工具链:开始对外输出
  • 数据文化 150+次改进复盘,周活1700到5000+
  • 敏捷数据治理 DataRank资产分从40到70
  • 精益数据生产D0级事故从非例行任务从10+降为1
  • DataGraph智能数据目录20%员工高频使用
  • 价值交付 NPS从19%到60%
滴滴数据系统构成
数据架构:

滴滴的数据架构体系包含了当前大数据领域主流的技术:
离线部分以hadoop和Hive为主,实时计算部分Flink,Spark
OLAP领域使用了Hbase、Presto和Clickhouse。
智能数据目录
  • 统一的元数据检索能力,
  • 支持Hive、 报表等多种数据实体的统一搜索
  • 基于数据价值或热度的综合排序
  • 业务驱动的数据图谱
  • 众包协作的知识沉淀


精益数据生产
  • 数据基础质量
  • 稳定性建设
  • 数据上下游联动(全链路 SLA)
  • 埋点管理
  • 数据采集
  • 运维/质量监控
  • 90%复盘率
建立数据委员会,推进业务-运维-数据的 协同机制 一键埋点,用户行为轨迹全记录 数据采集秒级同步,准确性99.999% 数据链路全监控,自动定位关键节点。
如何定位需要的数据
  • 指标口径管理(数据字典)
  • 元数据(数据地图+OneSearch)
  • 资产价值评估体系(DataRank)
  • 数据开放
  • 数据安全规范
指标口径变动100%管控 所有元数据信息一键快速查询 精准评估每一张表的数据影响和价值 数据开放率99.04% 隐私数据全脱敏,完备的权限管控机制, 数据泄露0事故。
更快更简单的使用数据
  • 精细化建设
  • 分级保障
  • 数据图谱与数据中间层
  • 成本优化
  • 数据价值量化
核心数据5点产出(业内普遍7-8点),开发效率提升35% ,指导数据优化方向
标准化数据服务

实时数据集成服务
  • 采集集群总规模约300+
  • 数据源约4500+个
  • Agent 数量27000个
  • 峰值摄入数据条数2900w/s
  • 日均查询2千万次
  • 平均响应时间<1S
  • 稳定性99.996%


本文分享自微信公众号 - 大数据技术与架构(import_bigdata)


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-5 22:34

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表