最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

【PPT】孙鲲鹏:从诸葛亮“草船借箭”看大数据“数据建模”

[复制链接]
跳转到指定楼层
楼主
发表于 2015-12-17 11:22:33 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2015-12-17 11:42 编辑

本文为168大数据特约大数据专家孙鲲鹏的供稿,其他机构未经允许禁止转载!

鲁迅评价诸葛亮“多智而近妖”,此话见诸《中国小说史略》,意思说诸葛亮足智多谋,像个妖怪。
而如今,从大数据的角度看,诸葛亮的足智多谋是因为他掌握了数据建模的办法。
今天,我们就来说说这诸葛先生的“数据建模”之道。
建模里的“模”是指模型。使材料成为一定形状的工具,就属于“模型”,这些模型看得见摸得着,叫做“具象模型”。但是也有些模型看不见摸不着,属于“抽象模型”,数据模型就是这其中一类。
“数据建模”是对杂乱无序的数据进行处理,筛选出有价值的数据结果的过程,其关键步骤有两个:一是逻辑建模;二是物理建模。
我们以诸葛亮的“草船借箭”为例,讲讲如何“数据建模”。
数据建模的方向、用途
《三国演义》第四十六回讲到,周瑜问孔明:“即日将与曹军交战,水路交兵,当以何兵器为先?”
孔明曰:“大江之上,以弓箭为先。”
瑜曰:“但今军中正缺箭用,敢烦先生监造十万支箭,以为应敌之具。此系公事,先生幸勿推却。”
孔明曰:“都督见委,自当效劳。”
为什么要借箭?因为诸葛亮答应周瑜造十万支箭来攻打曹操。这说的是数据建模的方向和用途。
数据源收集
孔明曰:“为将而不通天文,不识地利,不知奇门,不晓阴阳,不看阵图,不明兵势,是庸才也。”
可见,全方位的信息收集和积累多么的重要。
而这个过程,在数据建模中叫做数据源收集。
逻辑梳理
数据收集上来之后,诸葛亮通过梳理得出如下结论:
1,“今日有大雾”,这是说天气;
2,“吾料曹操于重雾中必不敢出”,这是说曹操的心理特点;
3,“子敬只得就我”,这是说鲁肃的权利;
这都需要对数据源有充分的认知和理解,在数据建模中,这个过程叫做逻辑梳理
这一过程虽然十分抽象,但它能帮助我们确定方案。
接着,诸葛亮对鲁肃说:“望子敬借我二十只船,每船要军士三十人,船上皆用青布为幔,各束草千余个,分布两边。”这就是草船借箭的方案。
到这里,逻辑建模就完成了。
判断标准
接下来,是把逻辑建模转化为物理建模。针对梳理好的逻辑:
1,雾有多浓才能不暴露目标?“是夜大雾漫天,长江之中,雾气更甚,对面不相见。”
2,曹操多疑才会按兵不动?“重雾迷江,彼军忽至”。
3,鲁肃能调来多少船只和人?“却说鲁肃私自拨轻快船二十只,各船三十余人。”
这都是条件级别;而它们在建模中各占多大比重,叫做权重设置。二者统称为“判断标准”。它是数据量化的过程,也是物理建模的第一步。
校验模型
诸葛亮乘船擂鼓呐喊,军士慌忙飞报曹操。
曹操说:“可拨水军弓弩手乱箭射之。”差人火速到江边助射。
曹操果然被诸葛亮料到不敢出帐,只是射箭防御,这在数据建模中叫做“校验模型”。
模型试点、模型确定
接下来,就是重点了。
“二十只船,用长索相连,径望北岸进发。当夜五更时候,船已近曹操水寨。孔明教把船只头西尾东,一带摆开,就船上擂鼓呐喊。少顷,旱寨内弓弩手亦到,约一万余人,尽皆向江中放箭:箭如雨发”。
先让船只一面受箭,这是“模型试点”;
万箭齐发,这说明试点成功,由此模型确定,可以进行输出和实际应用了;
“孔明教把船吊回,头东尾西,逼近水寨受箭,一面擂鼓呐喊。待至日高雾散,孔明令收船急回。
最后,“草船借箭”成功了,“鲁肃人见周瑜,备说孔明取箭之事。瑜大惊,慨然叹曰:‘孔明神机妙算,吾不如也!’”这么看来孔明的神机妙算还真是数据建模的成果!
实际上,数据建模的类型是多种多样的,比如:从算法上看,它包括定向逻辑算法和非定向逻辑算法;另外,非定向逻辑算法中还包含聚类和决策树等模型。上面讲的例子就属于定向逻辑算法中的打分算法啦。
海尔SCRM数据建模
海尔有一个会员俱乐部,叫梦享+。用户注册梦享+会员后,会产生很多数据,数据存放的平台叫SCRM:社交化客户关系管理平台。现在,SCRM数据平台里面已经存放着1.2亿海尔老用户数据。
这1.2亿海尔老用户,最近购买了什么家电、打了几次售后电话、到海尔网站浏览了哪些海尔产品、在哪个产品页面停留了几分钟、离开海尔官网后去了哪个外部网站看了哪个页面内容、打开海尔会员邮件点击了哪个版块、在微博上议论了哪些家电信息……用户的每一个行为,都变成数据动态进入了SCRM平台。
其实,用户每一个行为背后,都代表一个新需求,比如说:
近期购买了油烟机、燃气灶,说明在装修,可能成套购买家电;
打售后电话申请空调移机,说明在搬家,可能对家电更新换代;
到海尔官网浏览洗衣机,在一款洗衣机图片上停留超过30秒,可能想买这款洗衣机……
上面这一条一条数据分析逻辑,叫做商业逻辑。根据很多条这样的逻辑,就可以建立一个“需求预测数据模型”。将模型中的每条逻辑赋予一个权重分数,就可以算出每个用户是否可能要购买海尔产品、可能要买哪一类产品,还能算出用户的“需求”到底是“几分”。
就这样,SCRM大数据平台与海尔全流程12个数据系统通过数据接口进行数据采集、融合、识别、聚类、建模,将1.2亿线下实名数据与7.8亿线上匿名数据进行动态匹配管理。
用数据,还得有新办法。海尔SCRM-DMP数据管理平台与DSP需求方平台、SSP供应方平台对接,通过PMP私有交易、RTB实时竞价、CT协同定向等程序化购买手段,一对一大规模精准触达目标受众,开展数字化精准营销。
除了为产品找用户,更重要的是为用户找产品。海尔SCRM大数据平台支持海尔互联工厂,从大规模制造转型为大规模定制,为用户提供个性化方案,满足最佳体验。


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏1 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-6 06:25

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表