最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

2015数据分析师峰会之刘琳珂:数据可视化无所不在

[复制链接]
跳转到指定楼层
楼主
发表于 2015-9-13 14:45:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
刘琳珂

Tableau 大中国区首席顾问
       主要讲两个部分:第一部分我会介绍一下我所在的Tableau公司,和我们在不同的客户场景下做的可视化的情况的分享。第二部分我会使用BIM的数据来看一下,用我们产品做可视化数据分析大概的样子。我的题目是“数据可视化无处不在”,后面我也会接着谈到。右下角是我们的官方微信,大家有兴趣的话可以关注。我本身是大众化区的首席顾问,我们这家公司是2003年的时候创建,是专门做可视化数据分析的。我们三位创始人基本上都跟斯坦福有渊源,这位是负责可视化课程相关的教授,中间的是他的博士后是是我们的首席研发管,最左边的是我们的CEO,斯坦福MBA。
        在相关行业里面,唯一比较有特点的是我们最右边的创始人,他本人是这个行业里面少数亲手拿过奥斯卡金蛋奖的,像在阿凡达、魔戒当中获奖。我们本身做的事情是让企业数据分析的文本能够使用我们的工具,用可视化的方法去查看、理解。本身来讲我们的工具并不仅是面对数据科学家和数据分析人员,还会面向企业里那些看分析成果的普通拥护和各个管理职能岗位上的领导。我们的客户基本上遍布在各个行业,比如说沃尔玛、谷歌、易贝都是我们相当大的客户,国内的话像东方航空。我们在不同的客户领域来讲,通过可视化的数据分析方式来帮助它解决同质业务的客户,我们第一个拿出来放在本次大会的网站上,在我们公司介绍的链接上也有,大家有兴趣的可以看到。这是在推特上跟我们Tableau有关的,Tableau自己的和我们一些热点有关的专家和核心用户们,他们所组成的这样一个推特的发帖、转发这样的热点网络关系。
        刚才沈老师展现了多个用地图可视化分析的场景了,我就不说太详细了。比如说这是展现的海底光缆铺设的进程,几十年前铺设海底光缆到现在,你可以看到在这个过程中,1989年开始一直到现在,整个时间线不断进展,海底光缆从无到有的过程,这个是结合了数据线图和地图的可视化效果。下面这个可视化效果,相信多数人都不知道它是什么东西。前一段有个话题炒得很火热,发现了另外一颗行星类似地球的,这个是从泰普勒网站上下载的数据,它是找到几千个行星侯选的,可能适合生存的行星。那为什么看这个样子特别奇怪呢?右下角有一张小图,这是泰普勒天文望远镜CCD组成的情况,上面拍摄的是泰普勒持续坚持几周时间所搜集的数据和监测的结果。这上面的颜色,少量黄色的是可能的值得去筛选的行星,其他的是不太可能的。
       这是分析和数据的情况,这是Tableau大师级用户做的,他们是一家人,大概七、八代,100多口人家族的血缘数。如果你有类似的应用需求的话,其实也可以这样做。比如说这个人是谁?他整个家族,父亲、母亲两边各自有哪些,一层一层,一级一级从什么时候繁衍下来的。下面可视化的分享是很有趣的,它本身可以看到是在海上,在海洋边上。这个可视化效果的分享者是一位海洋生物学家,本身他不太懂什么可视化统计、数学这类的东西。但是他本身研究的东西,是在海洋馆里看到的那种,长着大翅膀的跟鲨鱼是近亲的鲎,他会在海洋生物身上绑上GPS定位器等等,去研究这些动物。他因为不懂数学、统计什么的,他就会把数据发到他们小组雇佣的可视化专家这边,让他们做。那他发现了Tableau这个工具比较好用,他自己就学了学,他自己用这个工具把可视化效果做出来了,不用再找之前小组里的可视化科学家来做这个工作了。


10
   
        刘琳珂:下面这个地图,刚才沈老师有看过北京公交线路的,我这是北京出租车的,在08年一个星期的时间,北京一千辆出租车行驶的轨迹,我就不播放了。
       后面的例子是我们应用在航空公司领域的,用来分析它的舱位的分布。这是欧洲我的同事做的对于A380的分析,你可以选是A380的上层,A380的下层。比如这个航班或者最近这十个航班乘坐A380的客户,这个航空公司的金卡客户喜欢挑什么样的座位?有很多客户比如说是素食者,或者对饮食有特殊要求,他们大概习惯分布在什么样的位置,以及平均多长时间内对特殊餐要求是多少,进而做成本分析,这些都可以结合位置可视化里做。
        这是一个在能源行业的客户在美国,它之前做了收入、成本的报表,但是这些东西不是特别的直观,所以他找到了我们Tableau的一家合作伙伴在美国的,在用Tableau做改造。所以他后来选了三K图,通过这个用可视化效果变成了由非可视化变成可视化结果。这样可以看到对这家公司来讲,这些收入有哪些大专院校业务组成呢,这个也可以做多级的,这个是直观的,很明显的看到这家公司主营业务是什么。
        后面一个其实跟刚才讲的有类似,我特意把它放上来,因为今天也是一个大会的形式,这个分析的是去年我们Tableau在西雅图的用户大会的时候,来参加大会的用户们到底喜欢听什么样的讲座这样的一个可视化分析。这个例子里,首先左边能够选的是客户的类别,这个客户是什么行业的等等都可以选择。这上面和下面分别是我们设了大概有二三十个不同的展厅,里头有不同的主题在讲。到底哪些主题的展厅是人去的多的,是通过这个位置图来去看的。下面的话是到底为了听这些讲座,这些人,比如说咱们你需要走多远,这儿有一个路线的分布,你可以选一下,看看是哪一类的来的听众,他们更愿意走更远的距离来去听到这些讲座,可能这些用户或听众是对你的业务或者你的产品更加关心的。像我们做的这个分析里头,当时这个部分是工程师走路走的最多的,听完这场听下一场。
        分享部分看一个实际案例,这是一个相当有意义的例子,这是用在西非的埃博拉防御体系上,我们知道西非的防御措施非常薄弱的,根据这个部分来讲,我们有一个在公有云上的网站,在这上面有一些非盈利组织利用我们的Tableau公有云来做它的业务的运营。比如这个例子,它们本身利用我们的平台来去分享它们对于西非的这个地方的病床,医疗资源,它的通信资源,它的病人等等这样的专题的分析。这个例子是选择了病床有多少,以及能够分享到多少埃博拉的病人,它做了很多,有网络资源,基站资源的发布,像发现了病人能不能做远程医疗等等这样的事情。
        下面一个部分,我就给大家看一个我准备好的一个数据。这份数据是我昨天找了一下,以这个地方附近,大概海淀的西北角附近,我在网上搜了一千家饭馆,它的点评的信息,均价的信息等等。我这个例子的数据是这样的,首先我们可以看一下,如果现在这一千多家饭馆按照地段还是按照菜系哪些餐馆最受欢迎。这很简单,我只需要看我的数据,我的数据是有点评数的,点评多的这个就受欢迎一点。这个是一千多家饭馆总的点评数。按照地段来说,按照排序可能更好一点。现在排序来看,周围的这一千家饭馆点评最高的是韩国饭馆。它大概有多少呢?我可以让这个数字显示一下,韩国的饭馆点评合计大概超过14万。这些饭馆当中如果是按价格来看,到底哪些便宜,哪些贵呢?我可以用颜色做可视化差异,我可以把均价的参数拖上去,用颜色来去看一下。你现在可以现在可以看到,这个颜色约发红的越贵,反之够越便宜。这是我们知道的概况的情况。
       然后我们看一下按照店来看,哪些店是这一千家当中最欢迎的呢?比如说我能看到这有一千家店,我现在想看的还是点评数。比如我现在想看它们哪个受欢迎。像我用可视化的方式我做好了,同时把点评数放到颜色上去,我就得到了用大小和颜色可视化差异的这么一个图。可以明显看到上面有三个点是比较突出的,这个来讲我设的也是颜色越发蓝,它的点评数越高,反之就越少。这个现在看起来像人的脸一样,两个圆的像眼睛一样的,就是海底捞和汉拿山。
        这些地方按照地理位置的分布会是怎样的呢?我们看一下,我们看一下它们地段处在什么样的地理位置上。这是海淀,在北京的西北角附近,现在上面有十几个不同的地段,包括了我们现在所在的。比如我可以让地段的名字直接显示在上面。这上面比如说我们现在在的远大路附近,我们一样也可以看一看,比方说我们现在看一下,这些地段的饭馆哪些地方去的人多,还是用点评数好了,我可以让它用大小来做可视化差异。你可以看到现在上面的点大小发生变化。同时我可以看一下价格,跟我们刚才看到的类似,我把价格拖到颜色上去。
        为了标识得清楚一些,后面有一些不看了。我们可以看到这是五道口和中关村,这边饭店总量最多。从价格来讲,在颐和园附近的均价,比其他地方都要高一些。如果按照详细餐馆的位置也很简单,我们可以看一下这是按照一千多家饭馆的位置,他们在地图上的样子是这样。现在可以吧口味的指标放在颜色上,你可以看到它的颜色发生了变化,它的口味点评的分数越高就越蓝,反之越红。我任意看一个,如果我想大概知道一下我们所处的远大路地段上面的这些饭馆大概商圈的范围有多大,这也是很简单的。你可以看到我现在所筛选的可视化商圈大概是390米,如果你再往外的话,其实可能就要到六、七百米以外才有其他的饭馆了,它的核心部分其实只有两、三百米。
        前面是一些基本情况,后面我们看怎么挑到自己满意的饭馆,有的人挑化学,有的人挑口味。比如说我们现在可以看一下,口味和环境如果两者都看的话,它们之间是什么样的关系?现在可以看到这儿一千多家店所分布的口味、环境之间的关系,如果我把它的服务质量拿过来放在颜色上,这张图横轴是环境,纵轴是口味,你是不是可以发现这样一个基本的规律,似乎口味好的饭馆,环境好的饭馆,大部分服务也都还好。反之这些服务都不太好的饭馆,基本说所处的区域都在左下方,或者口味和环境都有所欠缺。这部分来讲可以看一下它的均值,我把平均线拖过来,你可以看到这是一千多家饭馆平均的值,它平均值是8,如果你从四星以上挑起才可以找到这几者都可以兼顾的好的饭馆。那我们也没考虑到这个饭馆是不是火,去的人多人少,那我还可以把点评数拖过来放到大小上,去的饭馆多的人点就变大了。你可以看到,如果你想找去的人多、环境好的,你就到右上角找个头大的就可以了。
        那有没有快速的方法让我找到到底哪些饭馆特别值得去呢?也是有的。比如说我可以通过商店看,比如说要看口味,我使用一个图。这是一千多家饭馆盒须图的一个状态,但是特别好的没有,不过有特别差的。当然我们不是为了找差的地方去吃,我按照地段或者菜系把它做一个分类。现在按照菜系形成了一个盒须图的状态,可以看到现在找口味上超出这类平均值的饭馆很简单,我只要找这些点是在何需外面的越高越好。比如说这个点“红番茄”,这一类中远超平均值,我只要这样找就可以找到喜欢的饭馆了。其实我也可以把我刚才做的东西混合在一起,比如说我可以运用做的口味,这是地段和饭馆哪个火,以及我刚才用来挑饭馆的这个。我现在可以把它组成一个简单的逻辑,这样就不用像我一样从头做了,你想挑饭馆的时候就在我做的应用上点就行了,我做两个点击就可以。
        比如说我现在想看五道口的饭馆,我选择五道口这个地段的时候,这边显示哪个饭馆最好,右边显示的是口味、环境交叉的地方。我可以把这个也做上,让它也成为一个互动的因素。这时候我们就知道一定不要去哪些饭馆,这些饭馆我绝对不要去,这些饭馆大概都在什么地方?它的位置和这些不愿意去的饭馆当中包没包?其实是有的,这已经形成了一个可以供其他人来共享的可视化的调查了。
        我的介绍就到这儿,大家有兴趣的话我们可以到后面的Tableau展台看一看,如果有兴趣也可以到我们的网站上看一看其他的例子,谢谢。


        主持人:谢谢。刘先生讲的Tableau软件,相信大家感觉其实并不难,在上午的会议结束的签售会上,大家没有看到沈浩教授,因为他在调PPT,现在在后面已经摆了这本书,这是中国第一本中国人出版的案例集,所以感兴趣的朋友可以在大会结束之后到我们后面的展台一下,可以购买一下。


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-19 21:59

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表