最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

Teradata张琦:在云中Teradata“无处不在”

[复制链接]
跳转到指定楼层
楼主
发表于 2017-6-15 17:22:18 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
2017年6月14-16日,中国电子学会主办、至顶网等协办的“第九届中国云计算大会”在北京国家会议中心拉开大幕,本届大会主题为“生态构建 深化应用”。
Teradata天睿公司云计算及服务专家、大中华区总监张琦表示,对于松散耦合的数据往往是最会发生创新的地方;无耦合的数据就像是还没有初步筛选过的矿石;紧密耦合的数据就像是已经精炼过的矿石;松散耦合的很有可能当中找到宝。
Teradata天睿公司云计算及服务专家、大中华区总监张琦
以下为演讲实录
我们过去的商业模式,数据是商业运营的结果,今天商业是运用数据的结果。变化非常的巨大,真正的领导者至内而外引发行动,他们坚定的相信数据和分析才是今天商业社会真正的能源、真正的石油。我们坚信数据和深度分析才会释放伟大公司的所有潜力。
我们需要提升客户体验,在今天的竞争当中所有的公司都希望在竞争当中能够获得优势,获得新的创新地方。他们需要重新去重塑客户体验流程,作为消费者我想在座的每一位都一样,我们希望获得是独一无二的体验。比如走进银行我希望我们的客户经理能够了解我,能够给我推荐的东西是我需要的。提供的服务是适合我的,但我们进入一个客服网站我不希望看到千篇一律的产品,或者是不适合我的东西。当我的设备在运行的时候,我希望我的服务商能够提前预警告诉我什么时候可以出现问题,而不是事后来补救,这一些就需要大家数据和深入的分析来提供洞察力了解客户。
更重要的是要利用这一些洞察力,适当的时间、适当的地点,用适当的渠道跟客户发生正确的沟通,否则的话基本上会让客户觉得非常不好的体验。同样今天的企业需要创新,所有产品的创新需要不停的实验,实验需要不是灵光一现,需要的是数据需要的是分析。美国比较领先的视频点播厂商,它每年会在它的产品上经过超过一千次以上的实验,它曾经选赏一百万美金要求让全世界各地的数据分析师参与帮他们提升数据推荐引擎成功率。事实上据我了解还有很多来自中国的数据科学家、工程师参与了这一次竞争。最终通过大家的努力,数据推荐引擎的效率提升了10%,这其实是一个了不起的成果。事实上每一个伟大的科技公司,都在做同样的事情,谷歌也在做、亚马逊也在做,苹果也在做,这一切都离不开数据离不开分析。
今天大数据和深度的分析已经彻底的改变了商业的版图和商业的模式,他们不断能够增进主页的竞争力,甚至还再创造出全新的商业模式。Teradata我们是总结国内外的经验把各种方案总结到一起,混合云支撑服务三个主轴向客户提供大数据和深入分析的能力。
我们来谈谈数据,通用公司的CEO曾经有一次讲过,一架飞机从纽约飞到芝加哥它的发动机所产生的数据超过1TB,包括温度、耗油量、磨损等等。同样我们中国非常优秀的引人自豪的航天计划,我们的嫦娥神州等等航天计划,一个中等规模的航天器至少超过两万个物理量需要测量而且是实时的,神州飞船在天上载轨飞行两到三年那是多么大的数据这只是沧海一粟。举两个小例子,我们有大量的数据怎么去用它们呢?实际上大数据的分析最难的地方是找出哪一些数据有用,把有用的数据用起来,这其实往往是难点,我们往往可以把数据做一些简单的分类,比如说有一些数据它明显具有很强的商业价值,它跟其他的数据相互关联、相互耦合被业务用户频繁、反复的使用我们称它是紧密的数据,一般用技术的语言来讲,很多时候它是结构化的数据,它有对数据质量有要求,对数据完整性有要求。
一个极端是一些所谓的无耦合的数据,什么叫无耦合的数据,不是这一些数据不重要或者是错误的它只是孤立,暂时还没有和其他的数据结合起来产生更多的洞察力,这样的数据当然很多。一些质量的数据有时候只是一些记录。这些所有的数据很显然它们的价值是不一样的,至少价值密度是不一样的。
紧密耦合的数据用的很多,已经做了充分的发掘,显然具有很深的业务价值,我们每天都在用它,是我们企业运营的不可或缺的,像报表、推荐等等很多的数据。
一些无耦合的数据可能往往数据密度没有那么高。使用的程度当然也不一样,怎么去保管它们怎么去使用它们这一些平台技术都是不同的。比如简单来讲,对于无耦合的数据,怎么做呢?我们的策略一般来讲我们需要存下来,我们不知道什么时候会有用,数据有一天就是金子,我们希望用最便宜的方式把这一些数据存储下来,让我们的数据科学家,让我们的工程师可以去探索它们有一天也许就是有价值的数据。
对于松散耦合的数据往往是最会发生创新的地方,无耦合的数据就像是还没有初步筛选过的矿石,紧密耦合的数据就像是已经精炼过的矿石,松散耦合的很有可能当中找到宝。所以我们往往把这一些数据需要让我们的数据科学家和数量分析专家,或者我们的业务专家去分析,提供什么样的方式给他们分析呢?
往往我们是要给他们最方便的分析手段,所以我们一般提供他们这种高级的分析平台、探索平台。当然了大家都很清楚对于紧密耦合的数据,就像我们企业里每天的报表、财务报表、质量报表、合规报表,每天都不能少。它是我们企业经营每天的生命线。当然它的可用性要求就很高,它对时效性要求就很高,所以一般来讲我们往往会采用一些高可靠的、高性能的这种平台和工具去处理这一些数据。
另外一点不同的数据实际上不是一成不变的,就像原来是一些无耦合的数据,可能通过我们的数据科学家的探索,发现我可以找到与其他数据的相关关系,说不定这一些新的洞察力就是战胜你的竞争对手致命的一击。那这时候我们就可能需要把这一些貌似无耦合的数据迁移到这种高级分析的平台上。另外一点像我每天都在用的一些已经紧密耦合的数据,它们当然很有价值,它们是所谓的热数据,可是随着时间的推移热数据也会变冷,一旦热数据变冷以后,那因为成本的考量事实上我们也要进行迁移,把它迁移到相对廉价的其他的平台上去。今天的这技术和平台发展非常之快,无论是云公有云、私有云还是混合云,还是本地的很多解决方案非常之多,但是我想说,到今天为止事实上单独的平台和技术可以解决所有数据的问题,随便举一个例子公有云很灵活、伸缩性很强,但是我想很多客户对数据的安全性,隐私会有担忧。
私有云具有一定的灵活性,也能够通过把数据保留在企业内部解决了部分对数据安全性的担忧,但是对于一个中等规模的企业来讲,自己构建私有云和运维私有云事实上成本不低,需要去运维的IT资源和经验并不够多。那同样还有很多专门设计的高性能的一些专用平台,我想并不是所有的负载都适合云,比如说需要极高性能,极高可用性的数据事实上今天的云无论是公有云、私有云不能完全的承担,可能还需要我们一些本地的解决方案。
这一些方案也许性能很好它是专用的,灵活性又是问题,所以没有一个办法可以解决所有的问题。这世界上不是只有一把锤子所有的就是钉子,它们就不是钉子。
所以在今天在我们看来对于我们的企业来讲我们其实需要的是灵活性,我们需要是在多个云,无论是公有云私有云最有效的方面去应用,不仅仅是简单把数据和分析分布到不同的平台上去。这容易回到最初的数据完全分散的原始年代,我们所推荐的不同的平台,不同的分散是物理上分散,与逻辑上是要整合,并不是把数据分出去就行,逻辑上是要整合的。给用户的体验是要整合的,这个是很多厂商或者很多专家可能会忽略的地方。
根据2017年的调查,预计到2020年差不多90%以上的企业会选择在云端和本地都部署自己的IT系统。没有一家企业今天说我会到2020年丝毫不用去考虑任何云的部署,也很少有企业,尤其是规模比较大的企业,可以说我百分之百完完全全部署在云上,这其实也是很困难的一件事情,所以混合云的部署应该来讲是一个大的方向,这是毋庸置疑的。
另外一个明显趋势是越来越多至少有85%的企业不希望再把我所有的资源投入到相对繁琐的这种IT基础架构的购置、运维上去。这需要很多的技能、很多的金钱,很多时候说他们会说我希望把我的精力是不是放到我的业务专长上去,放到数据分析上去。所以这种平台即服务,其实就是云计算的服务越来越被我们的用户所接受,我们所看到85%的客户愿意接受分析服务、平台服务。
Teradata本身是作为业界数据仓库和高性能分析平台,今天来讲我们是完全支持在公有云、私有云以及本地机部署。同时我们也支持向客户提供分析托管云。这一些部署的平台和模式应该来说是所有的企业都会去考虑的。我们认为最重要的是可以让用户自由的去选择,所以Teradata在所有的平台上提供的工具,软件是一致的。
对客户来讲我原有的时候应用、数据模型,甚至是就是数据、工具经验都是可以无缝的迁移,随便举一个例子,我们可以在一些软件项目刚刚起来的时候,需要大量的人员去做开发、测试。那我们可以在私有云上、公有云迅速的生成资源进行开发测试,开发测试以后我们所有的软件和工具都是一致,你可以直接无缝的迁移到其他平台上根据业务的需要非常方便。
只把数据应用分布到不同的平台上其实只是第一步,最重要我们要提供用户自由在各个平台之间,逻辑上统一的数据访问,所以我们是提出我们要做无边界分析,简单来讲我们的数据也许分布在不同的平台上,有公有云私有云甚至不同的云和本地,我们可以通过某一个平台可以访问所有的数据,否则的话这对我们真正的分析师业务用户那得多痛苦,数据分在不同的地方。
Teradata是提供在所有的云平台之间可以自由迁移的软件许可。当然这应该来说在目前的混合云厂商当中应该是第一家,可以方便用户不会锁定在某一个平台上,可以自由的迁移,你想适当的时候都用云的许可,有一些时候我需要更高的我希望用本地机也可以。
我这边想举几个基于Teradata的这种混合云架构的一些应用的案例。比如说很多时候我们希望把数据、应用分布在不同的平台上去,刚才我讲过什么时候大家会选择本地机,事实上一定会有这样的需求,比如说我们像这一些需要高可用的系统,比如说类似于银行的核心系统,类似于一些业务单位的4个9的系统今天的云还是做不到我们需要本地,有的时候本地不够灵活,往往碰到月末、季末我们的财务需要做很多的分析。
比如说我们初创的公司、初创的业务,我们当然希望他们业务能够出现爆涨,当然IT不是那么强的伸缩性我们需要云,所以我们推荐云的方式,用本地云解决本地的问题,云去解决云的问题,无论是公有云还是私有云,利用无边界的分析方式把这一些数据统一起来,这样数据可以随时迁移,负载可以随时迁移,这样对用户来讲带来的是灵活性,同时保证了性能,还有本地部署的安全性,更重要的一点,云的这种伸缩性和按需付费,可以让我们的用户在成本上是可以得到优化的。
今天的这种数据分析,我们叫数据实验室,或者数据沙盒,已经是整个企业的长带,如果有哪位你所在的公司说我们还没有做这样的事情,一定要回去推荐给您的领导我们需要做这样的事情我们要用数据去做实践,业务单位、数据科学家会说,我拿到的数据往往都不是最新,我拿到数据可能都不知道什么时候的,甚至是假数据我怎么做实验。
做实验的时候需要做一些探索需要资源,往往跟IT部门申请要很久,告诉我要半年以后我要去申请时间很长,或者有的时候实现方式生产汲取你拿最新的数据去使用,就会对生产造成冲击。所以我认为云就很好解决,我们可以让用户相对自助去生成数据实验室和数据沙盒,另外我们不希望把生产的数据,往往是海量的数据拷贝到一个新的系统里去,我们希望是能够穿透到不同的平台去访问它,不用去拷贝。但是如果你个人有一些新的想法,新的数据加载进去,跟原有的数据进行分析,这一些平台对原有的生产环境不会有业务的冲突,这样可以保证既有创新又不会影响生产环境。
今天我们用云可能更加灵活,比如说我们可以在云上部署,在平时可以用很少的计算资源,但是出现真正灾难时,我们可以迅速的扩充计算资源使灾备系统迅速的起来,在有一些场合下我们利用公有云廉价的存储做到成本非常低的灾备系统。
今天其实已经有非常多的客户在用这种混合云的概念和产品在设计大数据平台,比如说以耐克为例,耐克在它的本地部署了核心的分析系统。因为有一些数据需要高性能的分析,深度的分析,有一些数据它有安全性能担心,所以部署在本地。另外有希望灵活性,所以在亚马逊的公有云上部署了一些临时的应用。另外它还利用了亚马逊的廉价的对象存储,存了大量的历史数据。看起来很便宜啊,不同的平台干不同的事情,一旦碰到业务爆涨大时候,可以迅速的伸缩性扩充,更重要的一点是什么?其实耐克特别喜欢一点,通过本地的分析平台,直接可以去访问公有云上所有的数据,不是简单访问,而是把数据拿过来直接跟数据进行关联和分析,这是使用上非常一致的体验,成本上又是可控,我们觉得非常高兴可以帮客户做到这一些。
回过头来我还想讲,在今天数据和分析,已经成为每一个企业主业,而不是副业。我们相信没有一个平台在今天为止可以解决所有的数据问题,那我相信我们Teradata提供的这种混合云的架构、公有云、私有云以及提供的这种分析机服务的托管云,可以给我们的分析带来更好的灵活性、安全性,以及成本的优化。我们Teradaa是扎根中国,我们希望跟中国所有的客户,以及我们的合作伙伴生态构建、深化应用。

作者:王聪彬 来源:至顶网CIO与应用频道


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-29 09:35

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表