最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

BI168大数据专访:深度解密国内大数据市场新贵wandisco

[复制链接]
发表于 2015-6-5 09:21:39 | 显示全部楼层 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2015-6-5 10:07 编辑

专访:深度解密国内大数据市场新贵wandisco
文|BI168创始人乔帮主
【编者按】大数据如春风化雨,不知不觉中迅速应用到各行各业。很多企业也都搭建了大数据分析平台,如何保障大数据平台系统的安全、24小时不停的运转呢?带着这个问题,我们今天特别专访了Wandisco(万迪斯科)大中华区总经理张涛先生。
1.jpg
以下是专访内容:
BI168大数据:非常欢迎wandisco大中华区总经理做客2015首席信息官峰会BI168专访室
嘉宾张涛
大家好,我是wandisco大中华区总经理张涛,很高兴认识大家。
BI168大数据:对于国内一线大数据从业者来说,Wandisco还是比较陌生的,首先,请你详细介绍下Wandisco
嘉宾张涛
我们公司进入中国时间不长,所以可能国内的市场对我们了解不多,借此机会向各位介绍一下我公司的基本情况。
我们公司总部位于美国加州硅谷,是一家专注于在开源领域提升数据安全与分布式计算的公司,公司业务方向为hadoop与ALM两大方向,公司成立于05年底,2012年成功的在伦敦证交所上市,主营业务现在是基于Hadoop和SVN以及Git等开源项目的企业级产品方案。 它解决的问题是在开源这个生态环境上如何应用在企业级场景,现在大家对开源都比较关注,在具体应用上也有很多行业走在前面,尤其像互联网公司,但是大部分传统行业对开源的理解还不太全面:大家只看到它免费的一面,却容易忽视开源产品免费支持有限、优质商业支持稀缺的特点。互联网行业因为内部技术资源充裕,技术人员众多,可以通过技术人员去填补这个缺陷。但是在企业级用户比如金融、电信等行业,很多东西是要采购,或者外包的形式来去做,对于这样的企业用户来说,使用开源的话,必须把支持服务成本算进来,而不能仅仅看到免费的部分。我公司的软件解决方案,恰恰是为了通过把知识和经验内嵌到产品中来降低人员成本。

我们公司的技术团队中包含Hadoop原生团队中的专家,在Hadoop的Apache PMC(项目管理委员会)中具有席位。这也是我公司在开源领域实力的证明。我们也在积极促进海外最顶级技术专家与国内社区的交流与合作。这份部分我们还有很多工作要做。以实现立足本土,服务中国市场的愿景。


BI168大数据:我们非常希望能帮助刚进入中国外资企业和我们BI168一起推整个产品在中国市场的发展和壮大,我们已经帮助了不少的BI或者大数据行业的一些企业在中国拓展市场。希望在中国市场的推广上能助力Wandisco。
  
嘉宾张涛非常愿意合作。我们公司是很重视中国市场的,虽然进入中国市场时间不长,投入还是很大的。比如说我们一开始在中国建立了全资子公司,把整个全球服务支持站点放在四川成都。这都体现了WANdisco对中国市场的重视也投入。
在其他的比如说欧洲或者北美的客户遇到问题,因为时差关系,正好在中国这边的是白天,所以可以由中国的员工提供支持服务。同样对中国客户也是这样。这是整个全球网络在支持。这也是为什么我们可以在中国维持一个相对比较小的团队。我们很欣喜的看到华为已经成为我们的大客户。包括有一些像在中国的外企如Polycom、PixelWorks,以及很多本土企业:华三、包括现在我们正在马上就要成为客户的金融客户,抱歉名字不能公开,整个在中国区的步伐还是比较坚实的,应该说进入中国一年,还是受到国内客户的认可。

BI168大数据:在我们社区有很多的会员在使用Hadoop作为大数据后台处理工具,包括BAT、京东、TalkingData、星环科技等等的好多。也向大家介绍下你的职业背景吧。
  嘉宾张涛我自己本身最开始是在银行从业,然后在IBM、SAP这样的外企也做过,一直在从事数据相关业务。最新的工作是带WANdisco公司进入中国,负责大中华区的总体业务。
BI168大数据:请您详细介绍下公司的核心产品以及能解决企业的什么问题和应用场景是哪些?
嘉宾张涛我们的产品的特点是这样,就是Hadoop是一个大的框架,在这个生态领域里边有不同的方向和厂家。比如说大家比较熟悉的公司,像ClouderaHortonworks ,这是典型的做发行版的公司,在国内也有跟他们类似的,比如说星科技就是比较有名的本土发行版公司,EMCIBM也有,其实这个领域有很多玩家
我们公司的产品是这样子的,我们并不做发行版,我们和发行版是互补的,也就是任何发行版都可以,可以和这些发行版进行协同工作。我们只是在发行版之上能够给客户带来一下几个价值:第一客户可以非常简单的就把异地协作或者异地灾备的问题解决。这是一部分,另外一个部分呢,还可以做混合的架构,这个混合的架构从两个方面来理解,一个方面是说你下面的发行版可以是不同的,但是我们可以把它连起来,版本甚至是阵营都不一样,没关系,只要它是基于开源的Hadoop的产品,我们都把它连起来,这样其实客户要的是统一的数据,而并不关心说你是用具体某一个版本,这样可以保证客户也不会被某一个版本或者某一个公司锁定。
    另外一个层面,我们甚至可以做到公有云或传统服务器上面混合部署,这样的其实是给客户带来最大一个灵活性,我们是个桥,这个桥可以把公有云和私有云上搭建的Hadoop连在一起,你可以先在公有云上建立Hadoop集群,然后扩展到私有云,抑或反向,现在可以两边一起协同工作都可以。
像我今天跟银行的客户聊,他就提到了,银行其实本来那些内部的数据就很全面,价值很高,他觉得价值够了,他现在发现一个问题,现在有很多社交数据,像网络日志那些东西,那些东西是行为数据,很有价值,但是量都特别大,放在传统系统里放不下,他要建个Hadoop。
但是这个时候又一个问题,就是你自建Hadoop还是放在云上,其实我们也可以说是给客户提供一种新的方式,传统的数据还是原来地方,那些在云端的东西,比如日志等本来也不涉及一些机密的东西,量又大,你可以把它放在云上,但是你把它分开存放,涉及到怎么一起使用的问题。数据怎么独立使用,然后中间还有数据隔离,不会混淆,就是你的这种高价值密度的东西不会被泄露出去,同样那边的东西,你愿意搬过来就可以搬进来,不愿意搬进去就在那放着,那些数据是可以隔离开的,安全可以保障,这是我们的产品提供方便。
BI168大数据:据了解,你们最大的核心竞争力应该是核心的技术专利。WANdisco独有的专利复制技术确保可以在不同地域的多个数据中心内部署任意数量的多活NameNode集群,在集群内实时数据同步且支持工作负载的均衡。传统困扰NameNode单节点故障问题不复存在。WANdisco实现跨地域的部署单一大数据集群的同时,每一个正在运行的应用依然具有非凡的局域网快速数据读写的体验。零宕机时间,零数据丢失!支持滚动升级的特性规避了因为Hadoop版本升级所带来的服务下线问题。WANdisco产品的独特能力足以帮助企业的大数据平台满足数据高可用和容灾方面最严格的监管要求和极端的业务需求。这一点应该是企业比较急于解决的一个问题,因为它涉及到一些灾备,故障处理的一个问题。能否为大家揭秘下你们核心的技术专利。
嘉宾张涛你这个问题问的特别好,因为这个正是我们最核心的技术,你刚才提到的Hadoop方面的问题,其实在整个IT界一直以来设计之初都会有这样的问题就是单点故障,任何东西只要有一个,它可能是一个故障隐患,也是一个性能瓶颈,那么就涉及到如何解决这一点,其实本质的背后是数据同步与复制,可能能让两个或者更多个工作,这样子的话就可以给系统带来扩展性和高可用性,异地灾备这样的一种特性。但是这个东西一直是一个难点,放在传统的比如说比较成熟的产品,比如数据库,有双机热备等机制来保障。 但是放在Hadoop上呢,有两个问题,第一个问题是Hadoop设计之初,是因为设计问题,当初没考虑,因为它的应用场景是互联网,互联网行不行无所谓,只要你便宜就行,所以就是比较简单或者比较简陋的一个方式。后来随着Hadoop的发展,大家都意识到这个问题,这个1.0的时代根本就是只有一个,彻底的就是它既是单点故障也是性能瓶颈,它出了问题,整个机器就宕机了。但是以前国内的客户可能对这个了解不很深刻,他觉得数据都会多份拷贝,但是这个由于是在数据存储层面,现在元数据这个层面他是没有的,元数据只有一份,一旦数据库目录丢失,你有多份的数据也无济于事,这是一个最大的风险。但在2.0时代呢,开源社区开始着力于改善这个情况,最简单的方式是做一个主从的节点:master/slave,就是一个在工作,另外一个在等着,如果这个master死掉了,slave会接替,但是这种方式原理是这样,但是真的实现的时候,它并不像传统的数据库或者其他的一些产品那么的完美。它是一个有点类似于将就的一个方式,容易出现脑裂等问题,其实是网络断了,没死,你判断它死没死,然后一会又马上通了,如果你判断它死了,它后来诈尸又活了,这时候就会脑裂了,因为两台机器,不知道以谁为准,这是常见的一个脑裂的问题。这种方式有了一些改善和进步,但是还是没有完全解决问题。为了能够完全的解决这个问题,应该是用双活或者多活的方式,用现在最先进的一个技术,但是这个技术难度较高。所以我们公司拥有自己的专利,是基于PAXOS协议或者叫算法,这个协议谷歌、微软也在用,我先简单解释一下,它为什么它是个专利。它其实是微软上世纪九十年代一个论文提出来的理论,就是它是基于多数节点存活的一个强一致性的数据复制算法,这个事情是在学术界已经有一个定论的,这个方法的特点是理论描述非常简单,大家能理解,就是多数人举手,多数表决。在描述简单的背后,是算法实现起来难度极高。我们公司呢,把它做一个具体实现,然后把它形成专利。

BI168大数据:WANDisco毕竟是刚刚进入中国,接下来,在国内市场有哪些战略规划或者是人才的布局呢?
嘉宾张涛首先是这样的,我们虽然进入国内时间不长,但在国内稳扎稳打,第一呢,是说要把重点客户,就是这个行业的标杆客户作为我们的重点,这是我们在国内拓展方面最重要的步骤,因为中国的市场,大家看你做没做出成绩,主要看是不是有足够重量级的选手,代表着市场的认可度。
华为是我们的大客户,华为整个在全球的研发网络,是我们产品支持的,包括在国际上来看也是我们的大客户,很高兴有机会助力我们中国本土企业。

其次,我们也从生态环境上,大力的扶植本土的合作伙伴,因为我认为想把一个市场孵化出来要靠合作伙伴和生态环境的力量,而不单单是依靠自己的力量。一个共赢的市场,是我们的目标。

BI168大数据:现在咱们国内都在谈互联网+还有大数据,Wandisco本身是做大数据的,谈一下你对互联网+的一些理解?
嘉宾张涛确实是现在互联网+和大数据讨论的特别多,大数据当然时间更长一点,长期的一个热点了,互联网+是最近才开始,这两个东西我认为在国内有非常大的空间,虽然我是作为外企的一个代表,但是我非常看好中国的市场和中国的公司。我看到的是现在这个时代,小型公司其实和一些大企业处于同一个起跑线,甚至说可能比他们还要更有优势,而且现在我们鼓励创新,创新的点在这个地方,在国内有基础,像阿里巴巴,像京东,还有BAT这样的创新型公司已经培育了市场和人才。但是这个方向也是一个非常大的,这个大的方向里面其实有很多细分的行业,可能没有哪一家能够把这个大方向全都覆盖掉,所以其实如何选择适合自己的小的方向是很重要的,这里面有两个重点:一个叫宏大前景,另外一个叫重视落地,这个非常重要。我相信在这个概念之下,有非常大的空间可以生发出非常多的成功故事,新兴的技术理念如果可以和传统行业有机结合,一是能够将这些传统行业进行一个提升,另外一个,可以生发出一些新的机会,这样呢,其实是非常适合国内现在一个现状的,包括产业升级也好,包括创新也好,这个是最关键的。
从我个人感受方面来讲,类似于像加州硅谷,他们算一个创业的比较好的生态环境,他们的一些成熟的东西其实是可以借鉴的,就是说不要求大而全,而是选一到两个非常小的点,单点突破。要小而快,要专注等等。所以这个东西如果能把它落到实地的话,其实有太多的中国的创业公司可以从这个概念、这个方向上受益。

BI168大数据:那顺应国家的这样一个政策,针对咱们国内的这个市场,wandisco接下来有什么战略规划,来适应国内的市场
嘉宾张涛我想从两个方面来讲,一个方面是说我们要加大对中国市场的投入,针对中国市场前期投入后,后期的话可能会有更好的效果。

另外一个方面呢,是说要全面的跟本土的生态环境的合作伙伴深入合作,要深耕中国,没有一个本土化的战略是很难取得成功的,所以我们会尽可能的的去贴近、倾听本土用户的需求,个性化的需求。同时更深入的和本土的合作伙伴合作共赢,靠自己是独木难成林的,所以一定要和合作伙伴合作。这样子的话,其实在国内的市场的巨大容量是非常可观的。这是另外一个,这是我的一点心得吧,不光是说能够帮助到我自己的企业,同时也能帮助到一些同行,其实在这个过程中不仅仅是卖东西,能不能有这种知识的经验的转移,这些东西互相分享,互相成长,这个东西是我最想看到的,而不是说我卖给你一样东西你付给我钱,这个其实意义不大。尤其是在开源领域。
甚至有可能在国内以后会创造出海外没有的商业模式,不一定非得是照搬国外的一些理念和一些东西。
BI168大数据:最后,送给我们BI168的会员们一些祝福的话吧。
嘉宾张涛我自己本身是一直做商业智能和数据业务的,所以听到BI这个名字的时候,我觉得是很有亲切感的,BI以及现在方兴未艾的大数据是一个有广阔前景的方向,希望看到BI168在未来能够对中国本土的大数据的客户、大数据的厂商,或者大数据的其他的生态环境整体上的推动,起到自己显著的作用。谢谢!
本文为BI168大数据专稿,非经BI168大数据同意,不得转载。转载需加本文出处!http://www.bi168.cn/thread-8098-1-1.html
楼主热帖

本帖被以下淘专辑推荐:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-3-29 08:08

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表