中国证券报记者:如何看待目前的大数据产业生态圈?
齐红威:2014年是大数据的商用元年,许多行业开始利用大数据产生价值。目前行业发展类似电商井喷式发展前的2006年、2007年,市场培育已经完成,生态圈初具规模,商业模式逐渐成熟。价值万亿元的大数据市场大门已经打开。
大数据生态圈主要划分为云计算服务商、数据提供商、数据服务商和数据应用商四个部分。其中,云计算服务商主要负责提供计算、存储和带宽等基础能力;数据提供商则提供各种数据,包括政务大数据、行业大数据、互联网大数据以及线下大数据等;数据服务商提供处理后的可应用数据原料,为政府、行业等提供服务,并利用自身的分析处理能力将大数据处理融合创造价值;数据应用商则利用经过初步处理后的大数据开发各类应用,例如征信、个性化旅游和交通服务等。
对比海外市场发展情况可以发现,其大数据生态圈在数据应用层下面有服务器技术,例如图像处理、语音处理;基础技术方面,有流式计算、分布式计算;再往下就是云计算,做基础架构。整体发展均匀,包括企业数量、企业规模、上市公司数量等。而国内市场主要集中在应用层,基础层面就涉及较少,产业链发展不均衡。
中国证券报记者:数据堂在大数据产业中如何定位?
中国证券报记者:数据堂采取怎样的商业模式?
中国证券报:数据堂的数据来源主要有哪些?
中国证券报:数据堂的资源具备哪些优势?
齐红威:数据堂的资源优势在线下数据。虽然互联网数据的规模很大,但无用的信息很多。要想得到有价值的数据分析结果,单靠线上数据难以完成。而线下数据收集困难,需要花费大量的人工、时间和资本,才能完成一定量的积累,数据形成规模才能真正产生价值。这也在行业发展中形成了较高的门槛。
数据堂的线下数据主要体现在人工智能数据和行业数据。人工智能数据包括图像数据、语音数据和文本数据,这些数据量大,且在互联网上难以大规模获取。数据堂通过众包的方式,五年来共累计获得50万全球众客(信息采集员),从线下快速获取语音、图像、文本等数据。通过筛选、去重、脱敏等技术手段处理,将数据标准化,以数据包的形式出售给客户。我们在AI领域的数据可以应用到无人驾驶、人脸识别、智能家居、人机交互、安防监控、智能电商等领域。
2015年以来,我们开始布局行业数据。随着大数据价值逐渐凸显,应用不断落地,越来越多拥有数据源的企业与我们合作。目前,数据堂的数据涵盖科技、信用、交通和医疗等数十大领域,主要用于金融征信、精准营销和智慧交通等。
跨业整合、异业应用,是数据堂行业大数据产品一大特色。跨业整合就是将多个行业的数据整合在一起,并找出之间的关联,形成数据产品。以征信领域为例,仅靠基本身份信息无法评估信用,需要把在线交易等多种数据整合起来,才能评估个人信用。异业应用就是将一个行业的数据应用到另一个行业。比如,数据堂的高速公路数据可运用在保险、旅游等行业。
目前我们已整合约45000套数据,数据总规模超过2PB。
中国证券报记者:怎么看待大数据行业的发展趋势?
齐红威:未来大数据行业聚集效应会越来越强,发展路径类似电商行业。电商做的是平台,本身并没有产品。在大数据领域,拥有数据源的一方,通常数据种类单一,需要与更多领域结合才能发挥更大价值。数据获取是一方面,但更关键是如何整合,将数据源打通才能形成价值。
以电商行业为例,随着市场空间逐渐打开,2006年-2008年,涌现出很多电商,其中有很多是垂直电商、区域电商。经过几轮行业洗牌,行业不断整合,集中度也在不断提升。
大数据行业发展情况类似。现在出现很多大数据公司,包括综合的、垂直行业的,未来发展趋势会类似电商行业。
中国证券报:大数据行业面临哪些挑战?
欢迎光临 168大数据 (http://www.bi168.cn/) | Powered by Discuz! X3.2 |