168大数据

标题: 大数据(生于2006,卒于2019)已死! [打印本页]

作者: 168主编    时间: 2019-11-4 19:13
标题: 大数据(生于2006,卒于2019)已死!
来源:云技术
由于关注的重心从我们收集数据的方式转向实时处理数据,大数据时代即将终结。大数据现在是支持多云、机器学习和实时分析这几个新时代的业务资产。

大数据时代生于2006年4月1日,卒于2019年6月5日
大数据时代终结于2019年6月5日,当时Tom Reilly宣布即将从Cloudera辞职,随后该公司市值应声下跌。加上MapR前不久宣布将于6月下旬关门大吉——这将取决于MapR能否找到买家来继续运营,2019年6月表明了这个事实:Hadoop推动的大数据这个早期时代已宣告结束。大数据会因在这几方面起到的作用而被世人铭记:促使社交媒体开始占主导地位,从根本上改变企业在处理多出好几个数量级的数据方面的理念,以及澄清分析数据、数据质量和数据治理的价值,不断评估作为企业资产的数据。
如果为大数据时代拟写某种意义上的悼词时,必须要强调一下:大数据技术实际上并没“死”,但第一代基于Hadoop的大数据已达到成熟的程度,它已在企业数据界确立了稳固的角色。大数据不再是无限增长的炒作周期的一部分,而是一种老牌技术。

大数据的诞生
大数据时代始于ApacheHadoop在2006年的亮相,开发人员和架构师将此工具视为有助于处理和存储多结构化数据和半结构化数据。企业在数据方面的理念发生了根本性转变,并不仅限于传统企业数据库的ACID(原子性、一致性、隔离性和持久性),导致数据使用场合发生了变化,许多公司意识到以前丢弃或保存在静态归档中的数据实际上有助于了解客户行为、采取行动的倾向、风险因素以及复杂的组织、环境和商业行为。Cloudera这款商业发行版推出后,Hadoop的商业价值在2009年开始得到确立,MapR、Hortonworks和EMC Greenplum(现在的Pivotal HD)紧随其后。虽然分析师们预测大数据这个潜在市场的规模高达500亿美元或更多,但Hadoop这种分析工具最终在最近十年受到了质疑。
Hadoop在企业界面临的挑战
虽然Hadoop在通过批处理支持大型存储和ETL(提取、转换和加载)作业以及支持机器学习任务方面大有价值,但它在支持公司和大型组织用来管理日常运营的较为传统的分析工作方面并非最佳选择。Hive、Dremel和Spark等工具在Hadoop上面使用以支持分析,但Hadoop从未变得足够快,无法真正取代数据仓库。
Hadoop还面临这样的挑战:NoSQL数据库和对象存储提供商在解决Hadoop最初旨在帮助解决的部分存储和管理难题方面取得了进展。随着时间的推移,在Hadoop上支持业务连续性面临挑战,加上支持实时、地理空间及其他新兴的分析使用场合方面缺乏灵活性,这使得Hadoop面对海量数据时很难在批处理之外大有作为。
此外,久而久之,许多公司开始发现大数据难题越来越与此有关:支持一系列广泛的数据源,并迅速调整数据模式、查询、定义和上下文,新的应用程序、平台和云基础设施供应商就体现了这一点。为了克服这个挑战,分析、集成和复制就必须变得更敏捷更快速。许多供应商纷纷创办就体现了这个挑战,包括:
如果从收购或融资的角度来看,许多这些公司似乎都备受瞩目,这绝非巧合。最近的例子包括但不限于:
这些解决方案的成功表明了日益需要分析师、数据和平台灵活性,以便面对诸多云和数据源改进数据的上下文分析价值。2019年会更闹猛,因为其中许多公司归私募股权公司所有,或者已获得大量的风投资金,需要尽快成功退出,帮助资助未来的风投基金。
随着大数据的消逝,我们进入到了后大数据时代,包括多云时代、机器学习时代以及实时和无处不在的上下文时代。
随着大数据时代走到尽头,我们现在可以少关注收集大量数据的机制,多关注处理、分析海量数据并与之实时交互方面的无数挑战。我们迈入大数据驱动的新时代时,请牢记以下几个概念。
结论
因此,大数据时代已宣告结束。但在此过程中,大数据本身已成为IT的一个核心方面,并引发了一系列新时代,每个时代未来一片光明。投入于大数据的公司应该将这些投入视作未来成为实时、增强和交互型互动公司的重要基础。随着大数据时代走到尽头,我们现在准备将整个大数据用作业务资产,而不仅仅是炒作,从而支持基于作业的上下文、机器学习和实时交互。






欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2