企业需要借助各种系统和解决方案来真正了解大数据的意义和重要性。更重要的是,这些系统和解决方案应该能帮助企业应对数据在速度、数量、种类和真实性方面的挑战,并且响应其他未知数据源的变化。此外,企业还需要将大数据与现有的分析数据和业务数据相互整合,以便全面了解企业现状。最后,通过使用卓越的商务智能工具(如 [color=rgb(68, 68, 68) !important]SAP BusinessObjects Business Intelligence (BI) 解决方案提供的工具),企业还应交付全面且易于理解的大数据。
基于磁盘的传统 RDBMS 无法解决所有问题
大数据在数量、种类和速度这三方面的发展也为基于磁盘的传统关系数据库带来了挑战。首先,传统数据库在执行数据插入和更新等操作的速率方面存在缺陷,无法满足大数据的更新速度或者用户分析大数据的速度。其次,传统关系数据库还要求预先创建数据库模式,来定义数据类型。面对种类繁多的数据信息,上述问题进一步加大了挑战的难度。随着技术的不断发展,包括 SAP IQ 在内的部分 RDBMS 已经能够应对上述挑战。SAP IQ 采用列存储技术,可有效压缩数据,同时还在多个服务器之间采用并行处理的方法,解决 TB 级数据存储问题。
为了应对业务挑战,在众多技术中寻找最佳平衡,您有时将不得不采用一些折衷方法。例如,基础型 Hadoop 软件是一款开源软件,无需许可费,且可在低成本的商用服务器上运行。但如果需要管理的服务器达到成百甚至是上千台,那么运行 Hadoop 集群所需的总成本可能相当高昂。在寻找最佳平衡的过程中,您必须考虑到各组件的相关性能及成本也在不断变化。例如,存储器的成本正逐步减少,其速度却在不断加快。那么最终,在存储器中存储 1 TB 数据所需的硬件成本也可能随之下降。这样,在某些特定情况下,与其他数据技术相比,SAP HANA 可能更实用。此外,如果您的应用需具备实时分析功能,则内存计算技术(尤其是 SAP HANA)很可能是您的唯一选择。尽管本文讨论的焦点是 Hadoop,但 Hadoop 是最佳解决方案的观点并不能一概而论。您还应该考虑其他技术,如 SAP 实时数据平台,该平台可将 SAP HANA、SAP IQ 等其他 SAP 技术以及 Hadoop 相整合。