HANA DB是一个列存储的数据库——这并不是什么创新,因为Sybase IQ也是。列存储的数据库更容易压缩,聚合结果更快,所以是为分析所设计的。这是HANA将会使数据分析提速的因素之一。
HANA DB是内存内计算数据库,也就是说不仅仅是部分数据存储在内存里,更重要的是,一些逻辑计算发生在内存的数据里,这样肯定要比在应用层计算快得多。这也是HANA使数据分析提速的重要因素。
曾有朋友问我,SAP如何应对“大数据”。我想,SAP BOBJ BI提供了丰富的前端报表和挖掘功能,SAP BW提供了强壮的数据建模功能, SAP EIM完善了BW的ETL并提供了更加全面的数据质量管理工具,而HANA使实时分析成为可能,这就是SAP应对大数据的解决方案。
传统的数据挖掘场景,BW提供了统一的挖掘系统,BWA用来提升性能: