马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
AI 数据战略 在以数据为中心的世界中 越来越多的组织正在应用 AI 高级分析 为具有挑战性的商业问题提供更智慧的答案 那么建立 AI 数据战略需要分几步? 来听听 IBM 杰出工程师 Linton Ward 怎么说的吧~ AI 驱动的分析能够更深入地研究组织数据,有助于提供高度个性化的用户体验,而这种体验来自于数据科学家和分析师之前使用传统分析方法无法检测到的数据和获取到的新的信息。 以批判性思维看待AI分析 如果希望良好地运用 AI 分析,组织从一开始就必须有一个经过深思熟虑的数据战略。当确定某个要解决的业务问题(和需要通过分析来支持的决策)时,组织需要批判性地思考解决该问题所需的数据。以下是帮助确保成功实施 AI 分析的五步流程。 1 制定计划 许多企业在数据孤岛中苦苦挣扎,这些孤岛导致获得分析数据的统一视图变得很困难。首先,组织需要阐明AI 分析项目的目标。然后,识别整个企业中的潜在数据源。除了传统的企业数据仓库之外,整合此数据可能还需要一个数据湖。 例如,关系数据库包含大量结构化的定量数据。定量数据对回答一些问题很有用,比如何时销售了多少件产品,以及该产品是与其他哪些产品一起销售的。但是,结构化数据对其他一些问题却用处不大,这些问题包括哪款产品可以与另一款产品一起销售,或者建议开发一个新的业务领域。要回答这些软性的、战略性的问题,必须对结构化数据进行扩充。 2 融合多样化的数据 回答战略问题所需的数据通常是定性的。定性数据通常来自非结构化来源,比如文本文档或笔记、外部网站内容、社交媒体文章和图像。组织需要确定如何从这类数据中获取额外的价值。 这方面的一个例子可能涉及到物联网。例如,如果组织拥有从智能设备传入的传感器数据,那么它可以使用工程注释或其他类型的软性数据来扩充定量数据,从而提高机器可靠性和修复预测。 3 定义数据架构 经历过并购或拥有不同业务领域的组织通常有许多不同的数据集——包括相同数据的不同视图。这种情形带来了一些问题:谁拥有该数据?最佳使用版本是什么?正确的数据架构是什么? 为了解决这些问题,组织需要超越数据库管理的视角,在不同数据来源之间建立数据架构。然后,必须以一种有意义的方式整合这些数据源。尽管分析项目的初始原型可能是特别设计的,但长期的成功需要可重复的数据架构和数据流。 可重复的数据流可以从各种端点获取数据,从业务运营流程到移动设备再到传感器。企业需要与拥有必要工具和专业技能来定义数据架构的公司开展合作。 4 数据治理 另一个关键考虑因素是数据治理,它有助于确保从不同来源收集的数据是可靠的,特别是对于受监管行业的组织而言。在保护安全性和隐私的同时,保持数据供应链的可视性也很重要。需要知道数据来源才能对其进行核实。可信的分析模型需要能够检测和跟踪数据管道中的任何问题。 新兴技术为高级分析提供了更多数据治理功能。例如,Hortonworks、IBM 等公司参与了开源 Apache Atlas 项目,该项目的使命就是将数据治理引入数据湖技术。 5 维护数据管道的安全 建立策略和程序来创建一个流程,使数据能够持续流入分析管道中,这样企业就能充分利用 AI 分析。关键的一步是在基础架构设计中和用于在组织中交付此功能的软件中建立安全性和隐私保护。 通过 AI 获取竞争优势 在任何组织中,数据都是最宝贵的资产之一,可以结合 AI 的强大功能来提供独特的竞争优势。通过遵循本文介绍的步骤,组织可以识别、收集、整合和管理对 AI 驱动的分析至关重要的数据。 本文作者:Linton Ward 来源:51CTO
|