最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

企业在利用AI时的三个建议

[复制链接]
跳转到指定楼层
楼主
发表于 2018-1-25 19:46:08 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
作者:Ben MacKenzie,Teradata加拿大   

从无人驾驶汽车到图像识别技术,AI越来越多地从新闻头条走到了我们的生活里。但因为业务问题和涉及数据的不同,在企业背景中应用AI技术依然存在挑战。

企业AI的博弈是一场不一样的比赛、需要遵守不一样的规则。一些区别来自于企业内部可用数据类型的不同,而另一些则受到应用AI的领域的操作复杂程度所影响,这一点我将会在接下来的文章里展开来说。要在企业的环境中利用AI技术,以下是我总结出的三条值得考虑的建议。


01
考虑那些AI技术已经得到认可的领域

AI在广泛的领域内都获得了惊人的成就,例如:图像识别、目标检测、诊断影像学、自动无人驾驶、机器翻译、语义分析、语音识别、机器人控制等领域,其中自然包括围棋和象棋。但特别的是,这些取得了重大突破的领域都是人类所擅长的。这就意味着:深度学习的网络是由人脑内的架构所激发的;而在计算机视觉领域,深度学习就是由视觉皮质的特定结构所激发的。这些例子都展示了本身具有层级结构的问题,能够经得起越来越多的抽象化表达和对这个领域的多种理解。这些领域中还有着大量的公开研究、代码、并且在很多情况下都存在预先训练好的模型。
而另一方面,在上述领域之外对于AI技术的应用程度依然较低。试想一下推荐人系统、欺诈监测或者预防性维修模型。AI已经被成功地应用在了这些领域里,但它带来的成果往往是锦上添花的,而相关的研究成果也较少对公众公开。在某种程度上,这意味着这些领域牵涉到了受到更严密保管的企业数据,数据本身的特性要求它不能被轻易地共享给更多的人。

而现在,好消息是很多的企业现在已经开始着手解决涉及到视觉、语言和机器人控制等方面的问题。不管是在工厂厂房应用计算机视觉技术,还是用于库存管理系统,还是将自然语言处理(NPL)技术用于合规报告或者语义分析,现在企业们能够直接利用起无数的研究成果和前人积累的经验。而在其他领域,因为缺乏完善的研究、没有经过预先训练的模型、没有出版论文或著名的公开成功案例,AI就应该被统一划分到其他的机器学习和分析技术中。


02
AI并不是魔术

把AI看作是基于未检验的跟踪记录所进行的传统分析和机器学习的延续,这将有助于企业避免将AI神化:只要投入足够的数据,我们就能得到满意的结果。如果你对AI有这样神化的想法,那么你可以试试把一只橡皮鸭子丢到水里,试着让AI预测一下它最终会漂到哪里去。你当然可以在接下来的一千年里不断地训练你的模型,但却依然无法得到最终的结果。因为没有针对组成这段溪流的每一个分子进行建模,整个流程就是完全随机的,AI什么也干不了。

对于企业希望利用AI解决的所有问题,AI技术并不总是能成为那个整体的解决方案。具备了区分图像的能力,并不意味着我们就能完全准确地预测出11月份美国西北部地区整体的苏打水消耗量。

在为您的企业评估AI的最佳使用方案时,请密切关注于那些AI技术已经可用的问题领域。是否有哪个问题发生的领域中已经有了可用的研究成果?您是否已经在某些问题上利用起了机器学习技术?这些都是您开始使用AI技术的优选落脚点。

你可能还听说过,AI对于数据的需求是非常巨大的。我们在上面讨论的已经取得过重大突破的AI领域都牵涉到了真正称得上是海量的数据集:例如在计算机视觉模型中就包含了数百万的图像数据。要精确地预测做成一个AI项目需要多少数据,这是不可能完成的任务;但通常而言,数据集越小,那么传统的分析技术所能提供的结果就越有用。类似的,你还可能听说过AI和深度学习减少了人工手动作业的需要;在已经取得重大突破的领域,这一结论确实是正确的:计算机视觉模型只看像素、NLP模型只看单字(或者有时只看字母)。而对于企业数据而言,情况却是不清晰的。数据肯定需要经过清洗和整合,通过编码打标属类特征,而时间序列数据则需要进行相应处理(有时就需要人工手动操作)。总的来说,在未经检验的领域中,对于特殊操作和AI之间的关系应该持半信半疑态度,并为十分复杂的数据管道做好准备。


03
尝试不同的AI实验,找到速效方案

要评估AI技术是否适用于你的使用案例,其中牵涉了太多的未知数,所以更好的方案就是广撒网。把AI技术应用于处理大量的问题,比如说有10个问题,再观察AI在处理哪些问题上能够带来最好的结果。采取这样的方法意味着如果AI不是某个问题正确解决方案的话,你就不需要在那个问题上再白费力气,承担起不适合的工作。另外,采取这样的策略,你就可以确保以相对快的速度获得测试结果;接下来就可以耐心地搭建正确的以AI为基础的使用案例模型,这一过程需要花费相对更长的时间(在大范围内排除在非适用问题上套用AI技术的可能性)。
部署AI技术需要多方面的考虑。很多公司从来没有把机器学习模型投入用于生产,一开始就猛地扎进AI技术里,这样的人很快就会发现自己被弄得一头雾水。这并不是说AI技术比起机器学习要复杂多少,而是在于部署流程、监控流程、版本控制、模型的性能记录都是复杂的,如果企业从来没有相关的经验,那么AI的部署很难顺畅完成。所以采取一个经过深思熟虑的方案,逐渐将AI技术应用于更多的使用案例,是完成这一项转变的更好的方法。

来源:Teradata

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-8 22:29

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表