最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

联想CTO芮勇谈多媒体计算、AR和智能手机的未来

[复制链接]
跳转到指定楼层
楼主
发表于 2018-3-6 10:00:24 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x


本文选自公众号:联想研究院

日前,国际计算机学会(ACM)对联想集团首席技术官、高级副总裁、ACM Fellow芮勇博士进行了专访。在专访中,芮博士讲述了自己的学术研究生涯,并对行业未来的技术发展,如智能手机、AR,多媒体计算等进行了分析和解读。以下是专访的中文译文版:

1、您是怎样进入多媒体计算研究领域的?

芮勇:在我读本科和硕士的时候,我的方向是控制理论和大规模系统优化。这些专业知识对我后来在多媒体领域的研究工作,比如“相关性反馈(relevance feedback)”,神经网络和深度学习等,都发挥了重要的作用。

在伊利诺伊大学厄巴纳-香槟分校读博期间,我开始从事多媒体分析和检索的研究。那时,互联网还处于幼年时期,Web浏览器刚刚出现,而搜索引擎还没有诞生。在那个时代,图像搜索的概念相当超前。

当时我遇到了一个很好的机会。美国国家自然科学基金会设立并资助了 “数字图书馆”项目。我有幸参与其中。我把控制理论,信息检索和计算机视觉这三个领域融合起来,进行了深入的跨学科研究,最终,我成为第一批基于相关性反馈实现图像搜索的研究者,为图像搜索创造了一种全新的模式。“相关性反馈”是一种通过用户先前的搜索结果和行为模式分析而优化搜索结果的方法。

获得博士学位后,我开始了在微软18年的职业生涯。在那里,我继续从事多媒体分析、理解和检索,机器学习,计算机视觉和模式识别等领域的研究工作。

现在,作为联想的首席技术官和联想研究院的领导者,我将继续带领团队推进多媒体计算的发展,并将最前沿的多媒体研究成果融入到联想的产品和服务中去。

2、如今这个时代,每天都会产生大量的多媒体数据,那么在未来,多媒体分析和检索有什么能为社会带来重要价值的新兴应用?

芮勇:从技术的角度来说,以深度学习为代表的人工智能算法正在并将继续促进多媒体研究,尤其近期深度学习较好构建了基于多模态(multi-modality)的算法框架,使得跨领域的多媒体数据的有效融合、利用/检索成为可能。

比如图像和视频的描述(captioning)。几年前,描述能做的只是给图像或视频自动打上标签(tag)。而深度学习建立了计算机视觉和自然语言处理之间的连接,可以将零散的标签变成一句基于视觉内容并且通顺连贯的自然语言描述。

随着相关领域和硬件设备的进一步发展,图像/视频描述甚至将支持一段(多句)关于内容的自然语言描述,也将支持更自然的用户交互系统;支持的模态(modality)也会超越计算机视觉和自然语言处理的范围,例如,可以导入语音特征(voice features), 空间深度信息(depth feature), 文本特征(text features)等。

3、智能手机是人们消费多媒体内容的主要渠道之一,联想也是智能手机制造商。根据现有研究和产品开发的进展,您认为未来的智能手机会是怎样的?

芮勇:从技术的角度来看,未来,像人工智能、VR/AR、5G、实时翻译、新电池技术以及全息技术的发展,将深刻改变智能手机和用户的体验。

具体而言,无边框屏(infinity screen),神经网络处理器(NPU),以及更多的传感器可能会出现在智能手机上。在传感器方面,手机将会融合生物特征传感器、深度摄像头,多摄像头以及更好的计算机视觉技术。此外,5G的发展将为智能手机用户带来10倍带宽和零延迟。

智能手机的形态也可能会发生大的变化。其中一个可能性是可折叠手机。比如,2016年,联想研究院研发出业界第一个真正的可折叠手机原型CPlus和Folio。CPlus可以在手机和腕表之间转换形态,而Folio则可以在平板和手机之间随意切换。

4、联想正在进军AR/VR领域,比如联想VR Classroom以及迪斯尼和联想合作推出的《星球大战:绝地挑战》AR设备Lenovo Mirage。AR/VR技术已存在了几十年,为什么现在这些技术正在走向主流?

芮勇:是的,AR/VR技术已经存在了几十年。但近年来的技术突破,比如光学镜头,计算机视觉以及slam(simultaneous localization and mapping, 即时定位与地图构建),让AR/VR技术开始加速发展,巨大潜力开始显现。另外,AR/VR可以帮助解决很多行业上的痛点问题,也能够给用户带来全新的娱乐体验。

我个人认为,与VR相比,未来AR很可能会成为一个更大的、更有前景的平台。尤其是当AR与垂直行业结合时,比如教育,培训以及工业维护等。在联想2017Tech World上,我们展示了联想研究院研发的晨星AR(daystAR)眼镜原型以及我们的AR平台。一位工程师在现场展示了如何利用这些AR设备和平台维修出现故障的飞机发动机,生动地诠释了AR技术在垂直领域的广阔应用前景。

ACM专访芮勇博士英文原版链接:https://www.acm.org/articles/people-of-acm/2018/yong-rui



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-24 01:57

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表