最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[产业] Waymo公开完整数据集:“挟数据以令诸侯”的格局是否会形成?

[复制链接]
跳转到指定楼层
楼主
发表于 2019-6-17 22:04:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本文来自微信公众号“硅谷大键” 。原题目《CVPR第一天,世界第一的无人车公司发布数据集》
对技术一向守口如瓶的Waymo,正在一点一点揭开神秘的面纱。
去年底,Waymo在官方博客公布了一个利用深度学习来教会汽车怎么行驶的技术【1】,ChauffeurNet从此浮出水面。
今年初,曾经为了激光雷达技术而与Uber以及时任Uber无人车老大的绝代枭雄Anthony Levandowski对薄公堂的Waymo,竟然开始公开出售自家的激光雷达(参见《世界第一的无人车公司,今天开始卖激光雷达啦!》)。
说起和Uber打官司这个事情吧,大键最近听说还有个反转。虽然当时官司是打赢了(Uber赔钱认错、庭外和解),但是去年底,有个和两家公司完全没有关系的工程师(好像还和无人车没啥关系),出于内心澎湃的正义感,自掏腰包出了6000美元,向Waymo在官司中使用的非常重要的936号专利发起挑战。最终,美国专利和商标办公室撤销了专利中原本的56项内容中的53项【2】!这个专利基本就废了,而Uber可能白白认输了。
和公开技术、贩卖激光雷达相比,今天的新闻毫不逊色:

在全球最大的计算机视觉会议CVPR的第一天的自动驾驶研讨会上,Waymo研究院老大Drago Anguelov宣布公开了包含完整传感器信息的、带标注的驾驶数据!

Waymo此次公布的数据集,包含了3000段驾驶记录,平均每段长度约为20秒。因为每秒钟大约有10帧数据,所以整个数据集包含了60万帧。光看60万帧这个数字,对比ImageNet的图片数量(大约也就是几十万到一百万张图的样子),放到学术界来看可是不小了,无疑是一片沙漠中的绿洲。从此以后,几乎所有能够买得起GPU的实验室都可以训练自己的自动驾驶模型了。
除了学校实验室之外,一众无人驾驶小公司应该也是疯狂受益。能免费得到这么多数据,谁还用买辆车装着雷达到处跑,然后还要标数据啊。这么多高品质的Waymo数据,如果学术界够用,那么对于startup来说,出个酷炫的demo也完全够用。不要说天使轮或者A轮了,如果算法的迁移能力够强的话(因为毕竟大部分Waymo的传感器市场上还是买不到),估计撑到B轮都不用收集驾驶数据,也不用花钱请人标数据了。我的天,想到这里,一个新闻工作者都有点蠢蠢欲动了!
不过,考虑到大部分startup可能活不过B轮,那么一堆提供无人车装配以及数据标注的公司可能要断粮了。唉,这属于高维打击吧。
仔细想来,一共6万秒的数据,也才16个小时多,一天都不到,半天刚出头。靠这些数据,任何人都不可能训练出一个和Waymo一样厉害的无人驾驶程序的。但是如果有任何的算法能在这个数据集上表现得不错,甚至于超过了内部的模型,Waymo马上可以拿来应用在自己十年的所有数据上面,或许就有一个巨大的提升。
之前提到了Waymo无人车大部分的传感器市场上还没有(唯一能买到的就是他家的近距离激光雷达),但是这次数据集一公开,所有传感器的特点都一览无遗了,比如说噪点多不多、远处物体距离准不准、除了距离和信号强度外还有没有其它信息。可以想象,一堆竞争对手甚至会拿着Velodyne的激光雷达跑到数据集中的地点采集激光点云数据,然后和Waymo的数据逐一比对,评估两者的优劣。
根据这次公开的资料显示,Waymo的无人车上有一个主激光雷达(就是车顶上那个,可以类比于Velodyne的64线或者128线的那种),加上四个近距离激光雷达,还有五个朝前看的照相机。所有的传感器数据都公开了,关键是还给你把物体能标2D的框就标2D的框,能标3D的盒子就标3D的盒子,实在是太厚道了!不过大键有一个小问题:据说为了保护隐私,照片里面的敏感数据都会打上马赛克,最主要的就是人脸。这样一来,行人检测岂不是会训练成马赛克检测?
对于这次公开的数据集,如果只用一个词来评价,无疑就是“共赢”。但是如果推演一下,有以下两件只对Waymo有利的事情可能会发生。
  • 为无人车startup服务的小公司们(比如Scale.ai这样标数据的公司)的订单可能会急剧减少。如果这些小公司都死掉的话,那么其它无人车公司在数据标注之类的事情上的成本会急剧上升。
  • 所有学术界的成果对Waymo的传感器的兼容性会是最好的,这有助于Waymo轻松吸收最新的科研成果。如果Waymo给自己的传感器(不管是激光雷达还是照相机)设置一些非常特殊的、难以复现的属性,那么其他无人车公司所用的传感器可能完全无法受益于这些基于Waymo数据的科研成果。

最后的最后,世界第一的无人车公司Waymo在还没有推出拿掉安全司机的无人驾驶出行服务之前就推出了如此重磅的公开数据集,有一种打持久战、等待学术界补血的意思。让我们看看,“挟数据以令诸校”的格局是否会形成,Waymo能否在未来的几年,继续保持自己的技术优势,带领大家早日实现无人驾驶出行呢?
参考资料:
【1】《学会开车:不只是模仿》,链接:https://medium.com/waymo/learnin ... tation-465499f8bcb2
【2】《工程师花了6000美元,证明Waymo的激光雷达专利无效》,链接:https://www.engadget.com/2018/10 ... ement-uber-velodyne
本文是原创作品,首发自微信公众号“硅谷大键”。如果喜欢文章,欢迎分享给你的朋友,也欢迎订阅我们的公众号。如果想转载到其它公众号或者其它平台,请在后台联系我们。希望大家共同支持原创作者、爱护原创文章。
本文所引用的资料(包括但不限于文字、图片和视频)全部标明出处,没有用作商业用途,也没有对资料进行曲解、篡改等恶意处理。如果资料的版权所有者希望移除引用,请给我们的公众号留言,我们一定及时处理。

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-26 18:29

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表