天府早报

注册

 

发新话题 回复该主题

自动驾驶研发的背面凯翼汽车被奇瑞抛弃众包 [复制链接]

1#

来源:21世纪经济报道

原标题:汽车业变“软”另一面

众包模式现隐忧

众包工人们是市场规模达近千亿美元的自动驾驶领域重要一环。

自动驾驶控制算法工程师,上海张江,34K。

路径规划与控制算法工程师,北京中关村,40K。

这些岗位给出的待遇条件无疑都是诱人的。

不过,从事自动驾驶研发工作并不意味着铁定月薪30K以上,另一种可能性则是月薪元。

自动驾驶研发的背面:众包

软件定义汽车,这一概念正在汽车行业得到越来越多的认可。汽车这一原本硬件导向的产品也正在变得软硬兼备。

整车企业的“服软”却并不仅仅局限于将中控显示屏做得更巨大,也不仅限于将漂亮的软件界面放在产品目录的扉页,更是渐渐体现在整车企业的员工队伍之中。

熟练的流水线技术工人已经渐渐不再是车企员工给公众的第一印象,车企的雇员也同样可以是一名端坐在数个硕大显示屏之前的电脑极客——至少这也是特斯拉希望给公众留下的印象。

遗憾的是,始终很少有车企愿意承认,这些光鲜亮丽的极客背后却存在着一大批看不见的地下工人。他们被叫做众包工人(Crowdworker)或鼠标工人(Clickworker),他们也被称为数字化时代的被剥削阶级。

图像语义分割是他们的工作职责,大陆、博世、宝马、奔驰、谷歌是他们的甲方。

而他们的实际工作待遇则是:一台电脑、一张椅子,每天长达至少10至12小时的工作时间。工会组织、正式合同、五险一金均不存在。他们绝大多数都是来自菲律宾、委内瑞拉、肯尼亚、马来西亚等欠发达国家的廉价劳动力。

这些众包工人们虽然工资微薄到仅有40美元的月薪,但他们却是市场规模达近千亿美元的自动驾驶领域最重要的一环。

一帧图片中的物体标注

自特斯拉横空出世,将通过自主车载操作系统收集每辆汽车的行驶数据变成现实以来,海量的用户数据便开始从成千上万辆汽车终端涌入整车企业总部。而这些数据最重要的用途之一便是用来训练自动驾驶控制算法。

无论是较为基础的模式识别算法和支持向量机,还是更为流行的前馈神经网络、卷积神经网络和深度信念网络,这些专业术语背后的控制算法无论多么优秀,但在进行大规模的训练之前都犹如新生儿一样是一张白纸。

而让这张白纸变得更聪明的方法便是通过大量的训练数据集对其进行持久的训练。不过任何训练数据在应用之前都需要经过人工标注(即Labeling)。就好比是最基础的模式识别算法在学习训练过程中也必须知道某一张图片所对应的正确答案,才能自主地寻找到判断的规律。

场景简单的模式识别算法可能仅仅需要识别一个数字,其所需的人工标注自然也仅仅只是一个数字。但是对于复杂的日常行驶场景而言,需要进行人工标注的对象则复杂得多。

一个合格自动驾驶控制算法需要识别行人、车辆、建筑物、障碍物、交通标识等各种可能出现的对象,这也意味着其训练数据中也必须配有对应的标注。针对自动驾驶控制算法的训练数据集往往是通过摄像头搜集而来的行驶录像,为了确保算法质量并满足汽车行驶的安全性要求,这些训练算法专用的录像必须在每一帧图片上进行像素级的标注。

一个典型的标注过程便是对每一帧图像中出现的所有重要物体进行像素级的描边,并手动对其进行分类,而这一枯燥的工作至今未有太好的自动化解决方案。

枯燥还只是人工标注的第一大难题。其最大的困难之处在于天文数字级别的工作量。仅以最常见的30帧视频文件为例,一份总时长达10万小时的训练数据就相当于亿张图片。考虑到对一帧图片进行仔细的人工标注通常耗费3小时,处理完整个训练数据需要一名员工工作万年。

如何才能摆脱此种窘境?

就犹如在软件研发领域上向硅谷巨头们看齐一样,硅谷巨头们也早已给出了答案:众包(Crowdsourcing)。

劳务良方还是公关定时炸弹?

早在年,亚马逊便首开先河成立自己的任务分发平台MTurk,试图激励全世界范围内的自由职业者们抽出时间为其完成大量的琐碎工作。这其中包括为Yelp网站进行评论和词条的编辑与筛选,翻译电商平台上的商品产品说明以及为商家填写日常行为数据等。而完成一小份工作的酬劳则仅为象征性的10美分,这也被视为众包模式的诞生。

一帧图片中的物体标注

很快,整车企业们便意识到该模式可以为其解决自动驾驶控制算法训练数据的标注问题。

年自动驾驶得到了资本市场的极大

分享 转发
TOP
发新话题 回复该主题