文|车东西 昊晗
编辑|晓寒
自动驾驶数据“上云”已成大势所趋,那下一步是什么?
眼下,自动驾驶行业已经进入商业落地的下半场,路面上搭载各级别自动驾驶系统的车辆也是越来越多。
对于车企们来说,落地交付不仅是对其多年潜心研发的一个认可,更要面临量产所带来的庞大数据量的挑战,而当下仅凭新建机房显然并不划算,数据存储“上云”也就成为不二之选。
但随着自动驾驶行业越来越“卷”,车企对云的需求已不满足于仅数据存储本身,像是感知模型训练、仿真测试、研发工具链等对智能汽车云的需求也是越来越旺。
所以在这个时间节点,自动驾驶数据“上云”已经可以算是最低要求,自动驾驶研发“入云”才是关键。
那么,车企们眼前对云最大的需求是什么?云服务又如何助力自动驾驶开发?智能车云未来该向何处发展?
近日,安永(中国)企业咨询有限公司(以下简称“安永”)与华为智能汽车解决方案BU合作撰写并发布了《从“上云”到“入云”,云服务赋能汽车产业智能网联升级——智能汽车云服务白皮书》(以下简称《白皮书》)。
该《白皮书》也是第一本云服务应用在汽车行业智能汽车时代,核心业务核心应用上的白皮书。书中对目前自动驾驶开发、车联网等智能车云服务应用场景进行了详细解读。
对此,车东西从这本《白皮书》中找到了上述问题的答案。
01 自动驾驶要落地,数据“上云”只是第一步
如果把自动驾驶行业发展分成上下半场,那么上半场就是从零到一的开发验证阶段,而下半场就是从一到多的商业落地阶段。
在上半场竞争中,车企们比拼的是谁家自动驾驶系统算法更高效,谁的接管率更低。而在下半场中,比拼的是谁交付规模最大、实际使用里程最多。
毕竟,实践是检验真理的唯一标准,自动驾驶也是同理。当下,各级别自动驾驶车辆越来越多,可行驶测试范围越来越广,应用场景也越来越丰富。
对于车企来说,“车多路广”固然是好事,但随之产生的海量数据就成为一件新“头疼事”。
通常来说,在自动驾驶研发阶段,如果按照10辆测试车,每年累计采集天数300天估算,单车每天可以产生10TB左右的数据量,每年产生的数据总量达到30PB左右。
而在商业落地阶段,虽然车辆不会像测试车那样没日没夜地跑,但车辆总数却呈指数级上涨。如果按照10万辆车,每年累计采集天数300天估算,那么未来车企所面临的数据总量将会达到ZB级。
这里简单介绍一下PB级和ZB级间的换算关系,1ZB=1024EB,1EB=1024PB,而用我们熟悉的TB单位来换算,1ZB约等于10亿TB。车企们所面临的数据压力可想而知。
商用阶段数据量将达ZB量级(图片取自白皮书正文)
现阶段,无论是从建设、运维成本还是信息安全来说,通过新建或扩容机房的方式显然已经跟不上数据增长的速度。
“传统的数据中心已经不能适应自动驾驶商用化的要求,“上云”是自动驾驶从开发到商用的必由之路。”某高科技公司智能车云服务产品部总经理说道。
由此可见,在自动驾驶商业落地下半场中,数据“上云”也就成为车企们的一大刚需,也成为决定其能否实现快速迭代的重要因素。
但是,海量数据不仅带来了存储难题,如何高效利用和处理又是另一大难题。
所以,数据“上云”只是第一步,而智能汽车云之于自动驾驶的意义也绝不是仅仅停留在满足数据存储本身。
02 感知模型怎么练,数据标注“入云”是关键
上文提到,自动驾驶行业正处于商业落地的下半场,各家表面上拼的是落地,是规模,是里程,但背后其实拼的是快速迭代能力、解决Corner Case能力。
也就是说,自动驾驶车辆的落地商用离不开持续而高效的算法迭代。
对自动驾驶算法迭代而言,感知模型训练和仿真测试又是重中之重,前者直接关乎自动驾驶系统的安全性,而后者决定了自动驾驶系统能否实现快速迭代。
但根据部分车企的研发人员反馈,感知模型训练和仿真测试却也是整个自动驾驶研发过程中的两大痛点。
自动驾驶相关高频痛点场景(图片取自白皮书正文)
首先是感知模型训练。众所周知,自动驾驶系统在感知层面与人类驾驶员类似,都是通过各种传感器对外部环境进行感知,前者靠摄像头、激光雷达、毫米波雷达,人类驾驶员靠的是眼睛、耳朵甚至是鼻子。
并且,对于自动驾驶系统和人类驾驶员来说,都是看到相对容易,辨别是什么更难。
自动驾驶感知方案
所以,感知模型训练就成为自动驾驶研发过程中最基础的一部分也是最重要的一部分。
毕竟只有看清了,认出是什么了,才能进行规划和决策。
具体来说,感知模型训练按照流程可以划分为五大环节,分别为数据存储、数据预处理、难例挖掘、数据标注以及模型训练。
自动驾驶研发关键控制点(图片取自白皮书正文)
而在这五大环节中,数据标注又是最耗时耗力的一环,让一众车企直呼“头疼”。
数据标注是指通过人工以及智能化工具,对传感器所捕捉的图像、视频、路牌文本等各类别信息进行目标检测和识别。简单来说,数据标注就是把图像(点云、相机)中的信息逐一标出来,是一个简单但对精度、效率要求极高的工作。
数据标注
所以,当人类在处理这项工作时,就难免会出现数据筛选耗时、人工标注返工率高、数据格式不统一等问题,也就使得整体标注效率比较低。而国外某自动驾驶车企也曾为了提升数据标注效率,因此减少人工标注的比例。
既然人工效率低,那么用AI进行数据标注呢?
通过AI对数据进行标注,虽然解决了人工的效率问题,但是数据积累的深度、广度都会直接限制及影响AI的学习能力,且基础算法模型的算力亦难以承担日益增长的数据量。
所以,像自动驾驶感知模型这种训练数据体量大、算法精度要求高、训练效率要求快的工作,就更适合采用汽车云服务进行数据处理。
相较于人工与本地AI训练的数据处理能力,汽车云服务凭借超强算力、高效精准的智能化策略优势,可以有效缓解自动驾驶数据处理过程中出现的各类难题与挑战。
《白皮书》提到高等级自动驾驶在港口、矿山等封闭场景中商用落地的节奏早于乘用车,而且汽车云服务也会在这些行业应用场景中发挥“云上大脑”的巨大价值。以矿区无人驾驶为例,汽车云服务对感知模型的训练起到了至关重要的作用。
无人驾驶卡车在矿区内经常会遇到非结构化路面、随机落石、异形车辆等情况,并且矿区还存在飞尘、扬土等恶劣环境。这对于自动驾驶系统研发来说,非常考验数据标注的准确度和模型训练的效率,而汽车云服务通过高效的数据处理、难例挖掘、自动标注、模型训练等能力,可以快速帮助无人驾驶卡车适应矿区复杂的作业环境,降低接管率,提升无人化作业效率。
从数据上来说,本地AI训练数据处理的效率较人工提升3~4倍,而依托云端的更高算力和更多的经验积累,汽车云服务数据处理的综合处理效率提升10倍以上,数据处理成本较人工降低50%。
自动驾驶研发数据处理发展历程(图片取自白皮书正文)
综上来看,在自动驾驶研发数据处理方面,汽车云服务的优势正在逐渐凸显。不仅可以有效识别高价值数据,优化存储空间,加速难例挖掘,还可以深度学习实现自动标注能力提升,优化标注算法效率与精度,降低数据处理成本。
03 要想快速迭代,仿真测试需要云来帮
在解决了数据处理难题后,对于在自动驾驶持续投入的车企们来说,要想实现快速迭代,海量测试必不可少。
行业普遍观点认为,自动驾驶系统至少需要100亿英里(约合161亿公里)的试驾数据,以确保车辆上路的行驶安全,但显然仅凭测试车“没日没夜”地跑难以完成。
所以,仿真测试也就成为自动驾驶研发的重要环节,也是必经之路。
据统计,在仿真测试中,车企主要面临四大挑战,分别为场景库覆盖度不足,行业间格式互不兼容;仿真测试所涉里程数大,场景类别多且耗时长;仿真测试与实车路测偏差大,置信度低;仿真评价体系不完善,反馈效果差。
自动驾驶仿真测试体系(图片取自白皮书正文)
并且,仿真测试对技术团队能力要求较高,要兼具多种交叉学科的专业技能,对业务融合程度的要求也更高一个层级,远超自动驾驶研发的其他业务环节。
上述这些挑战和问题,也就促发了仿真测试“入云”的迫切需求。那仿真汽车云又能解决什么问题呢?又是怎么解决问题的呢?
首先,仿真汽车云服务通过构建开放场景库,帮助仿真场景库更为标准与全面。其次,凭借云端大规模并行仿真的强大算力及高并发处理能力,将单线模式转变成并发模式,支持多场景下同时完成多个仿真任务,大大提升了仿真效率。
自动驾驶云仿真
而至于仿真测试与实车路测偏差大的问题,仿真汽车云服务可以集成计算机软件、车辆动力工程、交通等多领域专业能力,从微观到宏观提高仿真测试逼真度。
最后,在仿真测试评价方面,汽车云服务基于汽车行业经验并结合场景库,能为仿真测试过程提供多维且全面的评价指标体系,支持不同车企、不同发展阶段评价指标的定制化服务,加速仿真测试的算法迭代与场景库优化。
所以总结来看,对于整个自动驾驶云服务来说,高质量的仿真测试体系就像皇冠上的明珠,极具代表性地体现出自动驾驶研发“入云”的价值。而在数据处理和仿真测试这两大自动驾驶研发的关键控制点中,智能汽车云的作用已不可小觑。
对于涉足自动驾驶的车企来说,如今智能汽车云的重要性已经与传感器、计算平台、整车制造旗鼓相当,并已经成为在商业落地下半场中降本增效的秘密武器。
04 研发效率怎么提,工具链贯通是重点
当感知模型训练和仿真测试的效率得到改善后,那么是否就意味着整个自动驾驶研发流程的效率可以整体提升呢?
答案是否定的。
举例来说,某车企就曾在自动驾驶研发过程中,由于在不同阶段使用的各项工具零散,数据处理格式不一,导致开发模型迭代需要2个月,效率低下且成本高。
这也就意味着,仅单一研发流程的效率提升,而没有一个完整的自动驾驶研发工具链,并不能让整体研发效率得到有效提升。
最后的结果很有可能是1+1。
评论