双手脱离方向盘的自动驾驶梦,只是卡在高算力芯片上吗?
发布于2023-11-13
双手脱离方向盘——真正意义的自动驾驶汽车,何时能够自由驶上开放道路?看上去似乎仍很难有确切时间表。目前,能够上路的基本是以L1/L2低级别的辅助驾驶,L3级别以上的量产车型也还处于少数,L4级别以上的真正意义的自动驾驶,大规模普及似乎还遥遥无期。
不过,有一个好消息是,今年三季度,特斯拉在完全自动驾驶上迈出新的关键一步,其超级计算机Dojo宣布量产。
但人类的自动驾驶梦想,可能短期内还难以放飞。还有哪些卡点亟待突破?
2023年三季度,特斯拉在完全自动驾驶上迈出了一大步。7月,该公司开始量产自研超级计算机Dojo。按照特斯拉的构想,到2024年2月Dojo将成为全球最先进的5台超级计算机之一,到2024年10月,Dojo总算力规模将达到100 Exa-Flops。
图源:Tesla官网
自动驾驶“上路”现状
先来看一下目前自动驾驶汽车的上路情况:
2021年,L3级的量产车型已经在一些国家和地区上路。本田2021年3月开始发售全球首款搭载L3自动驾驶系统的高级轿车“Legend” ,并且得到了日本政府的上路许可。继本田之后,奔驰的L3级自动驾驶量产车型则于同年12月获得德国联邦汽车运输管理局 (KBA) 批准可以上路。
中国《智能网联汽车技术路线图2.0》显示,在2020年中国L2级自动驾驶的渗透率是15%,到2025年,L2-L3级的智能网联汽车销量占当年汽车总销量比例超过50%。国内长安、上汽、广汽、吉利、长城、小鹏等自主品牌,在2020年或是发布L3自动驾驶量产,或是发布了L3自动驾驶系统。
研究机构IHS Markit预计,到2025年,L2+L3级量产车型的市场份额将会超过50%。现在各家车企都开足马力进行研发,推动更高级别自动驾驶车型的量产。
麦肯锡预测,到2025年,63%售出的汽车将配备L2或更高级别的自动驾驶系统。到2030年,将有少量的高级别(L4及以上)自动驾驶量产车型出现在市场上。
自动驾驶进入算力角逐时代: “卷”高算力
在自动驾驶的角逐赛中, “卷”高算力成为各家主要造车企业以及自动驾驶芯片厂商的共识。
像是特斯拉,除了造车,更是投入了大量精力在AI训练和自研超级计算机上。2023年7月,特斯拉在全自动驾驶上迈出了一大步,其自研的超级计算机Dojo开始量产。按照特斯拉的构想,到2024年2月,Dojo将成为全球最先进的5台超级计算机之一,到2024年10月,Dojo总算力规模将达到100 Exa-Flops。
为什么要“卷”高算力?
2021年特斯拉首次公布Dojo项目时,马斯克(Elon Musk)曾给过答案: “解决自动驾驶的唯一方法是解决现实世界中的 AI 问题,无论是硬件还是软件,而这也是特斯拉正在做的事情。除非一家公司具有很强的 AI 能力以及超强算力,否则很难解决自动驾驶难题。”
纵观目前自动驾驶芯片的市场格局,背靠英特尔的Mobileye主要布局L1和L2市场,出货量目前占据市场70%的份额,预计在2024/2025年会推出算力达到128TOPS的EyeQ6;英伟达则聚焦于L3及以上的市场;特斯拉自成一派,自研自用FSD芯片。其他能够提供高性能自动驾驶芯片,并在市场中拥有一席之地的全球独立芯片厂商,主要瑞萨、高通以及华为、地平线、黑芝麻智能、芯驰科技等本土厂商。
来看一下目前市场上主要的自动驾驶芯片厂商及产品对比:
(数据来源:Mouser根据各公司官网、公开信息整理)
不同的自动驾驶芯片架构对比:
可以看到的是,过去几年里,主流芯片厂商早已开始布局L3以上的自动驾驶芯片,而自动驾驶芯片的算力角逐事实上已近白热化。英伟达在2021年发布的自动驾驶芯片Atlan其算力就直指L5级别自动驾驶所需的1000TOPS;而仅仅一年之后,英伟达便发布了更强大的下一代芯片Thor,是一颗单芯片算力能够达到 2,000 TOPS 的性能怪兽,直接自己把自己PK掉。Thor的算力是其现款量产产品Orin算力的近8倍,特斯拉FSD芯片算力的28倍。
的确,高算力是自动驾驶的芯片的确定趋势之一。因为随着自动驾驶等级的升高,自动驾驶汽车需要处理传感器对环境的感知、高精度地图精准定位、V2X信息通信、多种数据融合、决策与规划算法运算等过程,这些都会产生海量的数据,对于计算平台实时处理、分析海量数据的能力要求非常高。据英特尔推算,全自动驾驶时代,每辆汽车每天产生的数据量高达4000GB。根据地平线数据披露,自动驾驶等级每增加一级,所需芯片算力就会呈现数十倍的上升,L2级自动驾驶的算力需求仅要求2-2.5TOPS,但是L3级自动驾驶算力需求就需要达到20-30TOPS,到L4级需要200TOPS以上,L5级别算力需求则超过2000TOPS。
那么掌握了高算力自动驾驶芯片就掌握了高级别自动驾驶量产落地的密码了吗?答案显然并不能简单一概而论。
高级别自动驾驶量产落地的关键指标:不只是高算力
L3级别可以视做自动驾驶和辅助自动驾驶的分水岭,通常被定位为“有条件的自动驾驶”。业界公认对L3级别自动驾驶的认定,最起码要具备以下几点能力:首先要支持自动变道,即打转向后车辆可以自行完成变换车道;第二要支持高速公路的自动导航辅助驾驶(类NOA,0-120km/h);第三要支持市区的交通拥堵引导(TJP,0-60km/h)。
(来源:头豹研究院)
这意味着,要达到L3级别有条件的自动驾驶,不但需要多种传感器的融合,还需要强大的计算平台及具备深度学习能力的软件平台,以及高精地图+高精定位等的配合。
所以这其中,算力显然是关键因素。自动驾驶的三个核心环节在于感知、决策与执行。如果算力不足,那么自动驾驶汽车就无法从庞大的感知数据中,思考得出正确的决策,也就无法执行安全合理的操作。这体现在车端的即时决策,也体现在云端的算法训练。
但算力并不是唯一的指标。
地平线创始人兼CEO余凯在此前征程5芯片的发布会上就曾强调,算力只是一个技术参数,实际应用场景下软件的性能表现是更重要的关注要素。
事实上,还有更多的细化指标将影响芯片整体的性能。把绝对算力当作衡量人工智能芯片的主要指标是一个“很大的误区”。有效算力才是更值得关注的核心,即算力的有效利用率,每瓦的有效算力,每美元的有效算力,以及算力转化为AI结果的效能(目标数量、帧率等等)。也就是说,自动驾驶芯片的性能不能简单地从TOPS的数值来看,而应该是一种综合计算能力。自动驾驶系统是一个综合算力支撑的平衡系统,来支持不同传感器所需的完整算力,包括CPU、GPU、NPU、DSP等综合的算力。对于自动驾驶芯片更准确的描述应该是——一个异构多核架构下的计算芯片。因为它要提供给自动驾驶系统综合的计算能力,比如CPU可以给激光雷达的算法计算,包括路径规划的算法计算;GPU可以提供在泊车环境下全景算法拼接,包括虚拟的车模3D渲染;NPU则提供感知计算;ISP提供图象处理的计算能力等等。
而到了真正的量产层面,还必须考虑成本以及功耗等综合因素。因为算力就像自动驾驶汽车的第二个发动机,疯狂地掠夺着电力。
特斯拉曾公布过一项数据,在驾驶辅助系统启用时,其市区驾驶里程锐减25%。还有一项研究显示,特斯拉Model 3用于AI计算的功耗,约占电池总量的13%。而功耗的上升将使芯片产生更多热量,从而降低性能。这使得原本的理论算力峰值无法真正实现。因而低功耗高算力的人工智能芯片,将是高阶自动驾驶阶段芯片竞争的核心。这其中,算力功耗比,即能效,成为十分重要的指标。因为高能效比的芯片不仅能够为汽车节约大量的电力,还能产生更少的热能,有助于芯片模组的散热与高性能稳定运行。
结语
自动驾驶进入算力角逐时代,高算力自动驾驶芯片是确定趋势,但绝对算力并不是唯一指标,高级别自动驾驶的量产难题不仅仅卡在算力上,是涉及能效(算力功耗比)、综合计算能力等多方因素的综合体现。