新技术涌现叠加商业化落地 2024年自动驾驶步入不平凡之年

来源: 中国长安网
2024-07-05 08:39:17

印度吊桥坍塌致47名儿童遇难 最小孩子仅两岁日本人操逼,

  本报记者 龚梦泽

  进入2024年以来,自动驾驶行业热度陡然攀升。在人工智能时代,自动驾驶目前是前景最为清晰、落地最为迅速的领域之一。2月份,北京市高级别自动驾驶示范区为百度、小马智行、AutoX安途和文远知行颁发高速道路载人示范应用通知书,准许在北京经济技术开发区(北京亦庄)至北京大兴国际机场航站楼之间开展载人接驳。这标志着全球首个首都城市机场自动驾驶接驳载人示范场景正式开放。

  客运城市级应用落地

  无人驾驶重卡走进现实

  “经过各方共同努力,近年来,我国自动驾驶相关产业和市场规模呈快速增长态势,自动驾驶技术由测试示范稳步迈向商业化应用。”中国汽车工程学会理事长张进华如是称。

  今年3月下旬,《证券日报》记者也前往首都城市机场自动驾驶接驳载人示范区试乘,出行体验远超预期。从亦庄天骥智谷产业园外的上车点上车,安全员已在主驾位就座。记者后排落座后,面前屏幕上出现了“开启行程”的按钮。点击按钮,自动驾驶汽车一键启动,直奔机场。

  “车辆很聪明,不仅能看清前面的路,行驶过程中还能自动寻找最优的行进路线。”自动驾驶安全员刘师傅称,从试车员变成安全员,尽管同样是坐在驾驶位,但工作内容发生了改变。安全员最重要的工作就是在紧急时刻随时接管车辆。不过,这种紧急情况已经很少见。

  以机场接驳为例,此次自动驾驶接驳载人示范路线途径黄亦路—京台高速—大兴机场北线—机场高速—大兴国际机场,其中高速场景约40公里,全程几乎不需要安全员介入。

  按照系统规划路线,自动驾驶汽车进入大兴机场高速后,路上车辆逐渐增多。自动驾驶汽车本在最内侧车道上行驶,突然屏幕发出提醒:找到更优车道,正在尝试变道。变道过程中,车辆先是自动开启转向灯,随后车速逐渐下降,方向盘微微向右转动,利落切换至右侧车道。

  这是北京首次面向公众开放高速公路自动驾驶。驶出大兴机场高速时,收费站排布着10多个通道,分别标注着“ETC”“人工”和“临时关闭”。在众多通道中,自动驾驶车辆准确识别出ETC通道,并选择了一条排队最少的车道顺利通过。

  “寻找最优路线换道、安全条件下自动超车、自主盘绕匝道和通过高速收费站,自动驾驶车辆现在都能高效地完成,有时候感觉自己驾驶都不如它稳当。”刘师傅笑称。

  随着国家级车联网先导区、智慧城市基础设施与智能网联汽车协同发展试点等工作的深入开展,北京率先规划建设了全国首个高级别自动驾驶示范区,迸发出强劲的新质生产力。按照规划,亦庄示范区的建设正按照1.0阶段(试验环境搭建)、2.0阶段(小规模部署)、3.0阶段(规模部署和场景拓展)、4.0阶段(推广和场景优化)的步骤层层推进。

  据北京经济技术开发区管委会副主任、北京高级别自动驾驶示范区工作办公室主任王磊介绍,目前北京正在进行高级别自动驾驶示范区4.0阶段的规划,初步考虑能够覆盖四环到六环之间的平原新城大部分面积,这样就可能具备初步推动全面商业化落地的基础条件。

  “今年年初,本市已经实现了示范区至大兴机场的自动驾驶接驳以及城市副中心三大文化建筑周边的短途接驳。”北京市高级别自动驾驶示范区工作办公室相关负责人在接受《证券日报》记者采访时表示,接下来还将逐步开放更多场站,实现在北京南站、丰台站、朝阳站、清河站、城市副中心站及大兴机场、首都机场“五站两场”开放接驳,打造更多自动驾驶应用场景的标杆案例。

  体验过机场线自动驾驶载人接驳后,记者又驱车赶往了国内首家跨省自动驾驶重卡示范区应用许可的企业仓库,亲身体验了京津塘高速北京段的自动驾驶货运服务。

  此次体验的京津塘高速北京段及天津段自动驾驶测试路段总长超过100公里,涵盖了高速公路、进出收费站口、上下匝道等复杂情况,是自动驾驶测试的天然场景。记者登上离地一米多高的驾驶舱后,自动驾驶重卡安全员李师傅掏出无线键盘,对着车上的屏幕输入信息。“自动驾驶模式启动。”当卡车进入马驹桥收费站时,系统发出语音提示,李师傅的身份就此由司机切换为安全员。开始高速行驶后,他的目光变得机警锐利。

  此时,驾驶室后排的小马智卡产品经理张嘉浩同样目不转睛地看着电脑屏幕上的实时数据——包括车辆的位置标注以及方向盘摆动的次数、幅度等。“监测这些指标是为掌握车辆运行的实时数据,为接下来编队行驶和更大范围内的货运运营积累经验。”张嘉浩表示。

  “从前司机开重卡到港口取箱,不仅劳动时间长,排队办票流程繁杂,遇到风霜雨雪等恶劣天气一天得工作10多个小时,极易疲劳驾驶。”李师傅说,如今只要在平板电脑上一点,货箱自动派单,重卡即提即走,还可以全天候运输,大大提高了运输效率和安全性。

  从封闭园区测试到跨省开放运营,再到编队行驶的提出和应用,不仅进一步推动了整个智能网联汽车应用场景商业化进程,更标志着打通了包含公路货运在内的自动驾驶物流全场景运输。在张嘉浩看来,由于生产资料的属性,商用车是典型的成本敏感型行业。随着目前“门到门”自动驾驶运输逐步成为现实,高速干线运输的常态化运营曙光在望。

  新技术不断涌现

  自动驾驶迎质变之年

  总体来看,高阶智驾产品渴望商业成熟,但仍处于技术剧烈变革阶段。

  纵观自动驾驶技术的发展历程,人工智能的不断突破显著提升了自动驾驶的感知性能。从卷积神经网络(CNN)的引入,到循环神经网络(RNN)的应用,再到结合鸟瞰图(BEV)与Transformer(自注意力机制的神经网络架构)的创新,新技术的迭代涌现在不断增强自动驾驶的精确度与安全性。

  尤其是在“BEV+Transformer”与OCC(占用网络)之后,端到端(End-to-End)自动驾驶技术开始受到广泛关注。而特斯拉作为行业的先锋,其推出的FSD V 12系统成为端到端自动驾驶技术的典范。

  所谓端到端,指的是通过AI模型,只要输入原始数据就可以输出最终结果。比如ChatGPT,就是一个典型的端到端模型,输入文字语句,直接就能得到回答。那么,在自动驾驶领域何为“最终结果”?

  这还要从自动驾驶的演进说起。以前的自动驾驶按照不同功能划分为感知模块、控制模块、定位模块、规划决策模块等,由于涉及模块之间的参数传递,人为定义接口会过滤掉一些信息,导致处理的场景有限,长尾场景无法彻底消除。同时,依赖于人为规则的算法,每个模块之间“不可求导”,会导致各个模块只能达到局部而非全局最优。结果就是,人为规则操控的车辆缺乏“人味”,无法像人类一样随机应变且丝滑地处理场景挑战。

  而在端到端范式下,整个自动驾驶系统只有一个模块,或者说是神经网络——摒弃了传统自动驾驶中感知、规划、控制各大模块及下边的各类子任务,能够实现输入传感器数据可直接输出车辆动作控制,宛如人类通过五官和经验在开车驾驶。

  需要指出的是,目前业内对于端到端还没有一个权威统一的定义。特斯拉方面称,FSD Beta V12 也可叫做“感知决策一体化”,即把“感知”和“决策”融合到一个模型中,通过输入图像,旋即输出转向、刹车、加速等车辆控制信号的能力,进而实现自动驾驶。

  据观察,FSD V12在今年大面积推送后的确展现出了不同寻常的潜力。有特斯拉车主向记者表示,新系统相比上一代进步明显,在狭路会车、超车方面已非常从容熟练——“就像人开车一样”。

  “以前是靠人编程写规则,做海量的标定,教神经网络开车。现在则是仿生人类学习机制,通过一个AI神经网络大模型,不分模块和堆栈,直接接收感知信号,然后输出决策信号。”中国自动驾驶产业创新联盟调研员高超对《证券日报》记者表示。

  基于此,国内一些领先的企业也在跟进这一技术的研发与部署。就在今年的北京国际车展期间,小鹏汽车、华为、元戎启行、长城、商汤科技等多家公司争相宣布推出类似FSD V12的自动驾驶系统。同期,软银、英伟达和微软也斥资10.8亿美元投资了与特斯拉路线相同的自动驾驶公司Wayve。

  “2025年智能驾驶会发生质的改变。现在看甚至会提前到今年,因为技术进步比我想象中更快。”在小鹏汽车董事长何小鹏看来,原先智能驾驶需要大量代码制定规则,即使达到一万行,可能也只能实现50%的规则能力。“随着端到端技术的出现,我们仅需投入数十亿(元)的训练费用,便可以在一年内大幅提升产品性能,这将极大加快自动驾驶技术在实际应用中的普及速度。”

  华为智能汽车解决方案BU董事长余承东表示,今年8月份,华为将进入高阶智驾ADS 3.0方案时代,该方案就采用端到端架构。理想汽车CEO李想也表示,三季度将向测试用户推送端到端+VLM(视觉语言模型)的智驾方案。蔚来汽车虽未明确宣布端到端方案的落地时间,但大概率也在年内发布。

  尽管端到端自动驾驶系统蔚然成风,但其是否就是自动驾驶未来发展的唯一道路,目前也存在一些疑问。极越CEO夏一平在接受《证券日报》记者采访时就表示,大模型训练的核心不是比谁的数据多,而是比谁的数据更有价值。“数据质量很重要。数据质量不好,训练出的模型可能就是有缺陷的。”

  与此同时,端到端也需要巨大的资源支持,包括高质量视频数据的采集和算力资源的大幅增加。特斯拉CEO马斯克今年4月份在社交媒体上表示:“在AI训练和推理领域,任何支出达不到每年100亿美元水平的公司,都无法在市场上竞争。”据马斯克透露,到2024年底,特斯拉的训练算力将达到100E FLOPS(每秒浮点运算次数)。对于国内企业来说,算力资源的积累和竞争问题已迫在眉睫。

  但无论如何,端到端技术以其创新的理念,为实现完全无人驾驶的目标提供了新的可能性。随着技术的不断进步和行业的共同努力,上述挑战必将被逐一克服。而元戎启行、商汤科技、毫末智行等国内企业的积极参与,也展现了中国在自动驾驶技术领域的决心和潜力。

  大模型与L3路测双重加持

  年内行业融资达168亿元

  进入2024年,自动驾驶赛道第一笔融资落在毫末智行头上。2月22日,毫末智行宣布获超亿元B1轮融资,此轮融资由成都武发基金投资。这次的融资一开始就确定了投入方向:大模型。

  毫末智行董事长张凯表示,此次募得资金将主要用于毫末大模型等AI自动驾驶技术的研发投入。“毫末智行会以项目为牵引,加速自动驾驶项目落地。”记者观察到,早在去年,毫末智行就建成了国内自动驾驶行业最大的智算中心MANA OASIS,还推出了自动驾驶生成式大模型DriveGPT。

  大模型概念的异军突起,令自动驾驶企业与车企的合作再上新台阶。国内的文心一言计划接入红旗、长安、吉利、岚图等车企;国外方面,微软亦与奔驰联手,将ChatGPT整合到奔驰车载语音控制系统中。更有部分车企,不再甘愿充当这场科技浪潮中的配角,试图从幕后走向台前。如理想就自研了大模型Mind GPT。据记者不完全统计,蔚来、小鹏、吉利、长城、奇瑞等车企都申请了与GPT相关的商标。

  “Sora通过生成模拟现实世界视频自我训练,可能会比车企以往费时费力实际路测和视频训练来得更快,利用数据驱动解决复杂长尾的问题,极大地提高自动驾驶的泛化能力。”高超认为,Sora的交互能力还有机会影响到现有的自动驾驶模型,消除模块累计误差的同时降低成本。

  需要指出的是,成效显著的背后是巨大的成本代价。开发大模型,抛去技术差异不谈,成本也能拖垮一大片企业。OpenAI的一份报告指出,到2030年训练大模型的成本预计将从1亿美元上升到5亿美元。自动驾驶行业本来就是个无尽烧钱的领域,若再牵扯上大模型,结果多半是不堪重负。

  大模型之外,随着自动驾驶领域向L3迈出了落地的关键一步,也为行业平添了一把火。去年底,为促进智能网联汽车推广应用,提升智能网联汽车产品性能和安全运行水平,工业和信息化部、公安部、住房和城乡建设部、交通运输部等四部门联合发布《关于开展智能网联汽车准入和上路通行试点工作的通知》,L3及L4级别自动驾驶汽车开展准入试点。

  这意味着,自动驾驶在低级别自动驾驶领域内斡旋多年后,终于有望打破L3级自动驾驶政策和技术的双重屏障。一时间,包括宝马、奔驰、阿维塔、深蓝、极狐、智己等车企纷纷领取到测试牌照,并相继在北京、上海、重庆和深圳开启测试。小米集团董事长兼CEO雷军更是放话将在今年底开通100个城市NOA(自动辅助导航驾驶)。

  在力合资本副总裁许奔波看来,自动驾驶技术,是不亚于能源结构变革的交通领域技术革命。但短期内,受限于法律、伦理、技术等因素,需要在封闭或半封闭场景逐步培育、应用。“当前赛道场景的体量很重要,但赛道的场景特征及该特征能否有效延伸到更广阔的赛道,同样重要。”许奔波表示。

  例如,作为最早切入地图赛道的玩家,百度地图正经历着一场由汽车智能化以及AI驱动的技术和商业化变革。百度副总裁尚国斌告诉《证券日报》记者,在智能汽车成为最重要的智能设备后,地图厂商和车企均看到了巨大的商业潜力。百度地图会将过去做的地图大模型全部开放给合作车企,今年最重要的目标就是覆盖足够多的车型,把不同车型上的差异化跑通。

  “对于车企而言,2024年将成为自动驾驶从形成认知到购买转化的重要时间窗口。L3级自动驾驶测试车企的逐步扩展和陆续落地,将大幅推动高阶智能驾驶进一步迭代。”高云鹏总结道,在新能源汽车同质化较为严重的当下,自动驾驶功能必将成为未来汽车产品的核心发力点。

责任编辑:何松琳

发布于:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有