[汽車之家 行業(yè)] 由智能化,、電動(dòng)化帶來的全球汽車產(chǎn)業(yè)的大變革已經(jīng)取得成效,。在這一輪變革中,,技術(shù)快速迭代,,消費(fèi)者需求也發(fā)生了明顯改變,,甚至在我國形成了“無智能,不電動(dòng)”的特有現(xiàn)象,。若將智能,、電動(dòng)這兩個(gè)標(biāo)簽拆分來看,后者相對較低的門檻本就是我國繞過傳統(tǒng)壁壘實(shí)現(xiàn)競爭的根源所在,,前者則是“換道超車”的差異化競爭的重要倚仗,。
也就是說在隨后的進(jìn)一步變革中,智能化能力的強(qiáng)弱,,將直接決定車企的競爭上限,。如今的智能座艙發(fā)展可謂日新月異,巨屏,、車外語音,、手勢操控等新配置/功能不斷涌現(xiàn),而在智能駕駛領(lǐng)域,,大家越來越卷,。
其實(shí)想實(shí)現(xiàn)真正的自動(dòng)駕駛,,無非是兩條路徑:第一條是自上而下,直接定位到L4\\\\L5級別無人駕駛,,再將配置,、能力逐步下放,從而實(shí)現(xiàn)低成本解決絕大部分無人場景,;第二條則是如今主機(jī)廠們慣用的形式,,自下而上,量產(chǎn)低級別智能駕駛,,并通過其環(huán)節(jié)中產(chǎn)生的大量數(shù)據(jù)不斷迭代技術(shù),,向更高級別演進(jìn)。在這條路線中,,能否量產(chǎn)是最關(guān)鍵一環(huán),。
據(jù)汽車之家研究院公布的《中國智能汽車發(fā)展趨勢洞察》報(bào)告中顯示,2022年,,主動(dòng)剎車,、車道保持輔助系統(tǒng)、自適應(yīng)巡航系統(tǒng)等L2級智能駕駛代表性功能的市場滲透率高速增長,,哪怕此前略顯保守的海外品牌,,也將上述部分功能當(dāng)成了新車標(biāo)配。
但在真正考驗(yàn)“L2+”智能駕駛能力的領(lǐng)域,,比如城市NOA(面向城市域的高階智能駕駛輔助系統(tǒng),,不同車企間叫法不同),能實(shí)現(xiàn)向上突破者寥寥,。大部分公布了城市NOA功能的企業(yè),,要么屬于“期貨”尚未兌現(xiàn),要么是采用內(nèi)測,、早鳥等形式推送,,距離真正的量產(chǎn)尚有距離。而自動(dòng)駕駛領(lǐng)域的下半場競爭的開端,,也就藏在上述量產(chǎn)難題之中,。
★路線之爭:從【重】地圖到【輕】地圖
從目前來看,有能力涉足城市NOA領(lǐng)域的玩家并不在少數(shù),。走從下到上路線的企業(yè)有毫末智行,、蔚來,、理想,、小鵬、集度等,;走從上到下路線的企業(yè)有百度,、輕舟智航,、小馬智行等。不過從推出時(shí)間和推廣規(guī)模來看,,這些車企的城市NOA大多集中在廣州,、深圳、上海這三個(gè)城市,。
比如小鵬,,2022年9月,小鵬城市NGP智能導(dǎo)航輔助駕駛在廣州正式開啟試點(diǎn),,首批被推送的用戶是從廣州提交過智能輔助駕駛建議的P5車主中隨機(jī)選取,,且初期必須得經(jīng)歷“新手模式”——即在部分條件適宜路段使用城市NGP超過100公里,時(shí)長超過7天后才可解鎖全部路段,。自此一段時(shí)間后,,該功能才逐漸面在深圳、上海開放,。
曾在某次上海車展前夕憑借“自動(dòng)駕駛”視頻火遍全網(wǎng)的極狐,,雖然在2022年5月就交付了極狐阿爾法S HI版,但到9月才于深圳開啟城市NCA功能測試,,并于隨后延伸至上海,。
之所以早期城市NOA集中在廣州、深圳,、上海,,是因?yàn)樯鲜鋈蟪鞘惺菄鴥?nèi)最早一批頒發(fā)高精地圖城市試點(diǎn)的許可的城市。與高速域不同,,面向城市域的高階智能駕駛要面對的復(fù)雜路況呈指數(shù)級增長,,信號燈變化、潮汐車道變化,、路面行人軌跡預(yù)測,、非機(jī)動(dòng)車軌跡預(yù)測……這一切場景對于企業(yè)軟硬件綜合能力要求極高。曾有數(shù)據(jù)顯示,,小鵬城市NGP感知模型的數(shù)量已經(jīng)達(dá)到高速NGP的4倍,,預(yù)測/規(guī)劃/控制相關(guān)代碼量則提升至88倍,其復(fù)雜程度由此可見一斑,。
面對上述復(fù)雜場景,,在軟硬件綜合能力沒那么強(qiáng)大時(shí)絕對精度和相對精度均在 1 米以內(nèi)的,蘊(yùn)含道路類型,、曲率,、車道線位置等道路信息,以及路邊基礎(chǔ)設(shè)施、障礙物,、交通標(biāo)志等環(huán)境對象信息,,同時(shí)包括交通流量、紅綠燈狀態(tài)信息等實(shí)時(shí)動(dòng)態(tài)信息的,,高精度,、高新鮮度、高豐富度的高精地圖高精地圖就成為了車企快速上馬城市NOA的“捷徑”,。
但事物都有兩面性,,高精地圖的局限性,以及其資質(zhì)難獲取等特性也成為局限住車企NOA快速量產(chǎn)的關(guān)鍵原因,。在2023中國汽車論壇上,,重慶長安汽車股份有限公司首席專家李偉曾剖析過“重地圖”模式的弊端。他認(rèn)為該模式屬于遞增式投入,,雖然前期高速+少量城市數(shù)據(jù)采購成本不高,,但后期隨城市擴(kuò)展,采購成本激增,,不僅如此,,還面臨地圖鮮度不足、覆蓋不足的長期問題,,這必然導(dǎo)致智駕系統(tǒng)魯棒性差,。
『高精地圖示意圖』
至于其長期成本有多高,華為常務(wù)董事,、終端BG CEO,、智能汽車解決方案BU CEO余承東曾舉過一個(gè)例子:“僅僅采集上海市高精地圖,采集了一兩年,、9000公里,,都沒有把上海完全覆蓋。并且從國家安全的角度,,幾個(gè)月才允許刷新,,但是中國的道路天天在改,所以說依賴于高精地圖真的沒法廣泛使用,�,!闭�?yàn)榇耍瑯I(yè)內(nèi)也逐漸達(dá)成共識——想讓城市NGP快速實(shí)現(xiàn)量產(chǎn),,去圖化可能是唯一途徑,。
在業(yè)內(nèi),毫末智行無疑是第一批打出“重感知”派招牌的企業(yè),。早在2022年,,毫末智行便官宣了搭載HPilot 3.0系統(tǒng),,可實(shí)現(xiàn)城市NOH領(lǐng)航輔助功能的量產(chǎn)車型;今年4月,,在第八屆毫末AI DAY上,該企業(yè)又宣布上述功能的新“載體”——魏牌的新摩卡DHT-PHEV和魏牌藍(lán)山(參數(shù)|詢價(jià)),。根據(jù)現(xiàn)有規(guī)劃,,毫末智行旗下的城市NOH功能將率先在北京、上海,、保定等城市落地,。
『請點(diǎn)擊圖片查看清晰內(nèi)容』
除毫末外,小鵬,、華為等此前依賴高精地圖的企業(yè)也開始進(jìn)行“重感知”進(jìn)化,。其中小鵬的XNGP已經(jīng)進(jìn)行無圖化測試,預(yù)計(jì)在年底擴(kuò)展到50個(gè)城市,;余承東則宣布華為不依賴于高精地圖的城區(qū)NCA將在第三季度內(nèi)實(shí)現(xiàn)15城落地,,到四季度將增加到 45城。就連地圖巨頭百度都已經(jīng)在向重感知方案靠攏,,其ANP3.0系統(tǒng)已經(jīng)將“BEV 環(huán)視三維感知”技術(shù)作為安全冗余,。
★技術(shù)之爭:【數(shù)據(jù)能力】才是門檻
根據(jù)西部證券公布的預(yù)測顯示,未來城市NOA將是一塊大蛋糕,,其車型數(shù)量規(guī)�,?赡軙�2023-2025年分別達(dá)到11.9萬輛、67.6萬輛和243.6萬輛,。但想在這塊蛋糕中多吃多占,,可不僅僅是確定路線這么簡單。
在沒有或不依賴高精地圖時(shí),,如將傳感器識別到的數(shù)據(jù)進(jìn)行處理,,并通過其做到更大規(guī)模的城市泛化,適應(yīng)不同城市“亂七八糟”的路況,、場景,。以最基本的識別紅綠燈控車、別紅綠燈這一在部分人看來可能很基礎(chǔ)的功能為例,。我國不同城市的紅綠燈規(guī)格都不甚相同,,有三排燈、有五排燈,,有橫著的,、有豎著的……先不提算法,為了滿足上述場景,,收集來的數(shù)據(jù)規(guī)模就會和以前實(shí)現(xiàn)指數(shù)級增長,。
在這種數(shù)據(jù)規(guī)模下,像以前一樣依靠CNN卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型似乎就不再適用了。在這方面,,率先提出擺脫高精地圖,,甚至取消激光雷達(dá),采用純視覺方案的特斯拉給大家開了個(gè)好頭,,開始用Transformer大模型替代CNN,,利用其結(jié)構(gòu)簡潔、可無限堆疊基本單元得到巨大參數(shù)量的特性來提升,。
相比于CNN,,Transformer在的數(shù)據(jù)量越大,其效果就越好,。有研究表明,,當(dāng)訓(xùn)練數(shù)據(jù)集增大到包含 1億張圖像時(shí),Transformer的性能開始超過CNN,。而當(dāng)圖像數(shù)量增加到10億張時(shí),,兩者的性能差距變得更大。
在國內(nèi),,毫末智行則是率先引入Transformer大模型的自動(dòng)駕駛公司,。雖然時(shí)間上沒有特斯拉早,但毫末智行的創(chuàng)新在于用Transformer做時(shí)間和空間上的前融合,。
比如面臨一段在正常不過的路,,人眼看到的是雙向四車道,是連續(xù)的視覺圖像,,而攝像頭的識別卻并非連貫的,,而是一幀一幀的圖片。假設(shè)車往左偏5厘米,,人識別出來的信息很正常,,掰直即可,原有方案下攝像頭識別的可就復(fù)雜了,,也許以為路本身就是“歪的”,,這種時(shí)間上的“斷點(diǎn)”再加上前后左右、側(cè)前側(cè)后等方向攝像頭識別出的空間上的“亂象”,,若沒有高精地圖進(jìn)行糾正,,則很可能成把系統(tǒng)“干懵”,無法進(jìn)行有效拼接,。
而毫末的方法是用Transformer 做時(shí)間和空間上的前融合,,也就是通過該大模型的注意力特征,提取不同圖片像素之間的相關(guān)性,,用其特征向量進(jìn)行前融合,,再通過神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)預(yù)測,。這樣不僅能解決多角度攝像頭無法拼接出“上帝視角”的問題,甚至還能融合激光雷達(dá)數(shù)據(jù),,來給視覺效果進(jìn)行補(bǔ)充,。
對此,毫末智行技術(shù)總監(jiān)潘興曾用城市領(lǐng)域最容易出現(xiàn)的車道線場景作為范例,。他表示,,和高速場景不同,城區(qū)道路車道線極為復(fù)雜,,有的地方被磨沒了,有的地方可能重新粉刷,,但舊的車道線還沒完全鏟除,。這種場景下,Transformer大模型的注意力機(jī)制可以很好的解決問題,。
值得注意的是,,城市域NOA所面臨的類似場景還有很多。比如復(fù)雜十字路口處有多個(gè)紅燈,,到底哪個(gè)燈亮了車輛才應(yīng)該走,?想解決諸如此類的千千萬萬個(gè)場景,就得識別大量的數(shù)據(jù),、做大量的標(biāo)注,、模擬大量的場景、進(jìn)行大量的學(xué)習(xí),、加以大量的調(diào)整,、寫大量的規(guī)則……
上述“大量”要怎么解決?用毫末智行CEO顧維灝的話說,,行業(yè)里搞了20年,,把預(yù)測、規(guī)劃,、決策,、控制,每一項(xiàng)都分成一個(gè)個(gè)小任務(wù),,20 年也沒搞成,。直到類GPT(Generative Pre-trained Transformer)技術(shù)開始應(yīng)用。
今年4月11日,,毫末智行正式發(fā)布自動(dòng)駕駛生成式大模型DriveGPT,,中文名為“雪湖·海若”和爆火的ChatGPT類似,只不過ChatGPT采用自然語言進(jìn)行輸入與輸出,,DriveGPT則面向自動(dòng)駕駛場景,,用感知融合后的文本序列輸入,,以自動(dòng)駕駛場景文本序列作為輸出,將自動(dòng)駕駛場景Token化,,形成“Drive Language”,,最終完成自車的決策規(guī)控、障礙物預(yù)測以及決策邏輯鏈的輸出等任務(wù),。通俗來說就是,,把上述所有小任務(wù)縮減為兩個(gè)大任務(wù),一個(gè)是感知,,一個(gè)是認(rèn)知,。
另外,毫末智行也開始和生態(tài)伙伴探索四大應(yīng)用能力,,包括智能駕駛,、駕駛場景識別、駕駛行為驗(yàn)證,、困難場景脫困,。比如,在場景識別中,,毫末DriveGPT單針圖片的整體標(biāo)注成本,,僅相當(dāng)于行業(yè)的1/10。而這項(xiàng)技術(shù)向行業(yè)的開放使用,,將會大幅降低行業(yè)使用數(shù)據(jù)的成本,,從而提升自動(dòng)駕駛技術(shù)的發(fā)展。
毫末可以逐步將DriveGPT應(yīng)用在城市NOH,、捷徑推薦,、智能陪練以及脫困場景中。DriveGPT的加入,,能夠讓車輛行駛會更安全,,規(guī)控動(dòng)作更人性、更絲滑,,并有合理的邏輯告訴駕駛者,,車輛為何選擇這樣的決策動(dòng)作。
而這就是毫末給出來的去圖方案,,極為考驗(yàn)數(shù)據(jù)處理能力,。而這種處理能力,加上自動(dòng)駕駛數(shù)據(jù)量——也就是誰先量產(chǎn),,通過量產(chǎn)出來的車收集更多的數(shù)據(jù)并加以處理,,最終實(shí)現(xiàn)滾雪球式的技術(shù)迭代,這才是城市NOA功能的門檻所在,。
寫在最后:
高精地圖成本高,、采集難,、鮮活度差,而依賴大量基建的車路協(xié)同方案的實(shí)現(xiàn)難度要更高于高精地圖,,在此前提下,,想量產(chǎn)城市NOA,實(shí)現(xiàn)正向循環(huán),,著實(shí)不是一件容易的事,。
據(jù)毫末智行董事長張凱表示,該企業(yè)之所以能快速實(shí)現(xiàn)量產(chǎn),,無非是做好了一下幾個(gè)閉環(huán):用戶需求閉環(huán)——對駕駛場景數(shù)據(jù)持續(xù)分析完善策略,,并進(jìn)行新功能體驗(yàn)反饋;研發(fā)效能閉環(huán)——將數(shù)據(jù)驅(qū)動(dòng)理念深入到產(chǎn)品需求定義,、感知與認(rèn)知算法開發(fā)等產(chǎn)品開發(fā)流程,,整體開發(fā)效率提升;數(shù)據(jù)積累閉環(huán)——在車端部署診斷服務(wù)數(shù)據(jù)場景標(biāo)簽覆蓋92%的駕駛場景,;數(shù)據(jù)價(jià)值閉環(huán)——大模型持續(xù)挖掘數(shù)據(jù)價(jià)值解決關(guān)鍵問題,;產(chǎn)品自完善閉環(huán)——實(shí)現(xiàn)售后問題處理速度較傳統(tǒng)方式的十倍效率提升,,實(shí)現(xiàn)最快10分鐘定位售后問題,;業(yè)務(wù)工程化閉環(huán)——進(jìn)一步完善了從采集回流、標(biāo)注訓(xùn)練,、系統(tǒng)標(biāo)定,、仿真驗(yàn)證等環(huán)節(jié)到最終 OTA 釋放環(huán)節(jié)的產(chǎn)品研發(fā)全流程工程化閉環(huán)。上述閉環(huán)光是看起來就已經(jīng)頗為復(fù)雜,,實(shí)現(xiàn)起來就更不容易,,這種門檻實(shí)則已經(jīng)篩選掉了很多玩家。
對此,,即便體量(單指智能汽車)龐大如特斯拉,,也要通過開放FSD給其余車企的形式進(jìn)一步擴(kuò)大數(shù)據(jù)收集能力。在這方面,,背靠長城并逐漸擴(kuò)大朋友圈的毫末智行,、給眾多主機(jī)廠提供方案的華為似乎也有一定的規(guī)模優(yōu)勢。相信在這種挑戰(zhàn)下,,糾結(jié)“靈魂論”的主機(jī)廠會越來越少,,畢竟在自動(dòng)駕駛下半場競爭的急迫環(huán)境中,如此數(shù)據(jù)體量,、技術(shù)能力,,已經(jīng)不是靠自研和收購能解決的了。(文/汽車之家 陳燦 )
好評理由:
差評理由: