[汽車之家 行業(yè)] 11月15日,,第二十二屆廣州國際汽車展覽會正式開幕。在本屆車展中,,汽車之家邀請了極氪智能科技產(chǎn)品管理部部長石穿空展開深入交流,,共話車市風云、聚力行業(yè)未來,。
在此次交流中,,石穿空向汽車之家表示:“此次車展,我們發(fā)布了面向未來的技術架構,,引入了端到端Plus的概念,。Plus是什么呢?就是我們的數(shù)字先覺網(wǎng)絡,。數(shù)字先覺網(wǎng)絡不是一個圖,,它更多是本地司機的長期記憶,就和大腦的海馬體有點像的,,短期的記憶,。它每天都在發(fā)生,又很重要,,轉(zhuǎn)化成長期記憶存儲起來給大腦調(diào)用,,跟海馬體的功能很像,。有它的加持,可以做到?jīng)Q策的提前,,規(guī)避潛在的風險,。”
以下為對話實錄:
汽車之家:目前無圖智駕大概量產(chǎn)上車的情況怎么樣,?
石穿空:我們現(xiàn)在包括無圖城市NZP10月份開始大規(guī)模公測,,到今天為止我們進一步擴大公測規(guī)模,預計可以達到萬人的規(guī)模,。到今年年底整個無圖NZP就會釋放給全量的用戶,。本身我們?nèi)珖f人用戶可以到處都能用,到年底所有用戶都可以放給他們,,包括搭載“浩瀚智駕2.0”的幾個車型都會開放出去,。
汽車之家:我們的無圖智駕在今年年底可以全國開通,全國跑了,?
石穿空:全國和全量搭載浩瀚智駕2.0系統(tǒng)車型的用戶,。
汽車之家:如何理解我們的數(shù)字先覺網(wǎng)絡,端到端架構是怎么應用,?
石穿空:因為極氪相對來說起步比其他新勢力,,一些頭部友商起步比較晚,所以我們在整個技術的規(guī)劃,,尤其是技術架構的規(guī)劃上面,,寧愿在開始的時候想的清楚一點,這樣避免在后面少走彎路,。我們一開始就做了很多思考,,端到端是行業(yè)都比較認同的技術,本身這個事情是確定要去做的,。
從去年12月第一代發(fā)布的時候,,我們已經(jīng)在做。包括近期友商在做的視覺大語言模型,,我們阿爾法實驗室也在做這個研究,,同步我們在明年上半年,甚至可能會更早,,類似于視覺語言大模型也會上車,。
在這個基礎上我們也會思考,汽車的傳感器不只是視覺,,還有激光,,還有毫米波雷達,甚至將來還包括聲音,,因為人開車時都有各方面的思路,,這些信息都是對于自動駕駛來說,,我們將來不僅會搞視覺語言大模型,還會做多模態(tài)的語言大模型,,MLM的大模型,。這是行業(yè)在走的方向,我們也是提前去思考的,,并且端到端已經(jīng)在今年8月正式落地了,。
我們同時在思考另外一個問題,比如我經(jīng)常在杭州灣和上海待的時間比較多,,開車去上海和杭州灣,,用句夸張的話說,我閉著眼睛都知道上下班的路是怎么樣,,相當于是本地老司機,。其實我們會發(fā)現(xiàn),包括落地端到端之后,,整個無圖NZP我們做了很多測試,本身它實際的體驗已經(jīng)非常好了,,相信整個行業(yè)也是一樣的,。包括路口的通行,類人性已經(jīng)非常好了,。但我們發(fā)現(xiàn)一些問題是端到端和VLM,,甚至將來的MLM可能解決不了的。我們思考一個問題,,為什么一個本地老司機在本地開的很好,,但到了外地他就會謹慎很多。因為我們想不通,,你的駕駛技巧也在,,駕駛經(jīng)驗也在,該學的這些知識也都學過,,為什么到陌生的地方就是變謹慎了,,開的慢了,所以我們帶著這個疑問也在目前技術架構上思考這些問題,。
這就是今天我們帶來思考的結果,,也是跟行業(yè)分享一下我們思考探索的情況,今天上午我們發(fā)布了面向未來的技術架構,,在端到端+MLM,,以及有一個安全底線基礎模型上,我們引入了端到端Plus的概念,。Plus是什么呢,?就是我們的數(shù)字先覺網(wǎng)絡,。舉個例子,比如說你看到前面某一個車,,可能是三車道的路,,其中一個車道前面有一個深坑。人開呢,,這個深坑會繞開,,或者實在繞不開,可能會減速,。端到端Plus大模型如果這種場景學習過,,它在光照條件比較好的情況也能去處理的。有可能在五六十米,、七八十米之外看見之后,,它學過了,周邊的交通環(huán)境也比較好,,可能會繞開,,當它繞不開也會減速通行。但這里仍然存在一個問題,,有些場景下,比如說逆光或者黑夜,,有可能整個光照條件也不好,,等它到七八十米時并不能很好地實時識別,可能要等到更近了,,包括大燈照的更清楚了,,才能識別準確,更可信任了,。那時候已經(jīng)是二三十米了,,等它識別出來,一個80碼的速度去過,,它可能來不及響應,。識別之后有可能不得不來個急減速,體感就很不好,。急減速之后還得壓過去,,這個坑如果深的話,有可能胎或者輪轂都會受到傷害,。甚至更嚴重的,,還會影響方向盤,還會導致事故,。
也有些人會說不一定減速,,周邊沒有障礙的話可以發(fā)起急的轉(zhuǎn)向,,但要在二三十米發(fā)起急轉(zhuǎn)向,后方有來車也是很危險的,。不管怎么樣,,這種情況就會導致潛在風險的可能。你有數(shù)字先覺網(wǎng)絡,,因為這條路假設是陌生的,,沒有辦法。這條路你是每天上下班都會開的,,我不一定要看見,,我在1公里之外,甚至200米開外就知道前面是有個坑的,,我沒必要等到看到再去做響應,,可能會提前去做一些響應,是表達這個意思,。數(shù)字先覺網(wǎng)絡可以做到?jīng)Q策的提前,,規(guī)避潛在的風險。
舉個例子,,比如他們都說扁鵲治病很厲害,,但真正厲害的是扁鵲治未病之病,生小病時已經(jīng)治好了,,其實先覺網(wǎng)絡就是這樣一個思考!
汽車之家:比如我們很多車在路上跑會收集很多數(shù)據(jù),,把實時數(shù)據(jù),,比如路況信息,一些障礙信息提前輸入到端到端Plus網(wǎng)絡之中,,同樣路況下我知道前面有一定障礙風險了,,提前減速,做提前的準備,,再結合端到端更好地去過這個路口或路段,。
石穿空:對,我們說本地老司機,。
汽車之家:極氪車主都可以共享數(shù)據(jù),。
石穿空:現(xiàn)在我們剛起步,將來我們規(guī)劃當中你開的本地化信息也可以共享,。我這邊要強調(diào)數(shù)字先覺網(wǎng)絡不是一個圖,,這次我們的無圖NZP只用了SD的導航信息,任何高清地圖我們都沒有用,。數(shù)字先覺更多是本地司機的長期記憶,,就和大腦的海馬體有點像的,,短期的記憶。它每天都在發(fā)生,,又很重要,,然后會轉(zhuǎn)化成長期記憶存儲起來給大腦調(diào)用,跟海馬體的功能很像,。我們起了一個名字叫“數(shù)字先覺網(wǎng)絡”,,幫助大家更好的理解,它不只是一個圖,。圖里可能是一些車道級信息,,然后停止線,拓撲做得很細,,但你會發(fā)現(xiàn)坑不能算作傳統(tǒng)意義上的高精地圖,。還有小區(qū)路口,經(jīng)常有車躥出來,,這不是高清地圖能標識的,。還有紅綠燈被樹葉遮擋,這種是動態(tài)的時空環(huán)境的信息,。
我們把數(shù)據(jù)先覺網(wǎng)絡歸納兩部分:1.信息先覺,,有道路先覺、行為先覺,、時空先覺,。2.經(jīng)驗先覺,我們將來會利用數(shù)字先覺網(wǎng)絡去把人駕的經(jīng)驗和信息進一步學習和提煉,,實現(xiàn)駕駛經(jīng)驗的先覺,。我們知道上海司機開車的風格和武漢司機,成都,、重慶,、廣州的開車風格都不一樣,不僅每個地方司機開車風格不一樣,,甚至每個人開車風格也不一樣,。這里把人開車的風格,將來也可以丟到數(shù)字先覺網(wǎng)絡里訓練,,可以實現(xiàn)千城千面,,更遠的將來可以實現(xiàn)千人千面,因為只有自己的開車風格是最習慣的,。你把一個上海司機開車風格丟到武漢去,,他肯定不喜歡的。
端到端比以前規(guī)則時代已經(jīng)好很多了,因為規(guī)則時代可能更像是新手司機,,我不知道這樣比喻對不對,。可能老師教過的,,教練教過的,,他知道,他會去開,,老師沒有教過的,,他不知道怎么辦了,像新手司機,。端到端之后,,他更像一個開了幾年的老司機,老師教過的東西,,他上了路也有沒有遇到的情況,,他自己摸索了。就像數(shù)據(jù)給喂了之后,,他摸索學會了,,有一些老師沒有教過的也能開。它的泛化性比規(guī)則要好,,因為數(shù)據(jù)丟進去之后,,它不僅遇到的問題知道怎么解,類似的一連串的問題也能解,。端到端還是比規(guī)則時代提升了很多,。
如果比作駕駛考試的話,相對于原來規(guī)則你考個六七十分,,端到端上限能大幅度提升到90分,。而VLM/MLM,像人類老司機一樣,,我們開車場景不只是車或者人,有一些物理世界通識在里面,。比如一個尼龍袋,,端到端學習后認為是一個突出的物體,是個GOD通用障礙物,,不能撞,。但有了VLM/MLM,它知道是尼龍袋可以壓過去,,有更多的知識在里面,,不僅是交通知識,會幫助這個司機變成一個人類老司機,。
如果說端到端+VLM/MLM,,可以做到95分,,再進一步你要考到99分的話,就需要數(shù)字先覺網(wǎng)絡,,將來在更多的情況下體驗會更好,。
汽車之家:特斯拉和小鵬已經(jīng)是純視覺,還有激光雷達的輔助,,極氪未來考慮純視覺路線,,還是激光雷達技術作為保障?
石穿空:在技術上我們兩條路線都是在做準備的,,為什么都在做準備呢,?其實有一個信息,我不知道你有沒有注意到,,我們“浩瀚智駕1.0”發(fā)布之后,,我們上線的007既有激光版又有純視覺版的。像其他友商最近在上純視覺的智駕,,其實我們?nèi)ツ?2月份時候已經(jīng)上了純視覺版的,,那時候只支持高速的能力。我們第一次量產(chǎn)時是同時配置兩個車型,,其他廠商要么發(fā)激光的,,要么先發(fā)視覺的,沒有兩個配置一塊同時發(fā)的,。
對于第二點來說,,你的問題更多是純視覺將來要不要去做純視覺版城區(qū)的智駕。技術上我們會一直準備的,,但用不用,,這里有兩個考量,我們本身的觀點認為作為將來智駕的發(fā)展,,包括現(xiàn)在從安全角度來講,,激光也還是有必要的。因為激光本身是主動光的探測,,它在整個探測結果的時延,、精度以及測速和測量距離、位置的精度上,,其實是有天然不可替代的優(yōu)勢,。然后尤其在黑夜或者雨霧、逆光場景,,它不像攝像頭會需要ISP做不同的調(diào)校,,讓算法去調(diào)優(yōu)。本身算力就會涉及到時延,激光是主動物理的探測,,純視覺是基于算法的,,時延上本身就會有些影響。還有測量精度,,激光是有些優(yōu)勢的,。我們認為純視覺就像教一個小孩去學習,他本身學習能力要很強,,視覺是打底的,,是主要的東西。但激光并不是沒有用,,激光的優(yōu)勢是顯而易見的,。你優(yōu)先把視覺做得很強,再用激光好上加好,。
我們認為激光將來更多用于安全的冗余,、安全的兜底,包括面向?qū)砀唠A的駕駛,,怎么去做冗余,,傳感器的冗余是很有必要的,這是技術上的思考,。
當然,,是不是激光或者純視覺,更多是商業(yè)上的思考,,成本上去掉激光會更便宜一點,。還有車型的定位是怎樣的,其實好多用戶越來越懂智駕了,,它的芯片算力大不大,,有沒有配置激光,用戶第一印象就是有沒有這個,。有了這個,,我們會認為好,然后再說算法怎么牛,,體驗好不好,。所以是兩方面,一方面是技術的,,一方面是商業(yè)上的車型定位,以及這個車型將來對應的用戶群體怎么樣,,這個可能不是技術上怎么樣,,技術上就做好準備。
汽車之家:我們現(xiàn)在聽到一些用戶聲音,一種是用純視覺的,,覺得算法已經(jīng)特別好了,;還有一種認為用純視覺就省成本,不給高端硬件,。還有的認為用激光的更安全更有保證,,還有的認為用激光的算法不好,用戶也在搖擺之中,,這個階段智駕大家還是在選走哪個方向,,哪個路走得更順,我們都可以去選擇,。
石穿空:這兩個技術路線,,我個人認為不是技術路線之爭,因為帶激光在視覺算法上的技術儲備我們一直在做的,,不會說用激光之后純視覺就不搞了,,肯定純視覺基礎上再加入激光,同步在搞,,本身不是技術路線之爭,,完全是產(chǎn)品定義的考量。你可以有純視覺,,也可以有激光,,具體取決于自己車型面向的是什么樣的用戶群體,你的車想賣到什么樣的成本價位,,用戶群體是怎樣的,,是這個思考,我認為不是技術路線,。我不認為搞了激光之后,,視覺技術就不搞了。
汽車之家:最后一個問題,,剛才聊了這么多智駕方面,,極氪除了智駕,在本身產(chǎn)品競爭力上也很強,,現(xiàn)在有什么可以分享新技術,,以及未來極氪產(chǎn)品的規(guī)劃。
石穿空:面對未來兩三年的技術架構,,包括我們早上發(fā)布端到端Plus的新技術架構和數(shù)字先覺網(wǎng)絡,,技術方面我就不再重復了。
產(chǎn)品上最新的規(guī)劃,,也是前面陳總介紹過的,,除了無圖城市NZP,,我在年底會全國全量釋放給搭載“浩瀚智駕2.0”車型,車位到車位的功能,,2025年就看車位到車位了,,因為2024年大家都在看無圖全國,2025年就在看車位到車位,。車位到車位,,其實目前為止,但我還沒有看今天廣州車展的情況,,反正之前我了解到也就1-2家友商給媒體試駕過,,給用戶試駕過,其實沒有幾家,。我們極氪是第一批這樣去發(fā),,包括10月底我們已經(jīng)給大量媒體真正體驗過端到端,我們地庫的兩個抬桿可以過,,還上了高速的ETC,,我們的端到端支持一次可以過4個抬桿。
汽車之家:今天友商這些我們在實踐中已經(jīng)可以體驗了,。
石穿空:因為我們本身泊車的能力也很強,,機械車位也可以支持,因為現(xiàn)在整個行業(yè)支持機械車位的也就一兩家,。我們針對無劃線車位,,本身泊車就支持。所以端到端我們預計2025年1月份會分批開始啟動,,向用戶推送,。我們的目標是計劃在2025年年中左右,上半年看能不能更大規(guī)模給用戶推送出去,,大概是這樣的,。
汽車之家:謝謝,今年極氪是給了我們非常多驚喜的品牌,,包括產(chǎn)品,,包括技術,包括價格,。
石穿空:下半年我們迭代很快,,包括無圖智駕方案,用戶反饋說其實他沒有那么急,,但極氪是真的快,!
汽車之家:以前我們感覺新勢力往前跑得很快,我們這些有傳統(tǒng)車企背景的品牌會比較嚴謹�,,F(xiàn)在看,,極氪不管從嚴謹角度還是從技術迭代角度都很快,,讓用戶可以持續(xù)體驗,在銷量上勢頭也很猛,,包括7X銷量也是能印證的。除了卷價格之外,,極氪的產(chǎn)品力也很強,。
好評理由:
差評理由: