[汽車之家 行業(yè)] 11月15日,第二十二屆廣州國際汽車展覽會正式開幕,。在本屆車展中,,汽車之家邀請了極氪智能科技產(chǎn)品管理部部長石穿空展開深入交流,共話車市風云,、聚力行業(yè)未來,。
在此次交流中,石穿空向汽車之家表示:“此次車展,,我們發(fā)布了面向未來的技術架構(gòu),,引入了端到端Plus的概念。Plus是什么呢,?就是我們的數(shù)字先覺網(wǎng)絡,。數(shù)字先覺網(wǎng)絡不是一個圖,它更多是本地司機的長期記憶,,就和大腦的海馬體有點像的,,短期的記憶。它每天都在發(fā)生,又很重要,,轉(zhuǎn)化成長期記憶存儲起來給大腦調(diào)用,,跟海馬體的功能很像。有它的加持,,可以做到?jīng)Q策的提前,,規(guī)避潛在的風險�,!�
以下為對話實錄:
汽車之家:目前無圖智駕大概量產(chǎn)上車的情況怎么樣,?
石穿空:我們現(xiàn)在包括無圖城市NZP10月份開始大規(guī)模公測,到今天為止我們進一步擴大公測規(guī)模,,預計可以達到萬人的規(guī)模,。到今年年底整個無圖NZP就會釋放給全量的用戶。本身我們?nèi)珖f人用戶可以到處都能用,,到年底所有用戶都可以放給他們,,包括搭載“浩瀚智駕2.0”的幾個車型都會開放出去。
汽車之家:我們的無圖智駕在今年年底可以全國開通,,全國跑了,?
石穿空:全國和全量搭載浩瀚智駕2.0系統(tǒng)車型的用戶。
汽車之家:如何理解我們的數(shù)字先覺網(wǎng)絡,,端到端架構(gòu)是怎么應用,?
石穿空:因為極氪相對來說起步比其他新勢力,一些頭部友商起步比較晚,,所以我們在整個技術的規(guī)劃,,尤其是技術架構(gòu)的規(guī)劃上面,寧愿在開始的時候想的清楚一點,,這樣避免在后面少走彎路,。我們一開始就做了很多思考,,端到端是行業(yè)都比較認同的技術,,本身這個事情是確定要去做的。
從去年12月第一代發(fā)布的時候,,我們已經(jīng)在做,。包括近期友商在做的視覺大語言模型,我們阿爾法實驗室也在做這個研究,,同步我們在明年上半年,,甚至可能會更早,類似于視覺語言大模型也會上車,。
在這個基礎上我們也會思考,,汽車的傳感器不只是視覺,還有激光,還有毫米波雷達,,甚至將來還包括聲音,,因為人開車時都有各方面的思路,這些信息都是對于自動駕駛來說,,我們將來不僅會搞視覺語言大模型,,還會做多模態(tài)的語言大模型,MLM的大模型,。這是行業(yè)在走的方向,,我們也是提前去思考的,并且端到端已經(jīng)在今年8月正式落地了,。
我們同時在思考另外一個問題,,比如我經(jīng)常在杭州灣和上海待的時間比較多,開車去上海和杭州灣,,用句夸張的話說,,我閉著眼睛都知道上下班的路是怎么樣,相當于是本地老司機,。其實我們會發(fā)現(xiàn),,包括落地端到端之后,整個無圖NZP我們做了很多測試,,本身它實際的體驗已經(jīng)非常好了,,相信整個行業(yè)也是一樣的。包括路口的通行,,類人性已經(jīng)非常好了,。但我們發(fā)現(xiàn)一些問題是端到端和VLM,甚至將來的MLM可能解決不了的,。我們思考一個問題,,為什么一個本地老司機在本地開的很好,,但到了外地他就會謹慎很多。因為我們想不通,你的駕駛技巧也在,,駕駛經(jīng)驗也在,,該學的這些知識也都學過,,為什么到陌生的地方就是變謹慎了,,開的慢了,所以我們帶著這個疑問也在目前技術架構(gòu)上思考這些問題,。
這就是今天我們帶來思考的結(jié)果,,也是跟行業(yè)分享一下我們思考探索的情況,今天上午我們發(fā)布了面向未來的技術架構(gòu),,在端到端+MLM,,以及有一個安全底線基礎模型上,,我們引入了端到端Plus的概念。Plus是什么呢,?就是我們的數(shù)字先覺網(wǎng)絡,。舉個例子,比如說你看到前面某一個車,,可能是三車道的路,,其中一個車道前面有一個深坑。人開呢,,這個深坑會繞開,,或者實在繞不開,可能會減速,。端到端Plus大模型如果這種場景學習過,,它在光照條件比較好的情況也能去處理的。有可能在五六十米,、七八十米之外看見之后,,它學過了,周邊的交通環(huán)境也比較好,,可能會繞開,,當它繞不開也會減速通行。但這里仍然存在一個問題,,有些場景下,,比如說逆光或者黑夜,有可能整個光照條件也不好,,等它到七八十米時并不能很好地實時識別,,可能要等到更近了,包括大燈照的更清楚了,,才能識別準確,,更可信任了。那時候已經(jīng)是二三十米了,,等它識別出來,,一個80碼的速度去過,它可能來不及響應,。識別之后有可能不得不來個急減速,,體感就很不好,。急減速之后還得壓過去,,這個坑如果深的話,有可能胎或者輪轂都會受到傷害,。甚至更嚴重的,,還會影響方向盤,,還會導致事故。
也有些人會說不一定減速,,周邊沒有障礙的話可以發(fā)起急的轉(zhuǎn)向,,但要在二三十米發(fā)起急轉(zhuǎn)向,后方有來車也是很危險的,。不管怎么樣,,這種情況就會導致潛在風險的可能。你有數(shù)字先覺網(wǎng)絡,,因為這條路假設是陌生的,,沒有辦法。這條路你是每天上下班都會開的,,我不一定要看見,,我在1公里之外,甚至200米開外就知道前面是有個坑的,,我沒必要等到看到再去做響應,,可能會提前去做一些響應,是表達這個意思,。數(shù)字先覺網(wǎng)絡可以做到?jīng)Q策的提前,,規(guī)避潛在的風險。
舉個例子,,比如他們都說扁鵲治病很厲害,,但真正厲害的是扁鵲治未病之病,生小病時已經(jīng)治好了,,其實先覺網(wǎng)絡就是這樣一個思考,!
汽車之家:比如我們很多車在路上跑會收集很多數(shù)據(jù),把實時數(shù)據(jù),,比如路況信息,,一些障礙信息提前輸入到端到端Plus網(wǎng)絡之中,同樣路況下我知道前面有一定障礙風險了,,提前減速,,做提前的準備,再結(jié)合端到端更好地去過這個路口或路段,。
石穿空:對,,我們說本地老司機。
汽車之家:極氪車主都可以共享數(shù)據(jù),。
石穿空:現(xiàn)在我們剛起步,,將來我們規(guī)劃當中你開的本地化信息也可以共享。我這邊要強調(diào)數(shù)字先覺網(wǎng)絡不是一個圖,,這次我們的無圖NZP只用了SD的導航信息,,任何高清地圖我們都沒有用,。數(shù)字先覺更多是本地司機的長期記憶,就和大腦的海馬體有點像的,,短期的記憶,。它每天都在發(fā)生,又很重要,,然后會轉(zhuǎn)化成長期記憶存儲起來給大腦調(diào)用,,跟海馬體的功能很像。我們起了一個名字叫“數(shù)字先覺網(wǎng)絡”,,幫助大家更好的理解,,它不只是一個圖。圖里可能是一些車道級信息,,然后停止線,,拓撲做得很細,但你會發(fā)現(xiàn)坑不能算作傳統(tǒng)意義上的高精地圖,。還有小區(qū)路口,,經(jīng)常有車躥出來,這不是高清地圖能標識的,。還有紅綠燈被樹葉遮擋,,這種是動態(tài)的時空環(huán)境的信息。
我們把數(shù)據(jù)先覺網(wǎng)絡歸納兩部分:1.信息先覺,,有道路先覺,、行為先覺、時空先覺,。2.經(jīng)驗先覺,,我們將來會利用數(shù)字先覺網(wǎng)絡去把人駕的經(jīng)驗和信息進一步學習和提煉,實現(xiàn)駕駛經(jīng)驗的先覺,。我們知道上海司機開車的風格和武漢司機,,成都、重慶,、廣州的開車風格都不一樣,,不僅每個地方司機開車風格不一樣,甚至每個人開車風格也不一樣,。這里把人開車的風格,,將來也可以丟到數(shù)字先覺網(wǎng)絡里訓練,可以實現(xiàn)千城千面,,更遠的將來可以實現(xiàn)千人千面,,因為只有自己的開車風格是最習慣的。你把一個上海司機開車風格丟到武漢去,,他肯定不喜歡的,。
端到端比以前規(guī)則時代已經(jīng)好很多了,,因為規(guī)則時代可能更像是新手司機,,我不知道這樣比喻對不對,。可能老師教過的,,教練教過的,,他知道,他會去開,,老師沒有教過的,,他不知道怎么辦了,像新手司機,。端到端之后,,他更像一個開了幾年的老司機,老師教過的東西,,他上了路也有沒有遇到的情況,,他自己摸索了。就像數(shù)據(jù)給喂了之后,,他摸索學會了,,有一些老師沒有教過的也能開。它的泛化性比規(guī)則要好,,因為數(shù)據(jù)丟進去之后,,它不僅遇到的問題知道怎么解,類似的一連串的問題也能解,。端到端還是比規(guī)則時代提升了很多,。
如果比作駕駛考試的話,相對于原來規(guī)則你考個六七十分,,端到端上限能大幅度提升到90分,。而VLM/MLM,像人類老司機一樣,,我們開車場景不只是車或者人,,有一些物理世界通識在里面。比如一個尼龍袋,,端到端學習后認為是一個突出的物體,,是個GOD通用障礙物,不能撞,。但有了VLM/MLM,,它知道是尼龍袋可以壓過去,有更多的知識在里面,,不僅是交通知識,,會幫助這個司機變成一個人類老司機,。
如果說端到端+VLM/MLM,可以做到95分,,再進一步你要考到99分的話,,就需要數(shù)字先覺網(wǎng)絡,將來在更多的情況下體驗會更好,。
汽車之家:特斯拉和小鵬已經(jīng)是純視覺,,還有激光雷達的輔助,極氪未來考慮純視覺路線,,還是激光雷達技術作為保障,?
石穿空:在技術上我們兩條路線都是在做準備的,為什么都在做準備呢,?其實有一個信息,,我不知道你有沒有注意到,我們“浩瀚智駕1.0”發(fā)布之后,,我們上線的007既有激光版又有純視覺版的,。像其他友商最近在上純視覺的智駕,其實我們?nèi)ツ?2月份時候已經(jīng)上了純視覺版的,,那時候只支持高速的能力,。我們第一次量產(chǎn)時是同時配置兩個車型,其他廠商要么發(fā)激光的,,要么先發(fā)視覺的,,沒有兩個配置一塊同時發(fā)的。
對于第二點來說,,你的問題更多是純視覺將來要不要去做純視覺版城區(qū)的智駕,。技術上我們會一直準備的,但用不用,,這里有兩個考量,,我們本身的觀點認為作為將來智駕的發(fā)展,包括現(xiàn)在從安全角度來講,,激光也還是有必要的,。因為激光本身是主動光的探測,它在整個探測結(jié)果的時延,、精度以及測速和測量距離,、位置的精度上,其實是有天然不可替代的優(yōu)勢,。然后尤其在黑夜或者雨霧,、逆光場景,它不像攝像頭會需要ISP做不同的調(diào)校,讓算法去調(diào)優(yōu),。本身算力就會涉及到時延,,激光是主動物理的探測,純視覺是基于算法的,,時延上本身就會有些影響,。還有測量精度,激光是有些優(yōu)勢的,。我們認為純視覺就像教一個小孩去學習,,他本身學習能力要很強,,視覺是打底的,,是主要的東西。但激光并不是沒有用,,激光的優(yōu)勢是顯而易見的,。你優(yōu)先把視覺做得很強,再用激光好上加好,。
我們認為激光將來更多用于安全的冗余,、安全的兜底,包括面向?qū)砀唠A的駕駛,,怎么去做冗余,,傳感器的冗余是很有必要的,這是技術上的思考,。
當然,,是不是激光或者純視覺,更多是商業(yè)上的思考,,成本上去掉激光會更便宜一點,。還有車型的定位是怎樣的,其實好多用戶越來越懂智駕了,,它的芯片算力大不大,,有沒有配置激光,用戶第一印象就是有沒有這個,。有了這個,,我們會認為好,然后再說算法怎么牛,,體驗好不好,。所以是兩方面,一方面是技術的,,一方面是商業(yè)上的車型定位,,以及這個車型將來對應的用戶群體怎么樣,這個可能不是技術上怎么樣,技術上就做好準備,。
汽車之家:我們現(xiàn)在聽到一些用戶聲音,,一種是用純視覺的,覺得算法已經(jīng)特別好了,;還有一種認為用純視覺就省成本,,不給高端硬件。還有的認為用激光的更安全更有保證,,還有的認為用激光的算法不好,,用戶也在搖擺之中,這個階段智駕大家還是在選走哪個方向,,哪個路走得更順,,我們都可以去選擇。
石穿空:這兩個技術路線,,我個人認為不是技術路線之爭,,因為帶激光在視覺算法上的技術儲備我們一直在做的,不會說用激光之后純視覺就不搞了,,肯定純視覺基礎上再加入激光,,同步在搞,本身不是技術路線之爭,,完全是產(chǎn)品定義的考量,。你可以有純視覺,也可以有激光,,具體取決于自己車型面向的是什么樣的用戶群體,,你的車想賣到什么樣的成本價位,用戶群體是怎樣的,,是這個思考,,我認為不是技術路線。我不認為搞了激光之后,,視覺技術就不搞了,。
汽車之家:最后一個問題,剛才聊了這么多智駕方面,,極氪除了智駕,,在本身產(chǎn)品競爭力上也很強,現(xiàn)在有什么可以分享新技術,,以及未來極氪產(chǎn)品的規(guī)劃,。
石穿空:面對未來兩三年的技術架構(gòu),包括我們早上發(fā)布端到端Plus的新技術架構(gòu)和數(shù)字先覺網(wǎng)絡,,技術方面我就不再重復了,。
產(chǎn)品上最新的規(guī)劃,,也是前面陳總介紹過的,除了無圖城市NZP,,我在年底會全國全量釋放給搭載“浩瀚智駕2.0”車型,,車位到車位的功能,2025年就看車位到車位了,,因為2024年大家都在看無圖全國,,2025年就在看車位到車位。車位到車位,,其實目前為止,,但我還沒有看今天廣州車展的情況,,反正之前我了解到也就1-2家友商給媒體試駕過,,給用戶試駕過,,其實沒有幾家,。我們極氪是第一批這樣去發(fā),包括10月底我們已經(jīng)給大量媒體真正體驗過端到端,,我們地庫的兩個抬桿可以過,還上了高速的ETC,,我們的端到端支持一次可以過4個抬桿,。
汽車之家:今天友商這些我們在實踐中已經(jīng)可以體驗了,。
石穿空:因為我們本身泊車的能力也很強,,機械車位也可以支持,因為現(xiàn)在整個行業(yè)支持機械車位的也就一兩家,。我們針對無劃線車位,,本身泊車就支持。所以端到端我們預計2025年1月份會分批開始啟動,,向用戶推送,。我們的目標是計劃在2025年年中左右,上半年看能不能更大規(guī)模給用戶推送出去,,大概是這樣的,。
汽車之家:謝謝,今年極氪是給了我們非常多驚喜的品牌,包括產(chǎn)品,,包括技術,,包括價格。
石穿空:下半年我們迭代很快,,包括無圖智駕方案,,用戶反饋說其實他沒有那么急,但極氪是真的快,!
汽車之家:以前我們感覺新勢力往前跑得很快,,我們這些有傳統(tǒng)車企背景的品牌會比較嚴謹。現(xiàn)在看,,極氪不管從嚴謹角度還是從技術迭代角度都很快,,讓用戶可以持續(xù)體驗,在銷量上勢頭也很猛,,包括7X銷量也是能印證的,。除了卷價格之外,極氪的產(chǎn)品力也很強,。
好評理由:
差評理由: