[汽車之家 行業(yè)] 自特斯拉針對自動駕駛提出“端到端”技術(shù)路徑,,并在2023年8月25日進(jìn)行路測直播后,,國內(nèi)自動駕駛行業(yè)對此密切關(guān)注,并把“端到端”上車提上日程,,為何多家企業(yè)均將“端到端”視為自動駕駛發(fā)展方向,?
『深圳元戎啟行科技有限公司副總裁 劉軒』
在2024中國汽車論壇同期,,中國汽車工業(yè)協(xié)會聯(lián)合戰(zhàn)略合作伙伴汽車之家,特別策劃【車界先鋒】,,邀請行業(yè)領(lǐng)軍人物,,共同探討中國汽車產(chǎn)業(yè)的發(fā)展之道,,本期嘉賓為深圳元戎啟行科技有限公司副總裁劉軒,。
何為端到端,?劉軒解釋,,傳統(tǒng)的智駕模型有點像傳話筒的方式,,數(shù)據(jù)要通過感知、定位,、預(yù)測,、規(guī)劃,最終傳到控制,,每一層都要經(jīng)過一定的處理,有信息的損失,,會帶有一些偏見,而現(xiàn)在端到端的模型優(yōu)點在于世界的數(shù)據(jù)輸入,,輸出就是最終的控制信號,中間所有的模塊信息全部被一個大的端到端模型進(jìn)行計算,,中間過程可以最大程度減少傳話過程中信息損失的數(shù)據(jù)量,。
這也是為何端到端技術(shù)為何能夠成為自動駕駛領(lǐng)域的一個主要發(fā)展方向�,!岸说蕉思夹g(shù)的核心優(yōu)勢在于其能夠顯著提升高級別智能駕駛的落地效率,,同時在一定程度上降低成本,。而這一技術(shù)路徑的成功,,得益于大模型、大算力和大數(shù)據(jù)的結(jié)合,,推動人工智能算法實現(xiàn)質(zhì)的飛躍,。”劉軒指出,,端到端技術(shù),,本質(zhì)上是一種駕駛能力的大模型,,它能夠更便捷地處理復(fù)雜場景,相較于傳統(tǒng)基于規(guī)則的系統(tǒng),,其在新場景的適應(yīng)性和擴(kuò)展性上具有明顯優(yōu)勢。
此外,,端到端技術(shù)不依賴于高精度地圖,這一點對于實現(xiàn)全國乃至全球范圍內(nèi)的自動駕駛尤為重要,。劉軒解釋說,,人類駕駛員在開車時并不會在腦海中形成一張高精度地圖,,而是依靠對道路和路標(biāo)的直觀感知。高精度地圖作為中間結(jié)果,,雖然對于機(jī)器理解環(huán)境有所幫助,,但也帶來了維護(hù)更新,、時效性和數(shù)據(jù)安全等一系列問題,。因此,減少對高精度地圖的依賴,,是實現(xiàn)端到端算法的關(guān)鍵,。
在傳感器方面,純視覺系統(tǒng)理論上可以達(dá)到甚至超越人類駕駛員的水平,。劉軒認(rèn)為,,盡管目前許多自動駕駛系統(tǒng)為了快速達(dá)到一定水平而采用激光雷達(dá)或毫米波雷達(dá)作為安全冗余,但隨著傳感器成本的降低,,純視覺系統(tǒng)將成為未來的趨勢,。
在談及元戎啟行與特斯拉等企業(yè)的競爭優(yōu)勢時,劉軒認(rèn)為,,特斯拉在數(shù)據(jù)積累和端到端模型落地方面具有領(lǐng)先優(yōu)勢,。然而,元戎啟行作為第三方供應(yīng)商,,有機(jī)會與不同車企合作,,這在一定程度上避免了與車企的利益沖突。此外,,元戎啟行在中國復(fù)雜交通場景中積累的經(jīng)驗,,將有助于其端到端算法模型的快速迭代和競爭力提升。
面對特斯拉FSD可能進(jìn)入中國市場的挑戰(zhàn),,劉軒認(rèn)為這將對整個行業(yè)產(chǎn)生積極影響,。特斯拉的技術(shù)積累和產(chǎn)品體驗將教育市場,提高消費者對智能化體驗的期待,,從而推動車企更積極地推廣先進(jìn)技術(shù)。同時,,消費者為軟件和人工智能算法付費的意愿可能會提高,,這對于智駕供應(yīng)商來說是一個機(jī)遇。
不過,端到端技術(shù)的落地還面臨諸多挑戰(zhàn),�,!凹夹g(shù)上,需要足夠的數(shù)據(jù)積累來解決corner case問題,,保證安全性,。產(chǎn)品上,需要培養(yǎng)消費者對全域,、全時,、全場景智駕的接受度和使用習(xí)慣。此外,,智駕公司還需要在保證性能的同時,,發(fā)揮出更高的效率和成本優(yōu)勢�,!眲④幙偨Y(jié)道,。
以下為對話實錄(精編):
汽車之家:自特斯拉提出了端到端的技術(shù)路徑后,國內(nèi)自動駕駛企業(yè)對此非常關(guān)注,,也把端到端作為自動駕駛的一個方向,,很多車企業(yè)提出了日程,您覺得為何端到端會成為一個行業(yè)的方向,?
劉軒:我覺得端到端最主要的優(yōu)勢是在于它能夠推動高級別智能駕駛落地的效率,,并且它的成本一定程度上會降低,原因主要在于,,這幾年大家也可以看到在大語言模型上,,GPT的巨大成功讓大家相信Scaling Law,所謂的大模型,、大算力,、大數(shù)據(jù),有了這些東西其實就能夠推動人工智能算法進(jìn)行質(zhì)的變化,。
端到端其實本質(zhì)上就是一個所謂的駕駛領(lǐng)域這樣的一個大模型,,不是一個語言的大模型,是一個駕駛能力的大模型,。它的優(yōu)勢在于,,能夠更方便處理一些復(fù)雜的場景,。端到端之前有很多傳統(tǒng)的方式,,有很多是基于規(guī)則式的驅(qū)動里面有很大的比例,規(guī)則驅(qū)動很難適用于全國的各個地方,,每當(dāng)需要進(jìn)行新開城的時候需要花很大的精力進(jìn)行擴(kuò)展,,端到端在這方面它的效率會高很多,。
另一方面端到端其實能夠更擬人化更像人類駕駛員,讓消費者再去選它的時候,,它自身的感覺會更好一些,,更有可能進(jìn)行買單。一個是它的效率,,一個是它的體驗,,最終讓現(xiàn)在的端到端特別火的一個現(xiàn)狀,主要的原因是這些,。
汽車之家:您剛才提到了端到端成本的下降主要是哪些方面?
劉軒:端到端成本下降主要來講,,端到端相當(dāng)于你是用一個大模型驅(qū)動,,在所有的路段和所有的場景上,,采集到各種數(shù)據(jù)是喂在一個模型上,。相比端到端如果是采用之前的模塊化或者更早的規(guī)則驅(qū)動的模型也好,,其實可能會要針對不同的場景,,要有很多額外的工作,,這也就是為什么在前幾年會看到所謂的智駕開城需要很長的時間需要很多數(shù)據(jù)量的積累,這里面需要采圖,,有高精地圖的存在,可能有場景的訓(xùn)練和迭代過程,,這些研發(fā)成本是非常貴的,,整個數(shù)據(jù)本身也是也很高的成本。采用端到端之后有一個邏輯,,它更像人類駕駛員司機(jī),,比如說我在北京學(xué)完開車之后,,我在上海稍微熟悉一下當(dāng)?shù)氐慕灰?guī),,我的遷移成本是比較低的,。它的整個模型的智能化程度是更高更像人,,整體來講當(dāng)它想要進(jìn)行一個大規(guī)模推廣在全國的時候其實成本相對來說反而更低一些,。
汽車之家:所以說端到端不需要高精度地圖,?
劉軒:不需要高精度地圖,高精度地圖本身其實是一個中間結(jié)果,,人開車的時候人腦子里面不會有這么一張高精度地圖,,人只會說我看到路長成什么樣的一些路標(biāo),。但是具體路標(biāo)高多少厘米,它的空間絕對位置是怎么樣,,方向朝向哪一塊,,腦子里面絕對不會有這個東西,,這個東西它其實是處理的一個中間結(jié)果,是用你感知到的數(shù)據(jù)之后通過感知算法轉(zhuǎn)成一個機(jī)器能夠理解的3D或者有一些局部區(qū)域是2D的一種矢量圖或者某種信息也好,。
其實人類在開車的時候腦子里是沒有這樣的一個顯式的轉(zhuǎn)換過程,,可能是隱式的。在我們理解它是一個中間結(jié)果,,并不是最原始的輸入,,它會產(chǎn)生很多的問題,比方說如何去維護(hù)這樣的一個中間結(jié)果,,高精地圖什么時候是要被更新的,,萬一修路之后要不要更新,它的時效性如何,,數(shù)據(jù)安全能不能過,,這些都是很大的問題,。
所以我認(rèn)為,你要真的去實現(xiàn)一個比較好的全國都能跑,、乃至全世界都能跑的端到端的算法的話,,不應(yīng)該依賴于高精地圖,或者盡量減少對它的依賴,,越少的信息越好,。
汽車之家:有觀點說純視覺更加適合于端到端,這會不會打擊到激光雷達(dá)產(chǎn)業(yè),?
劉軒:純視覺的上線肯定是OK的,,因為人開車的時候,人都是被動式的,人眼都是光線照射進(jìn)來,,人是沒有辦法主動去發(fā)電磁波再反射回來,,理論上來說只用攝像頭,,它的上限是有可能,也能達(dá)到人相似的水平,,或者有可能比人做得更好,。
但是,現(xiàn)階段大家為了快速達(dá)到一定程度智駕的水平會用一些激光雷達(dá)或者有一些車用毫米波雷達(dá),作為一些安全冗余或者數(shù)據(jù)融合的數(shù)據(jù)源也好,,是可以快速達(dá)到一定程度的水準(zhǔn),。但是在最終為了成本的下降,,是不是把它去掉,這個主要還是取決于以后傳感器的成本到底能降到多少,,現(xiàn)在激光雷達(dá)也在降成本,聽說下一代都是千元級別的傳感器。另外純視覺的算力以后有多大的芯片能夠承載去做純視覺的智駕,,都還在探索中,,都有可能,要取決于以后綜合各方面,,會跟你的算力有關(guān),,跟你算法的模型有關(guān),也會根據(jù)你的數(shù)據(jù)量有一定的關(guān)系,。
純視覺應(yīng)該是可以做,,但它肯定是需要海量的數(shù)據(jù)進(jìn)行積累。這個邏輯是這樣的,,它的上限是很高的,,可能打平也許有可能更高,但是它的下限你是需要海量的數(shù)據(jù)進(jìn)行積累,,保證它在任何時候的一個安全性,。只有當(dāng)滿足一個最底線的安全性的時候用戶才真的愿意去用才能夠產(chǎn)生數(shù)據(jù)。
達(dá)到底線的安全性上,,使用激光雷達(dá)也許能夠快很多,。當(dāng)然也存在一種可能,你使用的激光雷達(dá)的車輛本身也在積累數(shù)據(jù),,因為激光雷達(dá)車輛上面也有攝像頭,,這些數(shù)據(jù)有可能用來訓(xùn)練純視覺的算法,訓(xùn)練到一定量之后純視覺也達(dá)到了一個類似的安全性,,或者用戶可以接受的安全性,,那個時候再去切換的話,才會去考慮傳感器的價格比獲得真的帶來安全性的一個提升或者減少,。在那個方面也許人們不僅僅是要去強(qiáng)調(diào)成本的下降,,更多的時候也許在那個時候大家追求的是以后的L3、L4,、乃至L5的駕駛,,也許傳感器需要額外的冗余,單路的傳感器都不一定夠,。這個是以后,,現(xiàn)在談?wù)撨有一點過早。
汽車之家:元戎啟行在端到端智駕系統(tǒng)開發(fā)中,,您覺得相比特斯拉來說,,有哪些競爭優(yōu)勢或者說不足?
劉軒:我覺得首先特斯拉在這一塊落地是最早最領(lǐng)先的,,它的優(yōu)勢在于它自己本身有車,,有大量的數(shù)據(jù),,它有幾百萬輛車源源不斷產(chǎn)生數(shù)據(jù),這個是它最大的優(yōu)勢,。現(xiàn)在大家都講端到端,,不同的端到端具體的實現(xiàn)路徑模型本身是不一樣的,實現(xiàn)的過程方式方法是有差別的,,我們會針對我們面臨的場景針對性訓(xùn)練我們的模型,。
我認(rèn)為我們的優(yōu)勢有幾點:
第一,我們作為一個第三方的供應(yīng)商,,其實我們是有機(jī)會跟不同的車企進(jìn)行合作的,,相比車廠本身可能會有一些興趣沖突,第三方其實跟車企合作的時候相對來說會車企本身會更放心一些,。
第二,,特斯拉目前來講采的大部分?jǐn)?shù)據(jù)還是在美國、歐洲相對來說交通場景比中國簡單的地方積累的數(shù)據(jù)多一些,,國內(nèi)的交通場景說實話復(fù)雜程度還是比世界上絕大部分地方還是要高一些,,我們在這種比較復(fù)雜城區(qū)的CBD、擁堵場景我們也積累了相當(dāng)?shù)慕?jīng)驗,,我相信這樣經(jīng)驗?zāi)軌驇椭说蕉怂惴P涂焖俚揭粋具有競爭力的水平,。
汽車之家:現(xiàn)在大家都在猜測特斯拉的FSD要來中國了,這樣對我們智駕公司來說壓力是不是特別大,?
劉軒:我覺得要從幾個方面辯證看這個事情,,特斯拉首先肯定是一個鯰魚,它在純視覺方面的技術(shù)積累是非常多的,,而且它在端到端模型上落地也是最早的,肯定是非常優(yōu)秀的企業(yè),,本身技術(shù)能力非常強(qiáng),。
另一方面我認(rèn)為特斯拉FSD如果在中國落地本身會對整個行業(yè)的競爭產(chǎn)生比較正面積極的影響,它會給消費者一個不同的產(chǎn)品體驗,,比如說能夠體驗到類似于FSD,,如果能夠體驗到類似于在美國這樣的體驗的話。因為美國的FSD本身是一個售價相對比較昂貴,,現(xiàn)在降價了以后是8000刀的水平,,本身對消費者市場能起到一定的教育作用,也許以后在智駕領(lǐng)域用戶不會一味追求卷價格,,能從一定程度上追求一定的場景的使用體驗包含智能化的體驗,,也許會對我們這樣的智駕供應(yīng)商來說,車企會更積極推我們的最先進(jìn)的產(chǎn)品落地,。
其次是用戶愿意花更多的價錢為軟件,、為人工智能的算法買單的意愿可能會更高一些,,我覺得從這個角度來講,特斯拉如果進(jìn)入到中國FSD落地應(yīng)該還是一件好事,,對整個行業(yè)有積極正面推動作用,。
汽車之家:除了您剛才提到需要大量數(shù)據(jù)閉環(huán)的挑戰(zhàn)之外,您覺得端到端要落地還要面對哪些困難,?
劉軒:端到端落地的話還有面對哪些困難,,我覺得還是端到端從技術(shù)來講,它的上限非常高接近于人或者以后超過人,,這個是ok的,,它的下限主要是你要有足夠的數(shù)據(jù)積累,保證它的cornercase被解決掉,,技術(shù)上這樣是ok的,。
另一方面還是要從產(chǎn)品的角度,最終肯定是終端消費者能夠把他培養(yǎng)起來,,他們是真的愿意去用全國范圍內(nèi)全域,、全時、全場景都能去開啟智駕,,當(dāng)你以這樣的結(jié)果為導(dǎo)向的時候端到端的優(yōu)勢就會很大,,因為它的效率比較高,實踐起來很快,,實踐的成本相對來說比傳統(tǒng)方案低一些,。
如果只是用戶專注在高速跑用一下,這樣的話其實相對來說端到端對它的吸引力沒有那么高,,我覺得對于消費者來講,,如何給他們一個比他們現(xiàn)在自己開車能有一個更好更舒適更智能的體驗的話,這個其實也是一個很大的挑戰(zhàn),,算是對消費者市場的一種宣傳和教育,。
汽車之家:相較于整車出口,智駕出海仍然是一件新興的事情,,這一塊的規(guī)劃能不能再多透露一些細(xì)節(jié),?
劉軒:我們在去年慕尼黑車展上已經(jīng)宣布了出海的計劃,第一站是在德國,,我們在德國進(jìn)行智駕算法在當(dāng)?shù)氐穆涞�,,以及測試等等工作,包含我們跟一些海外的車企的合作以及我們中國國產(chǎn)車企出海合作都有在進(jìn)行中,。
后續(xù),,我們端到端算法不依賴于高精地圖,對于法律法規(guī)能夠做出海方面有天然的優(yōu)勢,,相當(dāng)于落地遇到的障礙會比依賴高精地圖要小一些,,我們認(rèn)為在這一塊對我們出海有很大的幫助,,這也是包含國外車企或者是國內(nèi)車企出海他們愿意跟我們進(jìn)行這方面合作很重要的因素。
汽車之家:目前歐盟對中國車企貿(mào)易壁壘墻比較高,,這對于智駕公司來說會有什么影響,?
劉軒:智駕不能作為一個單獨發(fā)售的產(chǎn)品,必定要在車上面,,如果我們跟隨中國的車企進(jìn)行到出海的話,,在歐盟這一塊或多或少要被關(guān)稅總體的銷量進(jìn)行一定程度的影響。
對于我們智駕公司來講,,還是OK的,,我們是一個主要以軟件為主,大頭的開支是在研發(fā)還有測試相關(guān)的費用,,其實出來之后它的銷量相當(dāng)于本身的邊際成本可復(fù)制性比較強(qiáng),,邊際成本沒有那么高。說實話我們從不同的車型,,不同品牌的車型擴(kuò)展的時候成本相當(dāng)于比較低,。
另一方面我們現(xiàn)在跟海外當(dāng)?shù)氐能嚻笥幸恍┖献鳎驗樗男枨罅吭谀抢�,,如果他們減少了對中國電動車的購買也得買當(dāng)?shù)氐能�,。這一塊對于智駕的需求總量在那也不太可能減少,除非當(dāng)?shù)氐能嚻缶蛿[爛,,我就不做智駕,,但是我覺得以后的智駕肯定是一個大范圍的趨勢,對于智駕公司來講只要我們能夠保證我們在全球供應(yīng)鏈內(nèi)的競爭力和一定的技術(shù)優(yōu)勢,,我覺得機(jī)會還是非常大的,。
汽車之家:現(xiàn)在價格戰(zhàn)已經(jīng)持續(xù)一年多,車企成本壓力非常大,,這一塊的壓力有沒有傳遞到智能化供應(yīng)鏈的公司,?在這個背景下我們是如何在兼顧性能的同時又要發(fā)揮出更高的效率以及成本優(yōu)勢?
劉軒:我覺得是這樣的,,首先當(dāng)所有車都在卷價格,可能有相當(dāng)一大部分比例的車企平均每輛車都是在虧本賣的時候,,其實你很難去想象它愿意在智駕系統(tǒng)上負(fù)擔(dān)超過車總價百分之幾的價格,,行業(yè)內(nèi)每個車企內(nèi)心都有一個標(biāo)準(zhǔn),比如說智駕作為一個單獨的零部件,,硬件+軟件可能不能超過車價的多少,,這是在一個合理的范圍內(nèi),它肯定是受到一定程度的限制,。因為硬件的價格會去砍,,軟件的價格同樣也會去砍,。這方面對于智駕公司來講,也是現(xiàn)在行業(yè)面臨現(xiàn)實的問題,。
只要產(chǎn)品做得足夠好,,我們相信到未來這部分錢不是車企承擔(dān)這部分的成本,消費者能夠越來越多的接受我愿意為軟件買單,。今天下午的論壇上也有一位嘉賓的分享,,他說過去汽車銷售更多是一錘子買賣,本身汽車價值就是硬件,、電氣化的元器件,,動力系統(tǒng),本身這些是占很大程度的成本,。
以后軟件的比重越來越多,,車企會像消費者收費,更多是采用一種增值服務(wù),。智能駕駛現(xiàn)在其實某種意義上也是一種增值服務(wù),。我相信這個產(chǎn)品只要足夠好,用戶感覺到它能讓我的生活變得更好的時候它是愿意為這個東西買單的,。只要用戶作為消費端愿意去買單,,車企肯定會把這方面對于智駕公司供應(yīng)商的限制會適當(dāng)?shù)姆砰_一些,肯定整個行業(yè)是大家共同發(fā)展更好,,產(chǎn)品才會更有競爭力,,我們一直是這么認(rèn)為的。
好評理由:
差評理由: