百度發(fā)自動駕駛UniBEV車路一體解決方案

張凌霄

2023年01月09日 15:04 原創(chuàng) 來源：汽車之家發(fā)布于:北京

收藏 (0條) 舉報/糾錯

　　[汽車之家行業(yè)] 近日,，百度宣布百度Create大會（暨百度AI開發(fā)者大會）將于1月10日舉辦,。據(jù)悉，百度已連續(xù)第五年舉辦Create大會,，今年的Create大會將依舊在百度希壤元宇宙中呈現(xiàn),，分享百度在人工智能,、自動駕駛,、智能交通、智能搜索,、量子計算,、人工智能科學(xué)計算等領(lǐng)域的最新進展與思考。

　　在Create大會正式召開之前,，百度展示了如何用“手機全雙工語音交互”改善使用導(dǎo)航應(yīng)用的體驗,，還詳細介紹了如何用“上帝視角”提升汽車的自動駕駛能力，以及百度自研的深度學(xué)習(xí)平臺飛槳在科研領(lǐng)域的運用,。

業(yè)內(nèi)首發(fā)全雙工語音交互技術(shù)

　　以實際使用場景為例,，當(dāng)用戶駕駛車輛時使用地圖導(dǎo)航，一般會借助時播放的導(dǎo)航語音認路,。當(dāng)環(huán)境音比較嘈雜,，而用戶需要修改路線的時候，語音可能會識別不請,。它的原理也不難理解,，如果手機App在說話的時候，又在聽,，它可能會識別自己說的話,，非常容易造成誤判。

　　百度語音首席架構(gòu)師賈磊解釋說,，很長一段時間,，都沒有一個方案能普適的支持在手機上實現(xiàn)全雙工的語音交互——在手機播放導(dǎo)航提示的同時，也能夠聽清我們的指令，甚至像真人對話一樣可以被我們隨時打斷,，并對新的語音指令給予反饋,。

　　理論上講，想要實現(xiàn)全雙工語音交互,，必須先做回聲消除,，避免手機終端識別自己播放的聲音。賈磊說,，在前裝軟件的音箱,、車載系統(tǒng)上比較容易實現(xiàn)，可以通過硬件適配算法,，提前保證回聲消除的效果,。

　　而手機App屬于純軟件后裝方案，需要讓軟件算法適配不同型號的終端硬件,。通常,，手機上喇叭距離麥克風(fēng)的距離比較近，同時手機終端款式多,，硬件參差不齊,。這些因素疊加在一起，會導(dǎo)致聲音信號的回聲消除會出現(xiàn)各種各樣的問題,。再加上手機硬件的迭代更新非�,？焖伲芈曄Ч透与y以保證了,。

　　百度的技術(shù)團隊融合傳統(tǒng)信號處理和深度學(xué)習(xí)模型各自的優(yōu)點,，基于語音識別目標(biāo)，端到端地進行回聲消除和信號增強,，解決了手機場景下的回聲消除問題,，即使手機音量開到最大，回聲消除量也能達到40分貝,，使得手機APP的語音識別功能能夠正常工作,。

　　據(jù)介紹，這是第一個能在手機上實現(xiàn)純軟件方案回聲消除的技術(shù),。這個技術(shù)的實現(xiàn)讓讓人機交互更智能順暢,，更逼近人與人直接交互的體驗。目前,，百度已經(jīng)計劃將全雙工語音交互運用到更多場景中,，比如智能汽車。

車路一體的UniBEV解決方案

　　在近日的溝通會上,，百度還展示了自動駕駛車路一體解決方案UniBEV,。

　　據(jù)了解,，近幾年來，有的車企推出了BEV（Bird's Eye View,，視覺為中心的俯視圖）自動駕駛感知方案,。據(jù)介紹，BEV自動駕駛感知就好比是一個從高處統(tǒng)觀全局的“上帝視角”,，車上多個傳感器采集的數(shù)據(jù),，會輸入到一個統(tǒng)一模型進行整體分析推理生成鳥瞰圖，能有效地避免誤差疊加,；這種方案還能夠做到時序融合,，不僅是收集一個時刻的數(shù)據(jù)，分析一個時刻的數(shù)據(jù),，而是支持把過去一個時間片段中的數(shù)據(jù)都融合進模型做環(huán)境感知建模,，時序信息的引入讓感知到的結(jié)果更穩(wěn)定，使得車輛對于道路情況的判斷更加準(zhǔn)確,、讓自動駕駛更安全,。

　　而百度基于BEV基礎(chǔ)上，提出了UniBEV車路一體的解決方案,。它集成了車端多相機,、多傳感器的在線建圖、動態(tài)障礙物感知,，以及路側(cè)視角下的多路口多傳感器融合等任務(wù),，是業(yè)內(nèi)首個車路一體的端到端感知解決方案,。

　　基于統(tǒng)一的BEV空間,，UniBEV 車路一體大模型更容易實現(xiàn)多模態(tài)、多視角,、多時間上的時空特征融合,。百度借助大數(shù)據(jù)+大模型+小型化技術(shù)閉環(huán)，在車端路側(cè)的動靜態(tài)感知端有更大的優(yōu)勢,。

　　此外,，百度還展示了飛槳團隊的最新成果：推出了超大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù)PGLBox，是業(yè)界首個同時支持復(fù)雜算法+超大圖+超大離散模型的大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù),，通過顯存,、內(nèi)存、SSD三級存儲技術(shù)和訓(xùn)練框架的性能優(yōu)化技術(shù),，單機即可支持百億節(jié)點,、數(shù)百億邊的圖采樣和訓(xùn)練，并可通過多機擴展支持更大規(guī)模,。據(jù)悉飛槳目前已經(jīng)在百度的智能交通,、信息推薦,、搜索等標(biāo)桿場景實現(xiàn)落地，大幅提升業(yè)務(wù)效率和用戶體驗,。（文/汽車之家張凌霄）

查看同類文章：: 智能網(wǎng)聯(lián)

更多精彩內(nèi)容：: 海外諜照; 生產(chǎn)研發(fā); 2022F1賽事

汽車之家行業(yè)-大數(shù)據(jù) 全領(lǐng)域新視點

文章標(biāo)簽：智能網(wǎng)聯(lián)

取消收藏

+1 贊

+1 踩

百度發(fā)自動駕駛UniBEV車路一體解決方案

登錄后體驗更完整

智能買車

猜你喜歡