[汽車之家 行業(yè)] 近日,,百度宣布百度Create大會(暨百度AI開發(fā)者大會)將于1月10日舉辦,。據(jù)悉,百度已連續(xù)第五年舉辦Create大會,,今年的Create大會將依舊在百度希壤元宇宙中呈現(xiàn),,分享百度在人工智能,、自動駕駛,、智能交通、智能搜索,、量子計算,、人工智能科學(xué)計算等領(lǐng)域的最新進展與思考。
在Create大會正式召開之前,,百度展示了如何用“手機全雙工語音交互”改善使用導(dǎo)航應(yīng)用的體驗,,還詳細介紹了如何用“上帝視角”提升汽車的自動駕駛能力,以及百度自研的深度學(xué)習(xí)平臺飛槳在科研領(lǐng)域的運用,。
業(yè)內(nèi)首發(fā)全雙工語音交互技術(shù)
以實際使用場景為例,,當(dāng)用戶駕駛車輛時使用地圖導(dǎo)航,一般會借助時播放的導(dǎo)航語音認路,。當(dāng)環(huán)境音比較嘈雜,,而用戶需要修改路線的時候,語音可能會識別不請,。它的原理也不難理解,,如果手機App在說話的時候,又在聽,,它可能會識別自己說的話,,非常容易造成誤判。
百度語音首席架構(gòu)師賈磊解釋說,,很長一段時間,,都沒有一個方案能普適的支持在手機上實現(xiàn)全雙工的語音交互——在手機播放導(dǎo)航提示的同時,也能夠聽清我們的指令,甚至像真人對話一樣可以被我們隨時打斷,,并對新的語音指令給予反饋,。
理論上講,想要實現(xiàn)全雙工語音交互,,必須先做回聲消除,,避免手機終端識別自己播放的聲音。賈磊說,,在前裝軟件的音箱,、車載系統(tǒng)上比較容易實現(xiàn),可以通過硬件適配算法,,提前保證回聲消除的效果,。
而手機App屬于純軟件后裝方案,需要讓軟件算法適配不同型號的終端硬件,。通常,,手機上喇叭距離麥克風(fēng)的距離比較近,同時手機終端款式多,,硬件參差不齊,。這些因素疊加在一起,會導(dǎo)致聲音信號的回聲消除會出現(xiàn)各種各樣的問題,。再加上手機硬件的迭代更新非�,?焖伲芈曄Ч透与y以保證了,。
百度的技術(shù)團隊融合傳統(tǒng)信號處理和深度學(xué)習(xí)模型各自的優(yōu)點,,基于語音識別目標(biāo),端到端地進行回聲消除和信號增強,,解決了手機場景下的回聲消除問題,,即使手機音量開到最大,回聲消除量也能達到40分貝,,使得手機APP的語音識別功能能夠正常工作,。
據(jù)介紹,這是第一個能在手機上實現(xiàn)純軟件方案回聲消除的技術(shù),。這個技術(shù)的實現(xiàn)讓讓人機交互更智能順暢,,更逼近人與人直接交互的體驗。目前,,百度已經(jīng)計劃將全雙工語音交互運用到更多場景中,,比如智能汽車。
車路一體的UniBEV解決方案
在近日的溝通會上,,百度還展示了自動駕駛車路一體解決方案UniBEV,。
據(jù)了解,,近幾年來,有的車企推出了BEV(Bird's Eye View,,視覺為中心的俯視圖)自動駕駛感知方案,。據(jù)介紹,BEV自動駕駛感知就好比是一個從高處統(tǒng)觀全局的“上帝視角”,,車上多個傳感器采集的數(shù)據(jù),,會輸入到一個統(tǒng)一模型進行整體分析推理生成鳥瞰圖,能有效地避免誤差疊加,;這種方案還能夠做到時序融合,,不僅是收集一個時刻的數(shù)據(jù),分析一個時刻的數(shù)據(jù),,而是支持把過去一個時間片段中的數(shù)據(jù)都融合進模型做環(huán)境感知建模,,時序信息的引入讓感知到的結(jié)果更穩(wěn)定,使得車輛對于道路情況的判斷更加準(zhǔn)確,、讓自動駕駛更安全,。
而百度基于BEV基礎(chǔ)上,提出了UniBEV車路一體的解決方案,。它集成了車端多相機,、多傳感器的在線建圖、動態(tài)障礙物感知,,以及路側(cè)視角下的多路口多傳感器融合等任務(wù),,是業(yè)內(nèi)首個車路一體的端到端感知解決方案,。
基于統(tǒng)一的BEV空間,,UniBEV 車路一體大模型更容易實現(xiàn)多模態(tài)、多視角,、多時間上的時空特征融合,。百度借助大數(shù)據(jù)+大模型+小型化技術(shù)閉環(huán),在車端路側(cè)的動靜態(tài)感知端有更大的優(yōu)勢,。
此外,,百度還展示了飛槳團隊的最新成果:推出了超大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù)PGLBox,是業(yè)界首個同時支持復(fù)雜算法+超大圖+超大離散模型的大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù),,通過顯存,、內(nèi)存、SSD三級存儲技術(shù)和訓(xùn)練框架的性能優(yōu)化技術(shù),,單機即可支持百億節(jié)點,、數(shù)百億邊的圖采樣和訓(xùn)練,并可通過多機擴展支持更大規(guī)模,。據(jù)悉飛槳目前已經(jīng)在百度的智能交通,、信息推薦,、搜索等標(biāo)桿場景實現(xiàn)落地,大幅提升業(yè)務(wù)效率和用戶體驗,。(文/汽車之家 張凌霄 )
好評理由:
差評理由: