[汽車之家 新鮮技術解讀] 最初駕駛員只能通過物理按鍵、旋鈕對車輛下達指令,,別無他法,。隨著智能網(wǎng)聯(lián)汽車的發(fā)展,“語音助手”已經(jīng)漸漸成了人機交互的重要方式,,而面對未來的自動駕駛時代,,語音交互似乎要有更高的地位;即便是現(xiàn)在,,小鵬汽車給出的數(shù)據(jù)顯示,,用戶的智能語音日常使用率在90%以上。怎么把大家愛用的語音系統(tǒng)做到更好,?小鵬汽車即將用一次OTA給出答案,。
此次OTA的推送只針對小鵬汽車P7(參數(shù)|詢價),P7最早于2020年4月27日上市,,截至2021年6月份,,該車累計銷量已突破3萬輛。除了706km的NEDC續(xù)航里程比較傲人外,,該車的輔助駕駛能力,、語音識別系統(tǒng)都有出色的表現(xiàn),比如小鵬P7的輔助駕駛具備高速NGP能力,,其語音系統(tǒng)具備全場景語音能力,,此次新語音系統(tǒng)的升級會為其錦上添花,。
●新語音系統(tǒng)有了什么變化?
小鵬汽車將于2021年7月份下旬通過OTA向P7全系車型推送此次的新語音系統(tǒng),,此次語音系統(tǒng)最重要的變化點就是語音助手(小P)擁有更加擬人化的音色,,同時可實現(xiàn)具有情感變化的聲音輸出。至于語音助手的反應速度,、識別率,、功能實現(xiàn)等方面,新系統(tǒng)基本保持和此前一樣的水平,,并不會有顯著優(yōu)化,。
『小鵬汽車全新語音系統(tǒng)官方展示視頻』
其實此次語音系統(tǒng)OTA的目的很好理解,,就像我們能為小P換裝,、換頭像一樣,都是提升人機交互體驗,、提升情感交流的一種途徑,。對于傳統(tǒng)意義上的語音助手來說,它可能只是用來幫你完成功能操作的機器人,,話術死板,、音色機械感強、沒有情緒變化,;且不論語音助手的功能性是否強大,,面對一個“純正的機器人”,你有欲望和它交流嗎,?那如果語音助手的發(fā)音像個真的“小秘書”一樣,,結果是不是不同?
這次的新語音能做到什么水平呢,?首先是音色和音質(zhì),,音色我們可以通過上面的視頻大致有一個了解,這種擬人化水平確實和目前其它汽車語音助手有了很大的區(qū)分,,與此前的小P對比,,也是大大削減了機械感。至于音質(zhì),,小鵬汽車官方稱新聲音采用了24K采樣技術,,實現(xiàn)了高保真音質(zhì),。
針對音質(zhì)和音色水平,,我們有一個參考,微軟MOS(Mean Opinion Score)語音質(zhì)量評測是一項國際通用的語音質(zhì)量評測方法,,與真人,、機器人聲音相對比,,越大程度接近真實人聲就能獲得越高分數(shù),滿分5分,,小鵬汽車的新語音助手獲得了4.49分,,官方稱這是目前MOS評測中得分最高的車載智能語音助手。不過小鵬汽車也提到,,這套MOS評測體系也僅是主觀評測,,可供參考,但從專業(yè)角度來說,,并不代表100%的準確,。
另外,官方分享稱,,此次升級后的語音助手可以表達情緒變化�,,F(xiàn)在所有的汽車語音助手都是單純的將文字轉化為語音而已,“語氣”平和毫無變化,,但“新小P”將具備愉快,、溫和、親熱,、抒情,、嚴肅、不滿,、生氣,、害怕、悲傷,、冷靜等14種強烈情緒的變換能力,,可以實現(xiàn)情緒變換、語速變化,、抑揚頓挫等,;這些會增強語音助手的擬人化屬性。不過我預計類似情緒轉換的能力可能還是只覆蓋部分內(nèi)容,,并不會實現(xiàn)全量的覆蓋,。
小鵬汽車稱目前這套語音系統(tǒng)也具備“針對實際情況來自行調(diào)節(jié)語速、情緒”的能力,,但這個能力離真正上車還有一段距離,,仍需要后期不斷培養(yǎng)、調(diào)整,。目前為止,,我們只有官方的示例視頻來參考,新語音系統(tǒng)的實際體驗會如何,我們會在7月下旬為大家?guī)矸窒�,,請期待�?/p>
●小鵬汽車怎么實現(xiàn)的這些變化,?
小鵬汽車的語音系統(tǒng)此次是使用了“超大規(guī)模在線神經(jīng)網(wǎng)絡引擎+小型離線拼接引擎”的技術組合,這是實現(xiàn)新語音的關鍵因素之一,。不過這個方案對于運算量,、時延、網(wǎng)絡抖動,、與應用相結合,、聲音一致性等問題都有著較高的研發(fā)工作量、研發(fā)難度,,所以如此的技術方案并不是目前車企們的普遍選擇,。
“在線神經(jīng)網(wǎng)絡引擎+離線拼接引擎”能為語音系統(tǒng)帶來什么幫助呢?首先是發(fā)音方式,、質(zhì)量,,新語音助手的所有發(fā)音均由AI合成,現(xiàn)在部分語音設備的擬人化音色可能是通過錄音實現(xiàn)的,,一旦涉及前期沒有進行過錄制的內(nèi)容,,呈現(xiàn)出的聲音就會有差別,AI合成就避免了這點,。另外,,常規(guī)離線引擎的運算體量不是很大,帶來的弊端就是聲音質(zhì)感一般,,而小鵬汽車此次用到了云上引擎,,巨大體量的運算能力可以支持高質(zhì)量的聲音輸出。
在溝通會上,,我們也提到,,新聲音是否會對網(wǎng)絡有強需求?一旦在地庫或隧道等場景中斷網(wǎng),,語音系統(tǒng)會不會降質(zhì)(聲音品質(zhì)下降,,或降級到偏機械的聲音)?官方稱新語音對網(wǎng)絡的依賴較小,,如果遇到嚴重的網(wǎng)絡抖動等情況,,語音系統(tǒng)會用到離線引擎做保底,那時候的聲音確實會被降質(zhì),,小鵬汽車研發(fā)人員表示,,在前期測試中,這種情況發(fā)生的比例很低,,可能也就1%,、2%左右,。實車表現(xiàn)如何,后續(xù)我們也會為大家?guī)韺嶋H體驗,。
●關于新語音系統(tǒng)的其它好奇
從小P的角色定位、情感需求(要有自信,、有親切感,、信任感等)等角度出發(fā),小鵬汽車內(nèi)部從多種音色中選出了現(xiàn)在的小P,。目前語音系統(tǒng)不支持在幾種不同音色的擬人化語音中進行切換,,因為小鵬汽車認為,很難將每個聲音都打磨到非常好,,這其中對AI訓練量,、服務器占用、延遲的縮小等諸多方面都有較高要求,,所以“打磨出一款好聲音”比“個性化”的優(yōu)先級更高,。
不過作為彩蛋,研發(fā)人員稱在某些功能,、某些情景下,,小P還是會有少數(shù)不一樣的情緒、聲音出現(xiàn),,這要靠用戶自己挖掘了,。
小鵬汽車的研發(fā)人員表示,他們內(nèi)部也考慮過這個問題,,但除了技術難度,、成本以外,還有小P的定位要思考,,小P是個助手,?秘書?還是用戶的親人,?用戶會不會希望一個親人或朋友的聲音出現(xiàn)在語音系統(tǒng)中,?針對這些問題,小鵬汽車還在思考中,。屏幕前的朋友,,你們怎么想?
截至目前,,這套語音系統(tǒng)僅會在小鵬汽車P7上全量發(fā)布,,至于其它車型,還要以日后的實際車型規(guī)劃為準,,目前無法確定,。
總結:
還記得小鵬汽車P7語音系統(tǒng)的上一次重大OTA是加入了全場景語音功能,,可見即可說,中控屏上的元素你都可以通過語音控制,,而且不用記住那些死板的指令語,,看見什么念什么就行。
“全場景語音”堪稱做到了汽車語音助手中一流的功能實現(xiàn)水平,,它進一步完善了語音助手的功能豐富度,;而此次更加擬人化、有情緒,、有情感的小P則是從人機情感交流的角度大大提升了用戶體驗,。“全場景語音”+“擬人化語音輸出”,,小P又長大了,,希望7月下旬的實車體驗能給我們帶來驚喜。(文/汽車之家 尤冬青)
好評理由:
差評理由: