[汽車之家 新鮮技術解讀] “一人開車時喜歡用語音系統(tǒng),,全家人都在車上的話就算了�,!保晃粍傎I“智能車”的朋友聊天,,不經(jīng)意間他說了這樣一句話,。
近年來,各家推出的新車或多或少都跟“智能化”有了聯(lián)系。作為實體按鍵和觸控屏之外的新操作方式,,能動嘴盡量不用你上手的語音控制,,愈發(fā)常見也受到了不少消費者歡迎。不過易受其他乘客聊天干擾,、對后排乘客發(fā)出的指令識別能力較弱,,是不少語音系統(tǒng)的不足�,?蓪ι嫌欣舷掠行〉募彝ビ脩魜碚f,,家人的聊天往往是語音交互的背景音。本該大秀一場的好功能施展不開拳腳,,文章開頭的那句話,,就是車主們的無奈。
作為中國新勢力車企中聚焦家庭用戶的代表,,計劃本月中旬向用戶推送2.2版車機系統(tǒng)的理想,,將帶來哪些新功能、車主們的“無奈”會迎刃而解嗎,?咱們一起搶先體驗一下吧,。
2.2版本都有啥?
在2021款理想ONE(參數(shù)|詢價)上市之后,,理想發(fā)布了今年的語音系統(tǒng)升級計劃,。在推出包含喚醒打斷、動力與駕駛模式語音控制等功能,,并將底層能力換為地平線+思必馳+微軟的FOTA2.1之后,,理想將在FOTA2.2加入連續(xù)對話、可見即可說,、四音區(qū)鎖定和跨音區(qū)上下文對話等功能,,同時上線了“應用中心”擴充車機里的軟件。
這些新功能既減少了你說喚醒詞的次數(shù),,也能在不打斷家人聊天時,,讓語音系統(tǒng)準確識別用戶指令。說白了,,上圖這些就是針對全家人駕車出行的場景,,以及語音系統(tǒng)的短處研發(fā)的功能。
20秒連續(xù)說/爽點竟是“我也要”
顧名思義,,連續(xù)對話是指喚醒語音系統(tǒng)后,,在一段時間用戶可以連續(xù)說指令,而不用多次說出喚醒詞,。
舉個例子,,想打開空調(diào)和座椅通風,通常需要喚醒兩次語音系統(tǒng)并分別進行操作。伴隨說喚醒詞次數(shù)的增加,,不僅麻煩還會覺得自己很“話癆”,,更不用說與機器人對話產(chǎn)生的違和感造成的“不爽”了。我拍了段視頻,,大家感受一下,。
除了理想之外,,小鵬和長安等車企也提供了“連續(xù)說”功能,,想到哪說到哪、一次不到位還能連續(xù)調(diào)節(jié),,過程中減少了說喚醒詞的次數(shù),,操作也就沒那么繁瑣了。至于如何讓交互體驗不像跟機器人說話,,聽懂上下文邏輯是解決方案之一,。
支持連續(xù)識別,、掌握上下文邏輯銜接后,,相比“一次一句、反復喚醒”的傳統(tǒng)語音系統(tǒng),,現(xiàn)在的“理想同學”能省去不少麻煩事,。可在用更好的體驗吸引更多用戶之前,,它還要面對一個難題——抗干擾,。
生來就會四音區(qū)識別的理想ONE,能自動判斷語音系統(tǒng)應該重點關注的位置,,雖然像打開車窗這種操作,,無需用戶說“右后”等定向詞,但座艙內(nèi)的背景音依舊會干擾系統(tǒng)識別,。對于全家自駕游的用戶來說,,讓家人們暫停聊天總顯得不太和諧,因而在音源定向識別的基礎上,,理想加入了無效文本拒識能力,。
所謂無效文本拒識,就是系統(tǒng)會在識別的對話中,,依靠算法“挑出”指令并執(zhí)行,。乘客們聊天不會干擾人機交互,語音系統(tǒng)也能更好的應對多人出行場景了,。文字太蒼白,,還是請朋友看視頻吧,。
“氣氛組”一番嘗試后,,系統(tǒng)依舊能識別出副駕乘客說出的指令。從聊天話語中找到“指令”后,,系統(tǒng)會用加粗和高光,,告訴操作者指令已被識別,。
希望在旅途中享受片刻寧靜的你,想想自家對科技情有獨鐘、精力旺盛的“小怪獸”,,這個功能“香”不?掌握應對“小怪獸”的技巧后,,理想將多音區(qū)識別和上下文邏輯銜接合在了一起,。如果想系統(tǒng)幫你完成與上一位操作者相同的動作,現(xiàn)在只說“理想同學,,我也要”就夠了,。下面視頻里有完整演示哦。
用“我也要”三個字復刻之前乘客的全部操作,,體驗簡短卻足夠打消你嫌棄說話字多、太累,,不如直接動手用實體按鍵旋鈕操作的念頭,。無論說激發(fā)用戶使用語音系統(tǒng)的潛力,還是弱化了語音操作在個別場景下效率不高的長尾問題,,這項功能都稱得上2.2版系統(tǒng)的一個爽點,。
想點哪里直接說/體驗上的小亮點
一套好的語音系統(tǒng)應該讓用戶只動嘴不動手,可實現(xiàn)這個最終目標之前,,要實現(xiàn)無數(shù)個“小目標”,,比如部分功能做到“可見即可說”。在理想2.2版系統(tǒng)中,,QQ音樂,、喜馬拉雅、藍牙電話和車輛中心四項功能率先做到了這一點,。
從視頻中可見,系統(tǒng)不僅能識別頁面中的文字,,還能根據(jù)“返回”指令選中相應圖標,。同時只需說出目標選項中的幾個字,系統(tǒng)就能找到你想要的那個,。做到部分場景非必要不上手之余,,可見即可說功能也為坐在第二/三排,、無法點擊屏幕的乘客提供了便利。
不過體驗過程中我們發(fā)現(xiàn)了兩個小問題,,一來,,系統(tǒng)偶有需要操作者放慢語速才能聽懂的情況;二來,,彈出音樂列表后只能說歌曲名,,系統(tǒng)無法識別“第幾個”這樣的話術,這個細節(jié)可以再完善一下,。
另外,,理想聯(lián)手微軟打造了基于云端的在線神經(jīng)網(wǎng)絡深度學習模型,,通過緩存并在有需要時播放出好聽的聲音,減少了語音系統(tǒng)較為機械的發(fā)音,。這就是上文多段視頻中,,“理想同學”聲音的由來,至少男同學們應該很喜歡“她”,。
應用中心上線
伴隨理想應用中心登陸2.2版系統(tǒng),,車機能覆蓋到的場景和提供的音/視頻內(nèi)容得到了擴充。
中控屏與副駕屏中的應用不盡相同,,前者以在線音樂/音頻類為主,,后者主要提供視頻類軟件,提供聲音類內(nèi)容的只有“愛趣聽”,。
寫在最后
廠方人員跟我說,,這次搶先體驗的2.2版車機系統(tǒng),將在本月中旬推送給理想ONE的車主們,,雖然可優(yōu)化的地方還有,,但整體上說很值得期待。特別是連續(xù)對話,、無效文本拒識和跨音區(qū)上下文對話功能,,可以說是針對當前語音系統(tǒng)短板,以及居家出行的車上場景而來,。至于正式版會把“細節(jié)”打磨成什么樣,?咱們繼續(xù)期待吧。(圖/文 汽車之家 馬一凡)
好評理由:
差評理由: