[汽車之家 新鮮技術(shù)解讀] “一人開車時喜歡用語音系統(tǒng),,全家人都在車上的話就算了,�,!保晃粍傎I“智能車”的朋友聊天,,不經(jīng)意間他說了這樣一句話,。
近年來,各家推出的新車或多或少都跟“智能化”有了聯(lián)系,。作為實體按鍵和觸控屏之外的新操作方式,,能動嘴盡量不用你上手的語音控制,愈發(fā)常見也受到了不少消費(fèi)者歡迎,。不過易受其他乘客聊天干擾,、對后排乘客發(fā)出的指令識別能力較弱,是不少語音系統(tǒng)的不足,�,?蓪ι嫌欣舷掠行〉募彝ビ脩魜碚f,家人的聊天往往是語音交互的背景音,。本該大秀一場的好功能施展不開拳腳,,文章開頭的那句話,就是車主們的無奈,。
作為中國新勢力車企中聚焦家庭用戶的代表,計劃本月中旬向用戶推送2.2版車機(jī)系統(tǒng)的理想,,將帶來哪些新功能,、車主們的“無奈”會迎刃而解嗎?咱們一起搶先體驗一下吧,。
2.2版本都有啥,?
在2021款理想ONE(參數(shù)|詢價)上市之后,理想發(fā)布了今年的語音系統(tǒng)升級計劃,。在推出包含喚醒打斷,、動力與駕駛模式語音控制等功能,并將底層能力換為地平線+思必馳+微軟的FOTA2.1之后,,理想將在FOTA2.2加入連續(xù)對話,、可見即可說、四音區(qū)鎖定和跨音區(qū)上下文對話等功能,,同時上線了“應(yīng)用中心”擴(kuò)充車機(jī)里的軟件,。
這些新功能既減少了你說喚醒詞的次數(shù),也能在不打斷家人聊天時,,讓語音系統(tǒng)準(zhǔn)確識別用戶指令,。說白了,上圖這些就是針對全家人駕車出行的場景,,以及語音系統(tǒng)的短處研發(fā)的功能,。
20秒連續(xù)說/爽點竟是“我也要”
顧名思義,,連續(xù)對話是指喚醒語音系統(tǒng)后,在一段時間用戶可以連續(xù)說指令,,而不用多次說出喚醒詞,。
舉個例子,想打開空調(diào)和座椅通風(fēng),,通常需要喚醒兩次語音系統(tǒng)并分別進(jìn)行操作,。伴隨說喚醒詞次數(shù)的增加,不僅麻煩還會覺得自己很“話癆”,,更不用說與機(jī)器人對話產(chǎn)生的違和感造成的“不爽”了,。我拍了段視頻,大家感受一下,。
除了理想之外,小鵬和長安等車企也提供了“連續(xù)說”功能,,想到哪說到哪,、一次不到位還能連續(xù)調(diào)節(jié),過程中減少了說喚醒詞的次數(shù),,操作也就沒那么繁瑣了,。至于如何讓交互體驗不像跟機(jī)器人說話,聽懂上下文邏輯是解決方案之一,。
支持連續(xù)識別、掌握上下文邏輯銜接后,,相比“一次一句,、反復(fù)喚醒”的傳統(tǒng)語音系統(tǒng),現(xiàn)在的“理想同學(xué)”能省去不少麻煩事,�,?稍谟酶玫捏w驗吸引更多用戶之前,它還要面對一個難題——抗干擾,。
生來就會四音區(qū)識別的理想ONE,,能自動判斷語音系統(tǒng)應(yīng)該重點關(guān)注的位置,雖然像打開車窗這種操作,,無需用戶說“右后”等定向詞,,但座艙內(nèi)的背景音依舊會干擾系統(tǒng)識別。對于全家自駕游的用戶來說,,讓家人們暫停聊天總顯得不太和諧,,因而在音源定向識別的基礎(chǔ)上,理想加入了無效文本拒識能力,。
所謂無效文本拒識,,就是系統(tǒng)會在識別的對話中,,依靠算法“挑出”指令并執(zhí)行。乘客們聊天不會干擾人機(jī)交互,,語音系統(tǒng)也能更好的應(yīng)對多人出行場景了,。文字太蒼白,還是請朋友看視頻吧,。
“氣氛組”一番嘗試后,系統(tǒng)依舊能識別出副駕乘客說出的指令,。從聊天話語中找到“指令”后,,系統(tǒng)會用加粗和高光,告訴操作者指令已被識別,。
希望在旅途中享受片刻寧靜的你,,想想自家對科技情有獨鐘、精力旺盛的“小怪獸”,,這個功能“香”不,?掌握應(yīng)對“小怪獸”的技巧后,理想將多音區(qū)識別和上下文邏輯銜接合在了一起,。如果想系統(tǒng)幫你完成與上一位操作者相同的動作,,現(xiàn)在只說“理想同學(xué),我也要”就夠了,。下面視頻里有完整演示哦,。
用“我也要”三個字復(fù)刻之前乘客的全部操作,,體驗簡短卻足夠打消你嫌棄說話字多、太累,,不如直接動手用實體按鍵旋鈕操作的念頭,。無論說激發(fā)用戶使用語音系統(tǒng)的潛力,還是弱化了語音操作在個別場景下效率不高的長尾問題,,這項功能都稱得上2.2版系統(tǒng)的一個爽點,。
想點哪里直接說/體驗上的小亮點
一套好的語音系統(tǒng)應(yīng)該讓用戶只動嘴不動手,可實現(xiàn)這個最終目標(biāo)之前,,要實現(xiàn)無數(shù)個“小目標(biāo)”,,比如部分功能做到“可見即可說”。在理想2.2版系統(tǒng)中,,QQ音樂,、喜馬拉雅、藍(lán)牙電話和車輛中心四項功能率先做到了這一點,。
從視頻中可見,,系統(tǒng)不僅能識別頁面中的文字,還能根據(jù)“返回”指令選中相應(yīng)圖標(biāo),。同時只需說出目標(biāo)選項中的幾個字,,系統(tǒng)就能找到你想要的那個。做到部分場景非必要不上手之余,,可見即可說功能也為坐在第二/三排,、無法點擊屏幕的乘客提供了便利。
不過體驗過程中我們發(fā)現(xiàn)了兩個小問題,,一來,,系統(tǒng)偶有需要操作者放慢語速才能聽懂的情況;二來,,彈出音樂列表后只能說歌曲名,,系統(tǒng)無法識別“第幾個”這樣的話術(shù),這個細(xì)節(jié)可以再完善一下,。
另外,,理想聯(lián)手微軟打造了基于云端的在線神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型,,通過緩存并在有需要時播放出好聽的聲音,減少了語音系統(tǒng)較為機(jī)械的發(fā)音,。這就是上文多段視頻中,,“理想同學(xué)”聲音的由來,至少男同學(xué)們應(yīng)該很喜歡“她”,。
應(yīng)用中心上線
伴隨理想應(yīng)用中心登陸2.2版系統(tǒng),,車機(jī)能覆蓋到的場景和提供的音/視頻內(nèi)容得到了擴(kuò)充。
中控屏與副駕屏中的應(yīng)用不盡相同,,前者以在線音樂/音頻類為主,,后者主要提供視頻類軟件,提供聲音類內(nèi)容的只有“愛趣聽”,。
寫在最后
廠方人員跟我說,,這次搶先體驗的2.2版車機(jī)系統(tǒng),將在本月中旬推送給理想ONE的車主們,,雖然可優(yōu)化的地方還有,,但整體上說很值得期待。特別是連續(xù)對話,、無效文本拒識和跨音區(qū)上下文對話功能,,可以說是針對當(dāng)前語音系統(tǒng)短板,以及居家出行的車上場景而來。至于正式版會把“細(xì)節(jié)”打磨成什么樣,?咱們繼續(xù)期待吧,。(圖/文 汽車之家 馬一凡)
好評理由:
差評理由: