[汽車之家 用車資訊] 提到車載多媒體系統(tǒng)的語音識(shí)別功能,,我想大部分用戶都會(huì)覺得很雞肋,也難怪,目前很大一部分車載多媒體系統(tǒng)的語音識(shí)別功能都僅僅停留在語音命令識(shí)別階段,,使用時(shí)用戶必須通過按鈕啟動(dòng)語音識(shí)別程序,然后說出命令,,而且命令的發(fā)音以及詞匯必須準(zhǔn)確無誤,,否則識(shí)別效果較差,無法獲得較好的用戶體驗(yàn),。奇瑞為了讓用戶能夠用上更方便更好用的語音識(shí)別功能,,聯(lián)合國內(nèi)語音識(shí)別技術(shù)領(lǐng)軍企業(yè)——科大訊飛,開發(fā)出了Cloudrive2.0智云互聯(lián)行車系統(tǒng),,該系統(tǒng)的自然語言處理技術(shù)可以讓用戶光憑口說就能操作多媒體系統(tǒng)的大部分常用功能,,而且識(shí)別率可達(dá)90%以上(行車時(shí)帶有背景噪音的環(huán)境下),下面我們就一起來體驗(yàn)一下這款多媒體系統(tǒng)究竟有多好用,?
● 科大訊飛究竟是何方神圣,?
科大訊飛成立于1999年,由中科大優(yōu)秀博士生劉慶峰創(chuàng)辦,,是一家專注于語音技術(shù)研發(fā)的公司,。語音技術(shù)包括語音合成技術(shù)和語音識(shí)別技術(shù)。讓機(jī)器說話,,用的是語音合成技術(shù),;讓機(jī)器聽懂人說話,用的是語音識(shí)別技術(shù),�,?拼笥嶏w在創(chuàng)立的17年間從事語音相關(guān)領(lǐng)域的研究并積累了豐富的經(jīng)驗(yàn)。連續(xù)多年獲得國內(nèi)外的語音技術(shù)領(lǐng)域獎(jiǎng)項(xiàng)也證明了該公司的技術(shù)實(shí)力,。
科大訊飛走進(jìn)普羅大眾的視野是在2010年,,這一年科大訊飛推出了“訊飛語音云”技術(shù)。這項(xiàng)技術(shù)能夠?yàn)楹芏嗷ヂ?lián)網(wǎng)應(yīng)用提供即時(shí)的語音識(shí)別支持,,如用語音就能完成QQ,、短信、微博等內(nèi)容的輸入,,識(shí)別率高,、使用方便使其在業(yè)內(nèi)掀起不小的波瀾。
今年10月18日,,羅永浩在錘子M1/M1L系列手機(jī)發(fā)布會(huì)上宣布這兩款產(chǎn)品將支持訊飛語音輸入法,,識(shí)別率高達(dá)97%,,基本解決了移動(dòng)設(shè)備的語音輸入問題。
在關(guān)于訊飛語音輸入法的演示中,,羅永浩以較快的語速進(jìn)行隨意的語音輸入,,手機(jī)屏幕馬上生成準(zhǔn)確無誤的文字信息。這讓科大訊飛瞬間成了錘子新品發(fā)布會(huì)的主角,,使得科大訊飛這個(gè)原本默默無聞的科技企業(yè)一夜之間成了“網(wǎng)紅”,。
● 是什么催生了擁有強(qiáng)大語音識(shí)別功能的多媒體系統(tǒng)?
我想只要用過舊式語音識(shí)別系統(tǒng)的朋友都會(huì)抱怨識(shí)別率低,,除非使用字正腔圓的標(biāo)準(zhǔn)普通話,,而且語速還不能太快和太慢,否則無法識(shí)別是“家常便飯”,。不管是開發(fā)者還是用戶都知道問題所在,,但是要兼容不同地區(qū)用戶口音差異、讓計(jì)算機(jī)“讀懂”人類平時(shí)說話時(shí)的自然語言最終提升識(shí)別率,,又談何容易,?科大訊飛用了17年的時(shí)間進(jìn)行技術(shù)積累,最終實(shí)現(xiàn)了變革,,讓機(jī)器更好地識(shí)別自然語音同時(shí)把識(shí)別率提升至97%,。
促成變革的還有性能更強(qiáng),集成度更高的電腦芯片,,它能夠讓集成了復(fù)雜語音識(shí)別功能的車載多媒體系統(tǒng)足夠小,,能夠安裝到到汽車的中控臺(tái)內(nèi)部,同時(shí)強(qiáng)大的計(jì)算能力讓語音識(shí)別等待時(shí)間達(dá)到普通用戶可以接受的水平,。
4G網(wǎng)絡(luò)的普及也是變革過程中的幕后推手,。通過4G網(wǎng)絡(luò),語音識(shí)別系統(tǒng)能夠隨時(shí)更新語音庫并且在出現(xiàn)本地?zé)o法識(shí)別的詞匯時(shí),,通過云端服務(wù)器進(jìn)行識(shí)別,,保證語音識(shí)別系統(tǒng)能夠識(shí)別當(dāng)下最新的詞匯。
● 不僅僅是在多媒體系統(tǒng)上裝了一個(gè)“牛逼”的語音識(shí)別軟件那么簡單
屏幕前的你可能會(huì)覺得奇瑞的Cloudrive2.0智云互聯(lián)行車系統(tǒng)只是在普通的多媒體系統(tǒng)了裝了個(gè)“牛逼”的語音識(shí)別軟件,。這么看就大錯(cuò)特錯(cuò)了,。當(dāng)一個(gè)在實(shí)驗(yàn)室中識(shí)別率達(dá)到97%的語音識(shí)別系統(tǒng),用到在高速公路上奔跑的汽車上時(shí),,識(shí)別率可能會(huì)下降到50%甚至更低,。因?yàn)轱L(fēng)噪、胎噪等噪音都會(huì)極大地影響語音識(shí)別率,。
為了滿足奇瑞的高要求,作為多媒體系統(tǒng)提供商的科大訊飛必須對整套系統(tǒng)的硬件進(jìn)行各項(xiàng)耐久性測試,,保證系統(tǒng)在不同溫度,、振動(dòng)的環(huán)境中都有良好的穩(wěn)定性。
● 語音識(shí)別與車載應(yīng)用的互聯(lián)互通為用戶帶來便利
車載多媒體系統(tǒng)空有高語音識(shí)別率,卻不能實(shí)現(xiàn)點(diǎn)什么功能也是白搭,�,?拼笥嶏w通過入股地圖引擎公司——美行科技,獲得了豐富而精確的地圖信息以及千萬級的興趣點(diǎn)信息,。通過打通語音識(shí)別與導(dǎo)航系統(tǒng),,用戶只要說一句“我想吃火鍋”,多媒體系統(tǒng)就能自動(dòng)完成查找導(dǎo)航目的地,,然后通過語音確定目的地即能輕松實(shí)現(xiàn)導(dǎo)航,。
目前,科大訊飛已經(jīng)與30多個(gè)內(nèi)容提供商實(shí)現(xiàn)了合作,,我們熟悉的喜馬拉雅FM,、網(wǎng)易新聞、大眾點(diǎn)評,、美團(tuán)等應(yīng)用都能夠與科大訊飛的車載多媒體系統(tǒng)實(shí)現(xiàn)互聯(lián)互通,,通過語音以最簡單直接的方式進(jìn)行操作。
● 科大訊飛的理想——實(shí)現(xiàn)人與機(jī)器的無障礙溝通
科大訊飛已經(jīng)成功開發(fā)出一套被稱為AIUI(Artificial Intelligence User Interface)的人工智能交互界面,,通過集成雙全工技術(shù),、麥克風(fēng)陣列技術(shù)、聲紋識(shí)別技術(shù),、方言識(shí)別,、語義理解技術(shù)和內(nèi)容服務(wù),最終實(shí)現(xiàn)人機(jī)交流能像人與人交流一樣輕松,。
● 是不是真的好用,?試過才知道
在實(shí)際介紹試用過程之前,我們首先介紹下目前科大訊飛的該套系統(tǒng)在奇瑞車型上的搭載狀況,。首款搭載Cloudrive2.0智云互聯(lián)行車系統(tǒng)的車型是今年3月份上市的奇瑞艾瑞澤5,,搭載相同系統(tǒng)的奇瑞瑞虎3X也將在11月15號(hào)正式上市。新車將會(huì)提供一年免費(fèi)流量(每月500MB),,用于支持多媒體系統(tǒng)上的各種車載應(yīng)用,。流量超了還可以通過銀聯(lián)、微信,、支付寶等支付平臺(tái),,通過掃碼方式付款購買流量,價(jià)格為10元100MB,。根據(jù)目前用戶的使用狀況,,絕大部分用戶每月流量的不會(huì)超過500MB。
下面的視頻演示了奇瑞瑞虎3X多媒體系統(tǒng)語音識(shí)別功能,。從視頻演示中我們可以看到,,測試人員可以以正常甚至稍快的語速進(jìn)行自然語言語音輸入,,甚至還能打斷系統(tǒng)正在播放的語音來進(jìn)行語音命令的輸入,語音識(shí)別率較高,,測試的導(dǎo)航,、音樂播放、電話等功能都無需用戶按按鈕或者觸摸屏幕,,實(shí)現(xiàn)了光動(dòng)口不動(dòng)手的多媒體系統(tǒng)操作體驗(yàn),。
更多精彩視頻,盡在汽車之家視頻平臺(tái)
『奇瑞Cloudrive2.0智云互聯(lián)行車系統(tǒng)語音識(shí)別演示』
據(jù)現(xiàn)場技術(shù)人員介紹,,應(yīng)用于奇瑞Cloudrive2.0智云互聯(lián)行車系統(tǒng)的語音識(shí)別功能未加入方言的識(shí)別(科大訊飛有相應(yīng)的方言識(shí)別技術(shù)),,但對于帶有方言口音的普通話是能實(shí)現(xiàn)較高的識(shí)別率的。
全文總結(jié):
科大訊飛的語音識(shí)別技術(shù)確實(shí)是走在了世界前列,,奇瑞Cloudrive2.0智云互聯(lián)行車系統(tǒng)語音識(shí)別功能對于自然語言的識(shí)別率也達(dá)到了較高的水平,,一些常用的功能基本上通過語音人機(jī)交互1-2回就能實(shí)現(xiàn),極大地提高了使用便利性,。駕駛員無需看屏幕或者按按鍵就能實(shí)現(xiàn)各種多媒體系統(tǒng)功能,,可以更專注地觀察路況,提高了駕駛安全性,。
科大訊飛通過技術(shù)整合,,已經(jīng)完成了語音技術(shù)提供商向語音服務(wù)提供商的蛻變�,?拼笥嶏w提供的車載多媒體系統(tǒng)由于搭載了其國際領(lǐng)先的語音識(shí)別系統(tǒng),,在使用體驗(yàn)上擁有較高的水平。相比起蘋果CarPlay功能的語音識(shí)別,,由于科大訊飛與車企實(shí)現(xiàn)了深度合作,,其多媒體系統(tǒng)能夠與車輛實(shí)現(xiàn)更深入的互聯(lián),未來還能實(shí)現(xiàn)諸如用語音控制車內(nèi)燈光開關(guān),、調(diào)整空調(diào)等各種功能,。作為科大訊飛的合作伙伴,奇瑞也有望成為最先搭載科大訊飛下一代多媒體系統(tǒng)的廠商之一,,更先進(jìn)的AIUI將會(huì)使其多媒體系統(tǒng)使用體驗(yàn)再上升一個(gè)層次,,非常值得期待。(圖/文/攝/汽車之家 常慶林)
好評理由:
差評理由: