[汽車之家互聯(lián)出行]在過去一年的智能車聯(lián)測試項目中,總有朋友提問:我們在文章中提到的很多名詞,很難從字面理解是什么意思,,有時候會讓人摸不著頭腦。正好借著這個各位居家“沉淀”自己的機會,,我們就開啟一個系列,挨個為大家注解那些晦澀難懂的專有名詞,,講講它們的含義,、背景和意義,也備日后相關(guān)文章引用,。這第一期,,我們就先聊聊語音控制中的那些常見名詞。
STT和TTS
互聯(lián)網(wǎng)常識告訴我們:當(dāng)兩個字母/數(shù)字中間夾著一個“T”或者“2”時,,它大概率指代“to”這個單詞,,例如:P2P、B2C,、V2X,,STT和TTS也是類似。
在部分技術(shù)文獻中,,這個環(huán)節(jié)也被稱為ASR(Automatic Speech Recognition,,自動語音識別),,是融合了語言學(xué)、計算機科學(xué)以及電氣工程領(lǐng)域知識和研究的一個復(fù)雜項目,。
我們在宣傳語中經(jīng)常聽到的“語音引擎”,,通常就是指這五個環(huán)節(jié)的集合。在研發(fā)當(dāng)中,,盡管部分供應(yīng)商具備完整的解決方案,,但往往一輛車的語音控制系統(tǒng)會在不同環(huán)節(jié)選擇不同的供應(yīng)商,彼此通力合作,,才達到最終的效果,。
除了我們上文中解釋過的詞匯,NLP(Natural Language Processing,,自然語言處理)是把用戶的指令轉(zhuǎn)化為結(jié)構(gòu)化的,、機器可理解的語言。
語音控制是一個復(fù)雜的涉及語言學(xué),、計算機科學(xué),、電器工程等學(xué)科,云端和本地融合的一項復(fù)雜功能,,往往需要車企的電器部門和多個供應(yīng)商同時合作,,以達到最好的效果。對服務(wù)商而言,,想提供最好的產(chǎn)品,,需要在語言分析、指令集上常年累月的積累,,想做好,真的不容易,。