2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
在過去的十年左右的時(shí)間里,機(jī)器學(xué)習(xí)的進(jìn)步為開發(fā)越來越先進(jìn)的語音識(shí)別工具鋪平了道路。通過分析人類語音的音頻文件,這些工具可以學(xué)習(xí)識(shí)別不同語言的單詞和短語,并將其轉(zhuǎn)換為機(jī)器可讀格式。
盡管幾種基于機(jī)器學(xué)習(xí)的模型在語音識(shí)別任務(wù)上已經(jīng)取得了可喜的成果,但它們并非總是在所有語言中都表現(xiàn)良好。例如,當(dāng)一種語言的詞匯表中包含許多發(fā)音相似的單詞時(shí),語音識(shí)別系統(tǒng)的性能可能會(huì)大大下降。
圣雄甘地特派團(tuán)工程技術(shù)學(xué)院和杰比信息技術(shù)學(xué)院的研究人員已經(jīng)開發(fā)出一種語音識(shí)別系統(tǒng)來解決這個(gè)問題。在Springer Link的國際語音技術(shù)雜志上發(fā)表的一篇論文中介紹了這個(gè)新系統(tǒng),該系統(tǒng)將人工神經(jīng)網(wǎng)絡(luò)(ANN)與稱為對(duì)立人工蜂群(OABC)的優(yōu)化技術(shù)相結(jié)合。
研究人員在論文中寫道:“在這項(xiàng)工作中,使用Levenberg-Marquardt算法重新設(shè)計(jì)了ANN的默認(rèn)結(jié)構(gòu),以準(zhǔn)確地檢索最佳預(yù)測(cè)率。”“使用對(duì)立人工蜂群優(yōu)化技術(shù)進(jìn)一步優(yōu)化了隱層和隱層的神經(jīng)元。”
研究人員開發(fā)的系統(tǒng)的獨(dú)特之處在于它使用OABC優(yōu)化算法來優(yōu)化ANN的層和人工神經(jīng)元。顧名思義,人工蜂群(ABC)算法旨在模擬蜜蜂的行為,以解決各種優(yōu)化問題。
研究人員在論文中解釋說:“通常,優(yōu)化算法會(huì)在匹配域中隨機(jī)初始化解決方案。”“但是這種解決方案可能與最佳解決方案處于相反的方向,從而大大增加了計(jì)算開銷。因此,這種基于對(duì)立的初始化被稱為OABC。”
研究人員開發(fā)的系統(tǒng)將不同人說的單個(gè)單詞視為輸入語音信號(hào)。隨后,它提取所謂的調(diào)幅(AM)頻譜圖特征,這些特征本質(zhì)上是特定于聲音的特征。
然后,由模型提取的特征將用于訓(xùn)練ANN以識(shí)別人類語音。在大型音頻文件數(shù)據(jù)庫上進(jìn)行訓(xùn)練后,人工神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)預(yù)測(cè)新的人類語音樣本中的孤立詞。
研究人員在一系列人類語音音頻片段上測(cè)試了他們的系統(tǒng),并將其與更傳統(tǒng)的語音識(shí)別技術(shù)進(jìn)行了比較。他們的技術(shù)優(yōu)于其他所有方法,獲得了顯著的準(zhǔn)確性得分。
研究人員在論文中寫道:“該方法的靈敏度,特異性和準(zhǔn)確性分別為90.41%,99.66%和99.36%,比所有現(xiàn)有方法都要好。”
將來,語音識(shí)別系統(tǒng)可用于在各種環(huán)境中實(shí)現(xiàn)更有效的人機(jī)通信。此外,他們用于開發(fā)系統(tǒng)的方法可能會(huì)啟發(fā)其他團(tuán)隊(duì)設(shè)計(jì)類似的模型,這些模型結(jié)合了ANN和OABC優(yōu)化技術(shù)。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。