首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電信技術(shù) > 數(shù)據(jù)通信 > 基于稀疏DBN和雙向LSTM的視覺語音識別算法 【正文】
摘要:唇部視覺信息作為語音識別的輔助信息一直受到廣泛關(guān)注,為更好的提取唇部視覺信息,提出一種基于稀疏深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)和雙向長短期記憶網(wǎng)絡(luò)(Bidirectional Long Short-Term Memory,BiLSTM)的視覺語音識別算法。該算法通過在DBN的目標(biāo)函數(shù)后引入混合的范數(shù)和范數(shù)來實(shí)現(xiàn)DBN的稀疏表示,以此稀疏DBN對唇部視覺信息進(jìn)行稀疏瓶頸特征的提取,再將提取的瓶頸特征送入BiLSTM進(jìn)行特征的學(xué)習(xí)分類。實(shí)驗(yàn)表明,該算法能有效的識別唇部視覺信息。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:信息產(chǎn)業(yè)部;主辦單位:信息產(chǎn)業(yè)部數(shù)據(jù)通信科學(xué)技術(shù)研究所
一對一咨詢服務(wù)、簡單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >