首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 自動化技術(shù) > 智能系統(tǒng)學(xué)報 > 視聽覺跨模態(tài)表面材質(zhì)檢索 【正文】
摘要:針對文本圖像特征有時無法滿足對物體材質(zhì)進行真實準(zhǔn)確分析的情況,本文在視聽領(lǐng)域使用跨模態(tài)檢索方法進行表面材質(zhì)檢索。首先提取聲音的梅爾頻率倒譜系數(shù)(MFCC)特征,使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取圖像特征,然后利用典型相關(guān)分析將兩種特征映射到子空間并用歐氏距離進行檢索,并在慕尼黑工業(yè)大學(xué)觸覺紋理數(shù)據(jù)集上進行實驗驗證,實現(xiàn)了使用聲音檢索圖像的跨模態(tài)檢索過程。實驗結(jié)果表明,所提出的方法在材質(zhì)檢索方面有較好應(yīng)用效果。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:中華人民共和國工業(yè)和信息化部;主辦單位:中國人工智能學(xué)會;哈爾濱工程大學(xué)
一對一咨詢服務(wù)、簡單快捷、省時省力
了解更多 >直郵到家、實時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進度實時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >