首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用 > 智能計(jì)算機(jī)與應(yīng)用 > 基于序列到序列模型的文本到信息框生成的研究 【正文】
摘要:本文展示了一種序列到序列的模型(Seq2Seq)來基于文本生成信息框(Infobox),信息框指的是一組"屬性-值"對(duì)。該模型以端到端的方式工作,可利用一個(gè)編碼器將一個(gè)文本段落表示成一個(gè)隱向量序列,然后通過解碼器來生成信息框。本文在WIKIBIO數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。研究提出的序列到序列模型取得了58.2的F1值,該結(jié)果比流水線式的基準(zhǔn)方法顯著提升了21.0個(gè)百分點(diǎn)。實(shí)驗(yàn)結(jié)果表明,本模型具有以生成序列的方式來生成"屬性-值"對(duì)的能力。引入注意力與拷貝機(jī)制可以提升模型的準(zhǔn)確率。更重要的是,研究觀察到該拷貝機(jī)制有能力從輸入文本中拷貝稀有詞來生成目標(biāo)端信息框中的"值"。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
主管單位:中華人民共和國工業(yè)和信息化部;主辦單位:哈爾濱工業(yè)大學(xué)
一對(duì)一咨詢服務(wù)、簡(jiǎn)單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >