• Home
  • ニュース
  • 当研究室の論文が論文誌「知能と情報」に採択されました。
  • 当研究室の論文が論文誌「知能と情報」に採択されました。

    ◼︎書誌情報
    冨山翔司、味曽野雅史、鈴木雅大、落合桂一、岩澤有祐、松尾豊
    サマリレベルでの画像の利用法を用いたマルチモーダル翻訳手法の提案

    ◼︎概要
    本論文では、マルチモーダルニューラル翻訳におけるサマリレベルの画像の利用方法を提案する。従来のモデルでは、次の予測対象のトークンに関連する画像情報のみを抽出して利用することが一般的であったが、これが過剰翻訳を引き起こす可能性があることを明らかにする。この問題に対処するため、本研究では画像情報を文全体(サマリ)の特徴量のモデリングに利用し、これをデコーダに統合する新しいモデルである、MVNMTを提案する。MVNMTは、変分オートエンコーダを用いてテキストと画像の情報から共通の潜在表現を抽出する。本研究の実験結果は、MVNMTが従来のテキストのみを用いた翻訳モデルに比べて翻訳評価指標で上回り、かつ、トークンレベルの画像利用法を用いたMNMTモデルに比べて過剰翻訳の問題を効果的に緩和できることを示す。