内容をスキップ

研究室について
ニュース
研究
講義
起業家育成
- 松尾研発スタートアップ
- 起業クエスト
社会連携
メンバー
- 研究員・スタッフ一覧
- 学生一覧
採用・学生募集
ja
en

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

2023.12.22

—

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

◼︎書誌情報
冨山翔司, 鈴木雅大, 落合桂一, 松尾豊: 文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案
◼︎概要
文書生成タスクにおいて，強化学習は有効な手法であると知られている．過去の研究で提案された手法はいずれも，報酬関数の人手による設計の難しさからデータによる学習を試み，その際に文書生成器のサンプルを用いていた．本論文では，報酬関数の学習に文書生成器のサンプルを用いることで引き起こされる，学習時に生成器の学習の進捗を定量的に可視化できないという課題に対し，報酬関数の学習に文書生成器のサンプルを一切用いないGenerator-independent Reward Learningというフレームワークを提案する．本フレームワークに則った手法では，文書生成器の学習を定量的に可視化でき，かつ，代表的な文書生成タスクに対する強化学習応用手法に対して，性能面でも上回ることを確認した．

Related Post

IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026) に当研究室の論文3本が採録

IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026) に当研究室の論文3本が採録

Interspeech 2026に当研究室の論文が採録

Interspeech 2026に当研究室の論文が採録

IEEE Transactions on Automation Science and Engineering(T-ASE)に当研究室の論文が採録

IEEE Transactions on Automation Science and Engineering(T-ASE)に当研究室の論文が採録

UAI 2026に当研究室の論文が採録

UAI 2026に当研究室の論文が採録

JMIR Infodemiologyに当研究室の論文が採録

JMIR Infodemiologyに当研究室の論文が採録

BMJ Digital Health & AI Editorialに当研究室の招待論文が採録

BMJ Digital Health & AI Editorialに当研究室の招待論文が採録

MICCAI 2026 early acceptに当研究室の論文2本が採録

MICCAI 2026 early acceptに当研究室の論文2本が採録

ICML 2026に当研究室の論文5本が採録

ICML 2026に当研究室の論文5本が採録

研究室について
ニュース
研究
講義
起業家育成
- ＞松尾研発スタートアップ
- ＞起業クエスト
社会連携
メンバー
- ＞研究員・スタッフ一覧
- ＞学生一覧
採用・学生募集

Facebook
X

Copyright ©Matsuo-Iwasawa Lab. All Rights Reserved.