ビジョナリー・スタートアップ〜起業の理論と実践〜」応募開始のお知らせ

坂田教授とともに松尾教授が企画・監修に関わる「ビジョナリー・スタートアップ〜起業の理論と実践〜」の受講申込みを受け付けています!
2022年からGlobis Capital Partners様とコラボを組んだ実践的起業講義が、今年は東京大学正規科目となりました。東大および協定校は学部から博士まで学年を問わず受講可能です!また、後日YouTubeから一部動画も一般公開させていただきます。詳細はこちらから!

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

◼︎書誌情報
冨山翔司, 鈴木雅大, 落合桂一, 松尾豊: 文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案
◼︎概要
文書生成タスクにおいて,強化学習は有効な手法であると知られている.過去の研究で提案された手法はいずれも,報酬関数の人手による設計の難しさからデータによる学習を試み,その際に文書生成器のサンプルを用いていた.本論文では,報酬関数の学習に文書生成器のサンプルを用いることで引き起こされる,学習時に生成器の学習の進捗を定量的に可視化できないという課題に対し,報酬関数の学習に文書生成器のサンプルを一切用いないGenerator-independent Reward Learningというフレームワークを提案する.本フレームワークに則った手法では,文書生成器の学習を定量的に可視化でき,かつ,代表的な文書生成タスクに対する強化学習応用手法に対して,性能面でも上回ることを確認した.