LLM 大規模言語モデル講座 2023コンテンツ 公開

松尾研究室が2023年9~10月に東京大学サマースクールで開催した
LLM 大規模言語モデル講座のコンテンツを無償公開しています。

本講座は約2,000名の受講者が参加し、全7回の講義を実施しました。
最終課題としてGPUを使ったコンペティションでは約800名が参加し熱戦を繰り広げました。

2023年12月27日時点では講義のスライドの公開のみしております。
演習コンテンツ(ipynb)は2024年1月公開予定です。

ダウンロードは利用規約を確認の上、下記ページからダウンロードをお願いいたします。

https://weblab.t.u-tokyo.ac.jp/llm_contents/

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

◼︎書誌情報
冨山翔司, 鈴木雅大, 落合桂一, 松尾豊: 文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案
◼︎概要
文書生成タスクにおいて,強化学習は有効な手法であると知られている.過去の研究で提案された手法はいずれも,報酬関数の人手による設計の難しさからデータによる学習を試み,その際に文書生成器のサンプルを用いていた.本論文では,報酬関数の学習に文書生成器のサンプルを用いることで引き起こされる,学習時に生成器の学習の進捗を定量的に可視化できないという課題に対し,報酬関数の学習に文書生成器のサンプルを一切用いないGenerator-independent Reward Learningというフレームワークを提案する.本フレームワークに則った手法では,文書生成器の学習を定量的に可視化でき,かつ,代表的な文書生成タスクに対する強化学習応用手法に対して,性能面でも上回ることを確認した.