LLM 大規模言語モデル講座 2023コンテンツ 公開

LLM 大規模言語モデル講座 2023コンテンツ公開

For Students/ResearchersBy kawai 2023年12月29日

松尾研究室が2023年9~10月に東京大学サマースクールで開催した
LLM 大規模言語モデル講座のコンテンツを無償公開しています。

本講座は約2,000名の受講者が参加し、全7回の講義を実施しました。
最終課題としてGPUを使ったコンペティションでは約800名が参加し熱戦を繰り広げました。

2023年12月27日時点では講義のスライドの公開のみしております。
演習コンテンツ(ipynb)は2024年1月公開予定です。

ダウンロードは利用規約を確認の上、下記ページからダウンロードをお願いいたします。

https://weblab.t.u-tokyo.ac.jp/llm_contents/

【東大松尾研】2023年の活動報告

Blog, Lab NewsBy 白石萌莉 2023年12月27日

こんにちは、松尾研広報チームです。本郷キャンパスの銀杏並木も葉を落とし、すっかり冬景色に変わりました。 2…

BSスペシャル「欲望の資本主義2024 ニッポンのカイシャと生産性の謎」に松尾が出演します。

Lab NewsBy Yurina Nagao 2023年12月27日

BSスペシャル「欲望の資本主義2024 ニッポンのカイシャと生産性の謎」に松尾が出演します。
放送はNHK-BSにて1/1(月)22：30-23：59です。

GCI優秀生サンフランシスコ視察研修2023レポート

Blog, UncategorizedBy Erin Hirakawa 2023年12月26日

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

Research NewsBy 佐藤菜津 2023年12月22日

◼︎書誌情報
冨山翔司, 鈴木雅大, 落合桂一, 松尾豊: 文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案
◼︎概要
文書生成タスクにおいて，強化学習は有効な手法であると知られている．過去の研究で提案された手法はいずれも，報酬関数の人手による設計の難しさからデータによる学習を試み，その際に文書生成器のサンプルを用いていた．本論文では，報酬関数の学習に文書生成器のサンプルを用いることで引き起こされる，学習時に生成器の学習の進捗を定量的に可視化できないという課題に対し，報酬関数の学習に文書生成器のサンプルを一切用いないGenerator-independent Reward Learningというフレームワークを提案する．本フレームワークに則った手法では，文書生成器の学習を定量的に可視化でき，かつ，代表的な文書生成タスクに対する強化学習応用手法に対して，性能面でも上回ることを確認した．