「夏のICML連続読み会」開催のお知らせ

■ イベント概要

松尾研の研究員が週次で実施しているDeepLearning論文輪読会の特別編として、「夏のICML連続読み会」を下記日程でゲスト参加型にて開催いたします。

各回のテーマにあわせ、松尾研の各研究ユニットのメンバーが登壇します。

ゲスト発表枠も用意しておりますので、聴講だけでなく、登壇者としてのご参加も歓迎です。

(登壇していただける方でオフラインにてご参加される方には、交通費を支給いたします)

 

なお読み会後は懇親会の開催も予定しております。

松尾研の研究テーマや取り組み、研究環境等を知っていただける機会になればと思っておりますので、ぜひお気軽にご参加ください。

 

▼詳細情報・参加申込みは下記Compassページより

第1回 8/1(木) 12:00〜13:30 テーマ | 大規模言語モデル
https://connpass.com/event/325775/

第2回 8/8(木) 12:00〜13:30 テーマ | 世界モデル
https://connpass.com/event/326021/

第3回 8/22(木) 12:00〜13:30 テーマ | Brain Inspired Intelligence
https://connpass.com/event/326023/

第4回 8/29(木) 12:00〜13:30 テーマ | ロボティクス
https://connpass.com/event/326025/

第5回 9/5(木) 12:00〜13:30 テーマ | AI for Social Good
https://connpass.com/event/326027/

 

■ 松尾・岩澤研究室について

松尾・岩澤研では,これまで深層生成モデルや深層強化学習といった基礎アルゴリズムの開発,画像認識,自然言語処理,ロボティクスに関する研究,それらの技術的コアになる世界モデルに関する研究などの研究を行ってきました.現在はフルタイムの研究員の数も10名を超え,2023年度にはICML,ICLR,EMNLP,NAACL,ICRAなどのトップ会議,トップジャーナルに合わせて14本の論文が採択されています.(最近の採択論文一覧はこちら).最近ではBrain-Inspired Intelligenceチームも発足し,深層学習の限界を根本的に解消することを目指した研究開発も行っています.

 

■ 研究員採用について

松尾・岩澤研では,研究員の採用を積極的におこなっております.

詳細は下記よりご覧ください.

【松尾・岩澤研究室】研究員募集のお知らせ(定員20名)

 

NEDOの採択を受け、公開型での500億パラメータサイズの大規模言語モデル開発を開始します。

東京大学松尾・岩澤研究室

日本全体の開発レベル向上を志し、

公開型での500億パラメータサイズの大規模言語モデル開発を開始

―NEDO「ポスト5G情報通信システム基盤強化研究開発事業」事業(注1)採択事業者に決定

 

 

東京大学大学院工学系研究科技術経営戦略学専攻 松尾・岩澤研究室(以下「松尾研」)は、この度経済産業省及び国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が開始する、国内の生成AIの開発力を強化するためのプロジェクト「GENIAC(Generative AI Accelerator Challenge)」において、基盤モデル開発に必要な計算資源の提供支援を受け、500億パラメータサイズの公開型基盤モデル開発に取り組むことをお知らせします。

本取り組みにあたっては、開発された大規模言語モデル(以下「LLM」)の公開のみならず、開発過程の公開、そしてこれらの成果を社会全体で共有することを通じ、日本全体のLLM開発の技術レベル向上と社会実装の加速を目指します。

 

発表の詳細

 本活動では、2023年8月に公開した100億パラメータサイズのLLM「Weblab-10B」の開発経験をベースに、東京大学松尾研究室が提供する大規模言語モデル講座(2023年8月開催、2000名以上が受講)の修了生及び一般公募によって集まった有志の開発者(⺠間企業・研究者・学⽣で構成)が、最新の研究成果や技術的な知見を取り入れ、開発を進めます。

 一般的にLLMの最適なモデル構造やハイパーパラメータは十分に分かっていないため、第1フェーズにおいては8チームに分かれて複数の研究テーマを設定し探索を行い、知見を共有しながら試行錯誤することで、実用的かつ効率的な手法を採用します。その後第2フェーズでは、最優秀に選ばれた1チームが500億パラメータサイズのLLM開発に取り組むことを予定しています。なお、本活動は、基盤モデルの開発評価の過程でWeights & Biases社のプラットフォームを活用した開発を進めていきます。

 松尾研では本活動に参加を希望される有志の開発者を募集しております。募集要項は下記ページをご確認ください。

 https://weblab.t.u-tokyo.ac.jp/geniac_llm

 

 本活動を通じて開発されたモデル・ソースコード・開発過程・ノウハウは、2024年4月以降、松尾研のホームページ等を通じ広く公開してまいります。これらの透明性の高いアプローチを通じ、社会全体の技術リテラシーの向上と産業界やアカデミアにおける応用を促進して参ります。

 

注釈

(注1)国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通信システムの開発」事業。経済産業省が主導する基盤モデルの開発に必要な計算資源に関する支援や関係者間の連携を促す「GENIAC」プロジェクトの一環として採択事業者に一定の計算資源に関わる助成を行うもの。

GENIACの詳細はこちら:
https://www.meti.go.jp/press/2023/02/20240202003/20240202003.html
https://www.meti.go.jp/policy/mono_info_service/geniac/index.html

 

本件に関する問合せ先

東京大学 大学院工学系研究科 松尾・岩澤研究室
E-mail:pr@weblab.t.u-tokyo.ac.jp

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

◼︎書誌情報
冨山翔司, 鈴木雅大, 落合桂一, 松尾豊: 文書生成タスクに対する強化学習応用における文書生成器のサンプルに非依存な報酬関数学習フレームワークの提案
◼︎概要
文書生成タスクにおいて,強化学習は有効な手法であると知られている.過去の研究で提案された手法はいずれも,報酬関数の人手による設計の難しさからデータによる学習を試み,その際に文書生成器のサンプルを用いていた.本論文では,報酬関数の学習に文書生成器のサンプルを用いることで引き起こされる,学習時に生成器の学習の進捗を定量的に可視化できないという課題に対し,報酬関数の学習に文書生成器のサンプルを一切用いないGenerator-independent Reward Learningというフレームワークを提案する.本フレームワークに則った手法では,文書生成器の学習を定量的に可視化でき,かつ,代表的な文書生成タスクに対する強化学習応用手法に対して,性能面でも上回ることを確認した.