東京大学松尾・岩澤研究室 GENIACプロジェクトにおいて、大規模言語モデル「Tanuki-8×8B」を開発・公開

発表のポイント 経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、松尾・岩澤研究室が「Tanuki-8×8B」を開発・公開。 本モデルは、フルスクラッチで開発されており、対話、作文能力を評価する指標「Japanese MT-Bench」において「GPT-3.5 Turbo」と同等以上の性能を達成。 Apache License 2.0のライセンスに基づき、研究および商業目的での自由な利用が可能。「Tanuki-8×8B」の軽量版である、「Tanuki-8B」をチャット形式で利用できるデモも公開。 本モデルのNejumi LLMリーダーボード3における評価   発表内容 東京大学大学院工学系研究科技術経営戦略学専攻 松尾・岩澤研究室(以下「松尾研」)は、経済産業省及び国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が推進する、国内の生成AIの開発力を強化するためのプロジェクト「GENIAC(Generative AI Accelerator Challenge)」(注1)において、大規模言語モデル「Tanuki-8×8B」を開発し、公開いたしました。   〈開発の背景〉 本活動は、日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、2023年8月に公開した100億パラメータサイズのLLM「Weblab-10B」の開発経験をベースに、LLM開発を進めるものです。 松尾研が提供する大規模言語モデル講座(2023年8月開催、2000名以上が受講)の修了生及び一般公募によって集まった有志のメンバー(⺠間企業・研究者・学⽣で構成)が、それぞれの知見を取り入れながら開発に取り組みました。 開発工程は2つのフェーズに分かれており、Phase1(注2)では7チームに分かれてコンペティション形式で開発を進め、Phase2ではPhase1の優勝チームが更に大規模なモデル開発に挑戦しました。「Tanuki-8×8B」は本取り組みの結果開発され、公開するものです。 松尾研GENIACプロジェクトについては下記をご覧ください。 https://weblab.t.u-tokyo.ac.jp/geniac_llm/   〈「Tanuki-8×8B」の概要〉 「Tanuki-8×8B」はPhase1で構築された8Bモデルを8つに複製し、それぞれを専門家モデルとして分化・連携させることで動作するように効率的に追加学習されたモデル(注3)です。本モデルは、フルスクラッチで開発されており、作文、会話を評価する指標「Japanese MT-Bench」においては「GPT-3.5 Turbo」と同等以上の性能を達成しています。モデル名は「日本らしく、親しみを覚える動物の名前」というテーマでチームメンバーで案を出し、投票で決定しました。 開発モデル公開URL 本モデルはApache License 2.0のライセンスに基づき、研究および商業目的での自由な利用が可能です。 Tanuki-8x8B:https://huggingface.co/weblab-GENIAC/Tanuki-8x8B-dpo-v1.0 Tanuki-8B:https://huggingface.co/weblab-GENIAC/Tanuki-8B-dpo-v1.0 デモ公開URL 「Tanuki-8×8B」の軽量版である、「Tanuki-8B」をチャット形式で利用できるデモを下記URLで公開しております。下記URLにアクセスし実際の会話をお試しください。 https://huggingface.co/spaces/weblab-GENIAC/Tanuki-8B-dpo-v1.0 ※期間限定公開・終了日時未定 デモ画面   〈「Tanuki-8×8B」の特徴〉 「Tanuki-8×8B」は文章の作文や対話を中心に学習しており、当該能力を測る「Japanese MT-Bench」では事前学習からフルスクラッチで開発を行ったモデルとして、GPT-3.5 Turboと同等の性能を達成しています。   Nejumi LLMリーダーボード3における評価 はじめに、大規模言語モデルの総合的な日本語能力を評価するための最新(注4)のベンチマークシステムであるNejumi LLMリーダーボード3のベンチマークプログラムを用いてモデル性能を評価し、既存のモデル群(注5)と比較しました。   橙色が本プロジェクトで開発されたモデル、青色が他モデルを表す    Nejumi LLMリーダーボード3は言語モデルの文章作成、対話能力のほか、知識や安全性など、さまざまな観点から性能を評価するシステムです。本ベンチマークにおける「Tanuki-8×8B」の総合スコアは0.57/1.00で、OpenAIのGPT-3.5…

「世界モデル2024」の受講生募集開始

Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

松尾・岩澤研究室主催の公開講座「世界モデル2024」を開講します。
受講を希望される方は下記ページを参考にしてください。

  • 世界モデル 2024
    (申込締切:2024/9/17(火)10:00 ※ OmnicampusでのID登録・学年更新締切:2024/9/13(金)10:00)

Mr. Jonathan Frankle’s lecture to Matsuo Lab

Mr. Jonathan Frankle, who is famous for “The Lottery Ticket Hypothesis” and is currently Chief Neural Network Scientist at Databricks, gave a lecture at the University of Tokyo. Approximately 50 people, including researchers and students of the Matsuo-Iwasawa Laboratory, attended the lecture on “Training Modern LLMs from Scratch.     Speaker biography: Mr. Jonathan Frankle…

Matsuo Lab Research Internship 2024 has started

With the mission of “Creating Intelligence,” the Matsuo-Iwasawa Laboratory is actively conducting a wide range of research, including the development of world models and other fundamental technologies for deep learning and beyond, robotics, large-scale language models, and social implementation of algorithms. The number of full-time researchers has exceeded 10 (and is expected to continuously increase),…

※締切延長「大規模言語モデル 2024」の受講生募集開始

Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

松尾・岩澤研究室主催の公開講座「大規模言語モデル 2024」を開講します.
受講を希望される方は下記ページを参考にしてください.

  • 大規模言語モデル 2024

    ※締切再延長しました
    申込締切│2024年8月26日(月) AM10時
    (※ID登録締切│2024年8月23日(金) AM10時)

Prof. Danushka Visited Matsuo Lab.

Prof Danushka, who works for Amazon Inc, visited the Matsuo Lab on Wednesday 31 July. Prof. Danushka belonged to Ishizuka Laboratory as well as Prof. Matsuo, and has had a long-standing relationship with him. Because of this relationship, he has given a lecture every year at our lab. On the day of the lecture, nearly…