松尾研LLM開発コンペ2025

  • Home
  • 松尾研LLMコンペ2025
  • Home
  • 松尾研LLMコンペ2025
  • 本プロジェクトは、大規模言語モデル講座の修了生を含む、松尾・岩澤研究室講座の修了生および一般公募によって集まった有志の開発者(⺠間企業・研究者・学生で構成)約360名によって構成されています。参加者は12チームに分かれ、既存の大規模言語モデル(LLM)に対して事後学習を行い推論モデル(reasoningモデル)の開発に取り組みます。

    本コンペティションでは、最難関のベンチマークとされるHumanity’s Last Exam(HLE)において、オープンモデルとして最高性能(SOTA)の達成を目指すとともに、安全性評価のベンチマークであるDo-Not-Answerにおいても高水準の性能を追求します。最終的には、開発されたモデルやコード、そしてその開発過程で得られた知見を広く公開・共有する事を目的としています。

    本プロジェクトは、国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)の「日本語版医療特化型LLMの社会実装に向けた安全性検証・実証」における基盤モデルの開発プロジェクトの一環として行われます。

    LLM開発者を増やし、日本からイノベーションを生み出す

    2つのフェーズから構成されており、
    Phase1では12チームが、H100 GPU (80GB) 36基 × 約30日分という大規模な計算資源を活用し、
    チームごとにコンペティション形式でモデル開発を実施。
    Phase2では、Phase1の上位数チームが、追加の計算資源を用いてさらに高度なモデル開発に挑戦します。

    開発チーム紹介

    oNo.1

    • リーダー:小野 克樹
    • 開発方針:実験の量と質を極める

    RAMEN

    • リーダー:鈴木 佑晟
    • 開発方針:超推論特化モデルの開発

    Promptia

    • リーダー:田口 昂樹
    • 開発方針:革新的・効率的な推論能力強化

    K.A.T.O

    • リーダー:加藤 純
    • 開発方針:数学の可能性を広げる

    チーム 蝉時雨

    • リーダー:渡部 泰樹
    • 開発方針:知識積み上げ型Reasoning Modelの開発

    ねこ

    • リーダー:本田 大明
    • 開発方針:安全かつ高性能な Reasoning モデルの開発

    TruthOwl🦉

    • リーダー:村上 元規
    • 開発方針:フクロウ型推論性能のLLM開発

    Pont Neuf

    • リーダー:佐原 恭平
    • 開発方針:各メンバーの専門分野に即したデータ収集

    Camino

    • リーダー:神野 大輔
    • 開発方針:強化学習の難易度調整による性能向上

    Cogito

    • リーダー:秋山 達彦
    • 開発方針:スタンドプレーから生じるチームワーク

    チームきつね

    • リーダー:Holy-fox
    • 開発方針:定義の言語化で高品質な学習

    朱雀

    • リーダー:林武
    • 開発方針:世界最高難度の課題に特化

    お問い合わせ

    当研究室への進学/インターン参加の希望、
    共同研究や取材のご相談は
    下記よりお問い合わせください。