
プロジェクト詳細

概要
本プロジェクト「松尾研LLMコンペ2025」は、汎用データを活用したコンペティション形式のLLM(大規模言語モデル)開発を通じて、日本のAI技術力向上と次世代の開発者育成を目指します。本年度は、一般公募によって集まった有志の開発者約360名(民間企業・研究者・学生で構成)が、最新の研究成果や技術的な知見を取り入れながら開発を進めます。
参加者は12チームに分かれ、既存のLLMに対する事後学習によって推論モデルを開発します。最難関ベンチマークの一つである「Humanity’s Last Exam (HLE)」でオープンモデルの最高性能を目指すとともに、安全性ベンチマーク「Do-Not-Answer」でも高い性能を追求します。コンペティションは2つのフェーズで構成され、第1フェーズで全チームが競い、第2フェーズでは予選を勝ち抜いた上位2チームがさらなる性能向上に挑みます。最終的には、開発されたモデルやコード、そしてその開発過程で得られた知見を広く公開・共有する事を目的としています。
注) 本プロジェクトは、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)の「日本語版医療特化型LLMの社会実装に向けた安全性検証・実証」における基盤モデル開発プロジェクトの一環として行われます
特徴
透明性の高い非営利の公開型プロジェクトを目指します。チームの組成から、利用するデータセット、開発プロセスや日々の開発ログ、コミュニティでの交流、そして完成したLLMに至るまで、開発の過程で得られた知見や成果物を可能な限り情報発信・公開します。
これにより、開発メンバーだけでなく、本プロジェクトのコミュニティメンバーやオンライン上の誰もが、最先端のLLM開発に関する情報にアクセスできる環境を構築します。最終的に開発されたモデルは、研究や商用利用を促進する許諾範囲の広いライセンスでOSS(オープンソースソフトウェア)として公開することを目指します。
目的
本企画は、以下の3つの目的を達成するために推進します。
- 高性能な日本語LLMの開発と社会実装への貢献
- 世界レベルのベンチマークで高い性能を持つLLMを開発・公開することで、国内におけるLLMの実用化を加速させ、社会課題の解決に貢献します。
- 国内トップレベルのLLM開発人材の育成
- 実践的なLLM開発の機会を提供し、日本のAI分野を牽引する次世代の開発者を育成します。
- 開発ノウハウの普及と技術水準の向上
- 開発プロセスをオープンにすることで、LLM開発の知見を広く社会に共有し、国内全体の技術水準の底上げに貢献します。