世界から注目されるLLM研究の舞台裏。トップ研究者との議論が生まれる研究環境とは?

2020年に博士課程から松尾・岩澤研究室に所属した小島武特任研究員は、博士号取得後も研究室に残り、主にLLM(大規模言語モデル)の研究・開発に取り組んでいます。「Let’s think step by step」と指定することで、AIの正答率が高まるという発見をした小島さんの主著論文は、発表から2年足らずで2000以上(2024年5月24日現在)引用され、世界中のAI研究者から注目を集めました。100億パラメータサイズの大規模言語モデルの開発リーダーや経済産業省のGENIAC採択プロジェクトの開発支援チームリーダーとしても活躍する小島さんに、最新のLLM研究や松尾・岩澤研の魅力について聞きました。   著名なAI研究者たちとの共著論文を 手がける機会が訪れる研究室 —小島さんの代表論文である通称「step by step論文」は、発表から2年弱で2000以上の引用をされています。概要を改めて教えてください。 これは、松尾・岩澤研究室に加入した後、博士課程在籍時の2022年5月に発表した「Large Language Models are Zero-Shot Reasoners」というタイトルの論文です。LLM(大規模言語モデル)はゼロショットの多段階推論が可能であることをデータで示したものになります。     ゼロショットの多段階推論とは、LLMがプロンプト(指示)にFew-shot事例(いくつかの例題)がなくとも与えられた複雑なタスクをこなすことを指します。LLMから多段階の複雑な推論を引き出すためには、タスク特有のFew-shot事例が必要だと考えるのが、それまでの常識でした。しかし、膨大な知識を持つLLMに特別なプロンプトを与えることで、ゼロショット推論が可能になると私は考えました。 詳しくはこちら>> Large Language Models are Zero-Shot Reasoners 具体的には、「Let’s think step by step」というプロンプトを与えることで、LLMが事前学習していない新しいタスクでも論理的な推論を行える可能性を示しました。実験で使用したLLMは、GPT-3の後継であるInstruct GPT。これを使って、MultiArith(数学的な推論能力を評価するデータセット)の問題を解かせると「Let’s think step by step」のプロンプトを与える前後で、正答率が17.7%から78.7%に飛躍的に向上しました。GoogleのPaLMなど別のLLMでも同様の挙動を確認できました。 このアイデアを得たのは、Googleの研究者が2022年1月に発表した「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」という論文を知ったのがきっかけでした。LLMがFew-shotで似たようなタスクをこなせる可能性を示唆するもので、これならゼロショットでもできるのではないかと考えたわけです。まだ誰も手を付けていない領域だったこともあり、1〜2か月ほどで書き上げました。 詳しくはこちら>> Chain-of-Thought Prompting Elicits Reasoning in Large Language Models —この論文発表によって、小島さんの生活に変化はありましたか?…

2024年Sセメスター「ディープテック起業家への招待」受講申込み開始

坂田教授・各務教授・田中教授とともに、松尾教授が企画・監修を務める「ディープテック起業家への招待」の受講申込みを受け付けています!多くのエキスパート登壇に加え、最終発表は総長の前で発表、さらに優秀者はコミュニティ“DICE”への参加の他、選抜式の海外研修などの機会があります。年々パワーアップしている本講座、多くの皆様からのチャレンジをお待ちしています!
詳細はこちらをご覧ください。

Our paper was accepted for NeurIPS 2023

◼︎Bibliographic information Paul Yoo, Jiaxian Guo, Yutaka Matsuo, Shixiang Shane Gu. “DreamSparse: Escaping from Plato’s Cave with 2D Diffusion Model Given Sparse Views.” Neural Information Processing Systems (NeurIPS 2023) ◼︎Overview Synthesizing novel view images from a few views is a challenging but practical problem. Existing methods often struggle with producing high-quality results or necessitate per-object…

Our paper was accepted for Information Processing Society of Japan

◼︎Bibliographic information Hitoshi Nakanishi, Masahiro Suzuki, Yutaka Matsuo: HAWK-Net: Hierarchical Attention Weighted Top-K Network for High-resolution Image Classification ◼︎Overview To handle high-resolution images on finite computational resources, many research has been conducted on hierarchical networks to load features in only the most meaningful local regions. However, it is difficult to determine the correct number and…

2023年Aセメスター「ディープテック起業実践演習」申込み受付中!

坂田教授・各務教授・田中准教授とともに、松尾教授が企画・監修を務める「ディープテック起業実践演習」の申込みを10/4まで受け付けております。多くのエキスパート登壇に加え、最終発表は総長の前で発表、さらに優秀者はコミュニティ“DICE”への参加の他、選抜式の海外研修などの機会があります。また、履修による単位の付与対象は、東京大学大学院生、東京工業大学大学院生その他の単位互換協定校在籍生約30-40名(所属研究科、学年不問)とします。多くの皆様からのチャレンジをお待ちしています!
詳細はこちらをご覧ください
https://entredu.t.u-tokyo.ac.jp/2023a/

★応募フォーム:https://forms.gle/2LKamuJbnfaVAw249

Our paper was accepted for Pattern Recognition Letters

Our paper was accepted for Pattern Recognition Letters   ■書誌情報 Bo Yang, Jianming Wu, Kazushi Ikeda, Gen Hattori, Masaru Sugano, Yusuke Iwasawa, Yutaka Matsuo. “Face-mask-aware Facial Expression Recognition based on Face Parsing and Vision Transformer”, Pattern Recognition Letters, In Press, Pre-proof (2022). https://doi.org/10.1016/j.patrec.2022.11.004 ■概要 As wearing face masks is becoming an embedded practice due to the…

Our paper was accepted for Advanced Robotics.

Our paper was accepted for Advanced Robotics 2021年9月に実施された,家庭環境でのサービスロボットに関する世界的な競技会WRS 2020 Partner Robot Challengeにおいて,当研究室発のチームが準優勝を収めた際の研究開発をまとめています. ■書誌情報 Tatsuya Matsushima, Yuki Noguchi, Jumpei Arima, Toshiki Aoki, Yuki Okita, Yuya Ikeda, Koki Ishimoto, Shohei Taniguchi, Yuki Yamashita, Shoichi Seto, Shixiang Shane Gu, Yusuke Iwasawa, Yutaka Matsuo. “World robot challenge 2020 – partner robot: a data-driven approach for room tidying with mobile…

Our paper was accepted for EMNLP 2022.

Our paper was accepted for EMNLP 2022 [1件目] ■書誌情報 Machel Reid, Graham Neubig. “Learning to Model Editing Processes”, Conference on Empirical Methods in Natural Language Processing (EMNLP 2022). ■概要 Most existing sequence generation models produce outputs in one pass, usually left-to-right. However, this is in contrast with a more natural approach that humans use in…

Our paper was accepted for NeurIPS 2022.

Our paper was accepted for NeurIPS 2022. [1本目] ◼︎書誌情報 Shohei Taniguchi, Yusuke Iwasawa, Wataru Kumagai, Yutaka Matsuo. “Langevin Autoencoders for Learning Deep Latent Variable Models”, Neural Information Processing Systems (NeurIPS 2022). ◼︎概要 Markov chain Monte Carlo (MCMC), such as Langevin dynamics, is valid for approximating intractable distributions. However, its usage is limited in the context…

当研究室の発表が MIRU2022にてMIRU優秀賞を受賞しました。

当研究室の発表が、第25回画像の認識・理解シンポジウム (MIRU2022) にて「MIRU優秀賞」を受賞しました。

タイトル:Pixel vs. Object: 変化キャプショニングにおける最適な画像表現についての研究

著者: 土居健人,濱口竜平,岩澤有祐,大西正輝,松尾豊,櫻田健
https://sites.google.com/view/miru2022/home/award#h.8ea1ax6uvq4w