「世界モデル」とは何か? 知能の実現に向けて、松尾研が研究を推進する理由。

Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. 松尾研では「知能を創る」というビジョンを掲げ、研究を進めています。 本記事では知能を創る上で重要な研究テーマとなる「世界モデル」について、松尾研の特任助教である鈴木雅大さんにお伺いしました。 (鈴木さんのインタビューは、前・後編の2回でお届けいたします。後編はこちら)   世界を「直感的」に理解する世界モデルは、真の知能の実現において必要不可欠。 ー「世界モデル」の説明をお聞きする前に、なぜ松尾研は「世界モデル」の研究を推進しているかを教えてください。 松尾研では「知能を創る」というビジョンを掲げており、世界モデルが真の知能の実現において必要不可欠だからです。 世界モデルについては後ほど詳しくご説明しますが、「外界(世界)から得られる観測情報に基づき外界の構造を学習によって獲得するモデル」を指します。 我々は、世界モデルが知能のベースにあって、その上に様々な知的な機能が実現できると考えています。 これは松尾先生が使っていた言葉ですが、世界モデルは「子供の知能」にあたります。 つまり、親から教えられなくても、外界と相互作用して世界がどういうものかを「直感的」に理解するのです。 これができて、ようやく我々のような「大人の知能」、すなわち数学の問題を解いたり片付けをしたりといった高度な知的行動を実現する人工知能を作り始めることができます。 これまでの知能研究を振り返ると、古典的な人工知能(古き良き人工知能(Good Old Fashioned AI;GOFAI)とも言われます)では、 最初から探索や推論といった高度な「大人の知能(賢い知能)」を実現しようとしていました。 それがなぜ失敗したかというと、これらの知能が「世界」について「無知」だったからです。 そのため、計算機上では非常にうまくいったアルゴリズムも、現実環境では全く動かないということがよくありました。 計算機上だけで動く知能でよければこれで十分かもしれませんが、我々の現実世界で動作し、我々をサポートしてくれるような人工知能を実現するためには、 まず世界について自分なりに理解する、すなわち世界モデルを獲得する必要があるのです。       「予測」と「推論」により、効率的な制御学習が可能に。 ー世界モデルによって何ができるようになるか、詳しく教えてください。 先述の通り、世界モデルは「外界(世界)から得られる観測情報に基づき外界の構造を学習によって獲得するモデル」です。 なお、ここでの観測とは、画像をはじめ、音声、文書など外界から得られる様々な種類の情報のことです。これらを学習することで大規模な外界のモデルを作るというのが世界モデルの重要な点です。 世界モデルを持つことによって、大きく分けて「予測」と「推論」の2つが実現できます。 1つ目の予測とは、現在の観測から将来や未知の観測を予測することです。 例)グラスが地面に叩きつけられると割れてしまうと「予測」する  …

知能の実現に本気で挑む。多角的な視点を有する、松尾研の研究環境とは?

Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. 松尾研では「知能を創る」というビジョンを掲げ、研究を進めています。 前半では、知能を創る上で重要な研究テーマとなる「世界モデル」についてお伝えしました。後半である本記事では、松尾研の特任助教である鈴木雅大さんに、松尾研の研究環境やご自身の思いについてお伺いしました。(鈴木さんのインタビューは、前・後編の2回でお届けいたします。前編はこちら)     <知能を創る>という答えのない問い。多様な意見が議論の発展を促す。 ー 実際の研究環境についてお伺いしたいのですが、研究を推進する上での松尾研らしさとは何ですか? 基礎研究側からみた松尾研らしさは、なんといっても「<知能を創る>という情熱」と「多様性」です。 前者に関しては、松尾先生を含め、「知能を実現するためにどうすればいいか」を自由かつ真剣に議論できるところがとても特徴的です。人工知能系の研究をやる場合は、何か解くべき課題を見つけて、それについて取り組むという形が多いので、これは松尾研らしさと言えます。 後者に関しては、同じような考え方を持った人ばかりだと多様性が生まれないので 、異なる考えを受け入れることをとても重視していると思います。「知能を創る」ことへの情熱や世界モデルに対しての考え方など、根幹で共通してはいるものの、実は細かいところでは個々の意見が異なることも多々ありますし、時に松尾先生と意見が異なることもあります。 一般的な研究室だと、教授の示す方向に合わせる形で研究するか、あるいは完全にそれぞれが別々のことを研究するかに分かれることが多いです。ですが、松尾研では色々な考え方がありつつもこれが大事だという根幹の部分が共通しているという点で、結構珍しい研究室なのではないか?と思いますね。 ーなぜ松尾研の研究環境として多様性を重視しているのでしょう? 「知能がどうすれば実現できるのか」 という問いに、現時点で確実な答えがないからです。 知能を実現するための方法はまだ誰にもわからないので、メンバーで意見が完全に一致することは多くありません。ただ、そういった異なる意見が、議論の発展を促すのです。 これは同時に、人工知能という領域全体に当てはまる部分でもあります。例えば、自然科学の領域では世界がどのようになっているのかということがこれまでの研究の蓄積でかなり解き明かされているので、それをさらに発展させて「正解」に向かって研究を進めばいいんです。 でも、人工知能の領域では、人間のような知能を実現するということを達成した人はいないので、現在研究が進んでいる方向性が正しいのかは誰にもわかりませんし、知能について様々な考え方がある中で、どれが合っているのかを現在の我々が判断することはできません(※)。 そうした意味では、権威のある人の意見が必ずしも正しいとは限らないので、年配の研究者の方が若い研究者にリスペクトを持っているなと感じることも多いです。我々も当然、他の研究者の方々にリスペクトを持って研究を進めています。そういった風土を見ると、割とリベラルでいい研究領域だなと思っていますね。 ※ 厳密には知能も自然現象の一つなので「正解」があるはずです。しかし、それを解き明かすためには他の自然科学と同様に、仮説を立ててその仮説が正しいかを検証をする必要があります。これまで知能についての様々な仮説が考えられてきましたが、検証までできているものは殆どありません。理由としては、こうした知能仮説を検証する方法がこれまでになかったからです。近年の深層学習や世界モデルの発展によって、ようやく知能を創ることで知能を知るという「構成論的アプローチ」を取ることができるようになりました。そうした意味では、知能を解き明かす試みはようやく始まったところといえます。   「ロボットの実現には、まず知能が必要だ。」 人工知能研究へのこだわりの原点。 ー なぜ鈴木さんは「知能を創る」というビジョンに共感したのでしょう? 私自身が「人工知能を実現する」ということに強いこだわりを持っているからです。 私は元々ロボットに興味があったのですが、「知能を実現したい」と思った大きな転換点がありました。それは高校生の頃に二足歩行ロボットの動画を見たことです。 その動画ではロボットが「簡単に階段を降りられます」と言いながら、思いっきり階段を踏み外して転んでいて。転んでいるのにそのまま喋り続けている姿を見て衝撃を受けました。スタッフの人は それを見てすごく慌てて片付けようとしているけど、ロボットはずっと喋っているという。見た目はすごく人らしく歩いてるのに、頭はこんなに出来てないんだなと思いました。 これを見た時に「ロボットの頭、つまり人工知能を先にやるべきじゃないのか」と思い、大学(学部・修士時代は北海道大学に所属)では人工知能の研究をするために情報系の学科に入りました。  …

Our paper was accepted for Transactions of the Japanese Society for Artificial Intelligence : AI.

Our paper was accepted for Transactions of the Japanese Society for Artificial Intelligence : AI.   ◼︎書誌情報 張鑫,松嶋達也,松尾豊,岩澤有祐: M3IL: Multi-Modal Meta-Imitation Learning, 人工知能学会論文誌, 第38巻2号 J-STAGE(2022) ◼︎概要 Imitation Learning(IL) is anticipated to achieve intelligent robots since it allows the user to teach the various robot tasks easily.In particular, Few-Shot Imitation Learning(FSIL) aims to infer and adapt…

Our paper was accepted for New Generation Computing.

Our paper was accepted for New Generation Computing.   ■書誌情報 Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo. “Robustifying Vision Transformer Without Retraining From Scratch Using Attention Based Test-Time Adaptation”, New generation computing. ■概要 Vision Transformer (ViT) is becoming more and more popular in the field of image processing. This study aims to improve the robustness against…

「宝くじ仮説とその発展」の受講生募集開始

Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.

松尾研究室主催の公開講座  宝くじ仮説とその発展 の受講生を募集します.
詳細はWEBページをご覧ください。

 

■ 宝くじ仮説とその発展
https://deeplearning.jp/lectures/lth-2022/

Our paper was accepted for Pattern Recognition Letters

Our paper was accepted for Pattern Recognition Letters   ■書誌情報 Bo Yang, Jianming Wu, Kazushi Ikeda, Gen Hattori, Masaru Sugano, Yusuke Iwasawa, Yutaka Matsuo. “Face-mask-aware Facial Expression Recognition based on Face Parsing and Vision Transformer”, Pattern Recognition Letters, In Press, Pre-proof (2022). https://doi.org/10.1016/j.patrec.2022.11.004 ■概要 As wearing face masks is becoming an embedded practice due to the…