松尾研は人工知能の研究を推進していることはよく知られていますが、ロボティクス研究にも注力していることはご存じない方も多いのではないでしょうか?
今回は、そんな松尾研のロボティクス研究の目的やこれまでの経緯、活動の全体像、今後の展望について、修士時代のロボット研究の立ち上げから活躍している博士課程所属 松嶋 達也さんと、ロボットチームのアドバイザーをしている松尾研講師である岩澤 有祐さんにお話を伺いました。
「知能の実現」を掲げる松尾研で、深層学習を用いたロボット学習を推進。
ー松尾研ではなぜロボティクス研究を推進しているのですか?
松嶋:松尾研がロボティクス研究を進めるのは、実世界と相互作用を持つ実機を使うことで、松尾研の目標である「知能とは何かを解き明かす」ことに近付くことができると考えるためです。
身体を持つシステムとしてのロボットの実装やデータ取得を通じて、汎用的で適応性の高い「かしこい」振る舞いを生み出すことを目的としています。これは、近年、松尾研で力を入れている世界モデルの研究を実世界のデータを用いて行うことに相当します。
ーロボティクス研究とは、具体的にはどのような研究を進めているのですか。
松嶋:
ロボティクス研究を進めるロボットチーム(TRAIL)では研究活動・講義・ロボットサークル運営という3つの活動を推進しています。
研究活動においては、機械学習技術を用いてロボットの柔軟な認識や制御をデータから学習することを目指すロボット学習と呼ばれる分野の研究を中心に進めています。これまでのロボットは、工場のような綺麗に設計され、動作が制約された環境で高速かつ正確に決められたタスクをこなすという状況で活用されてきました。一方で、松尾研では、より難易度の高い、家庭環境や日常環境など人間とより近い場所で多様な環境で多様なタスクを想定して、先端AI技術を利用することによって様々な状況に対する汎化性能や未知の環境への適応可能性を高める技術の開発を行っています。
例えば、工場などでは「ナットを締める」という同じ動作を繰り返すようなロボットが使われてきましたが、家庭で使われるお片付けロボットであれば同じようには上手くいきません。Aさんの家の構造を完璧に理解し、その環境に適した振る舞いを身に付けたとしても、Bさんの家の構造は全く同じであることはほぼないため、これまでのロボットのプログラムや学習したことがそのまま活かせないということが理由です。こうした個々の環境に応じた振る舞いが求められるのが、家庭環境や小売環境の特異な点です。こうした問題を越えるために、我々は「汎化」「適応」というテーマに注力をしています。
そこで、松尾研では、それまでにロボットが動作した動きのデータから学習して、より良いロボットの動作を獲得することを目指す強化学習や模倣学習というアルゴリズムに関する研究をしています。また、模擬家庭環境を実際に研究室に用意して、実機の家庭用ロボットを用いたシステムを構築し、どのように深層学習技術を組み合わせれば、家庭内で遭遇しうる様々な物体やレイアウト、タスクに関して高い汎化性や適応可能性が得られるのかというデータドリブンなロボットシステムの構築に関する研究もしてます。さらに、実機のロボットから得られたデータだけではなく、それを模擬したようなシミュレータを活用して、データを効率よく集めて学習に用いるためのシミュレーション技術に関する研究(シミュレータから実世界への転移や、実世界のデータを用いたシミュレータの学習)にも取り組んできました。
また、上記の研究活動に付随して、ロボティクスと人工知能の融合領域に興味を持つ仲間を増やし、研究を活性化するための取り組みとして講義とロボットサークル運営も行ってきました。
ー現在は幅広く体系的に活動を推進していますが、研究の始まりはどのように興ったのですか?
岩澤:
ロボットを使った活動が本格的に始まったのは4年程前からですが、実は松尾先生は以前から「ロボット研究は重要である」と繰り返していました。
知能の研究という側面から見ると、ロボット(あるいは環境とインタラクションすること)の研究は、身体性という言葉がよく出てくるように重要な意味があります。また、応用という側面から見ても日本が得意とするロボットをはじめとしたハード作成の技術力と、日進月歩のAI技術の掛け合わせは重要です。デジタルの世界はデータを取れれば研究を進めることができますし、英語標準で進むため、英語圏ではない日本はグローバルで戦い辛い。一方、技術力のある日本はハードを伴う物理的な世界の方が優位に立ちやすいと考えました。
でもハードって泥臭くて、動かすのが大変なんですよね。大半の機械学習の研究者はロボットを動かすことができない。ちゃんとやれば勿論動かせるのですが、独特のルールがあったりするので参入障壁が高いんですよね。その中であえてロボットの研究を進めていくのはチャンスなのではと。
そんな流れの中で、ロボット研究を元々は研究員で小さく始めていたところに、実機を使って研究開発をしたいという意識を強く持つ松嶋くんのジョインを契機に、2018年頃から本格的にロボット研究を始めました。
松嶋:
2019年頃には赤門近くのビルでロボット実験のための専用フロアを借り、本格的に実機を用いた研究を始めました。当初は1台のロボットとデスク以外何もないだだっぴろい部屋でしたが、4年が経った今ではロボットや機器が多数導入され、関わる人数も大幅に増え、設備が充実してきています。2023年2月現在では、トヨタ製のモバイルマニピュレータであるHSRが3台、ロボットアームが6台(ufactory xArm 7が2台、Ufactory lite 6が2台、Sawyerが1台、他1台)、4脚ロボットのUnitree Go1Eduが2台,ルンバが7台・・と多くの実機を持ちながら、自由に動かせる環境が整っています。
▼Before
入居当初は環境も整っていなかったロボットルーム
▼After
現在では総勢30名程のメンバーがロボット研究に関わり、
数多くの実機を自由に動かすことのできる環境下の中、日夜研究や勉強会を実施しています。
ゼロからの研究スタート。
ロボット研究の勘所を掴む必要性を実感し、試行錯誤の日々。
松嶋:
こうやってまとめると順風満帆にも聞こえますが、今当時の動きを振り返ると、反省点が多くあります。威勢よくロボット学習に関する研究を始めたのはよかったのですが、初年次に行っていたロボット系のプロジェクトに関する論文はことごとく国際会議に落ちてしまいました。ロボティクスとしての勘所や難しさが全然分かっていなかったと痛感したのが、2019年の上半期頃です。
そういった経験を経て、やり方を考えなければという視点に辿り着きました。議論を重ねる中で人員増加や開発についてなど諸々の計画を立てた記憶があります。その頃から、せっかくならロボコンにも参加して実機のシステムを一回全部作ってみよう、ロボコンに出るのは大変なので人も増やさなくちゃと諸々の活動が動き始めましたね。
ロボティクスの研究開発としての「お作法」がゼロの状態から完全に手探りで進めていたので、今では懇意にしていただいているロボティクス専門の先生から当時、「松尾研は他のチームからエントリーシートの書き方を学んだ方がいい」という初歩的な指摘を貰ったことは苦い思い出として残っています(笑)。
岩澤:
他の研究と比べて、開発が大変ですよね。機械学習・深層学習の両方をできる人も少ないですし。研究体制を十分に構築しなければ、ロボットの研究を普通にやるのは大分難しいと感じたのがその時期ですね。
松嶋:
そこからWRS(ロボットコンペ)に向けての準備にも本格的に取り掛かりましたね。
研究活動に留まらず、人材発掘・育成を目的に
講義やサークル立ち上げも牽引。
ー研究体制を整えるための取り組みとして、他にはどのようなことをやっていましたか?
松嶋:
コンペに出場するには人数が必要なので、ロボットチームの体制強化と言う観点で、人材発掘・育成にも力を入れていました。
取り組みの一つ目として、ロボット学習に関連する分野の講義の企画と実施があります。
強化学習の領域に関心がある人はロボットにも興味があるというケースは多くあったので、まず最初に強化学習の講義を開催し、最新の研究の知見を広く伝えることで、研究の間口を広げていきました。
例えば、講義としては、2020年から深層強化学習に関する先端的な内容を扱う全6回の集中セミナーを年1・2回の頻度で開催しているほか、「世界モデルと知能」の講義では、強化学習や物理シミュレーション・グラフィクスに関する講義を行っています。また、研究室に配属されていない学部生や大学院生が、実際に手を動かしながら実機のロボットを使ってプロジェクトを行えるように「人工知能応用プロジェクト」というプロジェクト演習型の講義を開講しています。
また、もう一つの取り組みとして、2022年より「AI・ロボットサークルTRAIL」というサークルの運営をしています。
これは駒場生も参加できるロボットサークルなのですが、学部1・2年生という一番意欲のあるタイミングで関われる人を増やしたい、というのが発足意図です。
東大入学当初にロボットに興味がある人達って実は結構いるんですよね。ロボットサークル自体はあるけれど、気軽に動かせてかつ機械学習も学びたい人がその熱を向けられる場所がなかなかない。じゃあ駒場生がロボットを気軽に触れられるような居場所があれば人が集まるのでは?と考えたのがTRAILの構想の種です。もし仮に私が今学部1年生だったら飛びついていたと思いますし、いつもそんな場所を作りたいと思っています。
こうした背景から学部生からロボット研究に関わることができる環境を作っており、AI・ロボットサークルTRAILではロボカップの世界大会での入賞を目指しながら、実機ロボットを使ったロボットシステム・AI開発の経験を積めるような環境を提供しているほか、だれでも簡単に実機ロボットシステムでAIを開発する経験を積めるような世界の実現を目指し、「ロボットシステム入門」(通称:ルンバハック)の教材をオープンソースとして開発しています。
今は15人ほどの学部1年生が参加していて、自主的に毎日遅くまでロボットと必死に向き合っていて、その熱量に圧倒されています。
WebからDeepLearning、そしてロボティクス研究へ。
今後は基礎研究である「世界モデル」との繋ぎ込みも本格化。
ーこれまでの道のりを経て、2023年時点のロボットチームの現在地について教えてください。
岩澤:
ようやく研究を進める上での基礎工事の一番大事な部分が終わった、という感じですね。
今後の飛躍に向けての土壌が整ってきた感覚があります。
松嶋:
思い返すとこれまでずっと基礎工事ばかりしてきたような気がしますね(笑)。
岩澤:
もしかしたらまだ穴が空いてるかもしれないですけどね(笑)。
ー(笑)その一番大事な基礎工事が終わり、大きな変化としてはどんなものがありますか?
岩澤:
松尾研で研究を進めている「世界モデル」との繋ぎ込みですね。最近は、基礎研究で生まれた成果や知見をロボットに活用したロボットデモを作成する活動も行っています。松尾研には、かしこいロボットを作るためのアルゴリズムなど基礎的な技術に興味がある人と、実際にロボットを動かして作りたい人の両方がいます。松尾研のようにどちらもできるというケースは珍しいと思っていて、技術を研究している人がある技術を開発したら、それをロボットチームが技術として応用し、評価ができる。そういった環境を繋ぎ込んで作っていくことで、実際にロボットに応用した際の精度や評価を研究側に返す体制がようやく実現しつつあります。
松嶋:
また、自律的に動作するロボットが日常生活に溶け込んだ世界を作り、またその過程で「知能」というもの自体の仕組みを解明する、という目標を立てた時に、実際にやってみて分かる難しさを体感的に理解できるようになった点も大きいです。
実際のロボットの領域で機械学習の研究を応用してみて初めて、そもそもの問題設定が実態に即していなかったことが分かる、なんてことも多々あります。そこはロボット研究と機械学習の研究を両方進めている研究室だからこそ向き合える課題であり、大きな挑戦だと思いますね。
岩澤:
実際にロボットが動かないと研究ができないので、実機が増えて動く動かないが見えるようになったというのも大きいですね。研究の領域だと、数字を見て小さな差を競う動きもあるのですが、ロボットの領域だと、動いてる動いてないが明らかに分かるので、研究として純粋に楽しいという側面があります。
松嶋:
ロボット研究は、ロボットを動かすことに全力をかける領域なので、きちんと動いた・動いてないで評価できる分かりやすさはありますよね。
ー岩澤さんと松嶋さんから見て、松尾研はどのような研究室だと思いますか?
岩澤:
実現したい目標があれば、実現する上でいわゆる「大学の研究室」という固定観念に囚われず前に進んでいく組織ですよね、松尾研は。
松嶋:
それはすごく感じてます。「こういうことをやりたい」「ここが重要だと思う」ということを発信すると、「やってみなよ」と後押ししてくれるカルチャーがあるし、困ったことがあれば相談もしやすい。だからこそ、僕が入るまでは実際ロボットを本格的に進めていた訳ではなかったにも関わらず、「やりたい」と声を上げてロボット研究を前に進められたんだと思います。
ただ、僕だけがそういうことをやっているかというとそうでもなくて、ロボット研究を進める時は松尾研がwebの研究からdeep learningの研究に移った流れをすごく参考にしているんですよね。自分としてはその方法を参考にして、それのロボット版を進めているという感じがしています。
また、松尾研は周りの人を積極的に巻き込む文化が強いので、規模が必要なロボット研究において、最初からある程度の規模で研究を始めることができました。学生の入れ替わりがあるという点では他の研究室と同じく、体制構築という観点で苦戦した部分ではありましたが、今ではハードが分かる職員が在籍していることや、ロボットの実機の使用方法のスムーズな引き継ぎができていたこともあり、内部ノウハウがたまりつつあると実感しています。そのような周囲を巻き込む文化を土台にした成果が後押しし、新しい人が研究室に入ってきてもロボット研究に滑らかに取り組めるようになってきている感じがしますね。
目指すのは人間とロボットの共存。
研究室に閉じず、ロボティクス研究と社会の接点を増やしたい。
ーロボティクス研究における今後の展望についてお伺いしてもいいですか。
松嶋:
技術が世の中に入った時にどうサービスとして繋がっていくのか、そういった仕組み自体を考えていきたいと思っています。実際の日常生活に近いところで、ロボットが動き回ってるような場面って現状では全然ないと思うんですが、それができるような技術的な要素はある程度整ってきていると思っているので。
研究室に閉じないロボット開発みたいなことができるといいんじゃないかなと個人的には思っていますね。
その点で、ロボットや人工知能に関する基礎的な研究だけではなく、ロボコンなどの競技会に参加したり、デモを公開することで、ロボット技術に関して社会のいろいろな人との交流の機会を作って、研究活動にフィードバックしていきたいと思っています。
昨年の12月は外部の方も参加可能なアドベントカレンダーを開催したり、3/6から3/9にかけて東大の本郷キャンパスで開催されるロボカップには、学部生を中心として参加しますし、7月上旬にはロボカップの世界大会がボルドーで開催されるのでそれにも参加予定です。また、5/13-14には東大の本郷キャンパスで行われる五月祭でロボットのデモを一般公開する予定ですので、ぜひ見学してみてください。
ーありがとうございます。最後に一緒に研究をしたい方の人物像について教えてください。
松嶋:
目の前にある課題をテクノロジーで解決したいと思える人ですね。考えているだけでなく、手を動かさないといけないので、そういう動きが早い人と一緒に研究や開発を推進したいです。
私が岩澤さんと話しているときには、よく「ハッカーっぽい人」という言い方をすることもありますが、課題の構造を捉え、それを解決するために手を動かして「ハック」してみようとする人は松尾研に多いですし、研究室の環境を楽しめると思います。興味を持っていただいた方、ぜひラボに遊びに来てみてください。
twitter: https://twitter.com/trail_ut
site: https://trail.t.u-tokyo.ac.jp/ja/
(自己紹介)
岩澤有祐 / 東京大学松尾研究室 講師
経歴
- 2014年3月 上智大学大学院 理工学研究科 情報学専攻 修了
- 2017年3月 東京大学工学系研究科 修了
- 2017年4月〜2018年6月 東京大学工学系研究科特任研究員
- 2018年7月~2020年11月 同特任助教
- 2020年12月~2022年3月 同特任講師
- 2022年4月~現在 同講師
専門分野
- 転移学習・深層表現学習・深層学習応用
受賞歴
- Best Student Paper Award at Web Intelligence 2019,
- 人工知能学会全国大会優秀賞,人工知能学会全国大会学生奨励賞
- MIRU優秀賞など.
その他の活動
- 「Deep Learning基礎講座」,「AI経営寄付講座」「世界モデルと知能」などの講義担当
- 「深層学習」の監訳(翻訳取りまとめ)・分担翻訳
松嶋 達也 / 技術経営戦略学専攻 松尾豊研究室 博士課程所属
経歴
- 2018年3月 東京大学 工学部システム創成学科 知能社会システムコース 卒業
- 2020年3月 東京大学大学院 工学系研究科 技術経営戦略学専攻 修士課程 修了 (専攻長賞 受賞)
- 2020年4月〜 東京大学大学院 工学系研究科 技術経営戦略学専攻 博士後期課程 在籍
- 2018年より人工知能学会学生編集委員
専門分野
- 深層生成モデルを用いた環境のダイナミクスのモデリング(世界モデル)・モデルベース強化学習・メタ模倣学習