東京大学松尾・岩澤研究室(以降松尾研)では、2024年夏からリサーチインターンシップを開始しました。インターンたちは第一線で活躍する研究者の指導のもと、様々なテーマについて研究を行いました。2024年度は海外からの参加者も含め、総勢15名が参加しました。
本記事連載では、海外からのリサーチインターンシップに参加したインターン生に松尾研での経験や日本での思い出を紹介していただきます。第1回はスペイン出身のアルバロ・ベルモンテ=バエサさんです。
スウェーデン出身のサイモンさん(後日公開予定)の記事も併せてお読みください!
Q1: 研究テーマとメンターについて教えてください。
私の研究テーマは「高速で微分可能なシミュレータとレンダラを用いた動作計画とモデリング環境」です。私は、モデルベースのタスク・運動計画(TAMP)とモデルフリーの強化学習(RL)を組み合わせたロボット工学、特にロコマニピュレーションについて研究しました。ロコマニピュレーションとは、ロボットの脚を使って環境内を移動しながら、同時に操作タスクを実行する複合タスクのことで、ロボットが実生活のタスクに役立つようにするための鍵となるため、ロボット工学分野で大きな関心を集めています。
これを実現するために、我々は、モデルベースのモーションプランニングのような古典的手法と、RLベースのモーションコントロールのような最近のAIベースのトレンドとの交差を探求しました。動作計画アルゴリズムには環境や手元のタスクから既に知られている情報を活用し、物理モデルを使用して、時間経過に伴うロボット各部分の望ましい動きを決定するという利点があります。しかし、これらのアプローチはシステムと動作環境の正確なモデルを持っていることに依存しており、モデリング段階での仮定によるモデリングのミスマッチが常に発生するため、通常はそうではありません。一方、RLベースの制御では、事前に定義されたモデルは使用しません。代わりにシミュレーションの「試行錯誤」プロセスを通じて学習し、時間の経過とともに経験から学んでいきます。これは、シミュレーションでの学習プロセス中に大量の異なるシナリオに直面し、適応してきたため、結果として得られるコントローラは、異なる状況に対してよりロバストになります。しかし、このようなアプローチは、過去の知識を活用しないため、多くのデータとコンピューティング・リソースを必要とします。私のインターンとしての研究目標は、両者の長所を最大限に引き出し、四足歩行ロボットにロボットアームを取り付けたロコマニピュレーション・シナリオに適用して、これまでのアプローチがどのように改善されるかを確認することでした。
私のメンターはロボットチームのリーダーである松嶋達也さんです。松嶋さんはロボット工学のためのRLと、現在ロボット工学研究の最大のトレンドのひとつであるロボットの意思決定にLLMを使用することに関して素晴らしい研究を行っています。まるですべての論文を知っているようで、ロボット工学に関連するさまざまなサブテーマについてかなり幅広い専門知識を持っていることに驚きました。
アルバロさんのメンター、松嶋さんとの写真
Q2: 松尾研究室のリサーチインターンシップに応募した理由を教えてください。また、松尾研究室のリサーチインターンシップをどのように知りましたか?
私はスペインのアリカンテ大学の博士課程に在籍し、宇宙ロボットのような極限環境での学習ベースのロボット制御を研究テーマとしています。博士課程の一環として、海外の大学と共同研究を行う必要がありました。以前から日本で研究してみたいという思いがあったため、日本のロボット工学やAIの研究室を探していたところ、松尾・岩澤研究室(以下、松尾研)の研究実績を知り、ここが最適な選択肢だと考えました。特に松尾研のTRAILは、私の主な研究テーマである学習ベースのロボット制御と意思決定に焦点を当てており、非常に興味を引かれました。
そこで松尾研のスペイン人メンバーであるエンジニアのアルフレッドさんに個別に連絡を取り、TRAILでの研究滞在が可能か尋ねたところ、松嶋さんを紹介していただきました。その後松嶋さんと話し合う中で、研究テーマが一致し共同研究が双方にとって有意義なものになると感じました。そして、松嶋博士の指導のもとで研究を進めることに同意しました。
数ヵ月後、LinkedInで松尾研のリサーチインターンシップの告知を見つけました。その中のトピックの一つが松嶋さんと話し合っていた内容と非常に関連していたため、研究滞在に加えてインターンシップにも応募できないかと相談しました。松嶋さんからは、競争率が非常に高いとのことでしたが、「あなたは非常に優秀な候補者だと思う」と励ましていただき、自信を持って応募しました。
結果的に、私はインターンの1人に選ばれ、想像以上にラボと密接に連携しながら研究を進めることができました。松尾・岩澤研究室のメンバーと出会い、一緒に研究できたことを本当に幸運だと感じています。
Q3: リサーチインターンシップ中の1日のスケジュールを教えてください。
スケジュールは日によって変わりますが、大まかには下記のような感じです
Q4: 日本滞在中の楽しい思い出を教えてください。
早朝の浅草寺参拝
読売ジャイアンツの野球試合観戦
お台場のビーチの夕日と共に
アルバロさん、松尾・岩澤研究室での体験を共有していただきありがとうございました!
スウェーデンからのサイモンさんの記事(後日公開予定)もご覧ください!
松尾研究室では、「知能を創る 」というビジョンを実現するために、国際的な環境で基礎研究を推進しています。2025年度のリサーチインターンシップ(4月下旬~5月頃にご案内予定)にも、皆さんのご参加をお待ちしています。