当研究室の論文がICML 2023に2件採録されました。

■書誌情報 Toshinori Kitamura, Tadashi Kozuno, Yunhao Tang, Nino Vieillard, Michal Valko, Wenhao Yang, Jincheng Mei, Pierre Ménard, Mohammad Gheshlaghi Azar, Remi Munos, Olivier Pietquin, Matthieu Geist, Csaba Szepesvari, Wataru Kumagai, Yutaka Matsuo. “Regularization and Variance-Weighted Regression Achieves Minimax Optimality in Linear MDPs: Theory and Practice”, International Conference on Machine Learning (ICML 2023) ■概要 Mirror descent value…

当研究室の論文が情報処理学会論文誌トランザクションデジタルプラクティスに採録されました。

◼︎書誌情報
山本裕樹, 落合桂一, 鈴木雅大, 松尾豊: LSTMモデルによる金融経済レポートの指数化, 情報処理学会論文誌トランザクションデジタルプラクティス (2022)
◼︎概要
多くの投資家にとって金融機関や中央銀行,政府から出される金融・経済レポートを読むのは骨の折れる作業である.本稿では自然言語処理を用いて,金融経済に関する文書から自動的に景況感を読み取り指数化(景気センチメント)する手法を提案する.投資家はこの指数によって,文書の全体的な景況感を即座に読み取ることが可能となる.本手法の特徴は,景気センチメントを推定するモデルに深層ニューラルネットワークの一手法であるLSTMを用いた点と,これを学習するために必要な教師データとして景気ウォッチャー調査データを用いた点にある.手法の有効性を示すために,政府の発行する月例経済報告と日本銀行が発行する金融経済月報をそれぞれ指数化して日経平均株価と比較したところ,既存の経済指標と比較して高い相関があることが確認された.本稿で提案した手法は既に実務でも応用が進み,企業や政府がSNSや地域経済レポートを指数化して公表される等の活用が為されている.

当研究室の論文が人工知能学会論文誌に採録されました。

◼︎書誌情報 小林由弥, 鈴木雅大, 松尾豊: 深層生成モデルによる背景情報を利用したシーン解釈, 人工知能学会論文誌, 第38巻3号, 2023. ◼︎概要 Ability to understand surrounding environment compositionally by decomposing it into its individual components is important cognitive ability. Human beings decompose arbitral entities into some parts based on its semantics or functionality, and recognize those parts as “object”. Such kind of object recognition ability is fundamental to…

当研究室の論文がAdvanced Roboticsに採録されました。

◼︎書誌情報 Yuya Kobayashi, Masahiro Suzuki, Yutaka Matsuo: Learning Global Spatial Information for Multi-View Object-Centric Models, Advanced Robotics ◼︎概要 Recently, several studies have been working on multi-view object-centric models, which predict unobserved views of a scene and infer object-centric representations from several observation views. In general, multi-object scenes can be uniquely determined if both the properties…

当研究室の論文が情報処理学会論文誌に採録されました。

◼︎書誌情報
山本裕樹, 鈴木雅大, 落合桂一, 松尾豊: Bayesian Neural Newtorkによる景気テキストの不確実性評価と景気指標の開発, 情報処理学会論文誌 (2023)
◼︎概要
近年,ニュースやソーシャルメディアなどのテキストを深層学習モデルで解析して,人々の景況感を予測しようという試みが行われている.既存の研究では景気が良い/悪いといった景気の方向性に着目しているが,景気とは本来,不確かなものであり,テキストの書き手の景況感も中心の周りに広がった分布で評価すべきと考えられる.実際,テキストには景気に良い面と悪い面が併記されたり,先行きの不確実性を強調したりするなど,人間が読んでも書き手の景況感が単純に判断できないものも多い.このような書き手の景況感が不確実なテキストを除くことで,より確信的な景況感を持った意見だけを集めて景況感を評価することが可能となり,マクロな景況感の推定精度向上が期待される.本研究ではBayesian Neural Network(BNN)を用いることで景気テキストの不確実性を評価し,それを使って景況感評価の精度を高めることを提案する.実験ではまずBNNによって景気センチメント推定の精度が向上することを示した.次に,不確実性の高いサンプルを除いてセンチメントを集計することで,より精度の高い景気指標となることが確認できた.最後に,BNNで不確実性が高まるテキストの特徴やその時期について考察した.その結果,得られた不確実性と経済の不確実性指標として用いられている Economic Policy Uncertainty(EPU) 指数との統計的に有意な相関を確認できた.

当研究室の論文が電子情報通信学会和文論文誌Dに採録されました。

◼︎書誌情報
蔭山智, 鈴木雅大, 落合桂一, 松尾豊: 顔の角度情報を用いたDeepFake動画の検出手法の提案, 電子情報通信学会和文論文誌D (2023)
◼︎概要
近年,GAN や VAE のような深層学習を用いた画像生成手法により,実際には存在しない高精細な人物や風景の画像を生成することができるようになっている.またそのような画像の生成手法を応用することで,任意の画像の変換を行うこともできるようになっている.こうした技術を応用し,動画内の顔画像を変換することで,現実と区別がつかない Fake 動画(DeepFake 動画)を生成する事ができる.顔画像の操作によって生成された Fake 動画はニュースサイトやソーシャルネットワークで広がり,政治的に利用されたりポルノとして利用されることが社会的な問題となっている.そのため,ある動画が人為的に生成された FAKE 動画かどうかを検知する手法の開発は重要である.既存研究では動画内の全フレームにおいて生成が失敗していないことを前提に検知手法が提案されているが,実際の Fake 動画では顔が真横を向いているシーンでは生成に失敗している.本提案では当該事象に着目し,新たな観点である顔の角度情報の活用を提案する.本提案手法により,AUC にして最大で 3.4% の精度向上が図れた.

当研究室の論文が情報処理学会論文誌に採録されました。

◼︎書誌情報
山本裕樹, 鈴木雅大, 落合桂一, 松尾豊: 産業間の取引構造を用いた深層学習モデルによる生産指数の予測, 情報処理学会論文誌 (2022)
◼︎概要
多くの投資家にとって金融機関や中央銀行,政府から出される金融・経済レポートを読むのは骨の折れる作業である.本稿では自然言語処理を用いて,金融経済に関する文書から自動的に景況感を読み取り指数化(景気センチメント)する手法を提案する.投資家はこの指数によって,文書の全体的な景況感を即座に読み取ることが可能となる.本手法の特徴は,景気センチメントを推定するモデルに深層ニューラルネットワークの一手法であるLSTMを用いた点と,これを学習するために必要な教師データとして景気ウォッチャー調査データを用いた点にある.手法の有効性を示すために,政府の発行する月例経済報告と日本銀行が発行する金融経済月報をそれぞれ指数化して日経平均株価と比較したところ,既存の経済指標と比較して高い相関があることが確認された.本稿で提案した手法は既に実務でも応用が進み,企業や政府がSNSや地域経済レポートを指数化して公表される等の活用が為されている.

Our paper was accepted for ICLR 2023

① ■書誌情報 Akihiro Nakano, Masahiro Suzuki, Yutaka Matsuo. “Interaction-Based Disentanglement of Entities for Object-Centric World Models”, International Conference on Learning Representations (ICLR 2023) ■概要 Perceiving the world compositionally in terms of space and time is essential to understanding object dynamics and solving downstream tasks. Object-centric learning using generative models has improved in its ability to…

当研究室の論文が英文誌Pattern Recognition Lettersに採録されました。

当研究室の論文が英文誌Pattern Recognition Lettersに採録されました。 ■書誌情報 Bo Yang, Jianming Wu, Kazushi Ikeda, Gen Hattori, Masaru Sugano, Yusuke Iwasawa, Yutaka Matsuo. “Deep Learning Pipeline for Spotting Macro- and Micro-expressions in Long Video Sequences Based on Action Units and Optical Flow, In Press, Journal Pre-proof (Dec. 2022). https://doi.org/10.1016/j.patrec.2022.12.001 ■概要 This paper is an extension of our previously published ACM…