2021年5月28日

AI技術の世界最高峰の国際学会であるCVPR2021に2件が採択

パナソニック株式会社は、2つのAI技術を開発し、この度、世界最高峰の国際学会であるCVPR2021(IEEE Conference on Computer Vision and Pattern Recognition)において採択されました。

【研究成果の概要】

[1]Home Action Genome: Contrastive Compositional Action Understanding

住宅内における人の日常行動を模したシーンを、カメラや熱センサなど数種類のセンサを用いて撮影・計測したデータセット「Home Action Genome」を構築しました。住空間向けデータセットはこれまで規模が小さいものが主流であったのに対し、世界最大規模の住空間向けマルチモーダルデータセットを構築・公開しました。本データセットを適用することにより、AI研究者は、機械学習の学習用データとして用いることができるとともに、住宅内の人をサポートするAI研究に活用することができます。

上記に加えて、マルチモーダル・複数視点における階層的行動認識のための協調学習技術を開発しました。本技術を適用することにより、異なる視点・センサ、階層化された行動と詳細動作ラベルの間で一貫性を持つ特徴量を学習できるため、住空間における複雑な行動の認識性能を向上することができます。この技術は当社 テクノロジー本部 デジタル・AI技術センターとスタンフォード大学 Stanford Vision and Learning Labとの連携による研究成果になります。

図1:Cooperative Compositional Action Understanding(CCAU)の概要すべてのモダリティを協調して学習させることで性能の向上が期待できるとともに、
ビデオレベルの行動ラベルと詳細動作ラベルの両方を用いて学習を行うことで、
行動と詳細動作の間の相互作用から一貫性を持った特徴量を学習することができる。

[2]AutoDO: Robust AutoAugment for Biased Data with Label Noise via Scalable Probabilistic Implicit Differentiation

大量の学習データを収集することが困難な環境に適用が可能なAI技術の実現に向けて、学習データの分布に応じて自動的に最適なデータ拡張を行う学習技術を開発しました。当社の主要事業領域の中には、大量のデータを集めることが難しいために、AI技術を十分に活用できていないケースも多数存在しています。この課題に対して、本技術を適用することにより、これまで専門家の介在が必要であったデータ拡張パラメータのチューニング(調整)プロセスをなくし、自動で調整することができるため、AI技術の適用可能範囲を飛躍的に広げることが期待できます。今後の展開としては、本技術の研究開発を更に加速することで、身近な機器やシステムなどリアルな環境で使えるAI技術の実現に取り組んで参ります。この技術は当社のPanasonic R&D Company of America AIラボラトリーと、テクノロジー本部 デジタルAI技術センターの研究成果になります。

図2:AutoDOが解決するデータ拡張時の課題拡張された学習データ(青の破線)の分布と、潜在空間のテストデータ(赤の実線)と一致しないことがあり
(“2”は拡張不足、“5”は拡張過多)、その結果、従来手法ではテストデータの分布と一致せず、
学習した分類器 f(θ) の判断が不正確になります。AutoDOでは、この拡張パラメータを自動決定可能な手法を提案します。

【備考】

本技術の詳細については、2021年6月19日から開催されるCVPR2021にて発表を予定しています。

以上