2024年12月19日
- 技術・研究開発
- プレスリリース
- くらし
- テクノロジー
- 地域・まち
Adobe Acrobat Readerの特定のバージョンに、一部のPDFが開けないバグが発生しております。PDFが開けない場合、お使いのAcrobat Readerを最新版へアップデートの上お試しください。
パナソニック ホールディングス株式会社(以下、パナソニックHD)とPanasonic R&D Company of Americaは、AIモデルが学習しておらず「本質的に認識ができない」物体を「未知物体」として認識し、画像認識AIモデルの信頼性を高める技術を開発しました。
画像認識AIモデルは事前に学習させた対象に対しては高い認識率を誇りますが、実環境のすべての物体を画像認識AIモデルにあらかじめ学習させることは困難です。そのため実際の利用環境では、AIモデルにとって未知の物体に直面することは避けられません。
一方、AIモデルは「知らない」と判断することが苦手です。モデルが知っている範囲で無理やり認識し「知ったかぶる」ことが、予期しない誤動作にもつながりかねないことが近年AIの社会実装の進展に伴い、大きな課題となってきました。
AIの信頼性を高める技術に注目が集まる中、画像認識結果が「どれくらい信頼できるのか(不確実性)」を推定可能な生成モデルを、画像認識モデルの後段に追加することで、「未知物体」に付与された誤ラベルを棄却し、本質的に認識が可能な学習済の物体のみを正しく認識できるようにする技術FlowEneDetを開発しました。本手法は学習済の画像認識AIモデルの後段に追加するだけで簡単に拡張でき、高速に動作することが特徴です。今後、AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待されます。
本技術は、先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスであるUAI2023(The Conference on Uncertainty in Artificial Intelligence)に採択されました。2023年7月31日から2023年8月4日まで米国ピッツバーグで開催される本会議で発表します。
画像認識AIのひとつであるセマンティックセグメンテーション(※1)モデルは、画像中の画素レベルで、ある領域が何の物体であるかを推定できる、モビリティ、製造、医療等の幅広い領域で欠かせないAI技術です。
学習時と似た環境・物体については精度よく推定ができますが、実環境に存在するすべての物体を事前に学習させることは不可能です。学習データに存在しない未知の物体に遭遇した際に、そのモデルが学習した物体ラベルを無理やり当てはめてしまうことが、認識性能の低下や予期せぬ誤検知に繋がることが、課題となっています。
例えば、図1の矢印で示す物体(画像左上:ビールケース、画像左下:犬)は、セマンティックセグメンテーションモデルが事前に学習していない未知の物体ですが、学習済のラベルから無理やり当てはめて推定してしまった結果、そもそも認識できない物体であるはずのビールケースを、一部が車(紺色)で残りが道路(紫)と誤認識し、同様に犬についても一部が木(緑)で一部が道路(紫)と誤認識してしまっています。特に車載カメラに搭載されるAIモデルにおいては、「道路」と誤認識してしまうことは重大な事故にも繋がりかねず、未知物体は「未知」と推定できる技術が必要とされます。
これに対し、パナソニックHDとPanasonic R&D Company of Americaは、AIモデルが認識結果にどれくらい自信を持っているか(不確実性)を推定するフローベースの生成モデルFlowEneDetを開発しました。
フローベースの生成モデルは、逆変換可能な関数の合成として複雑な分布を表現できるモデルです。学習した物体の分布を正確にモデリングできるため、「学習した既知の物体」と「学習していない未知物体や誤分類(モデリング結果が実際の分布と合わない)」を分離することが可能となります。さらに、未知物体(OOD)や誤分類(IDM)領域をより高精度に分離するため、データ密度のモデリングを行うエネルギーベースモデルと組み合わせました。
今回開発したFlowEneDetを通常のセマンティックセグメンテーションモデルの後段に追加することで、時間のかかるセグメンテーションモデル側の再トレーニングを行うことなく、認識結果の不確実性を推定できるセグメンテーションモデルへと拡張できます。FlowEneDet自体は、エネルギーベースモデルにおける低次元の自由エネルギーを処理するモデルであるため、複雑さの低いアーキテクチャであり、学習・評価コストを大きく増やすことなく、未知物体と誤分類の同時検出を実現します。(図2)
事前トレーニング済みのセマンティックセグメンテーションモデルの後段に今回開発したFlowEneDetを追加し、複数のベンチマークデータセット(※2)に対して未知物体や誤分類の認識性能評価を行った結果、従来法を上回る認識結果(※3)を達成しました。(図3)
今回開発したFlowEneDetは、実環境でしばしばAIモデルが遭遇する、学習したことのない未知物体に対する誤認識を防ぐことで、モデルの性能と信頼性を高める技術です。AIの信頼性が求められる車載やくらし、B2Bなどの様々なユースケースでの活用が期待されます。
今後もパナソニックHDは、AIの社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進してまいります。
※1 セマンティックセグメンテーションとは、画素単位で物体の領域を認識し、各画素に何の物体が写っているのかを関連付ける画像認識タスク。セマンティックセグメンテーションのための代表的なAIモデルとしてDeepLabV3+やSegFormerが挙げられる(本手法の性能評価に利用)
※2 Cityscapes、Cityscapes-C、FishyScapes、SegmentMeIfYouCanのベンチマークデータセットにおいて
※3 MCD(Monte Carlo Dropout)、SML(Standardized Max Logits)といった従来法と比較し、真陽性率95%のときの誤検出率(FPR95)を20~50%低減
・発表論文 “Concurrent Misclassification and Out-of-Distribution Detection for Semantic Segmentation via Energy-Based Normalizing Flow”
本研究は、Panasonic R&D Company of AmericaのDenis Gudovskiy、パナソニックHD テクノロジー本部の奥野 智行、中田 洋平による研究成果です
https://arxiv.org/abs/2305.09610
・Official PyTorch code for UAI 2023 paper "Concurrent Misclassification and Out-of-Distribution Detection for Semantic Segmentation via Energy-Based Normalizing Flow"
https://github.com/gudovskiy/flowenedet
・Panasonic×AI WEBサイト
https://tech-ai.panasonic.com/jp/
・Panasonic×AI twitter
https://twitter.com/panasonic_ai
記事の内容は発表時のものです。
商品の販売終了や、組織の変更等により、最新の情報と異なる場合がありますのでご了承ください。