2024年12月19日
- 技術・研究開発
- プレスリリース
- くらし
- テクノロジー
- 地域・まち
Adobe Acrobat Readerの特定のバージョンに、一部のPDFが開けないバグが発生しております。PDFが開けない場合、お使いのAcrobat Readerを最新版へアップデートの上お試しください。
パナソニック ホールディングス株式会社(以下、パナソニックHD)は、AIによる物体検出の精度低下を抑えながら学習データ構築コストを半減※1できる技術を開発しました。
近年、AIは公共施設や自動車などさまざまな現場で実装が進み、くらしやしごとの安心安全を支えています。画像から人や自動車などを高精度に検出するAIモデルの開発においては大量の学習データが必要ですが、一度開発したAIモデルを撮影機材や時刻・天候等の条件が異なる現場や環境に適用する場合、その都度大量の学習データの撮影・取得とアノテーション(画像内の人、自動車などのラベル付け)を実施する必要があります。そのため、開発したAIを環境の異なる多様な現場に展開するには、データ構築に要する時間とコストが大きいという課題から、データ構築コストを削減する技術の需要が高まっています。
今回開発した少数のラベル付きデータに対するドメイン適応技術※2は、環境が大きく異なる現場に対しても、従来法と比較し圧倒的に少ない学習データでAIモデルの他現場展開を実現します。
本技術については、パナソニックグループの幅広い事業、ソリューションへの適用を目指し、多様な現場データでの実証実験を進めており、特に難易度の高い、RGB画像をソースドメイン、遠赤外線画像をターゲットドメインとした物体検出において、本手法の有効性が示されました。
高性能なAIモデルを実現するには、データ収集とアノテーションにより大量の学習データを用意する必要がありますが、多大な時間とコストを要します。このジレンマを解決するため、少数のデータでも高精度なAIモデルを実現する技術に注目が集まっています。
そのひとつである「少数のラベル付きデータに対するドメイン適応技術(Few-shot Domain Adaptation)」は、予め公開されている多数のラベル付きデータ(ソースドメインのデータ)で学習したAIモデルの事前知識を、少数の現場データ(ターゲットドメインのデータ)の学習に利用することで、現場データが少数でもAIモデルを学習できる技術です。
しかし、従来の方法では、例えば、ソースドメインがRGB画像で、ターゲットドメインが遠赤外線画像のようにデータの“見え”が大きく異なる場合、ソースドメインとターゲットドメインの知識差(ドメインギャップ)※3を埋めることができず、高い性能が得られないという課題がありました。
そこで、当社は、ドメインギャップの大きい条件下であっても高性能な少数のラベル付きデータに対するドメイン適応技術を実現するため、複数の画像を合成するデータ拡張方法の考え方を応用した新たな手法を開発しました。本手法では、単純に画像を置き換えるだけではなく、画像に写る物体(自動車や人など)の領域情報を利用して、同じ種類の物体同士を置き換えることで画像中の物体位置や存在確率なども考慮しました(図1(a))。
また、敵対的学習により、AIモデルが両ドメイン共通の特徴で画像を認識できるようにしました。敵対的学習とは、各画素のドメインの識別を行い、わざとドメインの識別を失敗するようにAIモデルを更新する学習方法です。AIモデルはソースドメインとターゲットドメインの区別が出来なくなるため、両ドメイン共通の特徴で画像を認識するようになります(図1(b))。
これらにより、従来法では対応が困難な、ソースドメインとターゲットドメインの見えが大きく異なる場合にも適用可能な、少数のラベル付きデータに対するドメイン適応技術を実現しました(図2)。
今回開発した少数のラベル付きデータに対するドメイン適応技術は、ドメインギャップの大きな環境に対しても、従来法より圧倒的に少ない学習データで高精度にAIモデルの他現場展開を実現し、くらしや社会の課題を解決するAI技術の社会実装を加速します。
学習データの取得条件をコントロールすることが難しいユースケースでも、短時間・低コストで高精度なAIモデルを提供できるため、例えば導入先ごとにセンシング対象・状況(外観、カメラ位置、照明条件など)が異なる現場系ソリューションの導入期間短縮や、赤外線カメラなどを用いた屋外/暗所向け認識技術の開発期間短縮への貢献が期待できます。
今後も当社は、お客様の幸せに貢献するAI技術の研究・開発を推進してまいります。
なお、本技術の一部は、画像認識・コンピュータビジョン分野の権威あるトップカンファレンスACCV※4で発表を行い、AIの社会実装に欠かせない領域における開発成果が国際的にも認められました。
※1 公開データセットを用いた少量データにおけるドメイン適応において、OCDCとOCDCDLを利用しない従来手法に比べ、当社手法が半数のデータで同等性能であることを確認(2023年5月23日現在、当社調べ)
※2 十分な教師ラベルを持つデータ集合(ある環境のデータの集まりをドメインと呼ぶ)から得られた知識を、十分な情報が無い別の環境で取得されたデータ集合(ターゲットドメイン)の学習に適用することで、ターゲットドメインにおいて高精度な認識モデルを学習する方法。
※3 撮影するセンサや環境、明るさなどの違いによる複数のデータ集合(ドメイン)間の分布がずれていること。
※4 Asian Conference on Computer Vision(ACCV)は、画像認識・コンピュータビジョン分野の権威あるトップカンファレンスです。世界中のAI研究者が最新の成果を発表・議論する場として知られ、2022年の採択率は約33%の狭き門となっています。
[1]“Few-shot Adaptive Object Detection with Cross-Domain CutMix”
本研究は、パナソニックHD テクノロジー本部の中村譲と石井育規の共同主著論文で、中部大学 山下教授との連携による研究成果です。
https://openaccess.thecvf.com/content/ACCV2022/html/Nakamura_Few-shot_Adaptive_Object_Detection_with_Cross-Domain_CutMix_ACCV_2022_paper.html
記事の内容は発表時のものです。
商品の販売終了や、組織の変更等により、最新の情報と異なる場合がありますのでご了承ください。