2024年12月19日
- 技術・研究開発
- プレスリリース
- くらし
- テクノロジー
- 地域・まち
Adobe Acrobat Readerの特定のバージョンに、一部のPDFが開けないバグが発生しております。PDFが開けない場合、お使いのAcrobat Readerを最新版へアップデートの上お試しください。
パナソニック ホールディングス株式会社(以下、パナソニックHD)は、カリフォルニア大学バークレー校(以下、UC Berkeley)、北京大学、カーネギーメロン大学の研究者らと、未知のデータを効率的に見分けることに着目したAI技術「Split-Ensemble」を共同開発しました。本技術は、分布外データの検出タスク、および分類タスクにおいて、従来法を上回る性能を示しました。
AIの信頼性は様々な面から問われています。中でも、AIが学習していないものを未知データと判定できないという問題は、ユースケースによっては致命的なリスクに繋がります。そこで、AIに解かせるタスクを、似たような対象を分類する複数のサブタスクに分割し、サブタスクの中で「未知データ」も多面的に教え込むことで、未知データを見分ける能力を効率的に獲得する新しいAI技術「Split-Ensemble」を開発しました。
本技術は先進性が国際的に認められ、AI・機械学習分野のトップカンファレンスであるThe 41st International Conference on Machine Learning(ICML 2024)に採択されました(採択率27.5%)。2024年7月21日から2024年7月27日にオーストリア ウィーンで開催される本会議で発表します。
AIによる画像認識や検出技術が様々な現場で人の意思決定をサポートしています。一方、AIにとって未知のデータや状況といったAIが学習していない分布外のデータ(out-of-distribution、以下、OOD)に適切に対処できない場合、誤判定のリスクに繋がり、例えば、自動運転などその影響が致命的になるユースケースも少なくありません。また昨今は、大規模言語モデル(Large Language Models、以下、LLMs)においても、OOD検出能力の欠如がもたらすハルシネーション(*1)が課題となっており、OODへの適切な対処が求められています。
従来OODへの対処は、OODとして学ばせる外部データを用意し、追加の計算コストをかける必要がありました。これに対し、Split-Ensembleでは、既にあるデータセットのみから作成した複数のサブモデルを使って、OODへ対処できるようにします。具体的には、似た者同士を見分けるサブタスクを複数用意し、それぞれのタスクを解く複数のサブモデルを学習します(図1)。サブタスクでは、一部のデータを分布内データ(in-distribution、以下、ID)として扱い、残りをOODとして学習させるアーキテクチャになっています。例えば、「ビーバーとカワウソとアシカとそれ以外(OOD)」、「楓と樫と松とそれ以外(OOD)」という風にすることで、似たカテゴリ同士の見分け方と同時に、OODの見分け方を学習します(図2)。
元のタスクを解けるようにするには、複数のサブタスクでサブモデルを学習し、それらの出力を統合する必要がありますが、小規模でも学習させるモデル数が増えれば必要となる計算量は増加します。そこで今回は、サブモデル間で可能な限りアーキテクチャを共有し、モデルの枝刈りなどを行うことで計算量の増大を抑制しました。
本手法の有効性をベンチマークデータセット(CIFAR-10、CIFAR100)で検証した結果、従来法(*2)に比べて4分の1の計算コストでOODを見分けられることが確認できました。高い性能に加えて、「別途OODデータを用意して教え込む必要がない」ことは、開発プロセスにおいて大きなメリットといえます。
今回共同開発したSplit-Ensembleは、従来の1/4の計算コストで未知データを意識した学習を行える手法であり、OODへの対処が求められる様々な場面で役立つことが期待されます。本手法の最も大きなインパクトは、独自のアーキテクチャにより深層学習モデルにOODの検出能力を向上させたという点です。今回の取り組みでは、ImageNetデータセットなど比較的小規模なタスクで評価を行いましたが、今後本手法を大規模なLLMsに適用することで、ハルシネーションの抑制などにも繋がっていくと考えられます。
今後もパナソニックHDは、AI技術の社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進していきます。
“Split-Ensemble: Efficient OOD-aware Ensemble via Task and Model Splitting”
https://arxiv.org/abs/2312.09148
本技術は、UC Berkeleyが主導する「BAIR オープンリサーチコモンズ(*3)」の枠組みで開発したもので、Panasonic R&D Center AmericaのDenis GudovskiyとパナソニックHD テクノロジー本部の奥野 智行、中田 洋平が参画した研究成果です。
なお、上記BAIR オープンリサーチコモンズの枠組みからは、パナソニックHDとUC Berkeley、ITALAI S.R.L 、Sapienza University of Romeの研究者らとの連携成果である下記論文もICML 2024に採択されました。AIの現場への適用を加速する技術として、ドメインシフト下でのセマンティックセグメンテーションタスクをターゲットに、僅か1%のラベルで教師ありドメイン適応の性能を上回るアクティブラーニング手法を提案しています。
“Hyperbolic Active Learning for Semantic Segmentation under Domain Shift”
https://arxiv.org/abs/2306.11180
また、ICML 2024併設のワークショップであるICML '24 Workshop on Advancing Neural Network Training (WANT): Computational Efficiency, Scalability, and Resource Optimizationに、パナソニックHDとUC Berkeley、南京大学、北京大学の研究者らとの連携成果である下記論文が採択されました。モデル量子化による軽量化の際、論文中で“task-critical”と呼ぶ特に重要なカテゴリ(人、車など)の精度低下を優先的に防ぐ新たな手法を提案しています。
“Fisher-aware Quantization for DETR Detectors with Critical-category Objectives”
https://arxiv.org/abs/2407.03442
*1 人工知能が学習したデータからは正当化できないはずの回答を堂々とする現象
*2 Naïve Ensemble
*3 産業界、学術界の垣根を越えて世界トップレベルの研究者がオープンにコラボレーションする場として設立されたAI研究機関で、2024年時点ではパナソニックHDのほか、Google、Metaなど10社が参画しています。
記事の内容は発表時のものです。
商品の販売終了や、組織の変更等により、最新の情報と異なる場合がありますのでご了承ください。