image:Panasonic x AI

Sep 28, 2022

Unternehmen / Pressemitteilung

Panasonic Holdings entwickelt fortschrittliche KI-Technologie, die für Top-Konferenzen im Bereich KI und Robotik (ECCV2022 und IROS2022) genehmigt wurden

Osaka, Japan–Panasonic Holdings Corporation hat die Annahme von Beiträgen für die European Conference on Computer Vision (ECCV) 2022, eine der führenden internationalen Konferenzen für KI und Computer Vision, sowie für die IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 2022, eine der führenden internationalen Konferenzen für KI und Robotik, bekannt gegeben. Autoren und Co-Autoren werden vom 23. bis 27. Oktober 2022 auf den Konferenzen Vorträge halten.

Panasonic Holdings ist bestrebt, innovative Produkte und Dienstleistungen bereitzustellen, die in der Lage sind, soziale und Lifestyle-Probleme zu lösen, indem KI-Technologie in den wichtigsten Geschäftsbereichen von Panasonic implementiert wird: Haushaltsgeräte, Wohnen, Automobilgeräte und B2B-Lösungen. Darüber hinaus ermutigen wir unser Team, unsere neuesten Forschungsergebnisse auf internationalen Konferenzen zu veröffentlichen, um aktiv zu den akademischen und industriellen KI-Forschungsgemeinschaften beizutragen.

Mehrere Forschungsprojekte, die gemeinsam von unseren Teams und Mitarbeitern durchgeführt wurden, haben kürzlich internationale Anerkennung in Computer Vision und Robotik erhalten, zwei Bereichen, die für die soziale Umsetzung von KI unerlässlich sind.

Panasonic Holdings wird weiterhin mit Forschern innerhalb und außerhalb des Unternehmens zusammenarbeiten, um die Forschung und Entwicklung der KI-Technologie voranzutreiben, die durch unsere Produkte und Dienstleistungen zur Zufriedenheit unserer Kunden beiträgt.

- Über ECCV und IROS
ECCV ist neben CVPR [1] und ICCV [2] eine der Top-Konferenzen in den Bereichen KI und Computer Vision. Bekannt als Ort für KI-Forscher auf der ganzen Welt, um ihre neuesten Errungenschaften zu diskutieren, liegt die Akzeptanzrate bei nur 20 % bis 30 %.

Liste der vom ECCV akzeptierten Forschungen:
1. Überdenken generischer Kameramodelle für die tiefe Einzelbildkamerakalibrierung zur Wiederherstellung von Drehung und Fischaugenverzerrung
2. MTTrans: Domänenübergreifende Objekterkennung mit Mean-Teacher-Transformer
3. Äquivarianz und Invarianz Induktive Verzerrung für das Lernen aus unzureichenden Daten

IROS ist neben ICRA [3] eine der Top-Konferenzen in den Bereichen KI und Robotik. Es ist bekannt als ein Ort für KI- und Robotikforscher auf der ganzen Welt, um ihre neuesten Errungenschaften über ihre jeweiligen Forschungsgebiete hinaus zu diskutieren.

Liste der bei IROS akzeptierten Forschungen:
4. DreamingV2: Reinforcement Learning mit diskreten Weltmodellen ohne Rekonstruktion

Forschungsdetails:

1. Überdenken generischer Kameramodelle für die tiefe Einzelbildkamerakalibrierung zur Wiederherstellung von Drehung und Fischaugenverzerrung

Hintergrund:
Es wird erwartet, dass Fisheye-Kameras mit ihren großen Sichtfeldern in verschiedenen Anwendungen eingesetzt werden, wie z. B. Weitwinkelüberwachung und Hinderniserkennung. Im Gegensatz dazu verhindert die große Fisheye-Bildverzerrung die Wiederverwendung bestehender Erkennungsmodelle. Daher ist es notwendig, diese Bilder mit Hilfe der Kamerakalibrierung in solche mit geringerer Verzerrung umzuwandeln. Herkömmliche Kalibrierverfahren haben zwei Probleme: großen Zeitaufwand und Anforderungen an spezielle Messsysteme. Um diese Probleme anzugehen, haben wir eine Kalibrierungsmethode erforscht, die einfach zu verwenden ist und eine hohe Genauigkeit für stark verzerrte Bilder aufweist.

Abstrakt:
Wir haben eine Kalibrierungsmethode eingeführt, die mithilfe von Deep Learning Verzerrung und Kameradrehung aus einem einzelnen Bild schätzt. Um eine präzise Kalibrierung für Fisheye-Kameras zu erreichen, haben wir ein geometrisches Kameramodell mit hoher Genauigkeit und einer kleinen Anzahl von Parametern vorgeschlagen. Obwohl wir nur ein Modell trainieren, ermöglicht dieses entworfene Modell eine hohe Kalibrierungsgenauigkeit aus einem einzigen Bild. Darüber hinaus können optimale Verlustfunktionsparameter vor dem Training durch numerische Simulationen anstelle von Trial-and-Error bestimmt werden. Dieser Simulationsansatz führt zu einer Verbesserung der Kalibrierungsgenauigkeit und einer Reduzierung der Trainingszeit. Unser Papier wurde auf der Grundlage der Verifizierung von großen Datensätzen und mehreren tatsächlichen Kameras sowie der Erzielung modernster Leistung angenommen [4].

Zukunftsausblick:
Obwohl täglich verschiedene Kameraanwendungen verwendet werden, wissen nur wenige, dass die Bedienung zeitaufwändig ist. Unser Verfahren kann den enormen Arbeitsaufwand reduzieren, indem Bildverzerrungen unter Verwendung von nur einem Bild korrigiert werden. Wir erwarten, dass unsere Methode aufgrund der sofortigen Neukalibrierung für den stabilen Betrieb von Kameraanwendungen weit verbreitet für die Bildvorverarbeitung verwendet wird. Insbesondere eignet sich unser Verfahren für Anwendungen wie ADAS und Sensorik auf Drohnenkameras, da wir davon ausgehen, dass diese Kameras stark von Vibrationen und Kollisionen betroffen sind.
Gründliche Forschung in den Bereichen Bildverarbeitung und modernste KI hat es uns ermöglicht, unsere Methode basierend auf Kamerageometrie und Deep Learning vorzuschlagen. Wir studieren kontinuierlich die Entwicklung fortschrittlicher Technologien zusammen mit dem oben beschriebenen Wissen.

Diese Forschung ist die gemeinsame Arbeit von Dr. Nobuhiko Wakai, Platform Division, Panasonic Holdings, Mr. Satoshi Sato und Mr. Yasunori Ishii, Technology Division, Panasonic Holdings, und Prof. Takayoshi Yamashita, Chubu University.

image:Fig.1

Abb. 1: Unsere Methode schätzt Verzerrung und Rotation in unserem vorgeschlagenen Kameramodell unter Verwendung tiefer neuronaler Netze aus einem einzelnen Bild, um ein Bild mit wiederhergestellter Verzerrung und Rotation zu erhalten. Auf diese Zahl wird in unserem angenommenen Papier in Abb. 1 Bezug genommen.

2. MTTrans: Domänenübergreifende Objekterkennung mit Mean-Teacher-Transformer

Hintergrund:
Neuere Objekterkennungsmodelle haben in einem ähnlichen Bereich wie dem Zugdatensatz vielversprechende Leistungen erzielt. Sie sind jedoch unter unterschiedlichen Umgebungen ungenau und erfordern groß angelegte gekennzeichnete Daten, um eine solche Umgebungsverschiebung zu überwinden.

Abstrakt:
Dieses Papier schlug ein Objekterkennungsmodell vor, das auf neue, unterschiedliche Umgebungen ohne Annotationsetiketten angewendet wird. Konkret verwenden wir Pseudolabels anstelle von Annotationslabels, um Modelle zu trainieren. Für genaue Pseudolabels haben wir mehrstufige Feature-Alignments vorgeschlagen, die die Diskrepanz von Feature-Darstellungen zwischen Domänen unterdrücken. Wir evaluieren die Robustheit unseres Modells gegenüber Domain Shift mit öffentlichen Datensätzen und bestätigen, dass unsere vorgeschlagene Methode auf diesem Gebiet eine State-of-the-Art-Performance erreicht [5].

Zukunftsausblick:
Es wird erwartet, dass unser Beitrag Kosten senkt und die Robustheit verbessert, wenn Objekterkennungsmodelle in verschiedenen Bereichen für Erkennungsfunktionen in Produkten wie Industrierobotern und Autos angepasst werden. Wir werden weiterhin neue Technologien entwickeln, indem wir gemeinsam mit Universitäten zusammenarbeiten und neue Technologien auf industrielle Anwendungen anwenden.

Diese Forschung ist die gemeinsame Arbeit der University of California, Berkeley AI Research (BAIR), der Peking University, der Beihang University, Herrn Denis Gudovskiy, Panasonic R&D Company of America AI Laboratory, Dr. Yohei Nakata und Herrn Tomoyuki Okuno, Technology Division , Panasonic-Beteiligungen.

image:Fig. 2

Abb. 2: Visualisierung der Detektionsergebnisse auf dem Foggy Cityscapes-Datensatz. Auf diese Zahl wird in unserem angenommenen Papier in Abb. 6 Bezug genommen.

3. Äquivarianz und Invarianz Induktive Verzerrung für das Lernen aus unzureichenden Daten

Hintergrund:
Deep Learning aus unzureichenden Trainingsdaten ist eine Herausforderung. Neben der gemeinsamen Motivation, dass das Sammeln von Daten teuer ist, glauben wir, dass die größte Herausforderung bei der Generalisierung von Modellen für maschinelles Lernen darin besteht, die Leistungslücke zwischen unzureichenden und ausreichenden Daten zu schließen – selbst wenn die Trainingsdaten ausreichend sind, können die Testdaten immer noch unzureichend sein die Ausbildungsverteilung. Daher liegt unser Fokus darauf, tiefe Modelle mit unzureichenden Daten zu trainieren, ohne externe Daten zu verwenden.

Abstrakt:
Deep Learning aus unzureichenden Daten wirkt sich negativ auf die Generalisierung aus. Der springende Punkt bei der Verbesserung der Verallgemeinerung unzureichender Daten besteht darin, das fehlende Klassenmerkmal wiederherzustellen und gleichzeitig das "kontextbezogene" Umgebungsmerkmal zu entfernen. Zu diesem Zweck schlagen wir zwei induktive Verzerrungen vor, um das Lernen zu leiten: Äquivarianz für die Klassenerhaltung und Invarianz für die Entfernung der Umgebung. Die Äquivarianz für die Klassenerhaltung wird mit einem handelsüblichen, auf Kontrastmitteln basierenden, selbstüberwachten Merkmalslernansatz erreicht, während für die Umgebungsinvarianz eine klassenweise invariante Risikominimierung (IRM) verwendet wird.

Zukunftsausblick:
Das Lernen aus unzureichenden Daten ist von Natur aus schwieriger als das aus ausreichenden Daten – letztere werden unweigerlich auf die begrenzte Umweltvielfalt voreingenommen sein. Wir werden uns bemühen, die Leistungslücke mit Mitarbeitern weiter zu verringern, um die datensatzbezogenen Probleme anzugehen, die für die soziale Implementierung von KI unerlässlich sind.

Diese Forschung ist eine gemeinsame Arbeit der Nanyang Technological University, der Singapore Management University und des Panasonic R&D Centre Singapore.

image:Fig. 3

Abb. 3: Veranschaulichung, wie die vorgeschlagenen induktiven Verzerrungen der Äquivarianz und Invarianz dazu beitragen, aus unzureichenden Daten zu lernen. Auf diese Zahl wird in unserem angenommenen Papier in Abb. 1 Bezug genommen.

4. DreamingV2: Reinforcement Learning mit diskreten Weltmodellen ohne Rekonstruktion

Hintergrund:
Reinforcement Learning auf der Grundlage von Weltmodellen [6] wurde in den letzten Jahren schnell untersucht und wird voraussichtlich vielversprechende Anwendungen wie das visuelle Servoing von Industrierobotern haben. Andererseits würde in den Fällen, in denen die zu steuernden und zu manipulierenden Objekte klein sind, das Verstärkungslernen versagen, da die Roboter die Objekte nicht erkennen können.

Abstrakt:
Dieses Papier schlug DreamingV2 vor, das visuelle Modelle realisiert, die kleine Objekte erkennen können, indem es selbstüberwachtes Lernen anwendet, das ursprünglich im Bereich des Computersehens vorgeschlagen wurde. Darüber hinaus realisiert DreamingV2 durch die Erstellung diskreter Variablen, die als latente Zustände innerhalb der Weltmodelle bezeichnet werden, kinematische Modelle, die diskontinuierliche Dynamiken einschließlich Roboter-Objekt-Kontakt erfassen können. Simulationsexperimente haben gezeigt, dass DreamingV2 bei verschiedenen simulierten Roboteraufgaben, wie dem Aufnehmen von Objekten mit einem Roboterarm, die weltweit höchste Leistung [7] erzielen kann.

Zukunftsausblick:
Unser Beitrag soll Handarbeit in Fabriken durch Roboter ersetzen. Darüber hinaus wird es die Programmierung und Abstimmung von Industrierobotern reduzieren, die derzeit viel Zeit und Arbeit erfordern. Wir werden diese Technologie für industrielle Anwendungen in Fabriken weiterentwickeln und die Evaluierung mit echten Robotern fortsetzen.

Diese Forschung ist die gemeinsame Arbeit von Dr. Masashi Okada, Technology Division, Panasonic Holdings, und Prof. Tadahiro Taniguchi, Ritsumeikan University.

image:Fig. 4

Abb. 4: DreamingV2 stellt die latenten Zustände innerhalb der Weltmodelle als diskrete Variablen dar und trainiert das Modell durch selbstüberwachtes Lernen (dh kontrastives Lernen). Auf diese Zahl wird in unserem angenommenen Papier in Abb. 1 Bezug genommen.

Neben den vier in dieser Pressemitteilung erwähnten Forschungsarbeiten wurde auch eine in Zusammenarbeit mit Panasonic Connect Co., Ltd. durchgeführte Forschungsarbeit für IROS2022 angenommen: „Tactile-Sensitive NewtonianVAE for High-Accuracy Industrial Connector Insertion“

Das folgende Papier wurde auch zum ECCV-Workshop angenommen, der in Verbindung mit ECCV2022 stattfinden wird.
"Invisible-to-Visible: Datenschutzbewusste menschliche Segmentierung mit luftgetragenem Ultraschall über Collaborative Learning Probabilistic U-Net"

Anmerkungen:
[1] IEEE/CVF-Konferenz zu Computer Vision und Mustererkennung
[2] Internationale IEEE/CVF-Konferenz über Computer Vision
[3] Internationale IEEE-Konferenz für Robotik und Automatisierung
[4] Ab 28. September 2022 als Genauigkeit der Kamerakalibrierung bei Methoden, die ein allgemeines Szenenbild zur Schätzung von Verzerrung und Drehung verwenden.
[5] Stand: 28. September 2022, als Erkennungsleistung (mittlere durchschnittliche Genauigkeit) von unüberwachten Domänenanpassungsmethoden in drei Domänenanpassungsszenarien (Cityscapes to Foggy Cityscapes, Cityscapes to BDD100K und Sim10k to Cityscapes).
[6] Framework zum Erwerb umfassender Modelle von Robotern, einschließlich ihrer Vision und Kinematik durch Deep Learning.
[7] Stand: 28. September 2022, Ergebnisse der Bewertung durch robosuite, einem öffentlichen Benchmark für bestärkendes Lernen. Basierend auf Vergleichen mit anderen hochmodernen Reinforcement-Learning-Algorithmen.

Anfragen zu dieser Pressemitteilung:

Panasonic×AI team
Digital and AI technology Center, Technology Division,
Panasonic Holdings Corporation
tech-ai@ml.jp.panasonic.com

Zugehörige Informationen:

- "Überdenken generischer Kameramodelle für die tiefe Einzelbildkamerakalibrierung zur Wiederherstellung von Drehung und Fischaugenverzerrung"
https://arxiv.org/abs/2111.12927
- "MTTrans: Domänenübergreifende Objekterkennung mit Mean-Teacher Transformer"
https://arxiv.org/abs/2205.01643
- "Äquivarianz- und Invarianzinduktiver Bias für das Lernen aus unzureichenden Daten"
https://arxiv.org/abs/2207.12258
- "DreamingV2: Reinforcement Learning mit diskreten Weltmodellen ohne Rekonstruktion"
https://arxiv.org/abs/2203.00494
- "Tactile-Sensitive Newtonian VAE for High-Accuracy Industrial Connector Insertion"
https://arxiv.org/abs/2203.05955
- "Invisible-to-Visible: Privacy-Aware Human Segmentation using Airborne Ultrasound via Collaborative Learning Probabilistic U-Net"
https://arxiv.org/abs/2205.05293
- Panasonic×AI-Website
https://tech-ai.panasonic.com/en/

Über die Panasonic-Gruppe

Die Panasonic Group, ein weltweit führendes Unternehmen in der Entwicklung innovativer Technologien und Lösungen für vielfältige Anwendungen in den Bereichen Unterhaltungselektronik, Wohnen, Automotive, Industrie, Kommunikation und Energie, ist am 1. April 2022 auf ein Betriebsgesellschaft umgestiegen, bei dem Panasonic Holdings Corporation als Holdinggesellschaft fungiert und acht Unternehmen unter ihrem Dach positioniert sind. Die 1918 gegründete Gruppe hat sich der Verbesserung des Wohlbefinden von Mensch und Gesellschaft verschrieben und führt ihre Geschäfte auf Grundlage von Gründungsprinzipien, die darauf abzielen, neue Werte zu schaffen und nachhaltige Lösungen für die Welt von heute anzubieten. Die Gruppe meldete für das am 31. März 2022 endende Geschäftsjahr einen konsolidierten Nettoumsatz von 7.388,8 Milliarden Yen. Die Panasonic Group hat sich der Verbesserung des Wohlbefinden der Menschen verschrieben und bietet erstklassige Produkte und Dienstleistungen, die Ihnen helfen, Live Your Best. Um mehr über die Panasonic Group zu erfahren, besuchen Sie bitte: https://holdings.panasonic/global/

スクロールできます

Der Inhalt dieser Website ist zum Zeitpunkt der Veröffentlichung korrekt, kann jedoch ohne vorherige Ankündigung geändert werden.
Bitte beachten Sie daher, dass diese Dokumente möglicherweise nicht immer die aktuellsten Informationen enthalten.
Bitte beachten Sie, dass es sich bei der deutschen, französischen und chinesischen Version um maschinelle Übersetzungen handelt, sodass Qualität und Genauigkeit variieren können.

Ausgegeben:
Panasonic Holdings Corporation

Downloads (Bilder)

Vorgeschlagene Nachrichten