image:Panasonic x AI

Sep 28, 2022

公司/新闻稿

Panasonic Holdings开发的先进人工智能技术获人工智能和机器人领域顶级会议ECCV2022和IROS2022的认可

日本大阪——松下控股株式会社宣布,人工智能和计算机视觉领域顶级国际会议之一的欧洲计算机视觉会议 (ECCV) 2022 和人工智能和机器人领域顶级国际会议之一的 IEEE/RSJ 智能机器人与系统国际会议 (IROS) 2022 已接受论文提交。作者和合著者将于 2022 年 10 月 23 日至 27 日在会议上发表演讲。

Panasonic Holdings 致力于通过将 AI 技术应用到 Panasonic 的主要业务领域:家电、住宅、汽车设备和 B2B 解决方案,提供能够解决社会和生活方式问题的创新产品和服务。此外,我们鼓励我们的团队在国际会议上发表我们的最新研究成果,以积极为学术界和工业界的 AI 研究社区做出贡献。

我们的团队和合作者共同开展的多个研究项目最近在计算机视觉和机器人技术方面获得了国际认可,这两个领域对于人工智能的社会实施至关重要。

松下控股将继续与公司内外的研究人员合作,推进人工智能技术的研发,通过我们的产品和服务为客户带来幸福。

- 关于 ECCV 和 IROS
ECCV 与 CVPR [1]和 ICCV [2]并列为人工智能和计算机视觉领域的顶级会议之一。作为全球 AI 研究人员讨论最新成果的场所,接受率只有 20% 到 30%。

ECCV接受的研究列表:
1. 重新思考用于深度单图像相机校准的通用相机模型以恢复旋转和鱼眼畸变
2. MTTrans:使用 Mean-Teacher Transformer 进行跨域对象检测
3. 从不充分数据中学习的等变性和不变性归纳偏差

IROS 与 ICRA [3]一起,是人工智能和机器人领域的顶级会议之一。它被称为世界各地的人工智能和机器人研究人员讨论他们在各自研究领域之外的最新成果的地方。

IROS 接受的研究清单:
4. DreamingV2:无需重建的离散世界模型强化学习

研究详情:

1. 重新思考用于深度单图像相机校准的通用相机模型以恢复旋转和鱼眼畸变

背景:
鱼眼相机具有大视场,有望用于广角监控、障碍物检测等多种应用。相比之下,大的鱼眼图像失真阻碍了现有识别模型的重用。因此,有必要使用相机校准将这些图像转换为失真较小的图像。传统的校准方法存在两个问题:耗时大和对特定测量系统的要求。为了解决这些问题,我们研究了一种易于使用且对严重失真图像具有高精度的校准方法。

抽象的:
我们引入了一种校准方法,该方法使用深度学习从单个图像中估计失真和相机旋转。为了实现鱼眼相机的精确标定,我们提出了一种精度高、参数少的几何相机模型。虽然我们只训练一个模型,但这个设计的模型可以从单个图像中获得很高的校准精度。此外,可以在训练前通过数值模拟而不是反复试验来确定最佳损失函数参数。这种模拟方法导致校准精度的提高和训练时间的减少。我们的论文是在大规模数据集和多个实际相机的验证以及实现最先进性能[4]的基础上被接受的。

未来展望:
虽然每天都会使用各种相机应用程序,但很少有人知道操作非常耗时。我们的方法可以通过仅使用图像来纠正图像失真来减少大量的劳动力。我们希望我们的方法能够广泛用于图像预处理,因为它可以为相机应用程序的稳定运行进行即时重新校准。特别是,我们的方法适用于 ADAS 和无人机摄像头传感等应用,因为我们假设这些摄像头在很大程度上受到振动和碰撞的影响。
对图像处理和尖端人工智能的深入研究使我们能够提出基于相机几何和深度学习的方法。我们正在不断研究先进技术的发展以及上述知识。

这项研究是松下控股平台部 Nobuhiko Wakai 博士、松下控股技术部 Satoshi Sato 先生和 Yasunori Ishii 先生以及中部大学 Takayoshi Yamashita 教授的共同工作。

image:Fig.1

图 1:我们的方法使用来自单个图像的深度神经网络估计我们提出的相机模型中的失真和旋转,以获得失真和旋转恢复图像。我们在图 1 中接受的论文中引用了这个数字。

2. MTTrans:使用 Mean-Teacher Transformer 进行跨域对象检测

背景:
最近的目标检测模型在与训练数据集类似的领域下取得了可喜的表现。然而,它们在不同的环境下是不准确的,需要大规模的标记数据来克服这种环境变化。

抽象的:
本文提出了一种适用于没有注释标签的新的不同环境的目标检测模型。具体来说,我们使用伪标签而不是注释标签来训练模型。对于准确的伪标签,我们提出了多级特征对齐,它抑制了域之间特征表示的差异。我们使用公共数据集评估我们的模型对域转移的稳健性,并确认我们提出的方法在该领域实现了最先进的性能[5]

未来展望:
我们的贡献有望在将目标检测模型应用到不同领域以实现工业机器人和汽车等产品的识别功能时降低成本并提高稳健性。我们将通过与大学合作,将新技术应用于工业应用,不断开发新技术。

本研究由美国加州大学伯克利分校人工智能研究所(BAIR)、北京大学、北航、Denis Gudovskiy 先生、美国松下研发公司 AI 实验室、Yohei Nakata 博士和技术部 Tomoyuki Okuno 先生共同完成,松下控股。

image:Fig. 2

图 2:Foggy Cityscapes 数据集检测结果的可视化。我们在图 6 中接受的论文中引用了该图。

3. 从不充分数据中学习的等变性和不变性归纳偏差

背景:
从不充足的训练数据中进行深度学习具有挑战性。除了收集数据昂贵的共同动机外,我们认为如何缩小数据不足和充足之间的性能差距是机器学习模型泛化的关键挑战——即使训练数据足够,测试数据仍然可以超出培训分布。因此,我们的重点是在不使用外部数据的情况下训练数据不足的深度模型。

抽象的:
从不充足的数据中进行深度学习会对泛化产生负面影响。提高泛化不足数据的关键是在去除“上下文”环境特征的同时恢复缺失的类特征。为此,我们提出了两种归纳偏差来指导学习:类别保存的等变性和环境移除的不变性。类保存的等方差是通过现成的基于对比的自监督特征学习方法获得的,而对于环境不变性,则使用类不变风险最小化 (IRM)。

未来展望:
从不充足的数据中学习本质上比从充足的数据中学习更具挑战性——后者将不可避免地偏向于有限的环境多样性。我们将挑战进一步缩小与合作者的性能差距,以解决对人工智能的社会实施至关重要的数据集相关问题。

这项研究是南洋理工大学、新加坡管理大学、松下新加坡研发中心的联合工作。

image:Fig. 3

图 3:说明所提出的等方差和不变归纳偏差如何帮助从不充分的数据中学习。我们在图 1 中接受的论文中引用了这个数字。

4. DreamingV2:无需重建的离散世界模型强化学习

背景:
基于世界模型的强化学习[6]近年来得到了迅速的研究,并有望在工业机器人的视觉伺服等方面具有广阔的应用前景。另一方面,在要控制和操纵的物体较小的情况下,强化学习将失败,因为机器人无法识别物体。

抽象的:
本文提出了DreamingV2,它通过应用最初在计算机视觉领域提出的自监督学习,实现了可以识别小物体的视觉模型。此外,通过在世界模型中创建称为潜在状态的离散变量,DreamingV2 实现了可以捕获不连续动态(包括机器人与物体接触)的运动学模型。仿真实验表明,DreamingV2 可以在各种模拟机器人任务中达到世界最高性能[7],例如用机械臂拾取物体。

未来展望:
我们的贡献有望用机器人取代工厂中的体力劳动。此外,它将减少工业机器人的编程和调整,目前这需要大量的时间和劳动力。我们将继续为工厂的工业应用开发这项技术,同时使用真实的机器人进行评估。

这项研究是松下控股公司技术部的 Masashi Okada 博士和立命馆大学的 Tadahiro Taniguchi 教授的共同工作。

image:Fig. 4

图 4:DreamingV2 将世界模型内部的潜在状态表示为离散变量,并通过自监督学习(即对比学习)训练模型。我们在图 1 中接受的论文中引用了这个数字。

除本新闻稿中提到的四篇研究论文外,一篇与松下互联株式会社株式会社合作的研究论文也被 IROS2022 接受:“用于高精度工业连接器插入的触觉敏感牛顿 VAE”

下面的论文也被 ECCV 研讨会接受,该研讨会将与 ECCV2022 一起举行。
“从不可见到可见:通过协作学习概率 U-Net 使用机载超声进行隐私感知人体分割”

笔记:
[1] IEEE/CVF 计算机视觉与模式识别会议
[2] IEEE/CVF 计算机视觉国际会议
[3] IEEE 机器人与自动化国际会议
[4] 截至 2022 年 9 月 28 日,作为使用一般场景图像估计失真和旋转的方法中的相机校准精度。
[5] 截至 2022 年 9 月 28 日,作为无监督域自适应方法在三种域自适应(Cityscapes 到 Foggy Cityscapes、Cityscapes 到 BDD100K 和 Sim10k 到 Cityscapes)场景中的检测性能(平均精度)。
[6] 通过深度学习获取机器人综合模型的框架,包括它们的视觉和运动学。
[7] 截至 2022 年 9 月 28 日,强化学习的公共基准 robosuite 的评估结果。基于与其他最先进的强化学习算法的比较。

有关本新闻稿的查询:

Panasonic×AI team
Digital and AI technology Center, Technology Division,
松下控股株式会社
tech-ai@ml.jp.panasonic.com

相关信息:

- “重新思考用于深度单图像相机校准以恢复旋转和鱼眼失真的通用相机模型”
https://arxiv.org/abs/2111.12927
- “MTTrans:使用 Mean-Teacher Transformer 进行跨域对象检测”
https://arxiv.org/abs/2205.01643
- “从不充分数据中学习的等变性和不变性归纳偏差”
https://arxiv.org/abs/2207.12258
- “DreamingV2:无需重建的离散世界模型强化学习”
https://arxiv.org/abs/2203.00494
- “用于高精度工业连接器插入的触觉敏感牛顿 VAE”
https://arxiv.org/abs/2203.05955
- “从不可见到可见:通过协作学习概率 U-Net 使用机载超声进行隐私感知人体分割”
https://arxiv.org/abs/2205.05293
- 松下×AI网站
https://tech-ai.panasonic.com/en/

关于松下集团

松下集团是全球领先的创新技术和解决方案提供商,广泛应用于消费电子、住宅、汽车、工业、通信和能源领域。2022 年 4 月 1 日,松下集团改组为事业公司系统,松下控股株式会社作为控股公司,旗下有八家公司。松下集团成立于 1918 年,致力于增进人类和社会的幸福,并根据创始原则开展业务,为当今世界创造新价值并提供可持续的解决方案。截至 2022 年 3 月 31 日,集团报告的合并净销售额为 73,888 亿日元。松下集团致力于改善人类幸福,团结一致提供优质产品和服务,帮助您关护无界,身心如悦。如需了解有关松下集团的更多信息,请访问:https://holdings.panasonic/global/

スクロールドきます

本网站内容在发布时准确无误,但可能随时更改,恕不另行通知。
因此请注意,这些文档可能并不总是包含最新信息。
请注意,德语、法语和中文版本均为机器翻译,因此质量和准确性可能有所不同。

发布:
松下控股株式会社
类别:

下载(图片)

精选新闻