image: NeurIPS 2024 Panasonic HD develops image generation AI “Diffusion-KTO” that can personalize images to your tastes based on your “likes” and “dislikes”

Dec 02, 2024

公司/新闻稿

松下高清开发图像生成 AI“Diffusion-KTO”,可以根据您的“喜欢”和“不喜欢”将图像个性化,符合您的品味

日本大阪,2024 年 12 月 2 日——松下美国研发公司 (PRDCA) 和松下控股有限公司 (Panasonic HD) 与加州大学等研究人员合作开发了“Diffusion-KTO(知识转移优化)”,这是一种图像生成 AI,它可以通过根据用户的“喜欢”或“不喜欢”等二元反馈调整生成模型,轻松生成符合用户目的和偏好的图像。

近年来,图像生成 AI 已广泛应用于从创意到商业应用等各个领域。除了图像的精细度之外,生成反映用户偏好和需求(个性化)的图像的能力已成为客户满意度的重要因素。新开发的 Diffusion-KTO 可以通过一种新方法高效地生成高质量、个性化的图像,该方法应用了量化每个人偏好和价值观的“效用函数”。与现有方法相比,我们的方法可以将偏好数据集的注释成本降低多达 N 倍(N 表示数据集大小)。

该技术已被接受在人工智能和机器学习的顶级会议 NeurIPS 2024(第三十八届神经信息处理系统年会)上发表,该会议将于 2024 年 12 月 10 日至 14 日在加拿大温哥华举行。

概述:

图 1:使用 Diffusion-KTO 的图像生成和调整过程

Panasonic HD 和 PRDCA 正在研究生成式 AI 模型的个性化。最近,从文本生成图像的 AI 模型对社会产生了巨大影响,许多人已经在使用它们。然而,挑战依然存在:
- 生成模型本身非常复杂,参数很多;
- 设置用户偏好涉及多个变量(颜色、形状、构图等)。
因此,想要通过调整参数来制作出用户喜欢的图像并不容易,目前用户需要充分利用快速工程来获得自己满意的图像。

调整生成的图像以更贴近用户喜好的研究也在进行中。但要做到这一点,需要单独收集比较“在类似图像中哪张图像更受欢迎”(成对比较)的数据,然后使用基于强化学习的复杂奖励模型进行调整。

针对这一问题,Diffusion-KTO 提出了一种新方法,即应用效用函数来量化每个人的偏好,这些偏好基于简单的二元反馈,例如“喜欢”或“不喜欢”。所采用的效用函数是根据行为经济学理论前景理论设计的,该理论表明,与获得同等收益相比,人们更愿意避免损失。二元反馈可以轻松高效地收集每个用户的偏好,从而大大降低了数据收集的成本和时间。此外,通过将其与与人类决策相关的效用函数相结合,可以高效地生成更符合用户偏好的高质量图像。

在评估实验中,我们发现 Diffusion-KTO 的表现优于基础模型 (SD v1-5) * 1,最高胜率达到 87.2%。具体来说,人类评估者始终更喜欢 Diffusion-KTO 生成的图像,而不是基础模型生成的图像。

未来展望:

Diffusion-KTO 是一种图像生成 AI,它可以通过简单的交互(用户的二元反馈)调整生成模型,并生成符合用户偏好的图像。通过应用这项技术,可以高效地创建用于 AI 训练的数据集,这对于 AI 开发至关重要。原则上,Diffusion-KTO 不仅可以应用于图像生成,还可以应用于文本生成和语音生成等其他生成模型,从而可以在需要根据用户偏好进行个性化的许多领域中使用。

松下高清将继续加速人工智能在社会中的应用,并推动人工智能技术的研发,为改善客户的生活和工作场所做出贡献。

*1 SD v1-5:图像生成模型稳定扩散 v1.5

相关信息:

“通过优化人类效用调整扩散模型”
这项研究由 PRDCA 的 Konstantinos Kallidromitis、松下 HD 的 Yusuke Kato 和 Kazuki Kozuka 与加州大学洛杉矶分校的博士生 Shufan Li 和之前在加州大学伯克利分校的 Akash Gokul 合作完成。
https://arxiv.org/abs/2404.04465

松下 × AI 网站
https://tech-ai.panasonic.com/en/

松下机器人中心网站
https://tech.panasonic.com/global/robot/

关于松下集团

松下集团成立于 1918 年,如今已成为全球领先的创新技术和解决方案提供商,为全球消费电子、住宅、汽车、工业、通信和能源领域提供广泛的应用。2022 年 4 月 1 日,松下集团改组为事业公司系统,松下控股株式会社作为控股公司,旗下有八家公司。截至 2024 年 3 月 31 日,集团报告的综合净销售额为 84964 亿日元。如需了解有关松下集团的更多信息,请访问:https://holdings.panasonic/global/

スクロールドきます

本网站内容在发布时准确无误,但可能随时更改,恕不另行通知。
因此请注意,这些文档可能并不总是包含最新信息。
请注意,德语、法语和中文版本均为机器翻译,因此质量和准确性可能有所不同。

发布:
松下控股株式会社
类别:

下载(图片)

精选新闻