AI生成艺术的底层原理:非平衡物理的扩散模型

发布日期: null

一把牛油果形状的椅子,熊猫在湖面上溜冰,袋鼠玩国际象棋,宇航员在火星上骑自行车...... DALL·E 2, Stable Diffusion等图像生成模型可以根据输入文本,产生各种超乎想象的图片。这背后的原理,来自非平衡物理中的扩散模型。如果为高维图像空间中的像素添加噪声,像墨水在水里扩散一样进行处理后逆转这一过程就可以从噪声中生成图像得到出乎意料的组合结果。

DALL·E2是OpenAI创造的图像生成系统让它描绘“金鱼在海滩上喝可口可乐”的结果将完全是超现实主义画面程序训练中会遇见海滩、金鱼和可口可乐但不大会看到三种直接结合体然而DALL·E2可以组合这些概念生成的结果可能让达利也感到骄傲.

DALL·E2是一种尝试使用训练集数据来创建质量和多样性方面堪比原数据新东西这是机器学习中最困难问题之一要走到这一步十分艰辛.第一种重要图象产生方式被称为神经网络的人工智能方法神经网络是由多层计算单元(即人工神经元)组成的程序尽管这些模式能让图画质量变得更好但并不可靠且难以培训与此同时一位对物理学充满热情博士后研究员创造了强大的生产模式这个沉睡良久直到两名研究生取得技术突破才使这只野兽复活.

UUID: 2a880036-da37-4cea-8804-e14348174428

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/返朴公众号-pdf2txt/2023/返朴_2023-02-15「转」_AI生成艺术的底层原理:非平衡物理的扩散模型.txt

是否为广告: 是

处理费用: 0.0070 元