OpenAI DALL·E 3来了，集成ChatGPT，⽣图效果太炸了

终于，OpenAI的⽂⽣图AI⼯具DALL-E系列迎来了最新版本DALL?E 3，⽽上个版本DALL?E 2还是在去年4⽉推出的。OpenAI表示，「DALL?E 3⽐以往系统更能理解细微差别和细节，让⽤户更加轻松地将⾃⼰的想法转化为⾮常准确的图像。」是不是真如OpenAI所说的那样呢？

眼⻅为实，我们来看以下DALL?E 3与DALL?E 2的⽣成效果⽐较，同样的prompt「⼀幅描绘篮球运动员扣篮的油画，并伴以爆炸的星云」，左图DALL?E 2在细节、清晰度、明亮度等⽅⾯显然逊于右图DALL?E 3。除了炸裂的⽣图效果之外，此次DALL?E 3的最⼤特点是与ChatGPT的集成，它原⽣构建在ChatGPT之上，⽤ChatGPT来创建、拓展和优化prompt。

这样⼀来，⽤户⽆需在prompt上花费太多时间。具体来讲，通过使⽤ChatGPT，⽤户不必绞尽脑汁地想出详细的prompt来引导DALL?E 3了。当输⼊⼀个想法时，ChatGPT会⾃动为DALL?E 3⽣成量身定制的、详细的prompt。同时⽤户也可以使⽤⾃⼰的prompt。⾄于集成ChatGPT后的效果怎么样？

OpenAI CEO⼭姆?奥特曼兴奋地展示了DALL?E 3的连续性⽣成结果，简直称得上完整的「故事⽚」。DALL?E 3还能⽣成更⾼质量的图像，更准确地反映提示内容。DALL?E将⽂本prompt转换成图像。即使是DALL?E 2，也会经常忽略特定的措辞导致出错。但OpenAI的研究⼈员说，最新版本能更好地理解上下⽂，并且处理较⻓的prompt效果会更好。

此外，它还能更好地处理向来困扰图像⽣成模型的内容，如⽂本和⼈⼿。⽬前，DALL?E 3处于研究预览版本。OpenAI计划将DALL?E 3的发布时间错开，将于10⽉份⾸先向ChatGPT Plus和ChatGPT Enterprise⽤户发布，随后在秋季向研究实验室及其API服务发布。不过，该公司没有透露何时或者是否计划发布免费的公开版本。