终于,OpenAI的⽂⽣图AI⼯具DALL-E系列迎来了最新版本DALL?E 3,⽽上个版本DALL?E 2还是在去年4⽉推出的。OpenAI表示,「DALL?E 3⽐以往系统更能理解细微差别和细节,让⽤户更加轻松地将⾃⼰的想法转化为⾮常准确的图像。」是不是真如OpenAI所说的那样呢?
眼⻅为实,我们来看以下DALL?E 3与DALL?E 2的⽣成效果⽐较,同样的prompt「⼀幅描绘篮球运动员扣篮的油画,并伴以爆炸的星云」,左图DALL?E 2在细节、清晰度、明亮度等⽅⾯显然逊于右图DALL?E 3。除了炸裂的⽣图效果之外,此次DALL?E 3的最⼤特点是与ChatGPT的集成,它原⽣构建在ChatGPT之上,⽤ChatGPT来创建、拓展和优化prompt。
这样⼀来,⽤户⽆需在prompt上花费太多时间。具体来讲,通过使⽤ChatGPT,⽤户不必绞尽脑汁地想出详细的prompt来引导DALL?E 3了。当输⼊⼀个想法时,ChatGPT会⾃动为DALL?E 3⽣成量身定制的、详细的prompt。同时⽤户也可以使⽤⾃⼰的prompt。⾄于集成ChatGPT后的效果怎么样?
OpenAI CEO⼭姆?奥特曼兴奋地展示了DALL?E 3的连续性⽣成结果,简直称得上完整的「故事⽚」。DALL?E 3还能⽣成更⾼质量的图像,更准确地反映提示内容。DALL?E将⽂本prompt转换成图像。即使是DALL?E 2,也会经常忽略特定的措辞导致出错。但OpenAI的研究⼈员说,最新版本能更好地理解上下⽂,并且处理较⻓的prompt效果会更好。
此外,它还能更好地处理向来困扰图像⽣成模型的内容,如⽂本和⼈⼿。⽬前,DALL?E 3处于研究预览版本。OpenAI计划将DALL?E 3的发布时间错开,将于10⽉份⾸先向ChatGPT Plus和ChatGPT Enterprise⽤户发布,随后在秋季向研究实验室及其API服务发布。不过,该公司没有透露何时或者是否计划发布免费的公开版本。