注意看,这张情侣照在⽹上转疯了:旧⼚街⻛格,带着浓浓90年代氛围感,但是,他俩⼀夜爆⽕的原因,你可能想象不到——这⼆位并不是真⼈!⽽是由AI⼀键⽣成的!(不论是乍眼看去或是放⼤细瞧,都会觉得是拿相机拍的真⼈吧!)这就是Midjourney最新V5版本解锁的逆天神技。就连AI绘画最被诟病的⼿,这次也完全能hold住了。
⽽且很多⽹友⼀开始不相信这是AI画的,于是他们亲⾃下场输⼊提示词来验证:A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen—v 5—s 250—q 2。
⼀对年轻的中国情侣,穿着夹克和⽜仔裤,坐在屋顶上,背景是20世纪90年代的北京,可以看到对⾯的建筑—v 5—s 250—q 2。在⾃⼰体验了⼀把之后,不少⽹友这次真的直呼:⼈类画师别活了。把我吓坏了。逼真得不像话90年代的中国情侣以假乱真,那么现代版的呢?把提示词中的年代改成2023年:⽆论是时尚的破洞裤、潮流的发型,还是背景的楼宇环境,⼀下⼦都拉回到了现在。
还有这样的:△来⾃微博@⾕⼤⽩话甚⾄有⼈觉得⼈物的眼神,根据时代不同也在发⽣变化。⽽且逼真程度也是骗过了不少⽹友:当然,“欧美爱情故事”也是不在话下:当然,⼤家最关⼼的还是“⼿”画的怎么样。于是,⼀位⽹友就专⻔加⼤难度来测试Midjourney V5的这项能⼒。例如⼀张印度美⼈露⼿的全身像:妥妥是影楼⼤⽚级别了。再⽣成竖⼤拇哥的:不仅没有拉胯,甚⾄Midjourney能把镜头的聚焦感体现出来。
那么只⽣成⼿呢?这⼀次,真的可以说是没让⼤家失望了:Midjourney这回可以说是惊艳众⼈了,不过也有⽹友好奇,另⼀位重量级选⼿Stable Diffusion表现⼜会如何?这不,有位⽹友便⽤Stable Diffusion搞了个镜像:效果似乎也不错?效果为何如此炸裂Midjourney时隔4个⽉的更新,为何会让效果⼀下拉⾼到如此“吓⼈”的程度?具体⼜更新了哪些东⻄呢?
整体来说,最明显的的当属以下三点更新了:细节更加逼真更多可以选择的⻛格告别不会画⼿⾸先是细节部分,下图从左到右依次是V3、V4、V5⽣成的效果,可以说是越来越逼近照⽚效果了。△图源:arstechnica不仅如此,在有⾯部特写时,各种肌肤纹理以及光影效果,⽐如说反射、眩光和阴影等,V5都能搞定。
在Discord发布说明中,Midjourney还指出,相较于V4版本,V5版本会有更多的可以选择的⻛格,分辨率也提升了2倍。⻛格的话,可以从0~1000中选择,stylize 0=照⽚,stylize 1000=更艺术。并且V5还会对提示词更加敏感,⽤更少更精简的⽂本⽣成更好的有效的图⽚。
更更更重要的是,这次升级,Midjourney可算是摆脱掉了“不会画⼿”标签,想要靠看⼿指数的多少来判别AI作画已经不管⽤了(Doge)。值得⼀提的是,此前,已经有⼈通过Stable Diffusion+ControlNet解决了AI画⼿的问题。不过,也有⽹友出来开杠,虽然⼿指数画对了,但仔细看细节还是能区分出的:⼤拇指还是有点过⻓了。
当然,除了上⾯这些⽐较明显的升级之外,Midjourney V5版本还更新了⼀些⼩细节。⼀位机器学习博主特意列了张表格对V4、V5进⾏了对⽐。△来⾃@Lars Nielsen⽐如说,在最新的V5版本中,重复式、铺瓷砖式作画功能⼜回来了,在V4版本中,这项功能被官⽅禁⽌。
还有,Midjourney V5⽣成的尺⼨也更加⾃由,像下⾯1:3、5:1这种窄⻓的图像就是V5⽣成的,甚⾄1:10的图像它也能⽣成(如果你想的话)。反观V4版本,尺⼨被限制在1:2~2:1之间。嗯,这样的话,说不定之后的某个电影创作画⾯就是Midjourney V5⽣成的。此外,V5版本还可以⼿动调节图像权重,⽐如输⼊⼀张图像,可以⼿动输⼊数值来决定它影响最终⽣成图像的程度。
如何上⼿试玩Midjourney⽬前在公测阶段,通过Discord的机器⼈指令,AI会根据提示词帮你⽣成4张你想要的图像。具体来说,加⼊测试后,在新⼿频道中,你可以通过/image指令来输⼊提示词。不过,现在想要玩上V5版本的Midjourney,得先充值成为付费⽤户才⾏。
(充哪⼀档都可以)在提示词中加⼊—v 5或者从/settings中选择“V5”,就可以试玩这个最新模型啦~就像这样:啊,对了,如果你不知道怎么写提示词,或许可以问问GPT-4。