
最近的AI视频圈,似乎热闹起来了。
自从谷歌上个月放了波叫Veo3的大招,各大同行好像也加快脚步了,像即梦、海螺,这两天都把最新的视频模型端了上来。
不过,这也导致世超最近刷到的AI视频,比以前多多了,而且能以假乱真,哥们是真分不清虚拟和现实了。。

而就在昨晚,一直专攻画图的Midjourney,也悄咪咪加入战场,发布了自己的视频模型V1。

不得不说,这帮人有点意思,官网的公告就很有逼格。他们说,虽然他们过去几年的重点是图像。但他们的最终目标,是构建能够实时模拟开放世界的模型。
而这个视频模型,就是一块关键的垫脚石。

嗯,直接画了块大饼,意思是要实时模拟一个《地球Online》?
为了实现这个大饼,他们把路都规划好了:先搞定视觉(图像模型),再让图像动起来(视频模型),下一步搞定 3D 模型和实时渲染。
只能说,静候佳音好吧。
世超也看了下官网的演示,不得不说,不愧是专业美术生,模型能力先不谈,这片子的艺术风格可以说是碾压同行了。

现在,模型已经在Midjourney官网上线了,10美元的会员就可以体验,世超第一时间花血本体验了一下。
结果嘛,世超认为,没那么差,但也没那么好。
先来说好的部分吧。首先是,你可以永远相信Midjourney的审美。
因为是图像公司,所以这个视频模型现在只有图生视频功能。
但这,也发挥出了Midjourney最大的长处——生图。生出要的图,就可以直接拿过来生视频。
于是我让它航拍了一辆火车(先生图再生视频),来看看它的运镜效果。

与之相比,Veo3这边的先生图再生视频,虽然画面也不错,但是运镜保守了许多。。

不过也能理解,毕竟是生图领域大神,这么多年的积累也不是白做的。
Midjourney出视频的速度也算不错,在世超测试过程中,Veo3生成一轮视频的速度,Midjourney能生成3轮。
而且,不仅有速度,还有性价比。根据官网的公告,Midjourney一个视频任务的收费,大概是画一张图的 8 倍。但一个任务会出 4 个 5 秒的视频。
这么一算,生成一个视频的成本,其实和两张图差不多。这比市面上已有的产品,便宜了超过 25 倍。
这么看,Midjourney走的是性价比高、轻量化这条路。
诶,既然好看又便宜,那就多放两个。



停,可以到此为止了。相信有些细心的差友已经发现了:你这头发怎么乱飞啊?
这就说到Midjourney的缺陷了,世超可以用一句话概括——有点落伍了。
经常用视频模型的朋友都知道,在很久以前,视频模型比较难用,因为它经常不听话,还违背物理定律,反正生出来的画面怎么看都不太合理。
而这些缺点,很多视频模型已经优化得越来越好了,但到Midjourney的最新模型这边,我依然能看到这些缺点。
那就是说,它还没有能和第一梯队的模型竞争的能力,因为综合能力明显落后。
还是直接上实测吧。
我让Midjourney生成一个小男孩投篮的视频,它生成出来是这样的。

如果你常看篮球比赛、也打篮球,就会发现。。这投篮有种说不出的僵硬感。
如果你看不出来,你再对比一下Veo3生成的视频,同样的参考图,你就会感觉舒服多了。

肢体动作这块,可以说确实还有待提高。
到物理模拟这块,就只能用拉了来形容了。。
世超给了Veo3一张图和一段提示词,让它模拟轮船在大海上碰撞玻璃。

这场面,虽然感觉跟想象中有点差距,不过也算可以了。
但Midjourney这边。。

这房子质量有点好,完全屹立不倒,跟不存在一样。这一对比,差距一下就拉开了。。
更值得一提的是,这玩意支持的最高分辨率,目前只有480p。
要知道,现在很多人觉得1080p都不过瘾,这么低的分辨率,估计也只能看个乐呵了。。

只能说一分钱一分货,是永恒的真理。
当然,Midjourney这也算是首次进军视频界,做成这样也是可以理解的。。
但不管怎么样,效果也得提上来,不然就可能被同行卷死了。
其实,世超是很喜欢Midjourney这个公司的,不仅是因为他们独一档的审美,也因为他们理想主义的气质。
毕竟他们的宗旨是:AI不是现实世界的复刻,是人类想象力的延伸。
世超还是希望Midjourney越来越好的,早日完成他们的愿景,毕竟,如果他们真能搓个地球online出来,应该会比现实生活精彩多了。
撰文:不咕
编辑:江江 & 面线
美编:萱萱
图片、资料来源:
Midjourney、Veo3
