
机器之心报道
编辑:张倩
一个猫咪跳水的视频,5 小时就引得上百万人围观,这是动物界的奥林匹克?

除了猫咪,参赛的还有羊驼、熊猫甚至长颈鹿……



当然,大家都知道这是 AI 做的,但相比之前,里面的 AI 痕迹已经没有那么明显了。要知道,以前让 AI 生成复杂运动,它们给出的结果大多是这样的:

这也是为什么,体操等复杂运动一直被视为视频 AI 模型的「图灵测试」。
这波「动物界奥林匹克」的热度是国内 AI 公司 Minimax 的新模型 ——「Hailuo 02」所带来的。本周三,该模型官宣上线。在官方发布的视频里,Minimax 给大家展示了新模型的生成的各项「杂技」,并表示,「艺术家们发现类似体操这种高度复杂的场景,Hailuo 02 是目前全球唯一一个可以做到的模型。」

当然,这个「全球唯一」还有待验证,但在大家发现它惊人的物理动作生成能力后,社交媒体上便充满了海螺 AI 生成的高难度动作视频。

这些视频的提示词并不复杂,我们找到了其中一个版本进行测试,效果还不错(不过要想得到完美结果,可能需要多次测试):

提示词:televised footage of a cat is doing an acrobatic dive into a swimming pool at the olympics, from a 10m high diving board, flips and spins
如果你想生成其他动物的视频,只需要替换提示词中的「cat」。
不过,有人提到,就跳水这个动作来说,阿里的通义万相 wan-2.1-t2v 也能做得很好,这是他在该模型 2 月份刚开源时测到的结果:

除了跳水,网友们还拿 Hailuo 02 测试了其他复杂运动,比如单双杠、艺术体操、跳高:

这个模型是怎么把复杂运动做这么好的?在官宣模型的文章中,Minimax 表示新模型使用了一种名叫「Noise-aware Compute Redistribution(NCR)」的架构,并公布了架构图:

看到这里,很多人可能会问,这些视频有什么用呢?这就不得不提最近在短视频平台上走红的各路 AI 视频 up 了。有人用一只橘猫,就能编出各种小短剧,比如把各种动物拐回家吃掉,偶尔一集不吃都能让观众觉得非常新鲜。这样的视频,甚至有人每天追更。

说到底,这些 AI 视频工具最广泛的用途就在于帮普通人实现创意。AI 视频工具功能越完善,能借助它们进行创作的人就越多,大家能看到的内容就越丰富。当然,相应地,观众对于「创意」的要求也就越高。
除了工具,在现阶段,提示词对于 AI 视频创作也很关键。如果大家有好玩的提示词,欢迎在评论区分享。