用50万刀追平世界第一，MiniMax的新模型是怎么做到的？

发布时间：2025-06-19 05:02:19

本文作者：小古

图片来源：互联网

有一说一，最近国内的AI大模型圈，属实有点安静了。

先不谈大伙万众瞩目的DeepSeek-R2了，这玩意除了半真半假的爆料以外，没有一点动静。

去年打得你来我往的AI六小虎，今年好像也和小猫一样蔫了。

图片来源：互联网

虽说也有发布，但总的来说，确实没什么特别让人惊艳的产品，也没啥让人使用的欲望。。

但就在昨天凌晨，沉睡的小虎突然嚎了一声：MiniMax宣布，开源他们的首个推理模型MiniMax-M1。

图片来源：互联网

从跑分图来看，其他方面算是中规中矩。但MRCR这项测试，也就是上下文长度测试，似乎表现出了惊人的统治力，跟其他开源模型拉开了一大截，仅略逊于Gemini2.5Pro。。

而且据Minimax团队博客所说，强化学习阶段的算力成本仅有50多万美元。

又来个以小博大吗？有点意思。

世超也去下载了他们的技术报告看了一眼，给大家说说里面的亮点吧。

首先，MiniMax采用了一种叫“闪电注意力”的机制。其实也不算什么新机制，算一种传统注意力机制的优化版。简单来说就是让模型在处理数据时，需要读写的次数更少，因此大大提升了模型的效率，“闪电“这名字当然也是这么来的。

图片来源：互联网

其次，MiniMax-M1 的 RL 训练框架上也进行了创新。

我们经常在推理模型里看到“嗯”、“等等”、“啊哈”这样的词，咱感觉它们没啥用，但其实它们对模型训练来说非常重要。

但，一些旧的算法在训练过程中，也会觉得它们没用，所以很容易忽略它们。。

所以MiniMax提出了一种叫CISPO的新算法，解决方法是，稍微调低一点这些词的“影响力”，这样既能让 AI 学到关键的推理思路，又不会因为这些语气词而干扰整个训练过程。

从论文来看，这同样提高了模型的训练速度，打败了传统的GRPO、DAPO。

图片来源：互联网

世超也是上手体验了一波，总的来说，体验可以说还不错，有值得说道的地方。

先聊聊上下文吧，可能还有很多差友不知道跑分图中的MRCR( 4-needle )是什么意思。

图片来源：互联网

之前，我们要测试模型的上下文长度，使用的招数叫“大海捞针”。也就是往一本书的文本里塞一条特殊的信息，比如“差评前沿部牛大了”。

然后把这本书喂给AI，再问他差评前沿部是不是牛大了，用它的回答来看它是不是记住了这条信息。

但AI圈的内卷已经让这个测试不够用了，随之而来的是全新升级版——MRCR（Multi-Round Co-reference Resolution）。

图片来源：互联网

如果说前面那个叫大海捞针，那MRCR(4-needle)就是捞4根针，并研究出4根针各自的联系。

所以，这测试不仅考验它能不能在信息海洋里捞到针，还要看它能不能在捞针的时候不被冗余信息冲昏头脑，可以说是非常难了。

而MiniMax能把其它模型甩在身后，肯定也是有点东西的。

世超也简单做了个测试。我下载了个txt版本的电子书，赫尔曼·梅尔维尔的《白鲸记》，约20万个单词。然后在里面偷偷加了句话：世超吃了生蚝后掉进了泥里。

生蚝掉进了泥土里，原来这就是蚝喜欢泥

图片来源：互联网

然后我把书丢给MiniMax，并询问它我的问题，它的回答言简意赅。

图片来源：互联网

不错，有点水平。

而Gemini，则是精准说出了这句话所在的位置，第135章，而且速度也更快，甚至还识别出这句话是我自己加上去的，因为它说和上下文并无关联。。只能说不愧是第一名。

图片来源：互联网

但，我丢给DeepSeek，它说它根本读不完。。

图片来源：互联网

只能说上下文长度这块，MiniMax确实能算顶级。

当然，只有这个肯定不够。世超还在Arxiv上随便找了篇文章，专挑那种看不懂的、公式多的，差友有看得懂的也可以评论区交流。

图片来源：互联网

结果我发现，MiniMax可以作为科研狗的搬砖利器。

我把文献分别丢给MiniMax、DeepSeek、Gemini，让它们保留格式翻译文章。

图片来源：互联网

咱来看看MiniMax的结果：

图片来源：互联网

别的不说，这排版看起来就很清爽，英文被翻译成了中文，但公式的位置完全没变。甚至，还能把图附在翻译里。。

图片来源：互联网

虽然内容不是100%正确，但看了就让人心情愉悦，起码看文献的时候，窗口不用切来切去了。

DeepSeek这边，其实也还不错，但正文里的图片它就附不上来了。

图片来源：互联网

但Gemini这边，排版甚至有点灾难。。

图片来源：互联网

因此啊，以后大家读文献用MiniMax，应该又能提升一波效率了。

接着，咱来测下编程能力，我让它们做了一个模拟多米诺骨牌的html文件。要求也很简单：

点击并拖动鼠标可以在画布上创建一排多米诺骨牌。

松开鼠标后，最后一枚骨牌会被推倒，引发连锁反应。

点击屏幕底部的 "RESET" 按钮可以清空画布，重新开始。

咱先来看优等生的。Gemini直接大手一挥，做出来一个完美的程序。

图片来源：互联网

DeepSeek这边，UI还挺看着酷炫的。就是感觉，代码有点投机取巧了。。没有感受到碰撞，纯纯是让多米诺自己躺平的。。

图片来源：互联网

MiniMax这边，就纯粹不是多米诺了，这是给大哥大嫂磕了个响头。

图片来源：互联网

只能说编程这一块，还有进步空间啊。

从这次发布来看，MiniMax的确还在搞自己的新东西，前一阵还发了自己的声音模型，效果也很不错，有以假乱真之势，感兴趣的差友也可以去试试。

最后提一句，MiniMax在发布M1推理模型的同时，还宣布了为期五天的连更计划，也就是说，这周每天晚上都能享受到一款新模型。不知道大的还在不在后面？还真让人有点期待了。

撰文：不咕

编辑：江江&面线

美编：萱萱

图片、资料来源：

MiniMax、DeepSeek、Gemini、X

图片来源：互联网

本文转载自互联网，如有侵权，联系删除。

上一篇: 完全不虚皇马！皇马1-1新月半场数据：射门5-11，控球率45-55

下一篇: 马马杜-萨尔：蓝军和巴黎有很多相似之处，我们能与他们竞争

相关文章