在全球 AI 竞赛进入“下半场”的关键节点,一家来自上海的 AI 独角兽公司—— MiniMax,用一场史无前例的“技术发布周”港联配资,宣告其在基座模型、多模态技术和通用智能体 Agent、视频 Agent 等领域的全面突破。
那么,在这场不断进击极限的赛道上,他们是如何率先冲破技术边界、跨越现有上限的?
一、开源 MiniMax-M1 重塑成本效益
当下,人们对 AI 的态度愈发务实,AI 竞赛的焦点逐渐从模型参数转向效率成本和落地能力的综合比拼。
美国斯坦福大学发布的《人工智能指数报告》(AI Index Report 2025)首次对推理成本进行了追踪,报告显示,推理成本在过去两年中降幅超过 280 倍。硬件层面,成本每年下降约 30%,而能效每年提升约 40%,成本效益显著提升。
近期,大规模混合架构推理模型 MiniMax M1 重磅开源,重塑成本效益,闭源模型的技术壁垒被开源力量快速消解。
MiniMax-M1 发布后在海外引起了开发者的广泛探讨:
社交平台 X 知名 AI 博主 MinChoi 评论称,MiniMax-M1 简直可以说集 Manus 、Deep Research、计算机技能和可爱于一体,随即他还展出了自己用 MiniMax-M1 做的 10 个有趣案例;美国知名科技媒体 VentureBeat 称为“正在搅动全球模型格局”,并成为当前开源体系下极具代表性的高性价比大模型;科技媒体 The Decoder 则将其性能对标 Google Gemini 2.5 Pro,进一步印证了 MiniMax 在全球技术版图上的崛起地位。
MiniMax M1 被誉为“全球首个开源大规模混合架构的推理模型”,其核心价值不仅在于多个生产力场景中比肩甚至超越顶尖闭源模型,更在于其极致的成本效益和技术创新,为 AI 的规模化应用提供了全新可能。
其独特的“闪电注意力”(Lightning Attention)混合架构与创新性的 CISPO 算法,在实现业内最高的 100 万上下文的输入与业内最长的 8 万 Token 的推理输出的同时,可以大幅提升计算效率。
技术报告显示,在进行 8 万 Token 深度推理时,所需算力仅为同赛道强手 DeepSeek R1 的约 30%,实现了性能与效率的完美统一。在最新的 Artificial Analysis Intelligence Index 榜单中,MiniMax M1 位列全球开源模型第二名。
更快的收敛意味着更少的训练时间和资源消耗。得益于 CISPO 算法的高效港联配资,M1 模型的整个强化学习阶段仅使用了 512 块英伟达 H800 GPU,耗时三周,成本仅为 53.5 万美元。
MiniMax 官方表示,这一成本“比最初的预期少了一个数量级”,足见其技术路线在成本控制上的巨大潜力。
二、Hailuo02: 突破物理极限 实现电影级 AI 视频创作
在 M1 搅动语言模型市场的同时,MiniMax 近期的另一款发布——新一代视频生成模型 Hailuo 02,则在多模态领域投下了一颗更具视觉冲击力的“炸弹”。
据介绍,这是目前全球唯一一个可以实现类似高复杂物理场景的视频大模型。一经发布,海外社交媒体上便充满了 Hailuo 02 生成的高难度动作视频,其中一个猫咪跳水的视频 5 小时就引得超过全球上亿人围观。
具体来说,Hailuo 02 的核心突破,在于其创新的 Noise-aware Compute Redistribution(NCR)架构,在将模型参数和训练数据量分别提升 3 倍和 4 倍的同时,实现了 2.5 倍的效率飞跃。
在国际权威测评榜单 Artificial Analysis 视频竞技场中,Hailuo-02 一经发布便迅速拿下全球第二的宝座,领先于 Google Veo3 和快手可灵(Kling)。
可以看出,最终呈现的效果是惊人的,原生 1080P 高清画质直接输出电影级的视频画面;极限复杂运动场景的实现体操运动员在空中连续翻转的流畅身姿、马戏演员喷火时火花与光影的逼真互动,轻松实现这些对时空一致性和物理逻辑性要求极高的场景。同时,受益于模型架构创新,海螺 02 模型官方价格显著低于 Runway、可灵等国内外同行,实现行业底价。
总结来说,Hailuo-02 在对物理世界规律的理解和表现上,已经实现了全球性的突破,更以“世界一流的效果”和“颠覆性的成本效益”,直接叫板 Veo3 等国际顶尖模型。
三、发布 MiniMax Agent “解放用户手脚”
如果说 M1 和 Hailuo-02 是 MiniMax 强大的“发动机”和“眼睛”,那么同步官宣的通用智能体产品—— MiniMax Agent,则是这家公司对“ AI 能力”的深刻思考和交付回答。
这个可以完成长程复杂任务(Long Horizon Complex Tasks)的通用智能体,不仅能多步规划出专家级解决方案、灵活拆解任务需求,还能执行多个子任务港联配资,从而交付最终结果。
比如面对“ Mag 7 投资组合双移动平均线策略收益率分析”这类需要大量信息搜集、筛选和验证的开放式任务,MiniMax Agent 能够活用多种工具,进行深度的网络研究,并最终给出精准、可靠的建议。
无论是做一套中学物理课件,还给《长安的荔枝》做一个剧情介绍网站,MiniMax Agent 所制作的 PPT 均是排版灵活、视觉美观,网页更像是文化机构做的宣传站点,甚至能用 3D 动态演示发动机的四个冲程,效果能直接用于教学。
“做一套中学物理课件,讲冲量和动量,要带动画演示”
“根据马伯庸小说《长安的荔枝》,做一个剧情介绍网站,风格设计自己定”
这些案例,仅仅是 MiniMax Agent 强大交付能力的冰山一角。
据悉,在 MiniMax 内部,该产品已经被使用了两个月,逐渐成为内部超过 50% 的员工日常使用的产品。
四、Hailuo Video Agent 开启“ Vibe Videoing ”创作时代
为了大幅降低视频创作门槛,让用户以自然语言输入即可一键生成专业级成片,MiniMax 推出了国内首个实现“成片直出”的视频创作智能体—— Hailuo Video Agent,开启“零门槛 Vibe Videoing ”创作时代,用户可以自动分析、构思并生成具有专业水准、富有观看价值的完整视频内容。
曾经奉行“规模至上”的 Scaling Law 教条正被多元创新路径瓦解。具体来说,MiniMax 在视频 Agent 中实现了以下技术创新:
自然语言驱动全局:抛弃传统工作流 + 节点的工具模式,通过 LLM 语言模型,AI 自动拆解任务并调用最佳工具链,创新性地支持用户在自然语言描述中构建完整视频,从而降低创作门槛、提升普通用户的创意空间。
全流程工具集:打造视频构思、资料收集、分镜制作、剪辑、配音等视频制作全流程工具集,并通过 Agent 模型在不同阶段实现自动调用,根据创作阶段智能匹配最优方案,从而 Agent 在自动化创作的同时保证视频质量。
创作过程可视化:通过 Agent 思维链实时展示 AI 工作逻辑,为自定义编辑提供可视窗口与操作空间。Agent 创作的透明化可操作窗口,让用户不仅可以有效监控 AI 创作流程,还能有效介入,实现可控的视频创作。
可以说,这款视频创作智能体不仅降低了用户创作门槛、保证视频的专业级质量,在更大程度地提升普通用户创作自由度的同时,可以让人与 AI 更好地进行双向协同。
据 MiniMax 透露,海螺视频 Agent 将通过三阶段进化,打开用户的创作自由度。目前已经实现第一阶段能力,第二阶段的视频 Agent 创作工具将于 2025 年夏季面世。
五、Voice design 上新
此外,MiniMax 同期发布的模型还包含语音模型 Speech 02 上的一个功能更新—— Voice Design 音色设计。
用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制,甚至生成世界上不存在的音色。还能与 Speech 02 语音模型在链路上相配合,用户在文字转语音中可真正实现“所需即所得”,以“任意语言 × 任意口音 × 任意音色”,实现可全自定义的无限组合。
实际上,早在今年 5 月中旬,语音模型 Speech-02 一经发布,即登顶国际权威语音评测榜单 Artificial Analysis,收获了全球用户的广泛肯定。Speech-01/02 两代模型已经帮助用户生成了累计超过 1.5 亿小时的语音,并与超过 30 个国家的客户实现了合作落地。
据悉,通过 Voice Design 的方式生成声音,解决了语音合成模型行业的两个挑战:精准匹配细分场景下的多样需求、无需复刻他人声音即可无风险实现脑海中音色表达。这将持续降低全球用户使用 AI 技术的门槛,让说各种语言的人都能感受到语音模型所带来的价值。
总结:一场“中国震撼”背后的自主创新之路
当我们回望那些闪耀于历史长河中的科技成果时会发现:真正伟大的不是某项具体发明本身,而是创造者们不懈追求卓越精神所带来的启示,影响深远的价值远超物质层面的成就。
从全球首个开源大规模混合架构推理模型 MiniMax-M1、到实现极致物理表现的视频模型 Hailuo-02、义“靠谱”生产力的 MiniMax Agent、国内首个成片创作助手 Hailuo Agent、再到音色设计 Voice Design,这一系列密集发布不仅是对其技术积累的集中展示,更是在这场全球 AI 竞赛中,为行业发展路径和竞争格局注入了全新的、颠覆性的变量。
技术的边界,从未是束缚的枷锁,而是激发挑战自我、突破极限的战场。
正如业内对 MiniMax 的评价,其创新之路为全球 AI 发展提供了第二条道路。MiniMax 没有选择跟随和模仿,而是坚定地走了“自主创新”这条更艰难的路。
从底层基础模型优化,到开创性的线性注意力混合架构,再到 CISPO 和 NCR 等算法与架构的持续迭代,MiniMax 的创新呈现出一种“环环相扣、层层递进”的良性循环。这种“倒逼出来的创新能力”,证明了通过算法和架构的深度优化,完全可以打破“算力 - 资本”的壁垒。
所有这些令人惊叹的突破都在提醒着我们一件事,没有绝对不可逾越的技术障碍 , 只有尚未被发掘出来的解决方案。
其开源策略更具深意。在全球 AI 巨头纷纷转向闭源以构建技术壁垒的当下,MiniMax 选择向世界开放其大语言模型的核心能力,彰显了中国新一代 AI 企业的技术自信和开放胸怀。
在 AI 文明向多极化演进的新开端,未来的技术史诗港联配资,将由东西方共同书写。
创通网提示:文章来自网络,不代表本站观点。