快科技 7 月 3 日消息,据媒体报道,在官网和开源平台 GitHub 上,上海国产 AI 独角兽 MiniMax 抛出全球首个开源大规模混合架构推理模型—— MiniMax-M1。该模型在权威评测榜单已位列全球开源模型第二。M1 发布当天,MiniMax 创始人兼 CEO 闫俊杰在朋友圈写下:第一次感觉到大山不是不能翻越。
M1 一登场,即在权威评测榜单中位列全球开源模型第二,仅次于 5 月 28 日发布的 DeepSeek-R1-0528。不过从细分项来看,M1 在长文本处理、工具调用等方面形成碾压级优势。
M1 支持高达 100 万 token 的上下文输入能力,相当于可以一次性处理整部《三体》英文原著,这一性能达到 DeepSeek 同类模型的 8 倍,甚至可与谷歌最新闭源模型 Gemini2.5Pro 相媲美。更令人瞩目的是,在保持顶尖性能的同时,其强化学习阶段仅投入 53.5 万美元,远低于行业常规的千万级研发成本。
MiniMax 展现出惊人的研发速度和产品化能力。在 M1 发布后的短短四个工作日内,公司连续推出视频生成模型 Hailuo 02、通用智能体 MiniMax Agent、视频创作智能体 Hailuo Video Agent 以及音色设计工具 Voice Design 等多款创新产品,保持着令人瞩目的 " 日更 " 节奏。
这家扎根上海徐汇的 AI 企业始终保持着独特的技术路线。早在 2022 年底 ChatGPT 引发全球关注之前,MiniMax 就已布局通用人工智能 ( AGI ) 领域,并果断放弃当时主流的大模型稠密架构和传统注意力机制。在全球大模型研发企业普遍收缩的行业背景下,MiniMax 逆势坚持基础模型研发的战略选择,最终换来了这次具有里程碑意义的技术突破。
登录后才可以发布评论哦
打开小程序可以发布评论哦