钛媒体 04-08
开源浪潮席卷全球,大模型亟需转型“商业化2.0”?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 第一新声,作者 | 琳玉

如果说 2024 年,我们见证了大模型从科技前沿走向大众视野,那么 2025 年,最明显的变化则是——开源逐渐成为行业趋势。

据不完全统计,仅今年 3 月至今,OpenAI、谷歌、Meta、英伟达、阿里、DeepSeek、智谱 AI、群核科技、阶跃星辰等全球 9 家科技巨头已密集发布超 10 款开源大模型。并且,开源模型性能不断突破,全球最大 AI 开源社区 Hugging Face 的模型榜单持续刷新……无论是科技巨头还是初创企业,都在加速拥抱开源。

但值得注意的是,当前市场中,闭源模式已在商业化上初显成效,甚至已有厂商在企业端收获了数亿元的订单,为何大模型巨头们仍要纷纷转向开源?开源之后,新的商业模式将如何演进?

" 开源派 " 加速开放," 闭源派 " 纷纷倒戈

实际上,早在去年大模型价格战、市场竞争进入白热化阶段后,关于大模型 " 开源 " 和 " 闭源 " 的交锋已经逐渐变得激烈。

" 闭源派 " 主张通过技术封闭实现商业变现、保护知识产权和确保服务质量。这种路径能够集中资源优化模型性能和安全性,避免技术泄露;而 " 开源派 " 则主张过开放模型代码、数据和算法,推动技术普惠、加速创新和构建协作生态。这种路径能够降低技术门槛,吸引全球开发者参与改进,并形成开发者社区,推动工具链和基础设施发展。

长期以来,闭源模式一直是商业化 AI 领域的主导范式,企业通过技术封闭实现商业变现、保障数据安全并维持竞争优势。然而,2025 年成为行业发展的关键转折点——随着 DeepSeek 等开源模型的崛起,全球 AI 行业迅速掀起了一场前所未有的 " 开源浪潮 "。

首先,开源阵营近期的开源速度和技术迭代节奏明显加快。

3 月初,在持续五天的 "DeepSeek 开源周 " 结束后,开源领域领跑者 DeepSeek 再次发布了 V3 模型的最新更新版本—— V3-0324 模型,在保持原有技术框架的基础上,V3-0324 模型针对性能、用户体验和实用性进行了优化。

而早在 DeepSeek 引发开源浪潮之前,美国科技巨头 Meta 一直是开源模型的领先玩家及重要奠基者。在 ChatGPT 问世仅 7 个多月后,Meta 就率先宣布开源 Llama 2,并且可免费商用。这也成为大模型发展的分水岭和开源模型社区的历史性时刻。

4 月 6 日,Meta 再次推出开源人工智能模型 Llama 4。据介绍,该模型目前有 Scout 和 Maverick 两个版本,是 Meta 迄今为止最先进的模型,也是同类产品中多模态性最强的模型。

在国内,中国互联网三巨头 BAT 之一的阿里,也是押注开源的典型代表。2022 年 11 月,阿里发布了中文 AI 大模型开源社区 " 魔搭 "(Model Scope)。2023 年 8 月,阿里云在 AI 模型社区魔搭 ModelScope 上开源 Qwen-7B 和 Qwen-7B-Chat,这是阿里首批开源的大语言模型,随后,阿里逐步扩大开源规模,并持续更新迭代,先后开源和更新了 Qwen-14B、Qwen2 系列、Qwen2.5-Omni 等数十个参数版本的模型。

相比于阿里,腾讯的开源之路虽然要滞后一些,但目前 " 混元大模型 " 也于去年开始,陆续开源了文生图、视频生成、多专家混合(MoE)和 3D 内容生成等多款大模型。

同时,受开源趋势的持续影响,近期,众多长期坚持闭源策略的企业也陆续宣布开源计划。

今年 2 月,一直坚持闭源的百度宣布文心一言于 4 月 1 日起免费,并将于 6 月 30 日正式开源;字节跳动方面,虽然核心模型豆包尚未开源,但团队近日开源了一项名为 COMET 的 MoE 架构优化技术,可将大模型训练效率提升 1.7 倍。论文显示,该技术已实际应用于字节的万卡集群训练,实现数百万 GPU 小时训练算力的节省。

在国际上,坚守闭源路线的 OpenAI,凭借 GPT 系列模型在商业 AI 领域占据主导地位,如今受开源冲击,其市场份额和行业影响力面临严峻挑战。

DeepSeek 发布以后,OpenAI CEO 山姆 · 奥特曼罕见松口,公开承认公司过去在开源策略上 " 站在了历史错误的一边 "。这一表态迅速引发连锁反应:今年 1 月,OpenAI" 试水 " 开源,向公众免费开放了轻量级推理模型 o3-Mini;4 月 1 日,公司再次宣布将在未来数月内发布一款 " 具备强大推理能力的开放权重(open-weight)模型 " 这将是 OpenAI 自 2019 年 GPT-2 以来的首个开源项目。

近期同样在开源方面迈出重要一步的还有英伟达。它们曾以闭源硬件和软件为主,构建了强大的生态系统。但 3 月 20 日,英伟达在 GTC 2025 大会上发布了全球第一个开源的人形机器人基础模型—— GROOTN1,这成为推动具身智能发展的重要力量,此后开发者可以直接使用这个模型来改造机器人。

AI 巨头们为何选择加速开源?

百度创始人李彦宏曾断言 " 开源大模型会越来越落后 "。当时的市场判断依据是,OpenAI 的闭源模式是黄金标准,开源并不便宜,且技术会越发落后。

但 DeepSeek 以开源模式实现技术突破和商业生态的双赢,使这些行业依据变得不那么奏效,也第一次令中国企业看到了开源模式的商业价值和影响力、看到了产业格局变化的可能性、看到了生态开放的冲击力。

随着开源从概念、尝试到如今成为巨头厂商们发展策略的必选项,其背后主要有双重驱动力:

一是技术发展趋势,二是市场需求。

从趋势来看,FutureLabs 专家胡延平指出,中国大模型开源的爆发源于四大驱动力,就像四股强大的浪潮,推动着开源的巨轮滚滚向前。

第一波浪潮是端侧智能崛起。如今,个人与企业对本地化 AI 部署的需求就像被点燃的火焰,越烧越旺。想象一下,你在自己的电脑上就能拥有一个智能助手,它能根据你的需求快速响应,无需依赖网络连接到遥远的云端服务器,是不是感觉超酷?这就是端侧智能的魅力。它的兴起,推动了模型轻量化与灵活性升级,就像给模型穿上了一件轻便的运动装,让它能够在各种设备上自由奔跑,发挥出最大的效能。

第二波浪潮是行业定制化需求。通用云端模型虽然强大,但就像一把万能钥匙,很难打开每一扇特定的锁。金融、医疗等领域有着严格的隐私要求和独特的场景化需求,通用模型很难满足这些 " 特殊客户 " 的需求。这时候,开源就像一把神奇的魔法棒,成为企业差异化竞争的 " 秘密武器 "。企业可以根据自身需求,对开源模型进行定制化开发,打造出专属于自己的 " 秘密武器 ",在激烈的市场竞争中脱颖而出。

第三波浪潮是生态化分工加速。头部企业就像技艺精湛的大厨,专注于基础模型研发,精心烹制出一道道美味的 " 基础模型大餐 "。而中小企业则像是各具特色的小吃摊主,基于开源模型构建细分应用,将这些 " 基础模型大餐 " 进行创意加工,变成各种美味的小吃,满足不同用户的口味需求。这样一来,就形成了 " 巨头搭台、百家唱戏 " 的热闹产业格局,整个 AI 生态系统变得更加丰富多样,充满活力。

第四波浪潮是技术跨越临界点。模型能力从 " 可用 " 迈向 " 高可用 ",就像一个孩子从蹒跚学步走向健步如飞。用户与应用进入爆发期,开源成为技术落地的 " 最短路径 "。当模型变得足够强大和好用时,人们迫不及待地想要将其应用到各个领域,而开源则为这种应用提供了最便捷的通道,让技术能够迅速地走进千家万户,为人们的生活带来改变。

总结来看,有三点因素将大模型企业推向了开源化:

一是技术民主化:从垄断到共创闭源模式曾是大厂建立技术壁垒的核心手段。例如,百度文心大模型长期闭源,通过 " 闭源 + 公有云 " 模式占据 B 端市场。但 DeepSeek 的开源证明,社区力量能够加速模型迭代——其开源模型 DeepSeek-R1 在发布后吸引了 3000 万月活用户,并推动接入企业数量激增。开源带来的不仅是代码共享,更是全球开发者的智慧聚合,这种 " 群体智能 " 让技术突破不再依赖单一团队。

二是成本与生态:开源降低准入门槛。大模型的训练成本动辄数千万美元,而开源模型允许企业复用基座,只需针对垂直场景微调。例如,医疗、法律等数据敏感的行业,可利用开源模型在本地部署,既保障隐私,又节省算力开支。阿里通义千问、腾讯混元等开源模型,正是通过降低技术门槛,吸引开发者构建应用生态,最终反哺核心业务。

三是政策与竞争:开源成国家战略。中国多地政府将开源写入人工智能发展规划。北京、上海、广东等地通过政策补贴、算力支持等措施,推动大模型开源生态建设。与此同时,国际巨头如 Meta(Llama 系列)、xAI(Grok)也加速开源布局,倒逼国产厂商加入这场 " 开放竞赛 "。

从需求来看,这场开源浪潮的终极价值分配中,真正的受益者还有生态链末端的开发者与中小企业——他们既是技术普惠最直接的受惠者,也将成为创新反哺的核心驱动力。

对开发者和中小企业而言,过去,构建 AI 模型需要巨额资金和技术积累,因此他们被迫成为市场的 " 追随者 "。开源大模型实际上改变了这样的游戏规则,通过降低技术门槛,让 AI 技术通过开源变得触手可及,开发者可以在此基础上快速迭代,将创意转化为现实。有数据显示,一家专注于电商服务的初创公司,利用通义千问开源模型开发企业的智能客服系统使成本降低了 80%、迭代周期缩短了一半、客户满意度大幅提升。

同时,开源模型也正在重塑各行各业。比如,过去受限于技术和资金短缺的基层医疗机构,如今借助开源方案成功部署了本地化病历分析系统。这些系统能快速解析患者病历数据,为医生诊断提供精准辅助,显著提升了基层医疗服务质量。这一突破不仅缩小了不同层级医疗机构的技术差距,更推动了基层医疗 AI 的普及。

开源 = 免费?商业化如何走通

开源模式给大模型的产业生态带来了很大的变化,这些影响在商业化方向上则表现为:市场可能认为开源免费的模型一定可以节省投入。

但实际上并非如此。

智谱 AI 张鹏曾在接受媒体采访时表示:" 历史经验表明,包括像 MySQL 也好,还有 RedHat,其实已经证明了开源并不等于完全免费,还有自己后期技术人员的投入、维护的成本,包括探索怎么把 DeepSeek 做本地化等等,成本一点都不低。当然未来的使用情况我们不知道,当前的情况是大家清醒过来了,开源免费并不等于真的免费,这件事情是大家有共识的。"

那么,在开源模式下,如何平衡技术普惠与商业回报?已经有部分领先的大模型厂商开始探索商业化 2.0 方案。

一是 " 开源基础模型 + 商业 API 增值服务 "

这种模式的核心逻辑是:开放基础模型权重吸引开发者生态,通过高性能 API 服务实现变现。比如,免费开源中等参数规模的基础模型,以供个人端和企业端的基础需求,而针对更高性能的闭源大模型接口、专属领域微调、企业级 SLA 保障等业务则提供付费的云端 API 服务。

典型案例是 DeepSeek 开源 DeepSeek-R1 基础模型,同时运营收费的 DeepSeek-V3 API 服务,其商业 API 的推理速度比开源版快 3 倍。根据测算,其日营收峰值达可达 56 万美元;智谱 AI 开源 ChatGLM3-6B,但企业客户需付费接入其 GLM-130B 商业 API,后者支持私有化部署和定制微调;

二是 " 开源社区版 + 企业专属版 "

这种模式的核心逻辑是:通过功能差异化的双版本策略实现分层变现。比如,社区版功能受限,可能仅支持基础推理和一定长度的上下文理解;企业版则包含量化加速、长文本支持、多模态等增值功能。

典型案例是阿里云千问开源 Qwen-72B 社区版,但企业需购买 Qwen-Max 获得 100 万 token 超长上下文、多模态图像理解能力和阿里云专属算力调度优化等服务;Red Hat 开源 Linux 社区版,但企业需要付费订阅 RHEL 才能获得安全补丁优先更新、专业级技术支持服务、硬件认证保障等。

三是 " 模型开源 + 云平台变现 "

这种模式的核心逻辑是:以开源模型为入口,引导用户使用关联云服务。比如,开源完整模型权重和训练代码,通过托管式模型服务、配套工具链、算力租赁等云服务实现变现。

典型案例是 Meta Llama 系列开源 Llama 3、Llama 4 模型,但企业需使用 Meta 云平台来获得托管式 API 端点服务、多模型编排管理工具、企业级数据加密管道等;Sealos 云原生平台开源核心代码,但客户使用其云服务可实现一键部署大模型实例、自动弹性扩缩容、跨云集群管理等增值服务。

综合来看,API 增值模式适用于技术领先型厂商、双版本模式适用于垂直领域深耕者、而云平台模式适用于本身包含云服务业务的厂商。大模型开源商业化的核心在于 " 开源引流,服务变现 ",通过生态共建、行业定制、云算力绑定等方式实现可持续盈利。

当前趋势显示,头部厂商正走向混合模式,企业要平衡开源趋势与商业变现,未来还需更多结合行业场景,通过 MaaS 模式增强商业化能力。

中国科学院院士梅宏曾表示,大语言模型在未来需要像互联网一样,走向开源,由全世界共同维护一个开放共享的基础模型,尽力保证其与人类知识的同步。否则,任何一个机构所掌控的基础模型都难以让其他机构用户放心地上传应用数据,也就很难产生足以满足各行各业业务需求的大量应用。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

浪潮 ai 开源 科技巨头 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论