开栏语
大模型正从技术竞逐的 " 实验室 " 加速奔向产业落地的 " 深水区 "。在这波浪潮中,一些先行者以敏锐的洞察力与破局勇气,率先探索技术与场景的融合边界——他们是打破算力桎梏的开源先锋,是深耕垂直领域的场景拓荒者,是构建生态协同的产业布道者。
聚焦大模型应用落地的 " 最后一公里 ",我们对话以技术为矛、以场景为盾的探索者,试图勾勒出一幅大模型赋能千行百业的 " 清明上河图 ",为行业提供可复用的方法论,也为中国 AI 产业的全球化突围注入信心与动能。
(策划:郭荣村、李少婷)
义乌小商品城外贸出海成风,不懂英语的店员对着海外直播平台热情阐述,大模型帮他们将订单统统揽下,这离不开 AI(人工智能)翻译的功劳。
在大模型重塑千行万业的浪潮中,传统翻译已发展成为集语言理解、知识处理、文化适配于一体的综合性智能服务体系。换句话说,翻译不再是被动接受技术赋能的领域,而是主动引领大模型产业变革的前沿试验场。
但热潮的另一面,是智能语言服务行业静默的变革——机器翻译增多,人类译员的工作并没有随之减少,然而单价出现下降;订单量的增长与盈利能力的滞涨构成悖论。在这场人机博弈中,终极胜负手或许就藏在未被算法吞噬的认知褶皱与知识基因之间。
近日,《每日经济新闻》记者专访了国家专精特新 " 小巨人 " 企业——传神语联网网络科技股份有限公司(以下简称传神语联)创始人何恩培。
当前,大模型的竞争已迈入第三年,新的玩家突出重围,座次又生变化。何恩培认为,此时谈定局为时尚早,大模型还远未成熟,当前更像是 1920 年的电气时代,基础技术已经诞生,但五花八门的应用尚未被发掘。
在他看来,智能语言服务行业正在从 " 单纯的语言转换 " 转向 " 知识理解与应用 "。趋势之下,传神语联选择 " 后撤一步 ",提供服务于行业的底层技术和工具。而在面向应用提供服务的过程中,他们意识到," 大数据 " 并不适用,质量更重于数量。
人机博弈:订单贬值,发力底层
技术发展的脚步越快,各行各业面临的拷问就越相似——人工智能会取代我们吗?
在这场关乎生存的讨论中,智能语言服务行业是最早被卷入的领域之一。早在大模型热潮来临之前,机器翻译就在不断进化,逐步蚕食着人工翻译的生存空间。
这种焦虑也冲击着客户的预期:如果机器翻译能做到 " 基本能看懂 ",为什么还要支付高昂的翻译费用?
生成式 AI 席卷而来,人工翻译会成为最先被取代的职业吗?
" 我可以给大家一个结论:翻译可能是人类和机器博弈中最后消亡的行业。" 何恩培笃信,语言不仅仅是沟通工具,也是人类思考的 " 操作系统 ",是一个复杂而动态的体系,机器需要通过自然语言来理解世界。
但在这场人类与机器的 " 博弈 " 中,智能语言服务行业呈现出一个值得探究的信号:订单增长幅度显著高于收入增长。何恩培抛出这样一组数据:2024 年,传神语联的智能语言服务收入增长了 10%,但订单量增长了 30%。
表面上看,这是一个乐观的信号,订单量增长说明市场需求仍然旺盛,但订单的碎片化趋势正在重塑行业——过去,一个翻译订单可能价值不菲,现在订单金额却越来越小," 因为客户自己能‘看懂’了 "。
机器翻译的普及使得语言不再是障碍,提供智能语言服务也不再是一项 " 从头到尾 " 的工作,而成为一种 " 修订和优化 " 的服务。客户的需求变得更加精准。同时,客户对人工翻译的付费意愿也在下降。既然机器能做到 95% 的准确率,为什么还要收这么多钱?
然而,何恩培认为,知识型产品具有一个显著特征,即使机器翻译的准确率高达 95%,但只要还需要人工从头至尾审阅,以识别那 5% 的误差,处理速度就会回落至人工水平。
人与机器的博弈最终带来了企业间的博弈。客户普遍认为,机器进行初步翻译,仅需稍作修改即可,进而付费意愿降低;而为了获客,智能语言服务企业选择压低价格,而成本端唯一的对冲方式,是不得不在部分场景中使用机器翻译;机器不可避免地抢走了一部分市场,而人类译员的工作量减少,但单价也随之下滑。
博弈中,传神语联选择 " 后撤一步 "。何恩培解释,过去,智能语言服务公司直接服务于终端客户,但未来,传神要做的是 " 赋能 ",让合作伙伴,比如翻译公司、中介机构,去覆盖直接的语言需求,而传神为他们提供底层技术和工具。
这一策略背后的核心逻辑是智能语言服务行业,正在从 " 单纯的语言转换 " 转向 " 知识理解与应用 "。" 传统翻译的总量并没有减少,而是产品形态发生了变化。" 何恩培说," 客户需要的,不再是简单的文本转换,而是一整套基于大模型的知识处理能力。"
数据不是越多越好:质量决定价值
出海,早已成为各家科技企业绕不开的话题。何恩培认为,对于中国企业而言,AI 出海的真正挑战不仅是语言问题,而是帮助企业在新的市场环境中实现知识迁移和业务落地。
" 他们关心的是能不能听‘懂’。" 何恩培认为,理想的场景是,大模型成为一个知识转换与传递的工具,但现实总比理想复杂。今天的大模型在语言覆盖上仍存在很大局限,尤其是对于非英语市场,数据的训练深度和准确性仍不足以支撑高质量的业务应用。" 每家企业的现有数据都很重要,因为企业是依据自身特色出海。"
企业高质量数据的稀缺,导致大模型在解决客户的深度问题上还没有呈现出绝对优势。" 我认为(当下)距离大模型真正解决客户问题还有一段路要走。" 何恩培表示。
" 过去企业把记录和数据混在一起,他们认为工单、硬盘(上的内容)也是数据,但这只能叫记录和资料。" 他指出,数据的价值并不在于存量,而在于其系统化以及可被机器学习和推理的程度。
在人工智能发展初期,行业普遍追求 " 大数据 " ——投入数量庞大的数据进行训练,以换取更强大的模型能力。然而,当大模型逐渐成为基础设施时,数据的 " 质量 " 将比 " 数量 " 更重要。
在何恩培看来,数据、参数和算法并非孤立存在,而是一种动态平衡关系;数据和参数规模在一定范围内能带来性能增长,但算法创新才是突破 " 天花板 " 的关键。
早期开发翻译软件时,何恩培已经体会到数据和规则规模的边际效应。" 当我们设定了 1.5 万条翻译规则时,效果非常好。但当规则规模扩展到 2 万条(时),(效果)反而变差了。" 原因很简单,数据之间、规则之间存在冲突,统计概率的关系也可能产生矛盾——换句话说,数据或参数在某个阶段的增加确实能带来提升,但当增长到一定程度,如果算法不突破,模型的质量反而会下降。
数据问题是传神语联提出 " 数推分离 " 架构的核心原因。何恩培回忆,最早在 2021 年,传神语联为法律行业开发了一套 AI 系统,能够学习过去十年的法律案例。然而客户很快提出了一个关键问题:新产生的数据怎么办,还要重新训练一次吗?
这促使他们开始思考:如果数据和推理能够分离,AI 系统就可以在不依赖大规模训练的情况下,实现自我学习和进化。" 我们不需要把所有数据压缩到神经网络里,而是让推理大脑保持轻量化,同时支持实时学习。" 何恩培解释道,这种架构不仅降低了模型的计算成本,还提高了适应性,使其能够在动态环境中不断优化自身。
DeepSeek 热潮后,知名投资人朱啸虎曾提出,以后给数据打标签的(工作)都需要博士生来做。何恩培认同这个观点:" 我们现在在处理数据时,很多时候已经是博士生在做了。" 在当下的人工智能热潮中,数据的价值并不取决于它的数量,而取决于质量,以及隐藏在其中的知识密度。
他举例,如果一名律师在过去十年处理过 500 个案件,他的大脑中就沉淀了丰富的专业经验。当有人请教他相关的问题时,他不需要拿出所有的案卷逐条翻阅,而是可以直接给出综合判断和方法论,这位律师的大脑就是一个 " 行业大模型 ",其价值在于知识的提炼,而不是原始数据的堆积。
何恩培认为,AI 的未来,也将走向这样的方向。企业往往不愿意分享自己的高价值数据,因为数据往往涉及核心业务和商业秘密,但这并不意味着数据无法转化为价值:" 数据可以不外流,但由数据训练出的智能是可以共享的。"
谈定局为时尚早:大模型还远未成熟
" 回看我们的成长路径,从最早的 2.1B 模型,到现在的 9B,我们从未在参数规模上盲目堆砌,也从未在算力上无止境投入。" 何恩培表示,这并不是因为资源不足,而是因为公司始终认为,这是一条更有效的技术路线。
在他的观点中,衡量大模型价值的核心指标并非参数规模,而是能否真正解决客户的问题。这种路径在行业内也带来了一定的认知挑战,销售和前端团队有时会遇到客户的疑问:模型参数还不到 100 亿,算得上是大模型吗?" 但当客户真正使用后,他们就会明白,关键不在参数,而在效果。"
在当下的科技语境中," 国产 "" 根技术 ""0 到 1" 已然成为热词,但在何恩培眼中,这些概念的边界远比市场讨论的更加复杂。
何恩培认为,根技术是产品和应用最基础的底层能力,它可以是自己研发的,也可以是基于开源的,甚至是通过授权获得的。但无论如何," 我们掌握了这项技术,这项技术也属于根技术,掌握了根技术,至少代表我们自己有了一定的主动性 "。而 "(从)0 到 1 的技术 " 则等于是某项应用发明,它既可以在应用层,也可以在根层。
在他看来,AI 的未来竞争,不仅仅是参数规模的竞赛,而是底层技术框架的竞争,未来人工智能会衍生出无数的行业专用模型,而这些模型的底层架构将决定它们的智能边界。
" 根原创 " 是何恩培提出的概念,他认为这是根技术当中最有生命力的一部分," 你只有在‘根’上创新,才能真正拥有自己的技术思想。" 何恩培强调,技术体系是带有思想性的,如果所有的技术来源都依赖于外部的开源框架,就很难摆脱既有框架的思想束缚。而当企业在根技术层面拥有自主权时,它不仅能摆脱对外部技术的依赖,还能决定自身技术演进的方向,这才是最有创新价值的部分。
在商业层面,大模型竞赛迈入第三年,关于大模型的商业模式、技术最终是不是应该是免费的,在行业内越来越被关注。过去,许多科技公司的商业模式都是先 " 烧钱做免费 ",再通过其他方式盈利。例如,搜索引擎免费,但靠广告赚钱;手游免费,但靠道具收费。
然而,大模型的情况似乎更为复杂。何恩培的核心观点是:To B(企业级)市场的 AI 服务,不可能是免费的。" 企业使用 AI 的核心目的是解决业务问题,而解决问题就一定会有成本。" 他说," 只是说在竞争中把成本降到最低,一定不会免费。因为(一旦)免费,它就缺乏了这项技术持续运转的能力,这由技术的稀缺性和商业模式共同决定。"
何恩培认为,今天的大模型远远没有成熟,市场格局还未定型,现在讨论最终格局为时尚早。
当前更像是 1920 年的电气时代,电力技术已经成熟,但没人能想到后面还有那么多家电、设备会被发明出来。一方面,今天的大模型很多问题尚未解决,不可能像一个成熟产品一样占领所有领域;另一方面,当前市场竞争依旧集中在通用大模型方面,但垂直场景中的模型尚未爆发。" 也许未来可能有一万个 AlphaFold 在不同行业,这才(会)形成大模型的完整生态。" 何恩培说。
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦