年入近 10 亿
两位中科大学霸创业 13 年
1976 年,黄伟出生于一个军人家庭,这使得他的性格坚毅果断、喜欢思考。
他与科大讯飞创始人刘庆峰同为中科大校友,晚三届入学,是刘庆峰师弟。1999 年刘庆峰创办科大讯飞时,黄伟仍在攻读学位。
中科大求学期间,黄伟硕士研究医学图像三维可视化,博士攻读语音方向,均属数字信号处理领域。这一从图像到语音的研究路径,为后来多模态大模型的兴起埋下伏笔。
博士毕业后,黄伟进入上海交大生物医学工程博士后流动站。2004 年,摩托罗拉与上海交大合作开展博士后项目,他加入摩托罗拉中国研究中心担任资深研究员。
金融危机期间,摩托罗拉将语音识别团队出售给 Nuance,黄伟拒绝被收编,于 2009 年加入盛大网络创新院,并于次年创建语音分院。
他带领的盛大语音团队曾获国际认可:2010 - 2011 年,在美国国家标准技术署(NIST)声纹识别评测(SRE)大赛中,团队力压麻省理工、斯坦福研究中心、IBM 等对手,在 9 个单项任务中斩获 5 项第一,综合指标位列榜首。
2011 年,黄伟的师弟梁家恩加入盛大语音分院担任高级研究员。
同年,搭载 Siri 的 iPhone 4s 问世,全球智能语音创业浪潮兴起。因盛大创新院战略调整,语音团队从创新院剥离至盛大掌门科技,黄伟与梁家恩于 2012 年共同创立云知声。
彼时,iPhone 4s 搭载 Siri 引发全球智能语音创业热潮,黄伟敏锐捕捉到智能语音作为人机交互入口的潜力。
云知声创始人 &CEO 黄伟,创业邦摄
2012 年 7 月,云知声成立并推出语音云平台。
创业初期,黄伟掏空积蓄并借款 200 万元。" 买房子贷款都没贷过这么多钱,但为了实现 AI 梦想,值得。" 他回忆道。
云知声定位人工智能底层技术与应用研发,技术演进紧跟行业趋势:从判别式 AI 的 1.0 阶段(语音识别、图像识别),到大模型崛起后的生成式 AI 2.0 阶段,每一步都与行业同频。
黄伟将人类需求总结为 " 快乐 " 与 " 健康 " 的二元命题:抖音、泡泡玛特满足情绪价值,医疗健康则承载生存刚需。基于此,团队在 2013 年便进军医疗 AI" 无人区 " ——尽管当时多数医院信息化基础薄弱,但提前布局暗合 " 抢占未来先机 " 的逻辑。
2014 年,云知声选定医疗、物联网(IOT)两大商业化场景,提出 " 云端芯一体化 " 战略。2018 年推出边缘交互式 AI 语音芯片 UniOne 系列,2023 年提供约 1300 万颗消费级 AI 语音芯片。
大模型领域,云知声 2016 年建立 Atlas 人工智能基础设施,2017 年推出基于 BERT 的大语言模型 UniCore,2023 年发布拥有 600 亿参数的自有大模型山海大模型。
据 Frost&Sullivan 数据,按 2024 年收入计,云知声是中国第四大 AI 解决方案提供商,在国内生活 AI 解决方案市场排名第三,医疗 AI 服务及解决方案市场排名第四。
截至 2024 年,客户数量达 576 家,覆盖华为、美的、格力、京东、北京协和医院、平安集团、吉利汽车等头部企业。
不靠人脉、构建 " 信任标杆 "
拿下中国顶尖医院客户
" 每个医生平均每天花三个小时来写病历,现在只需要一个小时。"
云知声通过 AI 语音 + 医疗,提升医生工作效率与医疗质量,同时降低医院运营成本。其服务涵盖智能导诊、医学影像辅助诊断及医保支付管理等多场景。
北京协和医院成为了云知声医疗领域首个客户,本质上是云知声希望在行业内形成 " 标杆效应 ",降低新客户的决策门槛。尤其是在 ToB 领域,灯塔客户的口碑是最直接的市场通行证。
黄伟认为,与中小客户合作,对行业理解容易相对片面,而锚定头部客户的需求更能直击行业终极命题——与协和医院合作使团队深入掌握临床体系与诊疗流程,快速积累行业经验。
这一策略凸显了 To B 与 To C 的核心差异:To C 依赖产品经理对人性的洞察,To B 则需严格遵循 " 客户需要什么就做什么 " 的逻辑。
早期,云知声凭借技术硬实力而非人脉资源打动协和医院。
" 你早期没有品牌优势、没有客户案例,你越找人,别人越觉得你没有实力,没有人敢合作。" 黄伟谈到。
2016 年,黄伟每日清晨 7 点参与协和医院晨会,与信息处、分管副院长及各科室负责人讨论信息化需求。" 医院不看学术指标,而是直接在病房测试,各种口音、专业术语都是考验。"
学术指标仅反映生产环境下的语音翻译准确率,而实际应用中,复杂环境(如嘈杂背景、方言口音)与医学专用名词会进一步降低识别准确率,对技术提出更高要求。
黄伟强调,技术落地需通过 " 自下而上 " 路径,让医生、科室主任等实际使用者从技术层面认可能力。
通常,To B 合作中,头部客户决策极为理性:技术需在复杂场景(嘈杂环境、方言口音、专业术语)中证明稳定性,产品必须直击临床痛点。
服务能力也是 To B 合作的核心支撑。
医院要求 7 × 24 小时即时响应,系统故障需短时间内解决,这对团队执行力与企业文化提出了更高要求。
招股书显示,2022 - 2024 年,云知声医疗业务收入分别为 1.1 亿元、1.5 亿元、2.0 亿元,占总收入比例从 18.9% 稳步提升至 21.2%。
其标准化产品模式依托 " 云端芯一体化 " 战略:将 AI 能力模块化,如同预制件搭积木,实现快速场景适配。
云知声在医疗赛道的优势源于 " 时间杠杆 " ——当同行仍在为医疗数据与行业认知的 " 鸡生蛋 " 困境挣扎时,团队已通过十年临床落地积累上百家医院信任资产。
然而,医疗业务并非易事。
云知声从 2013 - 2014 年启动战略规划,至 2016 年才实现产品落地,期间耗时两年多打磨产品:进行 PVC 测试、医院试用,直至医生将其视为工作刚需,在严肃临床场景中站稳脚跟。
这种扎根垂直领域的耐心与积累,是互联网巨头等平台型公司短期内难以复制的。
这种壁垒在大模型技术切换时尤为显著——老客户仅需从底层将 BERT 模型升级为山海大模型,即可完成产品迭代,省去了商务成本。
正如黄伟所言,当年在医院走廊抱着服务器调参数的坚持,最终实现了技术升级的 " 丝滑切换 ",而这份穿越周期的耐心,正是 AI 医疗赛道最稀缺的护城河。
把芯片当做 " 硬件 SDK"
即插即用降低客户门槛
物联网业务也同样遵循技术与需求匹配的逻辑。
2014 年云知声搭建 " 云 - 端 - 芯 " 产品体系,2018 年推出面向高低端市场的 AI 语音芯片 " 雨燕 "" 蜂鸟 " 并交付格力。
通过与格力合作,逐步拓展至奥克斯、TCL 等客户,2024 年芯片出货量达 3600 万颗且预计持续增长。
黄伟指出,物联网智能化需求不断演进:六七年前汽车尚未普及语音交互,如今 10 万元级车型已将其作为标配。
基于此,云知声将智能化能力延伸至汽车领域,客户涵盖奔驰、吉利、东风等。他类比触摸屏普及后用户习惯的变化,认为车内、家庭场景的自然语言交互需求将外溢至更多空间,如深圳地铁已实现语音购票。
云知声智能驾舱演示,创业邦摄
云知声智慧生活业务是营收主力,解决方案覆盖智能家居(语音控制家电)、车载语音(安全交互)、智慧交通(系统管理)、金融服务(业务提效)、物联网(设备互联)等领域。
招股书显示,2022 - 2024 年该业务收入分别为 4.9 亿元、5.8 亿元、7.4 亿元,占总收入比例超 78%,客户数量从 389 家增至 411 家,涵盖中国大型保险集团、深圳地铁 20 号线等。
云知声 AI 家居芯片模组,创业邦摄
构筑 " 一横一纵 "
开始向其他行业复制
据黄伟介绍,云知声的战略布局可概括为 " 一横一纵 "。
" 一横 " 覆盖消费电子、汽车、家居、酒店等物联网场景,输出通用人工智能能力,如同 " 高品质的水 " 满足多元需求——无论用户身份(教授、农民等)或地域(南北差异),只要不涉及专业问题,均可通过该能力服务千行百业。
" 一纵 " 聚焦医疗知识密集型场景,医学的高专业门槛(培养医生需 10 年以上)使其具备深度挖掘价值。
当前,云知声 AI 能力正从 " 医生助手 " 升级为 " 医生导师 ":早期类似 " 学生记录、老专家看病 ",如今通过山海大模型可在诊疗中实时提醒关键问题、减少漏诊误诊。例如西南某医院,大模型会在问诊时同步提示潜在风险。
值得一提的是,经过 2 年的发展,2024 年山海大模型的收入达到 7420 万元,客户已达 65 家。
黄伟指出," 一横一纵 " 两个战略方向承载着不同的技术与商业价值。
" 一横 " 重在广度——通过通用能力快速覆盖多场景;" 一纵 " 重在深度——以医疗为切入点挑战技术天花板。
医疗业务的核心并非收入规模,而是服务顶尖医院的数量与质量(如协和、友谊医院),这些医院丰富的医学知识库如同 " 医学图书馆 ",医生高频使用产品相当于积累数万名 " 模型训练师 ",这种 " 内化知识 " 模式比直接销售更具长期价值。
他强调,医疗的价值不仅在于技术突破,更在于 AI 辅助甚至超越人类医生的潜力——医生的每一次精准诊断都可能救命,这种社会价值远超收入或毛利的衡量。
目前,纵向的医疗能力已开始向其他知识密集型行业复制,如保险(协助医保局、保险公司审核费用清单)、法律(与国内大律所合作)。其中,保险领域已拓展六七个新客户,进入小规模深耕阶段;法律则是今年初步尝试。
未来,医疗场景仍将是云知声的重点,目标是做到全球技术领先;保险会继续巩固,法律则探索深化,逐步形成独立业务板块。
卖模型是伪命题
只卖基于大模型的产品和方案
过去 "Copy to China" 模式在互联网时代可行(如搜索引擎、电子支付可直接复制美国模式),但如今美国科技公司的商业模式需结合中国本土实际。
黄伟认为,团队既要借鉴国际经验,也要适应国情差异。
以医疗行业为例,业内常探讨 SaaS 模式,但医院普遍不接受。
云知声采用 " 接近 SaaS 的模式 " 应对:通过产品化、模块化收费(如按需组合 A、B、C 等功能模块,底层技术统一),灵活满足客户需求。他类比 " 做水 " ——无论客户将 " 水 " 制成矿泉水、果汁还是其他饮品,本质是提供底层能力,外界认为的 " 杂 " 并非核心问题。
这一模式支撑了云知声度过艰难时期:疫情期间项目制模式(依赖线下沟通、长周期交付)难以为继,标准化模块交付却让企业持续运营。
云知声的核心战略是 2014 年确定的 " 云端芯一体化 ":专注做产品而非项目,既能支持私有化部署(如医疗场景),也能适配公有云需求(如车载场景),满足差异化要求。
如今,DeepSeek 的爆发对行业而言有着多重意义。
在黄伟看来,首先证明中国本土团队的科技创新能力——百人规模团队可在技术上抗衡海外百亿美金投入的巨头;其次完成全民大模型科普,客户从被动接受转为主动寻求应用," 不用大模型就 out" 成为共识。
实际上,市场分层早已明确:
有 AI 能力的客户无需服务;没有 AI 能力的客户是核心目标;中间层客户尝试自建团队,用免费开源模型三个月后效果仅从 60 分提升至 75 分,远未达行业 95 分及格线,最终因成本高、场景适配差回归专业团队。
这种 " 自己干花 3000 万,外包花 1000 万 " 的成本对比,推动企业理性选择。
" 卖模型就是个伪命题。" 黄伟指出,有技术的企业早已用开源模型自建体系(DeepSeek 免费版性能超多数采购产品),没技术的企业即便拿到模型也难以驾驭。
因此,云知声从不卖模型,只卖基于山海大模型的产品和解决方案。
AI 创业者要忘掉博士标签
做一个真正商业组织的 CEO
常有人问黄伟 " 什么时候更难 ",他的回答是 " 明天更难 " ——创业的艰难是持续的,每一天都充满挑战。
他笑称,若早知创业如此辛苦,当初或许不会选择这条路。
但他强调,创业本质上需要理想主义:
若一开始就把路径规划得清晰周全,或许根本不该开始,因为创业本就是 " 九死一生 ";而一旦启动,就必须具备长期主义的心态,像张一鸣说的 " 延迟满足感 ",即便当下取得成绩,也需保持清醒,因为后续可能面临狂风暴雨。
而所谓乐观,不过是熬过明天的结果——不乐观,便撑不过当下。
他坦言自己原本性格谨慎,但军人家庭的成长背景赋予他骨子里的坚韧——遇到困难时,他总愿咬牙坚持。
黄伟的经验是,每一次克服困难的过程,不仅是解决问题,更会提升克服困难的能力,包括技术、手段和心力;随着能力提升,面对中等困难时再顶一顶就能解决,能力进一步提升,心态也更坚韧。
就像打怪升级,最初并未预料到创业会有这么多困难。
阶段性困难是企业的普遍挑战,但只要努力坚持,总会有朋友信任支持。这让黄伟相信," 每到绝处总能逢生 "。
他特别提醒,年轻创业者如今面临的挑战远超十年前,需避免 " 唯技术论 " ——博士学历、论文成果仅是起点,而非终点,应忘掉 " 博士 " 标签,真正以商业组织 CEO 的身份思考,将技术、产品、商业深度融合。
创业的征途上,孤独本是常态。许多心绪,如深海潜流,难与团队言说,更无法向外人道明,唯有独自沉淀,默然消化。
黄伟自有一套与自我和解的方式:泳池里的往返划水,是与水流对话,涤荡疲惫;偶尔沉浸于音乐的褶皱里,任旋律抚慰心神;或是独往古寺,在晨钟暮鼓中寻一份澄明;亦或与三五好友围坐,茶香袅袅间闲话家常。
这些细碎的瞬间,皆是他调整状态的隐秘出口。
最后,他感叹,创业本就是一场漫长的修行,需以全维度的能力去丈量征途。唯有不断走出安逸的樊篱,在千头万绪中寻得技术、商业与自我状态的微妙平衡,方能在时代的浪潮中,稳稳接住每一次挑战。
本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系 editor@cyzone.cn。
登录后才可以发布评论哦
打开小程序可以发布评论哦