全球顶刊独家合作+300人专家团！拆解阿里健康氢离子的循证实践？

5 月 13 日，阿里健康在发布会上宣布旗下医疗 AI 产品氢离子与拥有多本全球医学顶刊的英国 BMJ 集团（BMJ Group）达成期刊内容独家合作，并发布了其四层循证 AI 结构的产品逻辑，这一发布引发了行业内的广泛关注。

在场的行业人士深知这条新闻的价值——医学 AI 一直存在的供给和需求的错位，在此刻正被氢离子填平。

阿里健康董事会主席兼首席执行官沈涤凡先生做大会致辞

医疗 AI 核心痛点是幻觉，不是不够聪明

AI 幻觉是目前技术架构下大模型无法绕开的问题，统计数据显示出当前医学大模型 AI 幻觉的潜在风险，部分 AI 平台生成的医学参考文献中超三分之一系伪造，增加了验证的难度。

那些频繁刷榜的顶尖大模型同样面临这一挑战。纽约西奈山伊坎医学院在 2025 年曾对当时 6 款主流大模型进行测试，发现这些顶尖大模型在缺乏防护条件时幻觉率高达 50%-83% 之多。

事实上，这些 AI 并不是不够 " 聪明 "，相反，它们似乎太过 " 聪明 "，甚至不愿意承认自己的无知。

在这种背景下，你很难指望医生对医疗大模型 AI 有好感。毕竟，对于容错率极低的医疗场景，AI 的一次 " 一本正经的胡说八道 " 对医生可能就意味着职业生命的终结，对患者更是影响重大。

行业也逐渐意识到，评测榜单只是一方面，仅具备应试能力的模型并不能完全解决医疗健康的行业痛点。医疗行业真正缺的是每一句话都能经得起循证推敲的工具。这也凸显了在临床广泛应用之前开展更大规模前瞻性试验的必要性。毕竟，如果循证体系没跟上，技术跑得越快则隐患越大。

大洋彼岸的 OpenEvidence 率先找到一个破局点。通过 AI 提供证据支持 + 思路拓展，让医生从繁重而耗费精力的循证过程中解放出来。

从短期内覆盖 40% 美国医生群体的效果来看，OpenEvidence 这种从数据源头到结论输出的全链路信任体系显然得到了医生的认可。资本市场也迅速做出反应——在 2025 年到 2026 年短短一年时间内，OpenEvidence 连续完成三轮融资，融资总金额超过 5 亿美元。其估值也在一年内飙升 12 倍，达到 120 亿美元，堪称近年医疗行业资本市场的奇迹。

国内市场也迅速跟进，多款对标 OpenEvidence 的产品如雨后春笋般冒出。当然，同质化竞争也接踵而至。接入一个通用大模型底座，挂载一个医学文献库，包装一个问答界面，这样速成的产品就可以自称中国版 OpenEvidence？医疗 AI 的壁垒又究竟在哪里？

国内首次，全球医学顶刊独家合作

在经历了几个月悄无声息的打磨迭代后，阿里健康在 5 月 13 日正式发布了氢离子，给出了自己的答案，即把 " 靠谱 " 做到极致。然而，做到极致，在任何领域从来都不是一件容易的事，这背后是一套精密设计、环环相扣的系统工程，需要庞大的资源支撑。

所谓靠谱，最重要的一步，无疑是解决国内医生面临的循证医学知识获取难的痛点。

全球最前沿的医学研究正爆炸性产出，每 73 天全球医学知识就会翻一番。但文献分散、语言障碍、付费门槛高等问题使得我国医生获取这些顶尖医学循证证据的通道并不通畅。数据显示，国内高达 76% 的医生在获取顶刊文献时面临困难。

BMJ 集团旗下 70 本医学期刊将独家授权提供给 " 氢离子 "

阿里健康通过与英国 BMJ 集团（BMJ Group）达成期刊内容独家合作，从而获得了 BMJ 集团旗下 70 本医学期刊过往十年里发表内容和多媒体资源的独家授权。氢离子也因此成为 BMJ 集团在中国独家合作的医疗大模型 AI 平台。

从此，国内医生可以通过氢离子直连全球顶级医学文献，进行循证问答、全文阅读、在线翻译，解决临床与科研过程中的医学问题。

这是一件颇为困难的事，不仅需要强大的资源投入，也需要满足全球医学顶刊相当苛刻的合作条件。在阿里健康之前，鲜有国内机构成功达成类似的合作。阿里健康董事会主席兼首席执行官沈涤凡在发布会上也坦承了合作的不易。

BMJ 集团最终选择阿里健康，显然也是对阿里健康严谨态度的认可。BMJ 集团出版业务首席执行官 Niels Peter Thomas 博士更是认为此次合作将是 BMJ 集团突破传统知识获取方式的一次创新。

事实上，要达成此等合作，可能也只有阿里健康这样量级的企业可以实现。从这个角度而言，阿里健康也展现了自身作为国内头部企业的担当，为中国医生带来了显著的效率提升。

在此之前，阿里健康已与中华医学会、人民卫生出版社、中国抗癌协会（CACA）等国内权威学术机构达成深度合作。另据透露，阿里健康还正与全球多家顶刊进行合作沟通。

氢离子透露正与全球多家顶刊进行合作沟通

随着算法的持续优化，氢离子也将吸引更多医生使用，产生更多反馈，这些反馈的反哺又将生成更精准的算法，这个正向 " 飞轮 " 一旦开始，就将进一步扩大氢离子的优势，后来者的追赶成本呈指数级上升，壁垒也就此确立。

不难发现，真正的医疗 AI 护城河，在于是否建成了 " 证据理解 - 精准检索 - 模型强化 - 专家评测 " 的闭环能力。这才是当下医疗 AI 同质化竞争中难以复制的差异点。

氢离子的核心壁垒，四层循证 AI 架构

在发布会上，阿里健康 CTO 王祥志揭秘了氢离子的核心壁垒。这是一套建立在 PICO 框架（人群 - 干预 - 对照 - 结局）和 GRADE 标准之上的四层循证 AI 架构，完成了 " 证据理解 - 精准检索 - 模型强化 - 专家评测 " 的闭环，也是有别于其他通用大模型的底层技术逻辑。

氢离子发布 " 四层循证 AI 架构 "

第一层证据理解与内容体系，使得所有指南和文献在进入系统时，都会基于 PICO 框架和 GRADE 标准进行结构化理解。包括人群特征、干预手段、对照方案和临床结局等被逐一拆解，证据质量等级也将被系统评估。

第二层基于 PICO 的检索与数据增强，保证输出的每一句话都有据可查。当医生提出一个临床问题时，氢离子并不会简单地匹配关键词。它采用的 RAG 架构将 PICO 检索模式融入全流程，先把医生的问题解析为 PICO 四要素，再基于这一结构在千万级医学文献和数万部临床指南中进行证据检索。

第三层模型强化与微调。让模型学会 " 什么是准确、忠实循证、安全有用的答案 "，并确保满足循证医学的严格标准。氢离子在这里部署了双机制驱动：通过 Reward 模型让模型理解好答案的标准，再通过 Rubrics 评分体系确保每个回答满足循证医学的严格标准。

这是一个模型持续优化的过程。在这个过程中，准确率与幻觉率将被设为模型迭代的核心优化目标。

第四层，则是医学专家评审体系完成质量闭环。氢离子设立了 AI 医学专家委员会，总规模超过 300 人。这套机制在业内极为罕见，其价值不在于人数，而在于它形成了一个可持续运转的系统。氢离子构建了 " 顾问 - 指导委员会 - 评测组 " 的三层的专家委员会架构，并建立了明确的产品迭代反馈机制，专家的反馈将直接驱动前三层（数据层、检索层、模型层）的持续优化。

这四层体系，从理解到检索，从训练到评审，形成了一个完整的循证 AI 闭环，从而让每一个回答都可追溯、可验证、可信赖。事实上，单论每一层体验，或许都可以被复制，但由此形成的完整循证 AI 闭环，构建难度极大。

每一次功能增加，都是对医生需求的精准回应

" 靠谱 " 是底线。但如果产品的体验不好，也很难满足挑剔的医生。

为此，氢离子自内测以来产品已新上线了多项功能，快速迭代。

以 1 月更新 " 动态证据定位 " 功能为例，AI 在对临床 / 科研提问的进行智能回复的同时，不仅提供引证原文，还将信息颗粒度由 " 段落级 " 提升为 " 逻辑级 "，精准呈现其原始文献中直接支撑该观点的具体语句，而非整段文本。

后续氢离子又正式上线了多轮问答功能、多模态等功能。

在人机界面上，氢离子将循证问答、智能检索、在线阅读整合进一个界面，覆盖了 " 问答 - 检索 - 循证 - 研读 " 的完整工作流。这一整合设计解决了国内医生在多个医疗 App 之间切换的场景痛点。同时，它还内嵌中英对照翻译、AI 文献总结与一键溯源、自然语言搜索等能力。

过去两年，越来越多的医疗 AI 产品开始真正站在医生的角度去思考——他们究竟需要一个什么样的 AI？

氢离子的答案很简单：极致靠谱，让医生 " 敢用 "；提升体验，让医生 " 爱用 "

极致靠谱，靠的是国际顶刊的独家合作，从 PICO 结构化理解到 GRADE 证据分级、从 RAG 检索增强到 300+ 人专家评测的四层循证闭环。每一个回答都锚定权威证据，每一句话都可逐字溯源。

全球医学 AI 正经历从 " 通用智能 " 向 " 循证可信 " 的范式转移，中国市场也正处于布局阶段，方兴未艾。凭借高质量证据与强制溯源机制的组织，医学 AI 有望从信息检索工具升级为医生的 " 循证第二大脑 "。在这场竞争中，比拼的是谁对医学本质的理解更深刻。

在这条赛道上，氢离子正一路狂奔。

宙世代

一起剪

相关标签