钛媒体 6小时前
破解生命密码的AI,终于开源了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

中国工程院院士、之江实验室主任王坚

AI for Science(AI4S)再次迎来新突破。

最近,在杭州举办的 021 科学基础模型创新合作大会上,浙江之江实验室首次全面展示021 科学基础模型及系列领域科学模型研发的进展,包括全球首个百亿级人类基因组基础模型 Genos

021 模型构筑形成跨学科知识、跨领域推理、跨语言理解(覆盖 204 种语言)三大基石,具备出色的科学推理能力,能够深入分析、推导、验证多类科学问题。

"021" 就是 " 从 0 到 1",其中包含着之江实验室对科学基础模型的理解和发展规划。

在中国工程院院士、之江实验室主任王坚看来," 如果基础模型是人工智能的皇冠,那么科学基础模型就是人工智能皇冠上的明珠。"

之江实验室科学模型总体部技术总师薛贵荣认为,科学数据涵盖时间、空间、能量等多个维度,是对复杂物理系统演变规律的高维表征。为解决科学问题,科学界需要突破语言空间的局限,研发科学基础模型,构建 " 科学空间 + 语言空间 " 于一体的更高维空间,建立跨学科数据之间的深层连接,变革科学研究范式。

为此,之江实验室研发团队探索将科学数据和文本语料编码到统一的高维空间,让模型能够识别、处理科学数据,认识并解决复杂科学问题。经过近万次实验,团队形成了模型训练框架,包括预训练、后训练、强化学习等,并完成了 2360 亿参数规模的 021 科学基础模型训练。

021,不仅是 "zero to one" 的简写,也是 AI 正在从辅助科研转向重构科研的符号。

在 AI4S 的道路上,之江实验室通过与科学合作伙伴共同举办 " 种子班 " 来培养团队,让不同学科背景的人才聚集在一起,由专家级班主任带领,共同碰撞创新,在实战中完善、升级。截至目前,之江实验室已累计举办 22 期种子班,培育了 900 余名紧缺型 AI 人才。

图片来源:之江实验室

这并不是 021 模型第一次落地,在本月正式发布前,其在诸多科学领域已有成果展示。

其中引人关注的,是生命科学领域的全球首个百亿级人类基因组基础模型 Genos

10 月 23 日,之江实验室与华大生命科学研究院在第二十届国际基因组学大会上联合发布并开源了这款大模型。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

Genos 整合了人类泛基因组参考联盟(HPRC)和人类基因组结构变异图谱计划(HGSVC)等资源,基于 636 个 " 端粒到端粒 " 级别高质量人类基因组数据进行训练,覆盖全球不同人群。

Genos 模型采用混合专家(MoE)架构,通过 " 按需激活 " 机制降低推理成本,在致病性突变解读任务中准确率达 92%,结合科学基础模型后提升至 98.3%。它提供 12 亿和 100 亿参数两个版本,已在 GitHub、Hugging Face 及魔搭等平台开源,并集成至 DCS Cloud 云平台提供免费推理服务。 

在地学领域,之江实验室向全球开源了地球科学大模型 GeoGPT。

该模型基于 021 科学基础模型研发,目前已进行了数次迭代,支持图像描述总结、图像信息提取、地理空间推理、地学分析推理等典型任务,通过融合深时地球数据与智能算法,提升地学研究效率。

同时受到瞩目的,还有之江实验室联合中国科学院国家天文台研发的天文领域科学大模型 OneAstronomy

该模型同样基于 021 基础模型打造,能够实现跨模态融合推理,重构数据处理范式,释放望远镜自主观测潜力,推动实现 " 观测即发现 ",今年 9 月被列为全球科技公共产品,服务于开放科学行动。

此外,在材料学领域,021 打造出了多孔合金材料模型 OnePorous,可根据材料性能需求,逆向生成新型多孔结构,目前已应用于 3D 打印卫星主体结构制造。

事实上,自去年诺贝尔化学奖和物理学奖,均授予了与 AI 密切相关的研究者后,AI4S 就已被普遍认为是 AI 大模型的又一进阶之路。

各大高校和科研院所对 AI4S 探索步伐加速的同时,政策也在持续加码。其中引人关注的是,今年 11 月,美国总统特朗普还曾签署行政令启动 AI" 创世纪计划 "。该计划试图利用人工智能变革科学研究方式、加速科学发现,生物技术、关键材料、先进制造业等均是重点领域。

不止于学术界,包括谷歌、微软、Meta 等全球科技巨头,也在这一领域进行了重点布局。其中,谷歌 DeepMind 的 Alpha 系列大模型一直被视为领军者,该模型近年来在蛋白质结构预测方面的突出表现,已成为了 AI4S 的典型案例。

不过,目前大模型对科研领域的助力,覆盖范围还有所局限。在这一方向上,人才、科学数据的搜集整合、不同前沿学科的交融等问题亟待解决,并且极度缺少既往成功经验和案例可参考。某种程度上,这更凸显了打造新的基础科学大模型的重要性,这也正是 021 科学基础模型被开发及面世的意义。(作者|胡珈萌,编辑|李程程)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 开源 王坚 科研 科学研究
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论