作者 | 程茜
编辑 | 心缘
智东西 10 月 24 日报道,今天,2024 科大讯飞全球 1024 开发者节上,科大讯飞星火大模型再次重磅升级,星火 4.0 Turbo 多项能力全面超过 GPT-4 Turbo。
讯飞星火大模型 4.0 Turbo 在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力七大能力中全面超过 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o,星火 4.0 Turbo 效率相对提升 50%。
此外科大讯飞还首发了星火超拟人数字人、星火多语言大模型、汽车端侧星火大模型。面向医疗、教育、工业等场景,科大讯飞首发基于 " 问题链 " 的高中数学智能教师助手,以及实现了讯飞星火医疗大模型 2.0的六大核心场景能力升级,同时发布讯飞星火医学影像大模型。
基础设施层面,科大讯飞董事长刘庆峰宣布科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台 " 飞星二号 " 正式启动。
刘庆峰公布了科大讯飞亮相星火大模型一年来的应用落地成绩单:讯飞星火央国企中标第一、教育医疗市场第一、智能汽车市场第一、智能硬件市场第一、工业大模型第一、赋能科研应用第一、大模型开发者生态第一。
具体的一些数据指标为,2024 年 1-9 月,讯飞星火智能硬件 GMV 同比提升 50%,截至 10 月 23 日,双十一大促全渠道 GMV 同比增长 280%;讯飞星火 App 安卓平台累计下载量 2 亿。
一开场,刘庆峰就展示了几个科大讯飞应用落地的典型案例。
科大讯飞和华为联合研发了小艺声音修复,能让特殊人群的发音更加清晰,实现正常交流。
硬件方面,科大讯飞基于翻译技术打造的多语种 AI 翻译透明屏,能帮助用户通过这块透明显示屏实现无障碍交流。
从检测空调到检测智能汽车,科大讯飞的 VIAS 智能座舱人机交互效果评测机器人,目前在测试场景能覆盖车控、导航等 1383 个功能点,达到了人工检测的 90% 以上,测试提效 10 倍。
一、七大能力超 GPT-4 Turbo,首发超拟人数字人
讯飞星火 4.0 Turbo 实现了七大能力全面超过 GPT-4 Turbo,其中数学能力、代码能力超过 GPT-4o,星火 4.0 Turbo 效率相对提升 50%。同时,在国内外中英文 14 项主流测试集中,星火 4.0 Turbo 拿下9 项第一。
在数学能力中,星火 4.0 Turbo 的标准考试任务能力、实用数学任务均超过 GPT-4o。刘庆峰介绍,该模型已经完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可以实现类 o1 的高难度数学能力显著提升。
代码能力层面,在 HumanEval 测试集上,星火 4.0 Turbo 性能已超越 GPT-4o,并且针对个人开发者,科大讯飞还推出 7B 版本,支持大模型在本地运行。
科大讯飞将万物互联时代的多模 AIUI 交互标准进一步扩展,从此前的远场高噪、全双工、多语种多方言、多模态,延伸到了超拟人、个性化。
基于星火大模型,科大讯飞的语音交互拓展到了音视频流的实时多模交互。
首次发布的星火超拟人数字人,可以实现口唇、表情、动作的语义贯穿,用大模型自动生成,并保持语义一致性。
科大讯飞副总裁、研究院院长刘聪现场进行了真机演示,超拟人数字人可以展现出目瞪口呆、卖萌的表情,实时与用户实现交流。
并且,超拟人数字人还拥有实时视频流的动态交互能力。用户只要打开摄像头,将其对准想要询问的画面就能对动态画面进行实时交互提问。
刘聪演示过程中,在桌子上摆了孙悟空、奥特曼、怪兽的玩偶,超拟人数字人直接根据玩偶的站位变化,讲述了一个生动的故事。
旅游场景中,超拟人数字人还能帮你快速了解挑选的化妆品、礼品的信息,同时也能快速识别花草,以及种植花草的注意点。
用户还能一张照片生成自己的虚拟人,一句话创建发音。在虚拟人的编辑页面,用户可以自主选择声音或者读一句话创建自己的拟人发音,也可以调整自己的人像照片、性格等。
下面就是演示过程中,刘聪创建的数字人。
超拟人数字人的声音自然度达到 4.2 分,刘庆峰称,最好的播音员可以达到 5.0 分左右,真人水平一般为 4.0 分左右。
此外,在远场高噪场景,今年 9 月,科大讯飞在语音识别领域的赛事 CHiME-8 夺冠,并拿下连续五连冠。当下,科大讯飞的语音识别也首次实现全国地级市方言全覆盖,包括 288 个地市 202 种方言。
二、首发八个语种多语言大模型,1.3B 汽车端侧大模型
基于全新发布的星火 4.0 Turbo,科大讯飞首发了星火多语言大模型、汽车端侧星火大模型。
星火多语言大模型首批可以支持中文、英语之外的八个语种,其能力整体达到 GPT-4o 96% 的水平,多行业任务场景效果超过 GPT-4o。
与此同时,多语言的交互也为汽车的智能交互提供了工具。
基于大模型能力,用户与汽车的交互已经从导航、命令控制等基础应用交互,提升到包括用车助手、旅行家等应用层面,使得活跃用户的日均交互从 7 次提升到了 18 次。
为了让大模型直接在汽车部署,科大讯飞发布了参数规模为 1.3B 的汽车端侧星火大模型,相比于参数规模更大的模型,其效果损失 ≤1%,端侧首响 40ms,端云融合交互低至 1.3s。
2024 年第四季度,该模型将会在奇瑞、广汽、长城将有多款车型陆续上市开售。
在交互之外,科大讯飞正在与开发伙伴一起为车企构建丰富智能体生态,包括汽车内的支付、影视等。
三、深入教育、医疗、法律场景,用 AI 过滤作业、诊断医疗影像
讯飞星火大模型的软硬件已经在教育、医疗等场景实现了深入应用。
1、教育:高中数学教师助手,用AI 过滤作业必答题、选做题
在教育领域,科大讯飞首发了基于 " 问题链 " 的高中数学智能教师助手,并邀请 12 个区域的 50 多位数学教研员、400 多位教师人员共创。这一教师助手可以帮助老师定位孩子薄弱环节,进行启发式讲解。明天,科大讯飞还将发布带有智能教师助手的星火智慧黑板 2.0。
面向家庭学习,科大讯飞发布了搭载到学习机上的 AI 作业过滤器,能够帮助学生对作业、考题筛选,基于其对学生的知识习得能力等进行判断,选出学生的分为必答题、选做题和可不做题。这一功能预计在 11 月中旬上线。
2、医疗:医疗大模型六大核心场景升级,发布医学影像大模型
讯飞星火医疗大模型此前发布的功能包括智医助理、智慧医院、讯飞晓医等。
其中智医助理已经在 611 个区县,完成了 8.6 亿辅助诊断次数,8100 万不合理处方提示;智慧医院完成了 5000 万次 AI 患者服务,完成 6 亿次疾病随访;讯飞晓医的下载量达到 1500 万次,完成了 1.1 亿次 AI 咨询。
在此基础上,讯飞星火医疗大模型 2.0 实现了六大核心场景能力升级,包括医疗海量知识问答、医疗复杂语言理解、医疗诊断治疗推荐、医疗专业文书生成、医疗多轮交互、医疗多模态交互。
在细分的医学影像方面,目前围绕医学影像的诊断治疗,存在影像科医生数量相对不足、拍片质量参差不齐、重复影像检查发生率达到 41.82% 的问题。
在此背景下,安徽省实现了全国应用规模最大的影像云平台,实现了一次检查全省互通互认。
科大讯飞发布讯飞星火医学影像大模型,能完成智能智控、智能诊断、智能读片。影像助手可以帮助医师进行解释溯源,找到对应的判断标准,还能对比患者之前的影像 CT。
3、法律、企业、科研:用户工作效率翻倍提升,政务场景审核时间缩短 80%
星火大模型赋能法律和政务,法律大模型的场景应用包括 AI 书记员、AI 文书助理、AI 法律检索助手;政务场景的星火智办一体机,使得用户递交材料的审核时间缩短 80%,登记效率提升 5 倍,
面向企业,科大讯飞为企业大模型构建提供顶层规划到执行落地的全套解决方案,包括数据工具请洗脸、SFT 数据工具链、场景优化工具链、多模态知识零采编系统,提升 " 理数据、训模型 " 的效率。
在科研方面,星火科研助手 2.0 已经中国科学院下属 116 个院所使用,同时,科大讯飞已经联合团队开展了 AI+ 生物科技、AI+ 科学装置的科研攻关。
结语:大模型生态繁荣,AI 正改变科研范式
讯飞星火大模型从发布至今,都在强调基座模型升级与行业应用的紧密结合,目前其已经发布 20 多个行业大模型,打造了 300 多个智能体应用,这些形成了可以相互借鉴和复用的规模化效应。
如今,以大模型为代表的通用人工智能发展迅猛,今年诺贝尔奖、物理学奖、化学奖都与 AI 强相关,AI 改变科研范式已经成为科技界的共识。以科大讯飞为代表的国内大模型厂商,正在其中扮演着愈加重要的角色。
登录后才可以发布评论哦
打开小程序可以发布评论哦