科创板日报 02-16
阿里发布新一代基模千问3.5,每百万Token低至0.8元
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

《科创板日报》2 月 16 日讯(记者 黄心怡)除夕当天,阿里巴巴开源全新一代大模型千问 Qwen3.5-Plus,总参数为 3970 亿,激活仅 170 亿,性能超过万亿参数的 Qwen3-Max 模型,部署显存占用降低 60%,最大推理吞吐量可提升至 19 倍。Qwen3.5-Plus 的 API 价格每百万 Token 低至 0.8 元,为 Gemini 3 Pro 的 1/18。

与前几代的千问大语言模型不同,千问 3.5 从纯文本模型升级为多模态模型。千问 3 预训练在纯文本 Tokens 上进行,而千问 3.5 基于视觉和文本混合 token 上预训练,并新增中英文、多语言、STEM 和推理等数据,以不到 40% 的参数量获得超万亿的 Qwen3-Max 基座模型的性能。

千问 3.5 在 MMLU-Pro 知识推理评测中得分 87.8 分,超越 GPT-5.2;在博士级难题 GPQA 测评中斩获 88.4 分,高于 Claude 4.5;在指令遵循 IFBench 以 76.5 分刷新所有模型纪录;而在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中,千问 3.5 表现均超越 Gemini 3 Pro、GPT-5.2。

在视频理解方面,千问 3.5 支持 2 小时(1M token 上下文)的视频直接输入,适用于长视频内容分析与摘要生成。同时,千问 3.5 实现了视觉理解与代码能力的融合,结合图搜和生图工具,可将手绘界面草图直接转为可用的前端代码。

值得注意的是,在 Agent 应用方面,千问 3.5 可自主操作手机与电脑,在移动端支持更多主流 APP 与指令,在 PC 端可处理多步骤操作,如跨应用数据整理、自动化流程执行等。同时,千问团队构建了一个可扩展的 Agent 异步强化学习框架,端到端可加速 3 到 5 倍,并将插件式智能体 Agent 支持扩展至百万级规模。

据悉,千问 APP、PC 端已第一时间接入 Qwen3.5-Plus 模型。阿里很快将继续开源不同尺寸、不同功能的千问 3.5 系列模型。而性能更强的旗舰模型 Qwen3.5-Max 不久也将发布。

今年春节期间,国产大模型领域迎来密集发布潮。字节跳动的视频生成模型 Seedance 2.0、智谱 AI 旗舰模型 GLM-5、蚂蚁集团的全模态大模型 Ming-Flash-Omni 2.0、MiniMax 一代文本模型 M2.5 等相继发布。此外,DeepSeek,网页 /APP 正在测试新的长文本模型结构,支持 1M(百万 Token)上下文。

IDC 中国研究经理孙振亚认为,大模型的能力正在从纯粹的生成式输出向智能体能力进化。各家模型厂商都在代码、多模态、长上下文和工具调用能力上做针对性的优化。" 智能体落地毫无疑问是这一轮竞争的重点,甚至可以说是最核心的主线。" 孙振亚称。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 开源 字节跳动 除夕 科创板
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论