手机中国 02-16
阿里除夕夜将开源Qwen3.5模型 采用原生多模态架构
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技新闻】随着农历除夕的到来,阿里巴巴旗下的通义千问团队即将发布新一代开源大模型 Qwen 3.5。目前该模型系列的相关代码已提交至 Hugging Face 与 GitHub 仓库,标志着这一备受期待的 AI 技术即将正式面向全球开发者开放。

Qwen 3.5 在架构设计上实现了显著进化。它采用了全新的混合注意力机制(Hybrid Attention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。

与前代模型相比,Qwen 3.5 是一款原生多模态模型。它能够直接理解并处理文本、图像、音频以及视频数据,无需依赖外部插件或子模型进行转换。初步透露的模型规格包括 9B(90 亿参数)指令微调版以及 35B-A3B(基于 MoE 架构)的中型版本,后者在数学推理与编程能力上表现尤为出色。

当前的中国 AI 市场竞争已进入白热化阶段。除阿里外,DeepSeek 计划推出其 V4 模型,字节跳动也在升级其豆包系列。行业分析人士认为,阿里选择在除夕夜这一关键节点开源 Qwen 3.5,旨在通过技术领先地位获取春节期间的流量峰值,并巩固其在全球开源社区的影响力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 ai 开源 字节跳动 春节
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论