智东西 05-15
阿里Qwen深度研究上线!免费AI助理帮你自动“吃瓜”、写报告,实测效果如何?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 李水青

编辑 | 心缘

智东西 5 月 15 日报道,5 月 13 日晚间,阿里 Qwen 团队上线深度研究(Deep Research)智能助理系统,所有人免费可用。

消息一出,引起无数 " 打工人 "、" 科研狗 " 的狂喜。深度研究能让 AI 自动上网找资料、写研究报告,本来几小时的工作,现在十几分钟就能完成。相比于深度思考和深度搜索,深度研究是大模型使用的更高阶阶段,工作量更大,带来的效率提升更明显,对应的对模型综合能力的要求也更高。

在国外,谷歌、OpenAI、Grok 都推出了同类产品,但 OpenAI 的 Deep Research 需要付费 200 美元 / 月才能使用。在国内,同类产品还很少,智谱 AI 于 3 月底推出了免费可用的 AutoGLM 沉思,DeepSeek 等其他产品还未推出 Deep Research 功能。

Qwen 深度研究调用的模型,目前是阿里 4 月底最新推出的旗舰模型 Qwen3-235B-A22B。据智东西此前报道,该模型在编程、数学、通用能力等基准评估中的表现优于 DeepSeek-R1、OpenAI o1、OpenAI o3-mini、Grok-3 和 Gemini-2.5-Pro 等业界知名模型。

那么 Qwen 深度研究如何使用?实际应用效果如何?智东西第一时间带大家看看体验效果。

体验地址:https://chat.qwen.ai/

进入网站后,用户点击聊天框下的 " 深入研究 " 按钮,就可以体验深度研究服务了。注意需要保持 " 深度思考 " 和 " 搜索 " 两个按钮是关闭的,否则看不到 " 深入研究 " 按钮。

Qwen 深度研究的主要运行包括 " 规划 - 执行 - 总结 " 三个步骤。以一个文娱话题为例,近期热播综艺节目《乘风破浪的姐姐 6》话题点较多,于是我让 Qwen 深度研究帮我系统地梳理下《浪姐 6》的热点。

输入:

" 帮我吃一下近期《浪姐 6》的完整的瓜,重点关注陈德容、房琪等争议姐姐,以及吴宣仪、宋妍霏、侯佩岑、叶童等人气高的姐姐。"

Qwen 深度研究在规划之前,第一时间问了我三个问题,以确定报告范围。这与我们在深度思考、深度搜索中与机器人对话差别较大,深度研究要研究清楚用户的问题,会首先反问用户几个问题,从而对问题有更清楚的了解。在这个示例中,为了 " 吃瓜 " 全面,我要求 Qwen 深度研究的报告囊括提到的所有信息。

在此之后,Qwen 深度研究思考了 8 分钟 47 秒,而后给我扔出一篇长达 7 页的 pdf 报告,果然高端的瓜都是以 pdf 的格式呈现。

这份报告的最大亮点,在我看来是在报告的结尾生成了一个可下载的表格,一目了然地呈现了姐姐们的 " 关键事件与表现 "、" 观众评价与舆论焦点 "、" 排名变化或成绩示例 "。

这份表格干货覆盖全,并且把值得关注的事件都浓缩在一句话里,可以说是一份全面的 " 吃瓜地图 "。比如吴宣仪 " 失误如提前庆祝比赛结果 "、房琪 " 因聊天记录与实际情况不符引发信任危机 " 等,点击后面的角标都可以去查看信源原文。不过表格只列举了问题中提到的 6 位姐姐,没有适当延伸到其他姐姐,但这个问题也可以通过提示词优化。

从整份 pdf 报告的内容质量来看,我认为还是非常全面和精彩的。如果让我自己去搜索 8 分钟,一定达不到这个完成度。

Qwen 深度研究是如何写这份报告的?展开折叠的深度研究过程可以看到。

一是研究规划,围绕 "《浪姐 6》热点事件与争议分析 "、" 人气姐姐的表现与成长分析 "、" 节目整体热点与综合分析 " 三大方面,规划了多达 18 个搜索、查找或者整理的相关任务。

二是执行规划,围绕 " 陈德容和房琪《浪姐 6》争议事件及舆论分析 "、" 吴宣仪与宋妍霏《浪姐 6》合作舞台表现评价 "、"《浪姐 6》全网热点事件总结 "、" 陈德容和房琪在《浪姐 6》中的互动及观众反应分析 "、" 房琪在《浪姐 6》被淘汰前后舆论变化趋势 "、"《浪姐 6》中传统文化舞台表现与观众接受度分析 " 六个主题,执行了搜索、查找和整理等动作。

三是总结,输出一整份《浪姐 6》吃瓜报告,包括文字版和 pdf 版。

为了有所比较,智东西也用智谱清言 AutoGLM 沉思对这个问题进行了搜索。

可以看到,AutoGLM 沉思的执行过程也包括研究计划和搜索动作。

研究计划包括四个方面:

1、确认《浪姐 6》是什么节目,它的播出时间表和当前状态。

2、搜索陈德容、房琪、吴宣仪、宋妍霏、侯佩岑、叶童在浪姐 6 中的相关情况。

3、重点关注她们的争议点和热点话题。

4、在不同的网站上交叉验证信息,以获取更全面的观点。

AutoGLM 沉思执行了 14 次搜索动作。从输出的结果来看,AutoGLM 沉思的优点是在文尾放上了 63 条引用信源,数量多且可追溯。可能的问题是,智谱清言可能更需要优化下界面设计,其研究过程没有像 Qwen 一样用小框折叠,而是直接呈现在最终答案之前,一直拉到底拉有点费事。

对比来看,我认为两份报告都在很短时间内满足了我强烈的 " 吃瓜 " 欲望,比较全面丰富,胜过我自己去用搜索引擎搜很多遍。同时,两个工具都有没有覆盖的热点,但一起用基本上覆盖了所有的重要信息。此外有一个共同问题是,搜索的信源比较泛,如果拿来研究更加专业的问题,可能需要用户自己对生成的报告多加甄别。

此外值得一提的是,打开通义千问网页版,智东西发现其 " 分析研究 " 功能实际上已经具备 " 深度研究 " 能力,而且采用了左右分屏、回看任务等界面优化。

结语:深度研究工具开启认知新范式

阿里 Qwen 深度研究智能助理的推出,让更多人能用到 AI 自动检索资料、生成报告功能。实测显示,它能快速自动梳理复杂信息并输出结构化内容,大幅提升效率,尽管细节覆盖仍有优化空间。

从行业看,免费开放的 Qwen 深度研究降低了深度研究类工具的使用门槛,与智谱 AI 等国内玩家共同推动 AI 辅助分析产品的发展进程。未来,这类工具或将成为职场和学术研究的新标配,开启认知新范式。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

效果 阿里 deep 侯佩岑
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论