腾讯混元、Kimi、讯飞星火3个AI淘汰：《人机大战》迎来第一个残酷夜

来源：新浪财经

7 月 4 日晚，《人机大战：谁是世界杯预言家》迎来开播以来第一个真正的淘汰夜。

这一晚，人类预言家第一次有席位离开，12 个 AI 大模型也第一次出现出局者。讯飞星火、腾讯混元、Kimi 因 1/16 决赛阶段表现欠佳止步于此；孙继海所在的 " 热爱至上族 " 被现场投票淘汰。而几分钟后，孙继海又以补位嘉宾的身份走回演播室，加入了阎鹤祥的 " 自我中心流 "。

人和 AI，第一次在同一个晚上面对同样的命运。

这也是这一期和此前几期最大的不同。此前的《人机大战》更多是在问 "AI 和人类谁猜得准 "，而第一个淘汰夜真正提出的问题变成了：当预测进入淘汰机制，谁能留下？在这个机制里，AI 要证明稳定性，人类要证明判断力，普通用户则要证明自己能不能借助工具跑赢系统。

节目从这一晚开始，不再只是比分游戏，而是一场关于判断、风险和工具使用的公开实验。

更有意思的是，当晚随后进行的 1/8 决赛，又把这一判断继续往前推了一步：摩洛哥 3：1 战胜加拿大，法国 1：0 击败巴拉圭。两场比赛都没有制造新的童话，却共同呈现出淘汰赛的另一面——小组赛和 1/16 决赛里不断涌出的混乱，正在被更稳定、更成熟、更会控制风险的球队重新接管。

刘建宏 1 对 5：佛得角让 AI 预测先降温

淘汰夜真正开始前，节目先围绕阿根廷与佛得角展开了一场辩论：到底是阿根廷发挥不好，还是佛得角发挥太好？

多数嘉宾站在佛得角一边。韩乔生给出数据：阿根廷 22 次射门，佛得角 16 次射门、5 次打正；佛得角球员场均跑动 11.8 公里，四场比赛常规时间不败，逼平三支前世界冠军球队——" 一场发挥好是偶然，到第四场就不是偶然了 "。

阎鹤祥的解释更通俗。他讲了自己小学考试没考好、跟班主任辩解 " 是没发挥好，不是实力不行 " 的往事，老师回了一句：" 临场发挥不好，就是你实力不行的一部分。" 所以，能让阿根廷发挥不好，本身就是佛得角发挥好的证明。

唯一站到另一边的是本期新加入的刘建宏。他用一个从老一辈教练那里学来的粤语词概括这场比赛：" 扮猪吃老虎 "。

按照他的比喻，阿根廷以为自己面对的是一头猪，眼睛里已经是一盘盘红烧肉，没想到面具撕下来，可能是一头豹子。他还引了一句外电评论："1：0 之后，阿根廷就认为自己可以躺在浴缸里休息了。"

刘建宏这期的身份很微妙：他接替张踩铃坐进 "AI 先行者 " 席位，本人正在做的事业就是 AI Sport。但他开场说的一段话，可能是这档节目开播以来对 AI 最清醒的一次祛魅。

"AI 预测的成功率跟人类差不了多少，都是追求大概率事件。唯一预测不了的就是冷门，如果能预测到冷门，它就不是 AI 了，那是神。"

他接着说：" 不了解 AI 的人认为 AI 什么都能干，真正了解 AI 的人知道，AI 在很多领域可能连几岁孩子的能力都不如。" 以当天早晨阿根廷对佛得角的比赛为例，AI 无法预知阿根廷球员上场时的心理状态，" 这个只有上了场你才能看到 "。

这段话把《人机大战》这档节目的边界说清楚了：AI 可以提高判断效率，但它不是预言机器；它擅长大概率，却天然害怕小概率；它能处理数据，却很难实时获取球员心理、临场紧张和团队情绪这些变量。

正因为 AI 搞不定冷门、读不懂心理、算不出佛得角，这场人机对抗才有得打。

三个 AI 出局：淘汰赛惩罚的不是犯错，而是不稳定

刘建宏还顺手给出了一个预判。他说，世界杯这出戏，小组赛总显得特别混乱，" 感觉世界要变天了 "；到淘汰赛踢着踢着，又会回到原有秩序。他把这称为秩序的回归，而在秩序回归的过程中，押注混乱的一方会被甩下车。

当晚，这个判断在 AI 阵营得到了验证。

随后两场 1/8 决赛也在赛场上验证了这一点。摩洛哥 3：1 击败加拿大，法国 1：0 战胜巴拉圭，晋级的仍然是更成熟、更稳定的一方。加拿大和巴拉圭此前都已经完成了足够动人的世界杯叙事，但进入更深一轮淘汰赛后，比赛开始重新奖励控制力、经验和临场效率。刘建宏说的" 秩序回归 "，不是强队一定大胜，而是越往后走，偶然性越要让位于持续性。

按照赛制，12 个 AI 在淘汰赛阶段清零重计，1/16 决赛结束后仅前 9 名晋级。讯飞星火、腾讯混元、Kimi 三个模型排名垫底，正式出局，不再参与后续人机大战。

有嘉宾当场表示意外——腾讯混元在小组赛 32 强预测中曾押中 29 个，一度是准确率最高的模型之一。但清零重计的规则不认老本。场上总结出一句糙理不糙的规律：" 猜冷门死得早。" 曾经最爱反向押注的阶跃星辰，反而因为中途回归大概率算法而幸存。

在剩余模型中，中移九天、千问继续位居前列，联想天禧 AI 紧随其后。相比 " 神预测 "，这些靠前模型更像是靠连续命中大概率事件稳住位置，这种稳定性本身就是一种能力。

当然，这不是严格意义上的模型能力排名。几场球的样本远不足以评判模型强弱。但作为一个公共场景下的预测实验，它很直观地展示了不同模型的风险偏好，以及淘汰机制真正惩罚的东西：不是 " 错 "，而是 " 不稳定 "。

足球预测里，偶尔押中一次冷门很耀眼，但在淘汰赛机制下，持续站在更高概率的一边，往往更能活到下一轮。

这和现实中的 AI 应用并不遥远。很多时候，外界期待 AI 给出惊艳答案，但真正能够长期进入产业和用户场景的，未必是最会冒险的模型，而是最稳定、最可解释、最能持续降低错误率的系统。

孙继海出局又返场，人类未能票选出人机

人类这边的淘汰更有戏剧性。

结算完毕，阎鹤祥与孙继海以 1900 脑力值并列垫底，进入 " 降级区 "。投票前的自救陈词环节，两人都拿出了硬证据。

阎鹤祥的逻辑几乎无法反驳：" 有一场比赛，12 个 AI 全错了，只有我猜对了佛得角——如果我是人机，必须按 AI 的选项预测，所以我肯定是人。"

孙继海则打出身份牌：" 这还是一个关于足球的节目吧？在场所有人只有我踢过世界杯，你留着他干嘛？"

投票前，节目还处理了一笔横跨数期的脑力值债务：徐志胜、阎鹤祥、张踩铃、刘建宏和孙继海被卷进同一张账本，借款、展期、坏账、债务减免在直播间被即兴谈判。

投票结果几乎一边倒：孙继海所代表的 " 热爱至上族 " 席位被淘汰。大屏回顾历任预言家时，照片多到翻页才放得下——从苏醒到徐志胜，再到张路，" 日光族 " 的外号名不虚传。

孙继海的告别发言颇有职业球员的体面：" 他们的选择很有目的性，就是把最强的选走了。就像我第一次参加世界杯，对方把我铲倒了一样——它是个策略。" 随后身份揭晓：孙继海不是人机，卧底仍潜伏在剩下的五人当中。

他把剩余的 1900 脑力值全部赠予了自己当年开疆拓土的 " 硬核实力派 " 席位，然后离场。

然后，不到几分钟，他作为补位嘉宾走了回来——被淘汰的是席位，不是人。孙继海以自由身返场，现场 " 竞拍 " 归属，最终加入阎鹤祥的阵营，条件只有一个：" 如果我们的预测有分歧，以我的为准。"

阎鹤祥答应得最快：" 这里只有我不懂球，您来带着我冲 A。"

《人机大战》进入淘汰阶段后不再只是每晚猜三场球，而是把嘉宾关系、脑力值策略、身份悬念和真实赛果绑到一起。每一次出局，都会改变下一期的结构。

小高 16 连胜：真正跑出来的是 " 人 +AI"

如果说场上的对抗还在胶着，场外已经跑出了一个现象级人物。

来自河南商丘的用户小高，从淘汰赛开始保持胜平负预测 16 连胜，是节目披露的唯一百分之百胜率用户。他连续两晚获得节目连线，也连续两晚获得联想昭阳笔记本电脑奖励；前一晚他给出的三场预测，赛后方向全部命中，以至于韩乔生当晚预测时被拍到手机备忘录里记的全是 " 小高说的比分 "。

被问到秘诀，小高的回答很平实：" 现在 AI 很发达，我平常会用中移九天、联想天禧查资料，看看比赛、看各队状态，结合 AI 给的资料综合分析判断。"

《人机大战》的框架是 " 人类 vs AI"，但场外真正的胜者，既不是纯粹的直觉派，也不是任何一个 AI 模型，而是一个把 AI 当研究工具的普通人。

这也让 " 人机大战 " 的名字出现了一个有趣的反讽：真正跑在前面的，不是拒绝 AI 的人，也不是单个 AI，而是一个把 AI 纳入自己判断流程的人。AI 在这里不是对手，而是信息处理工具；人类的价值也不是凭直觉硬猜，而是在 AI 给出的资料、比赛状态和个人理解之间做二次判断。

节目披露，截至 7 月 3 日，" 世界杯预测人机大战 " 参与人数已达 2743 万，AI 阵营整体胜率仍以约 5 个百分点领先人类。但小高的 16 连胜说明，这个差距对于会使用工具的个体而言，完全可以被逆转。这显示，AI 进入日常判断之后，人与工具之间的关系正在变化。

而摩洛哥和法国的晋级，也让小高预测方式的价值更容易被理解：真正难的不是永远押冷门，也不是盲目相信热门，而是在每一轮比赛里重新判断，什么时候该相信概率，什么时候该给变量留位置。

1/8 决赛之后，五个人类席位只留四个，九个 AI 只留六个；半决赛时，双方各剩三席，同桌对决，而潜伏至今的人机卧底依然没有暴露。

作为 FIFA 官方技术合作伙伴，联想集团通过联想天禧 AI 超级智能体联动 12 大主流 AI，并与咪咕共同搭建 " 世界杯预测人机大战 " 及《人机大战：谁是世界杯预言家》。它表面上是在制造 " 人类 vs AI" 的对抗，实际上更像是在展示一种新的日常关系：AI 不是替人做决定，而是帮助人做出更好的判断。

这也是这档节目比比分竞猜走得更远的地方。世界杯仍然会有佛得角这样的意外，也会有法国晋级这样的秩序回归；而在这些不确定性之间，真正跑出来的，可能不是某一个模型，也不是纯粹凭直觉的人，而是会使用 AI 的人。

宙世代

一起剪

相关标签