来源:新浪财经
7 月 4 日晚,《人机大战:谁是世界杯预言家》迎来开播以来第一个真正的淘汰夜。
这一晚,人类预言家第一次有席位离开,12 个 AI 大模型也第一次出现出局者。讯飞星火、腾讯混元、Kimi 因 1/16 决赛阶段表现欠佳止步于此;孙继海所在的 " 热爱至上族 " 被现场投票淘汰。而几分钟后,孙继海又以补位嘉宾的身份走回演播室,加入了阎鹤祥的 " 自我中心流 "。
人和 AI,第一次在同一个晚上面对同样的命运。
这也是这一期和此前几期最大的不同。此前的《人机大战》更多是在问 "AI 和人类谁猜得准 ",而第一个淘汰夜真正提出的问题变成了:当预测进入淘汰机制,谁能留下?在这个机制里,AI 要证明稳定性,人类要证明判断力,普通用户则要证明自己能不能借助工具跑赢系统。
节目从这一晚开始,不再只是比分游戏,而是一场关于判断、风险和工具使用的公开实验。
更有意思的是,当晚随后进行的 1/8 决赛,又把这一判断继续往前推了一步:摩洛哥 3:1 战胜加拿大,法国 1:0 击败巴拉圭。两场比赛都没有制造新的童话,却共同呈现出淘汰赛的另一面——小组赛和 1/16 决赛里不断涌出的混乱,正在被更稳定、更成熟、更会控制风险的球队重新接管。
刘建宏 1 对 5:佛得角让 AI 预测先降温
淘汰夜真正开始前,节目先围绕阿根廷与佛得角展开了一场辩论:到底是阿根廷发挥不好,还是佛得角发挥太好?
多数嘉宾站在佛得角一边。韩乔生给出数据:阿根廷 22 次射门,佛得角 16 次射门、5 次打正;佛得角球员场均跑动 11.8 公里,四场比赛常规时间不败,逼平三支前世界冠军球队——" 一场发挥好是偶然,到第四场就不是偶然了 "。
阎鹤祥的解释更通俗。他讲了自己小学考试没考好、跟班主任辩解 " 是没发挥好,不是实力不行 " 的往事,老师回了一句:" 临场发挥不好,就是你实力不行的一部分。" 所以,能让阿根廷发挥不好,本身就是佛得角发挥好的证明。
唯一站到另一边的是本期新加入的刘建宏。他用一个从老一辈教练那里学来的粤语词概括这场比赛:" 扮猪吃老虎 "。
按照他的比喻,阿根廷以为自己面对的是一头猪,眼睛里已经是一盘盘红烧肉,没想到面具撕下来,可能是一头豹子。他还引了一句外电评论:"1:0 之后,阿根廷就认为自己可以躺在浴缸里休息了。"
刘建宏这期的身份很微妙:他接替张踩铃坐进 "AI 先行者 " 席位,本人正在做的事业就是 AI Sport。但他开场说的一段话,可能是这档节目开播以来对 AI 最清醒的一次祛魅。
"AI 预测的成功率跟人类差不了多少,都是追求大概率事件。唯一预测不了的就是冷门,如果能预测到冷门,它就不是 AI 了,那是神。"
他接着说:" 不了解 AI 的人认为 AI 什么都能干,真正了解 AI 的人知道,AI 在很多领域可能连几岁孩子的能力都不如。" 以当天早晨阿根廷对佛得角的比赛为例,AI 无法预知阿根廷球员上场时的心理状态," 这个只有上了场你才能看到 "。
这段话把《人机大战》这档节目的边界说清楚了:AI 可以提高判断效率,但它不是预言机器;它擅长大概率,却天然害怕小概率;它能处理数据,却很难实时获取球员心理、临场紧张和团队情绪这些变量。
正因为 AI 搞不定冷门、读不懂心理、算不出佛得角,这场人机对抗才有得打。
三个 AI 出局:淘汰赛惩罚的不是犯错,而是不稳定
刘建宏还顺手给出了一个预判。他说,世界杯这出戏,小组赛总显得特别混乱," 感觉世界要变天了 ";到淘汰赛踢着踢着,又会回到原有秩序。他把这称为秩序的回归,而在秩序回归的过程中,押注混乱的一方会被甩下车。
当晚,这个判断在 AI 阵营得到了验证。
随后两场 1/8 决赛也在赛场上验证了这一点。摩洛哥 3:1 击败加拿大,法国 1:0 战胜巴拉圭,晋级的仍然是更成熟、更稳定的一方。加拿大和巴拉圭此前都已经完成了足够动人的世界杯叙事,但进入更深一轮淘汰赛后,比赛开始重新奖励控制力、经验和临场效率。刘建宏说的" 秩序回归 ",不是强队一定大胜,而是越往后走,偶然性越要让位于持续性。
按照赛制,12 个 AI 在淘汰赛阶段清零重计,1/16 决赛结束后仅前 9 名晋级。讯飞星火、腾讯混元、Kimi 三个模型排名垫底,正式出局,不再参与后续人机大战。
有嘉宾当场表示意外——腾讯混元在小组赛 32 强预测中曾押中 29 个,一度是准确率最高的模型之一。但清零重计的规则不认老本。场上总结出一句糙理不糙的规律:" 猜冷门死得早。" 曾经最爱反向押注的阶跃星辰,反而因为中途回归大概率算法而幸存。
在剩余模型中,中移九天、千问继续位居前列,联想天禧 AI 紧随其后。相比 " 神预测 ",这些靠前模型更像是靠连续命中大概率事件稳住位置,这种稳定性本身就是一种能力。
当然,这不是严格意义上的模型能力排名。几场球的样本远不足以评判模型强弱。但作为一个公共场景下的预测实验,它很直观地展示了不同模型的风险偏好,以及淘汰机制真正惩罚的东西:不是 " 错 ",而是 " 不稳定 "。
足球预测里,偶尔押中一次冷门很耀眼,但在淘汰赛机制下,持续站在更高概率的一边,往往更能活到下一轮。
这和现实中的 AI 应用并不遥远。很多时候,外界期待 AI 给出惊艳答案,但真正能够长期进入产业和用户场景的,未必是最会冒险的模型,而是最稳定、最可解释、最能持续降低错误率的系统。
孙继海出局又返场,人类未能票选出人机
人类这边的淘汰更有戏剧性。
结算完毕,阎鹤祥与孙继海以 1900 脑力值并列垫底,进入 " 降级区 "。投票前的自救陈词环节,两人都拿出了硬证据。
阎鹤祥的逻辑几乎无法反驳:" 有一场比赛,12 个 AI 全错了,只有我猜对了佛得角——如果我是人机,必须按 AI 的选项预测,所以我肯定是人。"
孙继海则打出身份牌:" 这还是一个关于足球的节目吧?在场所有人只有我踢过世界杯,你留着他干嘛?"
投票前,节目还处理了一笔横跨数期的脑力值债务:徐志胜、阎鹤祥、张踩铃、刘建宏和孙继海被卷进同一张账本,借款、展期、坏账、债务减免在直播间被即兴谈判。
投票结果几乎一边倒:孙继海所代表的 " 热爱至上族 " 席位被淘汰。大屏回顾历任预言家时,照片多到翻页才放得下——从苏醒到徐志胜,再到张路," 日光族 " 的外号名不虚传。
孙继海的告别发言颇有职业球员的体面:" 他们的选择很有目的性,就是把最强的选走了。就像我第一次参加世界杯,对方把我铲倒了一样——它是个策略。" 随后身份揭晓:孙继海不是人机,卧底仍潜伏在剩下的五人当中。
他把剩余的 1900 脑力值全部赠予了自己当年开疆拓土的 " 硬核实力派 " 席位,然后离场。
然后,不到几分钟,他作为补位嘉宾走了回来——被淘汰的是席位,不是人。孙继海以自由身返场,现场 " 竞拍 " 归属,最终加入阎鹤祥的阵营,条件只有一个:" 如果我们的预测有分歧,以我的为准。"
阎鹤祥答应得最快:" 这里只有我不懂球,您来带着我冲 A。"
《人机大战》进入淘汰阶段后不再只是每晚猜三场球,而是把嘉宾关系、脑力值策略、身份悬念和真实赛果绑到一起。每一次出局,都会改变下一期的结构。
小高 16 连胜:真正跑出来的是 " 人 +AI"
如果说场上的对抗还在胶着,场外已经跑出了一个现象级人物。
来自河南商丘的用户小高,从淘汰赛开始保持胜平负预测 16 连胜,是节目披露的唯一百分之百胜率用户。他连续两晚获得节目连线,也连续两晚获得联想昭阳笔记本电脑奖励;前一晚他给出的三场预测,赛后方向全部命中,以至于韩乔生当晚预测时被拍到手机备忘录里记的全是 " 小高说的比分 "。
被问到秘诀,小高的回答很平实:" 现在 AI 很发达,我平常会用中移九天、联想天禧查资料,看看比赛、看各队状态,结合 AI 给的资料综合分析判断。"
《人机大战》的框架是 " 人类 vs AI",但场外真正的胜者,既不是纯粹的直觉派,也不是任何一个 AI 模型,而是一个把 AI 当研究工具的普通人。
这也让 " 人机大战 " 的名字出现了一个有趣的反讽:真正跑在前面的,不是拒绝 AI 的人,也不是单个 AI,而是一个把 AI 纳入自己判断流程的人。AI 在这里不是对手,而是信息处理工具;人类的价值也不是凭直觉硬猜,而是在 AI 给出的资料、比赛状态和个人理解之间做二次判断。
节目披露,截至 7 月 3 日," 世界杯预测人机大战 " 参与人数已达 2743 万,AI 阵营整体胜率仍以约 5 个百分点领先人类。但小高的 16 连胜说明,这个差距对于会使用工具的个体而言,完全可以被逆转。这显示,AI 进入日常判断之后,人与工具之间的关系正在变化。
而摩洛哥和法国的晋级,也让小高预测方式的价值更容易被理解:真正难的不是永远押冷门,也不是盲目相信热门,而是在每一轮比赛里重新判断,什么时候该相信概率,什么时候该给变量留位置。
1/8 决赛之后,五个人类席位只留四个,九个 AI 只留六个;半决赛时,双方各剩三席,同桌对决,而潜伏至今的人机卧底依然没有暴露。

作为 FIFA 官方技术合作伙伴,联想集团通过联想天禧 AI 超级智能体联动 12 大主流 AI,并与咪咕共同搭建 " 世界杯预测人机大战 " 及《人机大战:谁是世界杯预言家》。它表面上是在制造 " 人类 vs AI" 的对抗,实际上更像是在展示一种新的日常关系:AI 不是替人做决定,而是帮助人做出更好的判断。
这也是这档节目比比分竞猜走得更远的地方。世界杯仍然会有佛得角这样的意外,也会有法国晋级这样的秩序回归;而在这些不确定性之间,真正跑出来的,可能不是某一个模型,也不是纯粹凭直觉的人,而是会使用 AI 的人。


登录后才可以发布评论哦
打开小程序可以发布评论哦