快科技 3 月 9 日消息,此前传闻 DeepSeek V4 在上周发布,遗憾的是这事也没有发生,目前 DeepSeek 依然是官网更新了一个小模型,被网友成为 DeepSeek V4 Lite。
DeepSeek V4 Lite 的参数量据说只有 2000 亿,相比 V3 版本的 6700 多亿小了很多,而传闻中的 DeepSeek V4 满血版参数量达到 1 万亿级别,因此这次的 DeepSeek V4 Lite 被认为是在做测试验证,方便后续微调。
DeepSeek V4 Lite 的官方介绍不多,提升的主要是上下文能力,从上代的 128K 提升到了 1M,虽然比有些 AI 大模型的 2M 上下文还差一些,但网友实测这个 1M 上下文是实打实的,实际上还不止。
当然,最受关注的还是 DeepSeek V4 Lite 的能力,之前已经有过不少测试,知乎网友给出的反馈还可以看到更多的。
网友 @帅得自然表示网页版的编程能力比之前强了 10 倍,几乎没幻觉了,而且扔给 1MB 的 txt 代码文本让它修改都能基本一次过,最多三次。
另一个网友 @起名困难症晚期提供了一个更好玩的测试,他扔给 DeepSeek V4 Lite 一个 2.9MB 的《三体》全集文档,但在其中随机加入了几个密钥,让 AI 给找出来,这是验证上下文能力的一个关键。
结果 DeepSeek V4 Lite 真的给找出来了,第一次有些顺序不对,但提醒之后就给出了更详细的说明,而且每个密钥的出现位置也给详细标明了。
《三体》全集大约 80 万字,虽然文字数并就是 AI 的上下文能力,但通过这个测试可以看出 DeepSeek V4 Lite 现在的体量已经可以处理百万级文本,再加上编程能力的大幅提升,实用性就强出太多了。
完整版的 DeepSeek V4 啥时候发布还是个迷,具体的能力当然也不好说,但是从现有的表现来看 DeepSeek V4 还是有不鸣则已一鸣惊人的能力,大家的期待值也是拉满的。


登录后才可以发布评论哦
打开小程序可以发布评论哦