驱动之家 02-11
DeepSeek突发更新:不是V4但惊喜很多 编程实测来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 2 月 11 日消息,这个春节全网都在等 DeepSeek 发布最新的大模型 DeepSeek V4,但是现在来看大版本不一定会在春节期间发布,今天 DeepSeek 悄然更新了新版本,亮点不少。

根据 DeepSeek 自己的介绍,这次更新主要是提升了上下文能力,达到了 1M,而之前的 DeepSee V3 系列也就是 128K。

有了 1M 上下文,DeepSeek 可以一次性处理《三体》三部曲这样体量的超长文本,这点已经得到了很多网友的实测证实。

其他方面的能力是之前就有的,DeepSeek 也没有提及更详细的信息。

值得注意的是,DeepSeek 在回答完这个问题之后还特别加了一段,强调它就是最新的 DeepSeek 模型,没有特定的子名称,不是 V3 也不是 R1,彷佛在刻意强调这个模型的不同,但又不让人产生这就是 V4 Preview 预览版的联想。

但是从网友的反馈来看,这次 DeepSeek 的小更新实际上能力提升很大,知名大模型测试博主 @karminski- 牙医已经发布了一个快速测试,主要测试了编程方面的一个大象牙膏的测试项目。

结论就是肉眼可见美学 , 建模 , 物理模拟 , 代码性能都有提升 , 甚至还有小惊喜,这个就是比之前发布的任何版本都 SOTA,也就是当前最优的大模型(当然主要是指 DS 的版本)。

目前还不确定 DeepSeek 的这个新模型是不是完全体,因为有网友测试这两天很热门的 50 米距离上去洗车是走路还是开车去的问题上,DeepSeek 新模型给出的回答不一,有人说正确,有人说不行。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

联想 编程 春节 三体 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论