星途科讯 11小时前
DeepSeek估值超500亿美元,微软拟整合其模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

深度求索(DeepSeek)已完成超过 500 亿元人民币(约合 74 亿美元)的融资。知情人士透露,该公司当前估值已突破 500 亿美元,成为中国最具价值的人工智能初创企业。

在本轮融资中,深度求索创始人兼首席执行官梁文锋个人注资 30 亿元人民币。此前市场消息显示,腾讯控股正考虑投资约 14.8 亿美元。据悉,本轮多数参与者的资金将存入由梁文锋管理的有限合伙企业中。

技术突破与市场震荡

深度求索正式名称为杭州深度求索人工智能基础技术研究有限公司,系量化基金幻方资本旗下子公司。2025 年 1 月,该实验室开源高级推理模型 R1,其输出质量几乎可与 OpenAI 于 2024 年 12 月发布的 o1 模型媲美。凭借极高的硬件效率,R1 仅需少量算力即可进行推理,这一特性引发投资者对 AI 加速器需求下降的担忧,导致英伟达市值曾短暂缩水 15%。

今年 4 月,深度求索推出 R1 的后续版本 DeepSeek-V4-Pro。该模型包含 1.6 万亿参数,规模是前代的两倍以上,采用混合专家架构,仅在响应提示时激活 2840 亿个参数。训练数据集涵盖超过 32 万亿 token。

在推理效率方面,V4-Pro 利用优化的 KV 缓存数据结构,能够处理包含 100 万 token 的提示,其缓存大小仅为早期模型 DeepSeek-V3.2 的十分之一。这一突破显著降低了内存占用及推理成本。

微软寻求成本替代方案

深度求索算法的高性价比已引起科技巨头关注。据媒体报道,微软计划将其定制的深度求索模型整合至正式面向公众发布的 Cowork Copilot 应用中,旨在为目前支撑该软件运行的 OpenAI 和 Anthropic 算法提供更具成本效益的替代方案。

微软预计将在未来几周内推出该定制模型,主要使用经过微调的 DeepSeek V4 或其他开源模型。微调技术允许开发者针对特定工作负载优化 AI,从而提升输出质量与响应速度。

【星途科讯 图文丨程砚铮】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

微软 人工智能 开源 腾讯 首席执行官
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论