1
谷歌发布 Gemini 2.5 Pro "I/O"
5 月 7 日,谷歌 DeepMind 发布多模态大语言模型 Gemini 2.5 Pro "I/O",这是 3 月发布的 Gemini 2.5 Pro 升级版本,DeepMind CEO 称其为 " 有史以来构建的最强编程模型 "。初步基准测试显示,其在代码生成评估指标上全面领先,超越所有竞争对手。
该模型编号为 "Gemini-2.5-pro-preview-05-06",已向独立开发者、企业用户及普通用户开放,支持一系列高效开发工作流,单条文本提示即可构建完整、可交互的网页应用或模拟程序,显著降低入门门槛。企业用户通过谷歌云服务平台付费使用,价格未调整,每百万输入 token 收费 1.25 美元,每百万输出 token 收费 10 美元,支持 20 万 token 上下文窗口。
在第三方平台 WebDev Arena 排行榜中,该模型在生成美观实用网页应用方面获人类评审最高分,超越 Anthropic 的 Claude 3.7 Sonnet。多位知名开发者与平台负责人对其表现高度评价,称其在复杂任务中表现优异,Cursor 等平台已将其集成,预示着其将获广泛采纳。
2
Kimi 长思考模型 API 正式发布
5 月 6 日,Kimi 长思考模型 API(kimi - thinking - preview 模型)正式发布。
kimi - thinking - preview 模型是月之暗面提供的具有多模态推理和通用推理能力的多模态思考模型,擅长深度推理,可帮助解决代码、数学、工作等难题。
使用该模型时,可通过 curl 或 openai SDK 调用。其 API 响应中有 reasoning_content 字段作为模型思考内容载体,openai SDK 不支持直接访问该字段,需通过 hasattr 和 getattr 间接获取,流式输出时 reasoning_content 字段先于 content 字段出现。
多轮对话时,思考内容无需放入请求模型的上下文中,且即使不小心放入,其内容也不计入 Tokens 消耗。
该模型目前处于预览版阶段,存在不支持工具调用、联网搜索、JSON Mode、Partial 模式和 Context Caching 等限制。
最佳实践方面,建议使用流式输出以获得更好体验、避免网络超时,设置 temperature = 0.8(可根据需求调整),设置 max_tokens >= 4096 以避免无法输出完整内容。
3
Anysphere 完成 9 亿美元融资
5 月 6 日,AI 编程工具 Cursor 的母公司 Anysphere 近期完成 9 亿美元融资,估值达 90 亿美元,由 Thrive Capital 领投,a16z、Accel 等参投。
Cursor 能通过自然语言指令实现代码生成、查错修复等功能,被 OpenAI 前高管安德烈 · 卡帕西称为体验超越 GitHub Copilot,客户包括 OpenAI、Midjourney 等约 3 万家企业。自今年 1 月完成 1.05 亿美元融资后,其年度经常性收入 4 月增至约 2 亿美元,成为增长最快的软件公司之一。
当下 AI 编程领域热潮涌动,外媒同日爆料,OpenAI 已同意以约 30 亿美元收购 AI 辅助编程工具 Windsurf,这是其迄今为止最大规模的收购。两起事件均凸显了 AI 在编程领域渗透率的显著提升与资本对该赛道的强烈看好。
登录后才可以发布评论哦
打开小程序可以发布评论哦