(全球 TMT2025 年 10 月 29 日讯)亚马逊云科技宣布,Amazon Nova Multimodal Embeddings 多模态嵌入模型现已在 Amazon Bedrock 上线,这是一款专为 Agentic RAG 与语义搜索应用打造的顶尖多模态嵌入模型,是首个通过单一模型支持文本、文档、图像、视频与音频的统一嵌入模型。
嵌入模型可将文本、视觉、音频输入转换为数值表示形式的嵌入向量,这些嵌入向量会捕捉输入内容的语义信息,供 AI 系统进行比较、搜索与分析,为语义搜索、检索增强生成(RAG)等场景提供技术支撑。Amazon Nova 多模态嵌入模型为文本、文档、图像、视频、音频构建了统一的语义空间,可支持多种场景,包括混合模态内容的跨模态搜索、基于参考图像的搜索,以及视觉文档检索。
Amazon Nova 多模态嵌入模型支持的上下文长度最高达 8000 tokens,可处理的文本语言多达 200 种,并能通过同步与异步 API 接收输入。此外,它支持分段处理功能,可将长文本、视频或音频内容拆分为易于处理的片段,并为每个片段生成嵌入向量。最后,该模型提供四种输出嵌入维度,采用套娃表征学习(MRL)训练,能在几乎不影响准确率的前提下,实现低延迟的端到端检索。Amazon Nova 多模态嵌入模型提供四种输出维度选项:3072、1024、384 和 256。该模型包含集成了内置于 Amazon Bedrock 的负责任的 AI 功能。


登录后才可以发布评论哦
打开小程序可以发布评论哦