Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 优化语义检索,实现准确的 AI 推理
亚马逊云科技 re:Invent — 太平洋时间 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一项生成式 AI 微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。
NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成式 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成式 AI 应用。
作为一项语义检索微服务,NeMo Retriever 借助经 NVIDIA 优化的算法,帮助生成式 AI 应用作出更加准确的回答。使用该微服务的开发者,可以将其 AI 应用与位于各个云和数据中心的业务数据相连通。该服务为 AI 代工添加了 NVIDIA 优化的 RAG 功能,并被整合到亚马逊云科技 Marketplace 上的 NVIDIA AI Enterprise 软件平台中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先与 NVIDIA 合作,将生产就绪型 RAG 功能整合至其自定义生成式 AI 应用和服务中。
NVIDIA 创始人兼首席执行官黄仁勋表示:“具有 RAG 功能的生成式 AI 应用是企业的下一个杀手级应用。借助 NVIDIA NeMo Retriever,开发者可以创建自定义生成式 AI 聊天机器人、AI 助手和摘要工具。它们能够访问企业的业务数据,通过准确且有价值的生成式 AI 智能来提高生产力。”
全球头部企业借助 NeMo Retriever 提高大语言模型(LLM)准确性
电子系统设计领导厂商 Cadence 为超大规模计算、5G 通信、汽车、移动、航空航天、消费和医疗市场的企业提供服务。该公司正与 NVIDIA 合作,为工业电子设计领域的生成式 AI 应用开发 RAG 功能。
Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,比如能在设计流程早期发现潜在缺陷的工具等。我们的研究人员正在与 NVIDIA 合作,使用 NeMo Retriever 进一步提高生成式 AI 应用的准确性和相关性,以便发现问题,并帮助客户更快地将优质产品推向市场。”
破解精确的生成式 AI 应用的“密码”
与开源 RAG 工具套件不同,NeMo Retriever 是通过具有商业可行性的模型、API 稳定性、安全补丁和企业级支持,来为生产就绪型生成式 AI 赋能。
经 NVIDIA 优化的算法使 Retriever 的嵌入模型能够产出准确性最高的结果。经过优化的嵌入模型能够捕捉单词之间的关系,使 LLM 能够处理和分析文本数据。
企业可以使用 NeMo Retriever 将 LLM 连接到多个数据源和知识库,这样用户就可以轻松地与数据交互,并通过简单的对话指令获得准确且最新的答案。通过使用由 Retriever 驱动的应用,企业可以使用户安全地访问多种数据格式的信息,如文本、PDF、图像和视频等。
借助 NeMo Retriever,企业能够以更少的训练获得更准确的结果,加快产品上市时间,并减少生成式 AI 应用开发产生的能耗。
通过 NVIDIA AI Enterprise 实现可靠、简单且安全的部署
企业可以在几乎任何数据中心或云端的 NVIDIA 加速计算上部署由 NeMo Retriever 驱动的应用,以便在推理过程中运行。NVIDIA AI Enterprise 可支持通过 NVIDIA Triton 推理服务器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 软件进行加速的高性能推理。