作為 NVIDIA NIM 微服務(wù),開(kāi)放式 Llama Nemotron 大語(yǔ)言模型和 Cosmos Nemotron 視覺(jué)語(yǔ)言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。
人工智能正在進(jìn)入一個(gè)全新的時(shí)代——代理式 AI。在這個(gè)時(shí)代,專(zhuān)業(yè)智能體團(tuán)隊(duì)可以幫助人們解決復(fù)雜的問(wèn)題并自動(dòng)執(zhí)行重復(fù)任務(wù)。
借助定制 AI 智能體,各行各業(yè)的企業(yè)可以構(gòu)建智能解決方案,從而獲得前所未有的生產(chǎn)力。這些先進(jìn)的 AI 智能體需要一個(gè)多樣化生成式 AI 模型系統(tǒng),并且這些模型要針對(duì)代理式 AI 功能和能力進(jìn)行優(yōu)化。這樣的復(fù)雜程度意味著企業(yè)對(duì)強(qiáng)大、高效的企業(yè)級(jí)模型產(chǎn)生了極大的需求。
為了給企業(yè)代理式 AI 奠定基礎(chǔ),NVIDIA 宣布推出開(kāi)放式大語(yǔ)言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構(gòu)建,可以幫助開(kāi)發(fā)者在一系列應(yīng)用中創(chuàng)建和部署 AI 智能體,包括客戶支持、欺詐檢測(cè)、產(chǎn)品供應(yīng)鏈和庫(kù)存管理優(yōu)化。
許多 AI 智能體不僅需要語(yǔ)言技能,還需要感知世界并采取適當(dāng)行動(dòng)的能力,以更有效地發(fā)揮其作用。
借助全新的 NVIDIA Cosmos Nemotron 視覺(jué)語(yǔ)言模型 (VLM) 以及面向視頻搜索和摘要的 NVIDIA NIM 微服務(wù),開(kāi)發(fā)者可以構(gòu)建智能體,分析來(lái)自自主機(jī)器、醫(yī)院、商店和倉(cāng)庫(kù)的圖像和視頻以及體育賽事、電影和新聞,并對(duì)其做出響應(yīng)。針對(duì)希望為機(jī)器人和自動(dòng)駕駛汽車(chē)領(lǐng)域生成物理感知視頻的開(kāi)發(fā)者,NVIDIA 還宣布推出 NVIDIA Cosmos 世界基礎(chǔ)模型。
開(kāi)放式 Llama Nemotron 模型優(yōu)化了 AI 智能體的計(jì)算效率和精度
NVIDIA Llama Nemotron 模型基于 Llama 基礎(chǔ)模型而構(gòu)建,為 AI 智能體開(kāi)發(fā)提供經(jīng)過(guò)優(yōu)化的基礎(chǔ)模組。Llama 基礎(chǔ)模型是最熱門(mén)的商用開(kāi)源模型集合之一,下載次數(shù)超過(guò) 6.5 億次。這一成果建立在 NVIDIA 致力于開(kāi)發(fā)前沿模型的基礎(chǔ)之上,例如 Llama 3.1 Nemotron 70B,現(xiàn)在可通過(guò) NVIDIA API 目錄獲取。
Llama Nemotron 模型使用 NVIDIA 最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行剪枝和訓(xùn)練,可增強(qiáng)代理式 AI 功能。它們?cè)谥噶钭裱?、聊天、函?shù)調(diào)用、編碼和數(shù)學(xué)方面表現(xiàn)出色,同時(shí)經(jīng)過(guò)尺寸優(yōu)化,可在廣泛的 NVIDIA 加速計(jì)算資源上運(yùn)行。
Meta 副總裁兼 GenAI 負(fù)責(zé)人 Ahmad Al-Dahle 表示:“代理式 AI 是 AI 開(kāi)發(fā)的下一個(gè)前沿,為了抓住這次機(jī)會(huì),需要在 LLM 系統(tǒng)中進(jìn)行全棧優(yōu)化,以提供高效、準(zhǔn)確的 AI 智能體。通過(guò)與 NVIDIA 的合作,以及我們對(duì)開(kāi)放模型的共同承諾,基于 Llama 構(gòu)建的 NVIDIA Llama Nemotron 系列可以助力企業(yè)快速構(gòu)建自己的定制 AI 智能體。”
包括 SAP 和 ServiceNow 在內(nèi)的領(lǐng)先 AI 智能體平臺(tái)提供商,有望成為首批使用全新 Llama Nemotron 模型的企業(yè)。
SAP 首席人工智能官 Philipp Herzig 表示:“能夠跨多個(gè)業(yè)務(wù)線協(xié)作解決復(fù)雜任務(wù)的 AI 智能體將會(huì)超越當(dāng)今的生成式 AI 場(chǎng)景,將企業(yè)生產(chǎn)力提升到一個(gè)全新的水平。借助 SAP 的 Joule,數(shù)億企業(yè)用戶能夠與這些智能體進(jìn)行交互,以前所未有的速度實(shí)現(xiàn)他們的目標(biāo)。NVIDIA 的全新開(kāi)放式 Llama Nemotron 模型系列將推動(dòng)多個(gè)專(zhuān)用 AI 智能體的開(kāi)發(fā),助力業(yè)務(wù)流程轉(zhuǎn)型?!?/p>
ServiceNow 平臺(tái) AI 副總裁 Jeremy Barnes 表示:“AI 智能體使企業(yè)組織能夠事半功倍,為業(yè)務(wù)轉(zhuǎn)型樹(shù)立了新的標(biāo)準(zhǔn)。NVIDIA 開(kāi)放式 Llama Nemotron 模型性能和精度的提升有助于構(gòu)建先進(jìn)的 AI 智能體服務(wù),以解決各行業(yè)中各種職能的復(fù)雜問(wèn)題。”
NVIDIA Llama Nemotron 模型使用 NVIDIA NeMo 進(jìn)行蒸餾、剪枝和對(duì)齊。使用這些技術(shù)可以將這些模型保持較小的規(guī)模,以便在各種計(jì)算平臺(tái)上運(yùn)行,并在提供高精度的同時(shí)提高模型吞吐量。
Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務(wù)的形式提供,可輕松部署在云端、數(shù)據(jù)中心、PC 和工作站。它們可以為企業(yè)提供業(yè)界領(lǐng)先的性能,并且能夠可靠、安全且無(wú)縫地集成到其代理式 AI 應(yīng)用工作流中。
使用 NVIDIA NeMo 定制并接入業(yè)務(wù)知識(shí)
Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規(guī)模,為部署各種規(guī)模的 AI 智能體提供廣泛選擇。
Nano:成本效益最高的模型,針對(duì)實(shí)時(shí)應(yīng)用進(jìn)行了優(yōu)化,延遲低,非常適合部署在 PC 和邊緣設(shè)備上。
Super:高精度模型,可在單個(gè) GPU 上提供卓越的吞吐量。
Ultra:精度最高的模型,專(zhuān)為需要超高性能的數(shù)據(jù)中心級(jí)應(yīng)用而設(shè)計(jì)。
企業(yè)還可以使用 NVIDIA NeMo 微服務(wù)為其特定用例和領(lǐng)域定制模型,以簡(jiǎn)化數(shù)據(jù)管護(hù)、加速模型定制和評(píng)估,還可以應(yīng)用護(hù)欄,以確保響應(yīng)正常。
借助 NVIDIA NeMo Retriever,開(kāi)發(fā)者還可以集成檢索增強(qiáng)生成功能,將模型與企業(yè)數(shù)據(jù)連接起來(lái)。
使用面向代理式 AI 的 NVIDIA Blueprint,企業(yè)可以利用 NVIDIA 先進(jìn)的 AI 工具和端到端開(kāi)發(fā)專(zhuān)長(zhǎng),快速構(gòu)建自己的應(yīng)用。事實(shí)上,NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發(fā)布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強(qiáng)效助力。
NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過(guò) NVIDIA AI Enterprise 軟件平臺(tái)使用。
可用性
Llama Nemotron 和 Cosmos Nemotron 模型將以托管應(yīng)用編程接口的形式提供,可通過(guò) NVIDIA 官網(wǎng)和 Hugging Face 下載:https://www.nvidia.cn/ai/
NVIDIA 開(kāi)發(fā)者計(jì)劃的成員均可免費(fèi)訪問(wèn)開(kāi)發(fā)、測(cè)試和研究資源:https://forums.developer.nvidia.com/t/nvidia-nim-faq/300317
在生產(chǎn)中,企業(yè)可以使用 NVIDIA AI Enterprise 軟件平臺(tái)在加速數(shù)據(jù)中心和云計(jì)算基礎(chǔ)設(shè)施上運(yùn)行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務(wù)。
查閱相關(guān)軟件產(chǎn)品信息說(shuō)明:https://www.nvidia.cn/about-nvidia/terms-of-service/