印度人打招呼的方式遠(yuǎn)不止 Namaste、Vanakkam 和 Sat sri akaal 這三種。印度有 22 種憲法認(rèn)可的語(yǔ)言,而根據(jù)印度人口普查記錄,該國(guó)還有 1500 多種語(yǔ)言。英語(yǔ)是互聯(lián)網(wǎng)上最常用的語(yǔ)言,而會(huì)說(shuō)英語(yǔ)的印度居民只占到印度總?cè)丝诘?10% 左右。
作為世界上人口最多的國(guó)家,印度正在快速推進(jìn)數(shù)字化進(jìn)程。印度企業(yè)和當(dāng)?shù)爻鮿?chuàng)公司正在開(kāi)發(fā)多語(yǔ)種 AI 模型,讓更多印度人能夠用自己的母語(yǔ)進(jìn)行技術(shù)互動(dòng)。這是主權(quán) AI 的典型案例之一,主權(quán) AI 指的是開(kāi)發(fā)基于本地?cái)?shù)據(jù)集,并且能夠反映某地區(qū)特定方言、文化和習(xí)俗的本國(guó) AI 基礎(chǔ)設(shè)施。
這些項(xiàng)目正在構(gòu)建各種印度語(yǔ)言和英語(yǔ)的語(yǔ)言模型,驅(qū)動(dòng)企業(yè)的客服 AI 智能體、快速翻譯內(nèi)容以便更多人獲取信息,并使服務(wù)更易覆蓋超過(guò) 14 億的多元化人口。
為了支持這些舉措,NVIDIA 為印地語(yǔ)這一印度最流行且使用者超過(guò)五億的語(yǔ)言推出了一個(gè)小語(yǔ)言模型。該模型被命名為Nemotron-4-Mini-Hindi-4B,現(xiàn)已作為一項(xiàng)NVIDIA NIM微服務(wù)提供,可輕松部署在任何 NVIDIA GPU 加速系統(tǒng)上用于優(yōu)化性能。
印度 IT 服務(wù)和咨詢公司 Tech Mahindra 是首家使用 Nemotron Hindi NIM 微服務(wù)開(kāi)發(fā) AI 模型的公司。模型被命名為 Indus 2.0,主要針對(duì)印地語(yǔ)及其數(shù)十種方言。Indus 2.0 利用 Tech Mahindra 的高質(zhì)量微調(diào)數(shù)據(jù)進(jìn)一步提高模型的準(zhǔn)確性,使銀行、教育、醫(yī)療及其他行業(yè)的客戶能夠提供本地化服務(wù)。
Tech Mahindra 在 10 月 23 日至 25 日于孟買舉行的 NVIDIA AI Summit 上展示了 Indus 2.0。該公司還使用NVIDIA NeMo開(kāi)發(fā)了其主權(quán)大語(yǔ)言模型(LLM)平臺(tái) TeNo。
NVIDIA NIM 使構(gòu)建
印地語(yǔ) AI 應(yīng)用變得輕而易舉
Nemotron Hindi 模型擁有 40 億個(gè)參數(shù),源自 NVIDIA 開(kāi)發(fā)的一個(gè) 150 億參數(shù)多語(yǔ)種語(yǔ)言模型——Nemotron-4 15B。該模型由 NVIDIA NeMo(一個(gè)用于開(kāi)發(fā)生成式 AI 的端到端云原生框架和微服務(wù)套件)使用真實(shí)印地語(yǔ)數(shù)據(jù)、合成印地語(yǔ)數(shù)據(jù)和等量英語(yǔ)數(shù)據(jù)所組成的數(shù)據(jù)集剪枝、蒸餾和訓(xùn)練而成。
這個(gè)數(shù)據(jù)集由NVIDIA NeMo Curator創(chuàng)建。NeMo Curator 通過(guò)大規(guī)模處理用于訓(xùn)練和定制的高質(zhì)量多模態(tài)數(shù)據(jù),提高了生成式 AI 模型的準(zhǔn)確性。它還使用NVIDIA RAPIDS庫(kù)來(lái)加速多節(jié)點(diǎn) GPU 系統(tǒng)上的數(shù)據(jù)處理管線,從而減少處理時(shí)間和總體擁有成本。NeMo Curator 還提供處理高質(zhì)量數(shù)據(jù)所需的合成數(shù)據(jù)生成、數(shù)據(jù)過(guò)濾、分類和數(shù)據(jù)去重預(yù)建管線與構(gòu)建模塊。
在使用 NeMo 進(jìn)行微調(diào)后,最終模型在多項(xiàng)針對(duì) 80 億參數(shù)以下 AI 模型的準(zhǔn)確性基準(zhǔn)測(cè)試中處于領(lǐng)先地位。該模型被打包成一項(xiàng) NIM 微服務(wù),可輕松用于支持教育、零售、醫(yī)療等行業(yè)的用例。
其可作為NVIDIA AI Enterprise軟件平臺(tái)的一部分獲取。該軟件平臺(tái)為企業(yè)提供技術(shù)支持、企業(yè)級(jí)安全等額外資源,幫助企業(yè)簡(jiǎn)化生產(chǎn)環(huán)境中的 AI 開(kāi)發(fā)。
多家企業(yè)為印度的多語(yǔ)種人口提供服務(wù)
印度各地的創(chuàng)新公司、大型企業(yè)和全球系統(tǒng)集成商都在使用 NVIDIA NeMo 構(gòu)建定制語(yǔ)言模型。
NVIDIA 初創(chuàng)加速計(jì)劃會(huì)員公司正在使用 NeMo 開(kāi)發(fā)多種印度語(yǔ)言的 AI 模型。該計(jì)劃的會(huì)員均為前沿初創(chuàng)公司。
Sarvam AI 為企業(yè)客戶提供語(yǔ)音轉(zhuǎn)文本、文本轉(zhuǎn)語(yǔ)音、翻譯和數(shù)據(jù)解析模型。該公司開(kāi)發(fā)的 Sarvam 1 是印度首個(gè)本土多語(yǔ)種 LLM。該模型是完全在搭載 NVIDIA Tensor Core GPU 的印度本國(guó) AI 基礎(chǔ)設(shè)施上訓(xùn)練而成的。
Sarvam 1 在開(kāi)發(fā)過(guò)程中使用了包括 NeMo Curator 和 NeMo 框架在內(nèi)的 NVIDIA AI Enterprise 軟件,支持英語(yǔ)及 10 種主要印度語(yǔ)言,包括孟加拉語(yǔ)、馬拉地語(yǔ)、泰米爾語(yǔ)和泰盧固語(yǔ)。
Sarvam AI 還使用 NVIDIA NIM 微服務(wù)、適用于對(duì)話式 AI 的NVIDIA Riva、NVIDIA TensorRT-LLM軟件和NVIDIA Triton 推理服務(wù)器來(lái)優(yōu)化和部署具有亞秒級(jí)延遲的對(duì)話式 AI 智能體。
另一家初創(chuàng)加速計(jì)劃會(huì)員公司 Gnani.ai 構(gòu)建了一個(gè)多語(yǔ)種語(yǔ)音轉(zhuǎn)語(yǔ)音的大語(yǔ)言模型,為 AI 客服助手提供支持,該助手每天為印度和美國(guó)的 150 多家銀行、保險(xiǎn)和金融服務(wù)公司處理約 1000 萬(wàn)次實(shí)時(shí)語(yǔ)音交互。該模型使用 NVIDIA Hopper GPU 和 NeMo 框架,基于超過(guò) 1400 萬(wàn)小時(shí)的對(duì)話語(yǔ)音數(shù)據(jù)訓(xùn)練而成,支持 14 種語(yǔ)言。
Gnani.ai 使用 TensorRT-LLM、Triton 推理服務(wù)器和 Riva NIM 微服務(wù)來(lái)優(yōu)化其虛擬客戶服務(wù)助手 AI 和語(yǔ)音分析 AI。
使用 NeMo 構(gòu)建 LLM 的大型企業(yè)包括:
沃爾瑪控股的印度大型電商公司 Flipkart 正在通過(guò)集成NeMo Guardrails(一個(gè)使開(kāi)發(fā)者能夠?yàn)?LLM 添加可編程護(hù)欄的開(kāi)源工具套件),以提高其對(duì)話式 AI 系統(tǒng)的安全性。
Ola Group 擁有印度最大的網(wǎng)約車平臺(tái)之一。該集團(tuán)旗下的企業(yè) Krutrim 正在使用 Mistral NeMo 12B 開(kāi)發(fā)多語(yǔ)種印度語(yǔ)系基礎(chǔ)模型。Mistral NeMo 12B是一個(gè)極其先進(jìn)的 LLM,由 Mistral AI 和 NVIDIA 共同開(kāi)發(fā)而成。
總部位于欽奈的全球技術(shù)公司 Zoho Corporation 將使用 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服務(wù)器為其 70 多萬(wàn)客戶優(yōu)化和提供語(yǔ)言模型。該公司將使用在 NVIDIA Hopper GPU 上運(yùn)行的 NeMo 為 100 多個(gè)商業(yè)應(yīng)用從頭開(kāi)始預(yù)訓(xùn)練窄模型、小模型、中模型和大模型。
印度的各大全球系統(tǒng)集成商也在為其客戶提供由 NVIDIA NeMo 加速的解決方案。
Infosys 將利用 NVIDIA AI 堆棧開(kāi)發(fā)特定工具和解決方案。該公司的卓越中心還在開(kāi)發(fā)由 AI 驅(qū)動(dòng)的小型語(yǔ)言模型,這些模型將作為服務(wù)提供給客戶。
Tata Consultancy Services 基于NVIDIA NIM Agent Blueprint為電信、零售、制造、汽車和金融服務(wù)行業(yè)開(kāi)發(fā)了 AI 解決方案。該公司提供的產(chǎn)品包括 NeMo 驅(qū)動(dòng)的特定領(lǐng)域語(yǔ)言模型。這些模型經(jīng)過(guò)定制后,能夠處理客戶查詢,并回答 IT、人事或現(xiàn)場(chǎng)操作等各個(gè)企業(yè)部門(mén)員工提出的針對(duì)本企業(yè)的問(wèn)題。
Wipro 正在使用包括 NIM Agent Blueprint 和 NeMo 在內(nèi)的 NVIDIA AI Enterprise 軟件,來(lái)幫助企業(yè)輕松開(kāi)發(fā)定制對(duì)話式 AI 解決方案,例如支持客戶服務(wù)互動(dòng)的數(shù)字人等。
Wipro 和 TCS 還使用 NeMo Curator 的合成數(shù)據(jù)生成管線生成英語(yǔ)以外的其他語(yǔ)言的數(shù)據(jù),以便為客戶定制 LLM。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5274瀏覽量
105923 -
AI
+關(guān)注
關(guān)注
88文章
34588瀏覽量
276143 -
模型
+關(guān)注
關(guān)注
1文章
3500瀏覽量
50124 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
561瀏覽量
10709
原文標(biāo)題:印度企業(yè)使用通過(guò) NVIDIA AI 構(gòu)建的 LLM 為十多億當(dāng)?shù)卣Z(yǔ)言使用者提供服務(wù)
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)
NVIDIA NeMo Guardrails引入三項(xiàng)全新NIM微服務(wù)
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
NVIDIA與合作伙伴推出代理式AI Blueprint
NVIDIA推出適用于網(wǎng)絡(luò)安全的NIM Blueprint
NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用
日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新
NVIDIA NIM助力企業(yè)高效部署生成式AI模型
NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

借助NVIDIA NIM加速AI應(yīng)用部署

評(píng)論