近日,英偉達在其官方博客上宣布了一項重大進展,推出了一款名為Nemotron-CC的大型英文AI訓練數(shù)據(jù)庫。這一數(shù)據(jù)庫的發(fā)布,標志著英偉達在推動大語言模型訓練技術方面邁出了重要一步。
據(jù)英偉達介紹,Nemotron-CC數(shù)據(jù)庫總計包含了驚人的6.3萬億個Token,其中1.9萬億為精心合成的數(shù)據(jù)。這一龐大的數(shù)據(jù)量不僅為AI模型的訓練提供了豐富的素材,更為學術界和企業(yè)界在探索大語言模型領域時提供了強有力的支持。
英偉達聲稱,Nemotron-CC數(shù)據(jù)庫的設計初衷就是為了幫助學術界和企業(yè)界進一步推動大語言模型的訓練過程。通過提供如此大規(guī)模、高質(zhì)量的訓練數(shù)據(jù),英偉達期望能夠加速AI技術的創(chuàng)新和應用,為各行各業(yè)帶來更多的智能化解決方案。
隨著人工智能技術的不斷發(fā)展,大語言模型已經(jīng)成為研究和實踐中的熱點。而英偉達此次推出的Nemotron-CC數(shù)據(jù)庫,無疑將為這一領域的研究和應用注入新的活力。
-
AI
+關注
關注
87文章
33501瀏覽量
274069 -
數(shù)據(jù)庫
+關注
關注
7文章
3882瀏覽量
65539 -
模型
+關注
關注
1文章
3462瀏覽量
49789 -
英偉達
+關注
關注
22文章
3900瀏覽量
92870
發(fā)布評論請先 登錄
相關推薦
SEGGER emFile支持大型數(shù)據(jù)庫
IBM攜手英偉達AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新
云數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?
數(shù)據(jù)庫數(shù)據(jù)恢復—通過拼接數(shù)據(jù)庫碎片恢復SQLserver數(shù)據(jù)庫

英偉達發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型
NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓練數(shù)據(jù)

英偉達Blackwell可支持10萬億參數(shù)模型AI訓練,實時大語言模型推理
英偉達回應AI芯片推遲發(fā)布傳聞
英偉達打造人形機器人訓練平臺,引領AI新紀元
蘋果AI模型訓練新動向:攜手谷歌,未選英偉達
蘋果承認使用谷歌芯片來訓練AI
大型數(shù)據(jù)庫可選擇WDS作為其數(shù)據(jù)庫一體機產(chǎn)品存儲底座


評論