在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用

英特爾中國 ? 來源:英特爾中國 ? 2024-07-24 15:12 ? 次閱讀

深入研究檢索增強(qiáng)生成 (Retrieval Augmented Generation, RAG),該創(chuàng)新方法定義了企業(yè)和機(jī)構(gòu)如何利用大語言模型(LLM)來發(fā)揮其數(shù)據(jù)的價(jià)值。本文將探索若干英特爾 軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用,在簡(jiǎn)化部署和支持?jǐn)U展的同時(shí),增強(qiáng)其上下文感知能力和實(shí)時(shí)響應(yīng)性能。

1為您的應(yīng)用量身定制GenAI

ChatGPT的面世改變了AI的發(fā)展格局。企業(yè)爭(zhēng)相利用這項(xiàng)新技術(shù)打造新產(chǎn)品,提高競(jìng)爭(zhēng)優(yōu)勢(shì)和生產(chǎn)力,實(shí)現(xiàn)更加經(jīng)濟(jì)高效的運(yùn)營。

生成式AI(GenAI)模型,如Grok-1(逾3,000億參數(shù))和GPT-4(數(shù)萬億參數(shù)),利用來自互聯(lián)網(wǎng)等文本來源的海量數(shù)據(jù)進(jìn)行訓(xùn)練。這些第三方大語言模型適用于通用用例。然而,企業(yè)的大多數(shù)用例都需要使用自身的數(shù)據(jù)來訓(xùn)練和/或增強(qiáng)AI模型,這樣模型產(chǎn)出的結(jié)果才能對(duì)業(yè)務(wù)更有幫助。以下是生成式AI在各行各業(yè)的應(yīng)用示例。

cda67caa-45bf-11ef-b8af-92fbcf53809c.png

來源:由《麻省理工科技評(píng)論》根據(jù)“Retail in the Age of Generative AI(生成式AI時(shí)代的零售)”、“The Great Unlock: Large Language Models in Manufacturing(大解鎖:制造業(yè)中的大語言模型)”、“Generative AI Is Everything Everywhere, All at Once(生成式AI無處不在、每時(shí)每刻都在發(fā)生)”和“Large Language Models in Media & Entertainment(媒體和娛樂行業(yè)中的大語言模型)”(Databricks,2023年4月至6月)中的數(shù)據(jù)編寫。

雖然企業(yè)可以用自有的數(shù)據(jù)對(duì)模型進(jìn)行調(diào)優(yōu),但重新訓(xùn)練模型需要額外的時(shí)間和資源。好在現(xiàn)在有了一種頗受歡迎的技術(shù),即檢索增強(qiáng)生成(RAG),它可以利用企業(yè)專有的數(shù)據(jù)來增強(qiáng)開源預(yù)訓(xùn)練模型,從而創(chuàng)建特定領(lǐng)域的LLM,得出針對(duì)具體業(yè)務(wù)的結(jié)果。此外,RAG無需與第三方大型基礎(chǔ)模型共享數(shù)據(jù),因此能夠讓企業(yè)更好地保護(hù)數(shù)據(jù)安全。

在本指南中,我們將介紹RAG如何與英特爾多種優(yōu)化技術(shù)和平臺(tái)搭配使用,為GenAI系統(tǒng)帶來出色的價(jià)值和性能。

2檢索增強(qiáng)生成(RAG)是什么?

RAG技術(shù)將動(dòng)態(tài)、依賴查詢的數(shù)據(jù)添加到模型的提示流中,再從存儲(chǔ)在矢量數(shù)據(jù)庫中的專有知識(shí)庫中檢索相關(guān)數(shù)據(jù)。提示和檢索到的上下文可以豐富模型的輸出,從而帶來更加相關(guān)和準(zhǔn)確的結(jié)果。因?yàn)閿?shù)據(jù)不會(huì)被發(fā)送給管理模型的第三方,因此,RAG可讓企業(yè)在保護(hù)數(shù)據(jù)隱私性和完整性的同時(shí)更好地通過LLM充分利用數(shù)據(jù)。RAG工作流程的關(guān)鍵構(gòu)成可簡(jiǎn)單分為四個(gè)步驟:用戶查詢處理、檢索、上下文整合和輸出生成。下圖展示了這一基本流程。

cdbc0bec-45bf-11ef-b8af-92fbcf53809c.png

RAG的實(shí)用性不僅限于文本,它還可以極大地改變視頻搜索和交互式文檔探索的方式,甚至使聊天機(jī)器人能夠利用PDF內(nèi)容來回答問題。

RAG的應(yīng)用過程通常被稱為“RAG 管線”,因其從用戶提示開始,整個(gè)數(shù)據(jù)處理流程都是一致的。用戶提示首先進(jìn)入關(guān)鍵步驟“檢索機(jī)制”中。在這一步,相關(guān)提示會(huì)被轉(zhuǎn)換為矢量嵌入,接著使用矢量搜索在預(yù)先構(gòu)建的矢量數(shù)據(jù)庫(如PDF、日志、轉(zhuǎn)錄文本等)中找到相似的內(nèi)容。檢索到最相關(guān)的數(shù)據(jù)后,RAG會(huì)將其與用戶提示整合,然后傳送給模型用于推理服務(wù)和最終輸出生成。這種上下文整合為模型提供了在預(yù)訓(xùn)練階段無法獲得的額外信息,使模型能夠更好地契合用戶的任務(wù)或興趣領(lǐng)域。由于RAG無需重新訓(xùn)練或調(diào)優(yōu)模型,因此能夠高效地添加數(shù)據(jù)來為L(zhǎng)LM提供上下文。下一節(jié)將探討RAG解決方案的架構(gòu)和堆棧。

3標(biāo)準(zhǔn)RAG解決方案的架構(gòu)

下圖所示的RAG解決方案架構(gòu)展示了標(biāo)準(zhǔn)RAG實(shí)施方案的構(gòu)建模塊。RAG實(shí)施流程主要包括:①構(gòu)建知識(shí)庫、②查詢和上下文檢索、③響應(yīng)生成④跨應(yīng)用產(chǎn)出監(jiān)控幾個(gè)核心部分。

cdd0e274-45bf-11ef-b8af-92fbcf53809c.png

RAG LLM架構(gòu)

讓我們展開談?wù)勂渲袔讉€(gè)核心部分:

①構(gòu)建知識(shí)庫:

? 數(shù)據(jù)收集:從基于文本的來源(如轉(zhuǎn)錄文本、PDF和數(shù)字化文檔)中收集數(shù)據(jù)建立私有知識(shí)庫。

? 數(shù)據(jù)處理管線:利用特定RAG管線來提取文本、格式化內(nèi)容以進(jìn)行處理,并將數(shù)據(jù)分塊成可管理的大小。

? 矢量化:通過嵌入模型處理數(shù)據(jù)塊,將文本轉(zhuǎn)換為矢量,可包括用于豐富上下文的元數(shù)據(jù)。

? 矢量數(shù)據(jù)庫存儲(chǔ):將矢量化數(shù)據(jù)存儲(chǔ)在可擴(kuò)展的矢量數(shù)據(jù)庫中,以便進(jìn)行高效檢索。

②查詢和上下文檢索:

? 查詢提交:用戶或子系統(tǒng)通過聊天式界面或API調(diào)用提交查詢,并通過安全服務(wù)進(jìn)行身份驗(yàn)證。

? 查詢處理:采取輸入保護(hù)措施來確保安全性和合規(guī)性,然后進(jìn)行查詢矢量化。

? 矢量搜索和重排序:進(jìn)行初始矢量搜索以檢索相關(guān)矢量,然后使用更復(fù)雜的模型重排序以優(yōu)化結(jié)果。

③響應(yīng)生成:

? LLM推理和響應(yīng)生成:將頂層上下文與用戶查詢結(jié)合,再通過預(yù)訓(xùn)練或調(diào)優(yōu)的LLM進(jìn)行處理,然后再進(jìn)行后處理以提升質(zhì)量和增強(qiáng)安全性。

? 響應(yīng)交付:通過界面將最終響應(yīng)返回給用戶或子系統(tǒng),確保答案的連貫性和上下文準(zhǔn)確性。

④產(chǎn)出監(jiān)控:

? 檢索性能:監(jiān)控檢索過程的時(shí)延和準(zhǔn)確性,并保留記錄以用于審核。

? 重排序的效率:跟蹤重排序的表現(xiàn),確保上下文相關(guān)性和速度。

? 推理服務(wù)質(zhì)量:觀察LLM推理的時(shí)延和質(zhì)量,維護(hù)日志以便審核和改進(jìn)。

? 安全防護(hù)有效性:監(jiān)控輸入和輸出處理的安全防護(hù)(guardrail),確保合規(guī)性和內(nèi)容安全性。

4RAG相關(guān)技術(shù)

開發(fā)RAG應(yīng)用通常會(huì)從集成RAG框架開始,例如Haystack、LlamaIndex、LangChain和英特爾研究院的fastRAG。這些框架可通過提供優(yōu)化和集成關(guān)鍵的AI工具鏈來簡(jiǎn)化開發(fā)過程。

我們從知識(shí)庫構(gòu)建、查詢和上下文檢索以及響應(yīng)生成這三個(gè)關(guān)鍵步驟來考量RAG工具鏈。通常,RAG框架提 供涵蓋整個(gè)工具鏈的API。不管是選擇使用這些抽象,還是選擇利用獨(dú)立組件,都需要深思熟慮并從工程角度慎重考慮。

cdf3811c-45bf-11ef-b8af-92fbcf53809c.png

英特爾提供的優(yōu)化技術(shù)/方案填補(bǔ)了工具鏈和硬件之間的缺口,并且在提升這些工具鏈與英特爾 至強(qiáng) 處理器兼容性及功能的同時(shí),增強(qiáng)了跨工具鏈的性能。這些優(yōu)化被集成到現(xiàn)有框架中,或者作為附加的擴(kuò)展進(jìn)行分發(fā),目的是減少開發(fā)人員對(duì)大量低級(jí)別編程的需求。這種抽象使得開發(fā)人員能夠利用增強(qiáng)的性能和針對(duì)其特定用例量身定制的解決方案,專注于高效構(gòu)建RAG應(yīng)用。

接下來,本文將對(duì)工具鏈的多個(gè)組成部分進(jìn)行更詳細(xì)的探討。

構(gòu)建知識(shí)庫 + 上下文檢索:

? 集成框架:Haystack和LangChain作為常見RAG框架,為矢量數(shù)據(jù)庫和搜索算法提供了高級(jí)抽象,使得開發(fā)人員能夠在基于Python的環(huán)境中管理復(fù)雜的過程。

? 矢量數(shù)據(jù)庫技術(shù):Pinecone、Redis和Chroma是支持主流搜索算法的關(guān)鍵矢量數(shù)據(jù)庫解決方案。英特爾研究院提供的可擴(kuò)展矢量搜索(Scalable Vector Search, SVS)技術(shù)也很有發(fā)展前景,預(yù)計(jì)將在2024年初與各大矢量數(shù)據(jù)庫集成。

? 嵌入和模型可訪問性:通過Hugging Face API進(jìn)行集成的嵌入模型往往可無縫整合到RAG框架中。這大大提升了納入先進(jìn)自然語言處理(NLP)的簡(jiǎn)便性。

響應(yīng)生成:

? 低級(jí)別優(yōu)化:oneAPI高性能庫可以優(yōu)化PyTorch、TensorFlow和ONNX等主流AI框架,因此您可以使用熟悉的開源工具,因?yàn)樗鼈円厌槍?duì)英特爾 硬件進(jìn)行了優(yōu)化。

? 高級(jí)推理優(yōu)化:英特爾 Extension for PyTorch等擴(kuò)展添加了高級(jí)量化推理技術(shù),可助力提升了大語言模型的性能。

如您所見,RAG涉及多個(gè)相關(guān)聯(lián)的部分,在單一平臺(tái)(如英特爾 至強(qiáng) 處理器)上進(jìn)行管理可簡(jiǎn)化配置、部署和維護(hù)。

下一節(jié)將深入探討RAG應(yīng)用的復(fù)雜性,包括幫助團(tuán)隊(duì)實(shí)現(xiàn)成功部署的各種考量因素和技術(shù)。

5加速RAG應(yīng)用與落地

RAG管線的許多步驟需要耗費(fèi)大量計(jì)算資源,而同時(shí),終端用戶又對(duì)低時(shí)延響應(yīng)有著較高要求。此外,由于RAG經(jīng)常用于處理機(jī)密數(shù)據(jù),因此整個(gè)管線的安全性都至關(guān)重要。英特爾 技術(shù)賦能RAG管線,助力提升各個(gè)計(jì)算平臺(tái)的安全性能和充分發(fā)揮專為特定領(lǐng)域或行業(yè)量身定制的生成式AI的優(yōu)勢(shì)。

計(jì)算需求

一般來說,LLM推理是RAG管線計(jì)算最密集的階段,特別是在實(shí)時(shí)應(yīng)用環(huán)境中。然而,創(chuàng)建初始知識(shí)庫(處理數(shù)據(jù)和生成嵌入)對(duì)計(jì)算的需求同樣可能很高(取決于數(shù)據(jù)的復(fù)雜性和體量)。英特爾在通用計(jì)算技術(shù)、AI加速器和機(jī)密計(jì)算方面的進(jìn)步為應(yīng)對(duì)整個(gè)RAG管線的計(jì)算挑戰(zhàn)提供了重要基石,同時(shí)還能提高數(shù)據(jù)隱私和安全性。

和大多數(shù)軟件應(yīng)用一樣,RAG也能從專為滿足終端用戶事務(wù)需求而量身定制的可擴(kuò)展基礎(chǔ)設(shè)施中受益。隨著事務(wù)需求的增加,開發(fā)人員可能會(huì)因計(jì)算基礎(chǔ)設(shè)施負(fù)載過重而面臨時(shí)延增加,且基礎(chǔ)設(shè)施還會(huì)因矢量數(shù)據(jù)庫查詢和推理計(jì)算而趨于飽和。因此,獲得隨時(shí)可用的計(jì)算資源來擴(kuò)展系統(tǒng)和快速處理新增需求對(duì)企業(yè)至關(guān)重要。另外,實(shí)施關(guān)鍵優(yōu)化以提升諸如嵌入生成、矢量搜索與推理等關(guān)鍵步驟的性能也非常重要。

數(shù)據(jù)隱私和安全性

? 安全AI處理:英特爾 軟件防護(hù)擴(kuò)展(Intel Software Guard Extensions,英特爾 SGX)和英特爾 Trust Domain Extensions(英特爾 TDX)在處理過程中在CPU內(nèi)存中進(jìn)行機(jī)密計(jì)算和數(shù)據(jù)加密,提高了數(shù)據(jù)安全性。這些技術(shù)對(duì)于處理敏感信息至關(guān)重要,有助于利用管線各部分的加密數(shù)據(jù)創(chuàng)建更安全的RAG應(yīng)用。對(duì)于需要在矢量嵌入生成、檢索或推理過程中更安全地處理敏感數(shù)據(jù)的RAG應(yīng)用來說,這是一個(gè)重要特性。

? 采取適當(dāng)防護(hù):在RAG應(yīng)用中,防護(hù)涉及采取措施來管理LLM在RAG系統(tǒng)內(nèi)的行為。這包括監(jiān)控模型的響應(yīng)、幫助遵守指導(dǎo)原 則和最佳實(shí)踐,以及控制其輸出來降低毒性、不公平偏見和隱私泄露的風(fēng)險(xiǎn)。在RAG應(yīng)用中采取防護(hù)措施有助于LLM得到用戶的信任和負(fù)責(zé)任的運(yùn)用,同時(shí)符合系統(tǒng)的整體目標(biāo)和要求。

開源優(yōu)化

嵌入優(yōu)化

? 量化嵌入模型:英特爾 至強(qiáng) 處理器可以利用量化嵌入模型來優(yōu)化從文檔中生成矢量嵌入的過程。例如,bge-small-en-v1.5-rag-int8-static 是一個(gè)使用英特爾 Neural Compressor進(jìn)行量化的BAAI/BGE-small-en-v1.5版本,與Optimum-Intel兼容。按照Massive Text Embedding Benchmark (MTEB) 性能指標(biāo)計(jì)算,使用量化模型進(jìn)行檢索和重排序任務(wù)時(shí),浮點(diǎn)(FP32)和量化INT8版本之間的差異小于2%,同時(shí)提高了吞吐量(見腳注1和3)。

在最近與Hugging Face合作進(jìn)行的一項(xiàng)研究中,我們?cè)u(píng)估了以每秒文檔數(shù)為指標(biāo)達(dá)到峰值編碼性能所需吞吐量。總體而言,無論模型大小,量化模型在各種批大小下均較基線bfloat16(BF16) 模型取得高達(dá)4倍的改進(jìn)。

ce8cc4a8-45bf-11ef-b8af-92fbcf53809c.png

圖1. BGE-small吞吐量

矢量搜索優(yōu)化

? 針對(duì)CPU優(yōu)化的工作負(fù)載:在英特爾 至強(qiáng) 處理器上,矢量搜索操作得到了高度優(yōu)化,特別是在第三代及以后的處理器中引入了英特爾 高級(jí)矢量擴(kuò)展 512(Intel Advanced Vector Extensions 512,英特爾AVX-512)之后。英特爾 AVX-512利用融合乘加 (FMA) 指令,將乘法和加法合并為一個(gè)運(yùn)算,從而增強(qiáng)了內(nèi)積計(jì)算,這是矢量搜索中的一個(gè)基本運(yùn)算。這一功能減少了計(jì)算所需的指令數(shù)量,顯著提高了吞吐量和性能。

? 可擴(kuò)展矢量搜索 (SVS)可擴(kuò)展矢量搜索(SVS)技術(shù)提供快速的矢量搜索能力,可助力優(yōu)化檢索時(shí)間并提升整體系統(tǒng)性能。它通過使用局部自適應(yīng)矢量量化(LVQ)來優(yōu)化基于圖形的相似度搜索,在保持準(zhǔn)確性的同時(shí)盡可能降低內(nèi)存帶寬要求。其結(jié)果是顯著減少了距離計(jì)算時(shí)延,并在吞吐量和內(nèi)存要求方面獲得了更好的表現(xiàn)(如下圖所示)。

ceaefece-45bf-11ef-b8af-92fbcf53809c.png

圖2. SVS與其它被廣泛采用的實(shí)現(xiàn)方案(HNSWlib與Faiss-IVFPQfs)在每秒查詢數(shù)量(吞吐量)方面的性能對(duì)比。該圖展示了在rqa-768-10M-OOD數(shù)據(jù)集(由密集通道檢索模型 RocketQA[QDLL21]使用分布外查詢生成的1000萬個(gè)768維嵌入向量)上,QPS和召回率的關(guān)系曲線。(腳注2和3)

推理優(yōu)化

RAG主要涉及推理運(yùn)算,這一過程可由英特爾 至強(qiáng) 處理器通過先進(jìn)的模型壓縮技術(shù)提供支持。這些技術(shù)支持在較低精度(BF16和INT8)下進(jìn)行運(yùn)算,并且不會(huì)造成明顯的性能損失。在本節(jié)中,我們將簡(jiǎn)要介紹各種針對(duì)推理的優(yōu)化和機(jī)會(huì)。

? 英特爾 高級(jí)矩陣擴(kuò)展(Intel Advanced Matrix Extensions,英特爾 AMX):第四代和第五代英特爾 至強(qiáng) 可擴(kuò)展處理器內(nèi)置英特爾 AMX,能夠提高矩陣運(yùn)算的效率并優(yōu)化內(nèi)存管理。

? 先進(jìn)的開源推理優(yōu)化工具:英特爾貢獻(xiàn)并擴(kuò)展了主流深度學(xué)習(xí)框架,如PyTorch、TensorFlow、Hugging Face、DeepSpeed等。對(duì)于RAG工作流程,英特爾關(guān)注的是通過實(shí)施量化等模型壓縮技術(shù)來優(yōu)化LLM的機(jī)會(huì)。英特爾 Extension for PyTorch目前提供多種先進(jìn)的LLM化配方,如 SmoothQuant、僅權(quán)重量化和混合精度 (FP32/BF16)。下圖顯示了在雙路第五代英特爾 至強(qiáng) 平臺(tái)上運(yùn)行的INT8量化Llama 2和GPT-J模型的推理時(shí)延。

cf78a896-45bf-11ef-b8af-92fbcf53809c.png

圖3. 基于第五代英特爾 至強(qiáng) 可擴(kuò)展處理器的Llama 2 13B和GPT-J 6B性能3

6RAG在企業(yè)中的應(yīng)用機(jī)遇

零售

零售商面臨的挑戰(zhàn)是向客戶推薦符合其多樣化和不斷變化的偏好的產(chǎn)品。傳統(tǒng)的推薦系統(tǒng)可能無法有效地掌握最新趨勢(shì)或個(gè)體客戶反饋,導(dǎo)致建議不太貼合實(shí)際。

采用基于RAG的推薦系統(tǒng)使零售商能夠不斷整合最新趨勢(shì)和個(gè)體客戶反饋,從而得出更個(gè)性化的產(chǎn)品建議。該系統(tǒng)通過提供相關(guān)、及時(shí)和個(gè)性化的產(chǎn)品推薦來豐富購物體驗(yàn),進(jìn)而助力提高銷量并提升客戶忠誠度。

制造業(yè)

在制造業(yè)中,設(shè)備故障導(dǎo)致的意外停機(jī)是一個(gè)重要的成本驅(qū)動(dòng)因素。傳統(tǒng)的預(yù)測(cè)性維護(hù)模型可能會(huì)遺漏故障發(fā)生前出現(xiàn)的細(xì)微異常狀況,尤其是歷史故障數(shù)據(jù)有限或缺失的復(fù)雜設(shè)備的異常狀況。

用于預(yù)測(cè)性維護(hù)的基于RAG的異常檢測(cè)系統(tǒng)可以實(shí)時(shí)分析大量運(yùn)行數(shù)據(jù),并將其與豐富的設(shè)備性能知識(shí)庫進(jìn)行比對(duì),以在故障發(fā)生之前識(shí)別出可能存在的問題。這種方法在延長(zhǎng)設(shè)備使用壽命的同時(shí),盡可能減少了停機(jī)時(shí)間和維護(hù)成本。

金融服務(wù)

由于金融數(shù)據(jù)和法規(guī)不斷變化且數(shù)量龐大,大規(guī)模提供個(gè)性化的金融建議面臨重重挑戰(zhàn)。客戶期望能夠獲得快速、相關(guān)且個(gè)性化的金融建議,而傳統(tǒng)的聊天機(jī)器人無法始終準(zhǔn)確提供這些建議。

RAG模型則能夠通過動(dòng)態(tài)拉取最新的金融數(shù)據(jù)和法規(guī)來生成個(gè)性化的建議,顯著增強(qiáng)了金融建議聊天機(jī)器人的能力。聊天機(jī)器人可以利用龐大的知識(shí)庫,為客戶提供量身定制的投資策略、實(shí)時(shí)市場(chǎng)洞察和監(jiān)管建議,從而提高客戶滿意度和參與度。

后續(xù)行動(dòng)

英特爾提供一套資源來幫您開始執(zhí)行實(shí)施方案,您可以通過英特爾 Tiber Developer Cloud 獲取硬件,也可以利用 Google Cloud Platform、Amazon Web Services和 Microsoft Azure等各大云服務(wù)平臺(tái)中無處不在的計(jì)算資源。對(duì)于需要代碼示例、演練、培訓(xùn)等內(nèi)容的開發(fā)人員,請(qǐng)?jiān)L問英特爾 開發(fā)人員專區(qū)。

更多英特爾至強(qiáng)為AI加速相關(guān)解決方案內(nèi)容,歡迎點(diǎn)擊“閱讀原文”了解

1 性能聲明基于雙路英特爾 至強(qiáng) 鉑金 8480+處理器,每路56個(gè)內(nèi)核。PyTorch 模型使用單路處理器上的56個(gè)內(nèi)核進(jìn)行評(píng)估。IPEX/Optimum設(shè)置使用 ipexrun、單路處理器和22至56個(gè)內(nèi)核進(jìn)行評(píng)估。TCMalloc在所有運(yùn)行中都已安裝并定義為環(huán)境變量。

2 性能聲明基于雙路英特爾 至強(qiáng) 鉑金 8480L處理器,每路56個(gè)內(nèi)核,每路配備512 GB DDR4內(nèi)存,速度為4800 MT/s,運(yùn)行Ubuntu 22.04.12。對(duì)于 deep-96-1B數(shù)據(jù)集,我們使用具有相同特性的服務(wù)器,唯一的區(qū)別是每路配備1 TB DDR4內(nèi)存,速度為4400 MT/s。

3 實(shí)際性能受使用情況、配置和其他因素的差異影響。性能測(cè)試結(jié)果基于配置信息中顯示的日期進(jìn)行的測(cè)試,且可能并未反映所有公開可用的安全更新。沒有任何產(chǎn)品或組件是絕對(duì)安全的。具體成本和結(jié)果可能不同。英特爾技術(shù)可能需要啟用硬件、軟件或激活服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10119

    瀏覽量

    173432
  • 軟硬件
    +關(guān)注

    關(guān)注

    1

    文章

    312

    瀏覽量

    19465
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    316

    瀏覽量

    617

原文標(biāo)題:看英特爾? 軟硬件如何助力加速RAG應(yīng)用落地

文章出處:【微信號(hào):英特爾中國,微信公眾號(hào):英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    阿里巴巴攜手英特爾開發(fā)一款基于FPGA的解決方案,以幫助客戶提升業(yè)務(wù)應(yīng)用的性能

    Alibaba Cloud(阿里云)已宣布與英特爾合作開展基于云的現(xiàn)場(chǎng)可編程門陣列 (FPGA) 加速服務(wù)試點(diǎn)計(jì)劃,該計(jì)劃旨在幫助客戶虛擬訪問云中的豐富計(jì)算資源,更高效地管理業(yè)務(wù)、科學(xué)和企業(yè)數(shù)據(jù)
    發(fā)表于 03-15 14:27

    英特爾高清顯卡4600幫助

    英特爾,問候。最近我買了一臺(tái)新的BenQ XL2411P顯示器。它通過HDMI(進(jìn)出)使用單顯示器連接到我的筆記本電腦。我的筆記本電腦集成了Intel HD Graphics 4600
    發(fā)表于 10-26 14:53

    英特爾的Caffe優(yōu)化是否支持這些網(wǎng)絡(luò)?

    我們正在嘗試在Caffe開發(fā)的網(wǎng)絡(luò)的DevCloud中進(jìn)行培訓(xùn)。我們嘗試了LeNet,AlexNet和自定義網(wǎng)絡(luò)。沒有顯示有關(guān)培訓(xùn)的狀態(tài)。英特爾的Caffe優(yōu)化是否支持這些網(wǎng)絡(luò)?如果是這樣,您可
    發(fā)表于 12-05 10:43

    為什么選擇加入英特爾

    近日,加入英特爾已有3個(gè)月的明星芯片架構(gòu)師Jim Keller接受了外媒VentureBeat的采訪,在采訪中談及了自己加入英特爾的始末和讓其為之興奮的新角色——英特爾公司技術(shù)、系統(tǒng)架構(gòu)和客戶端事業(yè)部高級(jí)副總裁兼芯片工程事業(yè)部總
    發(fā)表于 07-25 07:31

    蘋果Mac棄用英特爾芯片的原因

      蘋果首次舉行線上開發(fā)者大會(huì)(WWDC20),在一系列iOS14、macOS等軟硬件更新宣布中,最重磅的莫過于蘋果電腦Mac未來將使用自研的ARM架構(gòu)芯片,逐步替代現(xiàn)有的英特爾芯片。  在業(yè)
    發(fā)表于 06-23 08:53

    英特爾Optane DC PMM硬件的相關(guān)資料分享

    數(shù)據(jù)移近CPU,提供類似DRAM的延遲,同時(shí)也具有類似存儲(chǔ)設(shè)備的持久性和容量。 經(jīng)過一年的時(shí)間聽取硬件和軟件合作伙伴談?wù)摮志脙?nèi)存的好處,現(xiàn)在,隨著第二代英特爾至強(qiáng)可擴(kuò)展處理器的發(fā)布,Optane DC ...
    發(fā)表于 11-17 06:21

    英特爾ComposerXE 2015中進(jìn)行英特爾線程構(gòu)建模塊的測(cè)試

    Taylor系列:在英特爾?ComposerXE 2015中測(cè)試英特爾?線程構(gòu)建模塊
    的頭像 發(fā)表于 10-30 07:06 ?3279次閱讀

    采用英特爾線程構(gòu)建模塊英特爾? TBB)的流程圖介紹

    采用英特爾?線程構(gòu)建模塊的流程圖
    的頭像 發(fā)表于 10-30 06:20 ?3609次閱讀
    采用<b class='flag-5'>英特爾</b>線程<b class='flag-5'>構(gòu)建模塊</b>(<b class='flag-5'>英特爾</b>? TBB)的流程圖介紹

    英特爾VTune的性能優(yōu)化介紹

    英特爾?VTune?和性能優(yōu)化
    的頭像 發(fā)表于 11-06 06:17 ?3207次閱讀

    使用英特爾編譯器和英特爾TBB增強(qiáng)計(jì)算泰勒系列擴(kuò)展

    我們使用英特爾?編譯器和英特爾?線程構(gòu)建模塊英特爾?TBB)優(yōu)化了泰勒系列擴(kuò)展版本。
    的頭像 發(fā)表于 11-06 06:08 ?3187次閱讀

    如何進(jìn)行英特爾TensorFlow的優(yōu)化

    此網(wǎng)絡(luò)研討會(huì)為想要構(gòu)建,安裝和探索針對(duì)TensorFlow *的英特爾?優(yōu)化的開發(fā)人員提供信息。
    的頭像 發(fā)表于 11-05 06:50 ?3070次閱讀

    軟硬件結(jié)合,英特爾助推計(jì)算力指數(shù)級(jí)提升

    美國時(shí)間5月16日,英特爾2019開源技術(shù)峰會(huì)(OSTS)在華盛頓州Stevenson圓滿結(jié)束。大會(huì)從14日開始,共持續(xù)3天。在今年的開源技術(shù)峰會(huì)上,英特爾公司高級(jí)副總裁兼架構(gòu)、圖形與軟件部門總經(jīng)理
    發(fā)表于 05-22 20:46 ?161次閱讀

    英特爾首個(gè)針對(duì)AI優(yōu)化的Stratix 10 NX FPGA產(chǎn)品即將發(fā)布

    英特爾公司官網(wǎng)獲悉,近日英特爾正式發(fā)布第三代英特爾? 至強(qiáng)? 可擴(kuò)展處理器及全新的 AI 軟硬件產(chǎn)品組合,旨在進(jìn)一步助力客戶在數(shù)據(jù)中心、網(wǎng)絡(luò)及智能邊緣環(huán)境中加速開發(fā)和部署 AI 及數(shù)
    發(fā)表于 10-12 11:35 ?1224次閱讀

    英特爾oneAPI 2023工具包正式上線,幫助開發(fā)者利用英特爾硬件的先進(jìn)功能

    為進(jìn)一步幫助開發(fā)者利用英特爾硬件的先進(jìn)功能,近日,英特爾宣布英特爾? oneAPI工具包的2023年版本已在
    的頭像 發(fā)表于 12-20 17:05 ?1299次閱讀
    <b class='flag-5'>英特爾</b>oneAPI 2023工具包正式上線,<b class='flag-5'>幫助</b>開發(fā)者利用<b class='flag-5'>英特爾</b><b class='flag-5'>硬件</b>的先進(jìn)功能

    英特爾2024產(chǎn)品年鑒:AI與軟硬件的融合發(fā)展

    潛力,并攜手廣泛的生態(tài)合作伙伴促進(jìn)應(yīng)用落地。具體而言,2024年英特爾軟硬件產(chǎn)品及生態(tài)方面主要取得了以下進(jìn)展: 12月 英特爾發(fā)布代號(hào)為Battlemage的全新 銳炫B系列顯卡 。英特爾
    的頭像 發(fā)表于 12-31 17:28 ?314次閱讀
    <b class='flag-5'>英特爾</b>2024產(chǎn)品年鑒:AI與<b class='flag-5'>軟硬件</b>的融合發(fā)展
    主站蜘蛛池模板: 色无欲天天天影视综合网 | 四虎精品视频 | 青草青草视频2免费观看 | 亚洲欧美视频 | 午夜一级毛片看看 | 欧洲亚洲国产精华液 | 欧美 亚洲 一区 | 亚洲成网站www久久九 | 国产美女免费 | 1024视频色版在线网站 | 成年人网站在线 | 久久精品国产99精品最新 | 国产理论 | 台湾av| 永久免费观看黄网站 | 欧美yw193.c㎝在线观看 | 又黄又粗暴的120秒免费gif视频 | 美女脱裤子屁屁视频 | 在线色播 | 日本一卡二卡≡卡四卡精品 | 午夜大片免费完整在线看 | ts人妖在线观看 | 交在线观看网站视频 | 天天看片网站 | 深夜动态福利gif动态进 | 国产伦精品一区二区三区女 | 1000部啪啪 | 精品欧美小视频在线观看 | 37pao强力打造免费高速高清 | 在线天堂中文在线网 | 免看乌克兰a一级 | 在线观看免费高清 | 黄在线网站 | 九月婷婷亚洲综合在线 | 色综合色狠狠天天综合色hd | 日本大片免费播放网站 | 在厨房乱子伦在线观看 | 亚洲 欧洲 日产 韩国在线 | 亚洲一区二区视频在线观看 | 国产小视频在线观看免费 | 亚洲视频高清 |