91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AGI時(shí)代的奠基石:Agent+算力+大模型是構(gòu)建AI未來(lái)的三駕馬車(chē)嗎?

GPU視覺(jué)識(shí)別 ? 來(lái)源: GPU視覺(jué)識(shí)別 ? 作者: GPU視覺(jué)識(shí)別 ? 2023-12-21 13:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI Agent;人工智能體,RPA;大語(yǔ)言模型;prompt;Copilot;AGI;ChatGPT;LLM;AIGC;CoT;Cortex;Genius;MetaGPT;大模型;人工智能;通用人工智能;數(shù)據(jù)并行;模型并行;流水線并行;混合精度訓(xùn)練;梯度累積;Nvidia;A100;H100;A800;H800;L40s;混合專(zhuān)家;910B;HGX H20;L20 PCIe;L2 PCIe

AI Agent是一種智能實(shí)體,能夠感知環(huán)境、決策并執(zhí)行動(dòng)作,具有獨(dú)立思考和執(zhí)行任務(wù)的能力。與傳統(tǒng)大模型相比,AI Agent能夠獨(dú)立思考目標(biāo)并采取行動(dòng),而不僅僅依賴(lài)于提示。AI Agent基于大模型,具備上下文學(xué)習(xí)、推理和思考的能力,因此是通往AGI(通用人工智能)的主要研究方向。

AI Agent由大模型、規(guī)劃、記憶和工具使用四個(gè)部分組成,其中大模型是核心,提供推理和規(guī)劃等能力。近期在AI Agent領(lǐng)域涌現(xiàn)出多個(gè)研究成果,包括在游戲、個(gè)人任務(wù)助理和情感陪伴方面表現(xiàn)優(yōu)異的產(chǎn)品。雖然目前AI Agent研究主要集中在學(xué)術(shù)和開(kāi)發(fā)者領(lǐng)域,商業(yè)化產(chǎn)品較少,但在企業(yè)環(huán)境中,AI Agent建立對(duì)某一垂直領(lǐng)域的認(rèn)知的場(chǎng)景更為適合。一些初創(chuàng)公司已經(jīng)在以企業(yè)級(jí)Agent平臺(tái)為核心進(jìn)行產(chǎn)品研發(fā),未來(lái)幾年內(nèi)預(yù)計(jì)將有更多以Agent為核心的產(chǎn)品涌現(xiàn)。

當(dāng)然,AI Agent的訓(xùn)練離不開(kāi)算力,服務(wù)器作為一個(gè)強(qiáng)大的計(jì)算中心,為AI Agent提供算力基礎(chǔ),支持其進(jìn)行復(fù)雜計(jì)算和處理大規(guī)模數(shù)據(jù)的任務(wù),包括模型訓(xùn)練、推理和處理大規(guī)模數(shù)據(jù)集。

藍(lán)海大腦大模型訓(xùn)練平臺(tái)基于開(kāi)放加速模組高速互聯(lián)的AI加速器,提供強(qiáng)大的算力支持。配置高速內(nèi)存且支持全互聯(lián)拓?fù)洌瑵M足大模型訓(xùn)練中張量并行的通信需求。支持高性能I/O擴(kuò)展,同時(shí)可以擴(kuò)展至萬(wàn)卡AI集群,滿足大模型流水線和數(shù)據(jù)并行的通信需求。強(qiáng)大的液冷系統(tǒng)熱插拔及智能電源管理技術(shù),當(dāng)BMC收到PSU故障或錯(cuò)誤警告(如斷電、電涌,過(guò)熱),自動(dòng)強(qiáng)制系統(tǒng)的CPU進(jìn)入U(xiǎn)LFM(超低頻模式,以實(shí)現(xiàn)最低功耗)。致力于通過(guò)“低碳節(jié)能”為客戶(hù)提供環(huán)保綠色的高性能計(jì)算解決方案。主要應(yīng)用于深度學(xué)習(xí)、學(xué)術(shù)教育、生物醫(yī)藥、地球勘探、氣象海洋、超算中心、AI及大數(shù)據(jù)等領(lǐng)域。

大模型引領(lǐng)前行:AI Agent

自主智能體在AGI之路的探索

一、AI Agent:探索 AGI 的真實(shí)形態(tài)

1、什么是 AI Agent?

AI Agent是一種智能實(shí)體,具備感知環(huán)境、決策和執(zhí)行動(dòng)作的能力。與傳統(tǒng)人工智能不同,AI Agent通過(guò)獨(dú)立思考和調(diào)用工具逐步完成給定目標(biāo),實(shí)現(xiàn)自主操作。雖然AI Agent在人工智能和計(jì)算機(jī)領(lǐng)域成為研究熱點(diǎn),但由于數(shù)據(jù)和算力限制,實(shí)現(xiàn)真正智能的AI Agents仍面臨挑戰(zhàn)。

wKgZomWDzkqAGA0vAAXxggV--c0790.png

Hyperwrite 研發(fā)的 AI Agent 個(gè)人助理插件實(shí)現(xiàn)自動(dòng)預(yù)訂航班機(jī)票

AI Agent與大語(yǔ)言模型和RPA的區(qū)別在于,具備獨(dú)立思考和行動(dòng)的能力,相較于大模型需要基于明確的prompt進(jìn)行交互,而RPA則僅能在預(yù)設(shè)流程下工作。AI Agent的工作僅需目標(biāo)就能獨(dú)立思考并采取行動(dòng),拆解任務(wù)并根據(jù)反饋?zhàn)灾鲃?chuàng)建prompt。與RPA相比,AI Agent能處理未知信息和復(fù)雜環(huán)境,使其成為更靈活的自主智能體。

wKgaomWDzkuAOsprAARBPK7vZS4008.png

AI Agent 的工作流程

2、AIAgent 的最終發(fā)展目標(biāo):通用人工智能 AGI

AI Agent并非新概念,早在多年前已有研究,如2014年AlphaGo和2017年OpenAI Five。這些AI能通過(guò)實(shí)時(shí)信息分析規(guī)劃操作,滿足AI Agent基本定義。當(dāng)時(shí)主要應(yīng)用在具有對(duì)抗性和明顯輸贏場(chǎng)景的游戲中,采用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練。然而,通用性在真實(shí)世界中難以實(shí)現(xiàn)。

近年來(lái),大語(yǔ)言模型的崛起推動(dòng)AI Agent相關(guān)研究的快速發(fā)展。這些模型基于龐大的訓(xùn)練數(shù)據(jù)集,包括豐富的人類(lèi)行為數(shù)據(jù),為模擬類(lèi)人交互提供堅(jiān)實(shí)基礎(chǔ)。大模型的快速發(fā)展使其具有上下文學(xué)習(xí)、推理和思維鏈等類(lèi)似人類(lèi)思考方式的能力,成為AI Agent的核心。

wKgZomWDzkyAVOFJAAfYqLXDhrk936.png

大模型的能力涌現(xiàn)現(xiàn)象

盡管大模型在全球范圍內(nèi)引起熱潮,但隨著時(shí)間推移,人們對(duì)大模型實(shí)際能力的認(rèn)識(shí)更為清晰。大模型仍存在幻覺(jué)、上下文容量限制等。因此,AI Agent成為新的研究焦點(diǎn)。通過(guò)讓大模型結(jié)合一個(gè)或多個(gè)Agent,構(gòu)建具備自主思考、決策和執(zhí)行能力的智能體,繼續(xù)探索通往AGI之路。

wKgaomWDzkyAB8Z-AACkJcYHNKA576.png

研究 AI Agent 的最終目標(biāo)是通向 AGI

AI Agent的發(fā)展可以類(lèi)比為自動(dòng)駕駛的L4階段,盡管已取得一定進(jìn)展,但距離真正的實(shí)現(xiàn)仍存在一定差距。據(jù)甲子光年報(bào)告,與人類(lèi)的協(xié)作程度可以與自動(dòng)駕駛的不同級(jí)別相媲美。對(duì)話機(jī)器人(如ChatGPT)可視為L(zhǎng)2級(jí)別,人類(lèi)向AI尋求意見(jiàn),但AI不直接參與工作;副駕駛工具(如Copilot)相當(dāng)于L3級(jí)別,人類(lèi)和AI共同協(xié)作完成工作,AI生成初稿,人類(lèi)進(jìn)行修改;而AI Agent則相當(dāng)于L4,人類(lèi)給定目標(biāo),Agent自行完成任務(wù)規(guī)劃和工具調(diào)用。然而,類(lèi)似于L4級(jí)別的自動(dòng)駕駛尚未真正實(shí)現(xiàn),AI Agent雖易于想象和演示,但在真實(shí)應(yīng)用中仍存在一定挑戰(zhàn),其真正的應(yīng)用前景仍是未知。

wKgZomWDzk2ASItNAAQ3lzcEgko971.png

將 AI 和人類(lèi)協(xié)作的程度類(lèi)比自動(dòng)駕駛的不同階段

3、應(yīng)用兩大方向:自動(dòng)化(自主智能體)、擬人化(智能體模擬)

AI Agent的發(fā)展在基于大語(yǔ)言模型(LLM)的應(yīng)用中呈現(xiàn)出兩大主要趨勢(shì):

1)自主智能體

這類(lèi)AI Agent致力于實(shí)現(xiàn)復(fù)雜流程的自動(dòng)化。當(dāng)賦予自主智能體一個(gè)目標(biāo)時(shí),能夠自主創(chuàng)建、執(zhí)行、調(diào)整任務(wù),并根據(jù)目標(biāo)優(yōu)先級(jí)不斷重復(fù)這個(gè)過(guò)程,直至完成目標(biāo)。由于對(duì)準(zhǔn)確性要求較高,通常需要外部工具輔助,以減少大模型不確定性。

2)智能體模擬

這一類(lèi)Agent致力于更加擬人和可信的表現(xiàn)。分為強(qiáng)調(diào)情感和情商的智能體,以及注重交互的智能體。后者通常在多智能體環(huán)境中操作,在預(yù)期之外展現(xiàn)出場(chǎng)景和能力。由于具備多樣性的特點(diǎn),使其能夠充分利用大模型生成不確定性。

當(dāng)然這兩個(gè)方向并非完全獨(dú)立,相反自動(dòng)化和擬人化作為AI Agent的兩大核心能力將同步發(fā)展。隨著底層模型的不斷成熟和對(duì)不同行業(yè)的深入探索,AI Agent的適用范圍和實(shí)用性有望進(jìn)一步擴(kuò)大。

wKgaomWDzk2APS-jAAjfHJc2YjI850.png

二、AI Agent 拆解:大模型、規(guī)劃、記憶與工具

基于大型語(yǔ)言模型的AI Agent可分為四個(gè)主要組件:大型語(yǔ)言模型(LLM)、規(guī)劃、記憶和工具使用。

wKgZomWDzk6AJXMqAAJNTTCPUj4492.png

由 LLM 驅(qū)動(dòng)的自主智能體系統(tǒng)的架構(gòu)

1、大模型+規(guī)劃:Agent 的“大腦”,通過(guò)思維鏈能力實(shí)現(xiàn)任務(wù)分解

Agent可以有效引導(dǎo)和激發(fā)LLM的邏輯推理能力。當(dāng)模型規(guī)模足夠大時(shí),LLM本身就具備推理能力,在簡(jiǎn)單推理問(wèn)題上展現(xiàn)出良好的表現(xiàn)。然而,在處理復(fù)雜推理問(wèn)題時(shí),LLM有時(shí)可能會(huì)出現(xiàn)錯(cuò)誤,導(dǎo)致用戶(hù)無(wú)法獲得理想回答。這主要是因?yàn)閜rompt不夠合適,無(wú)法充分激發(fā)LLM的推理能力。通過(guò)追加輔助推理prompt,可以顯著提高LLM在推理問(wèn)題上的效果。在《Large language models are zero-shot reasoners》一文中的測(cè)試中,通過(guò)在提問(wèn)時(shí)追加“Let’s think step by step”prompt,數(shù)學(xué)推理測(cè)試集GSM8K上的推理準(zhǔn)確率從10.4%提升到40.7%。作為智能體Agent能夠自主創(chuàng)建適當(dāng)?shù)膒rompt,更好地引發(fā)大型模型的推理能力。

wKgaomWDzk6AcOyBAAO-f4HiWl8747.png

通過(guò)調(diào)整 prompt 可以提升大模型推理效果

在處理復(fù)雜任務(wù)時(shí),Agent可以調(diào)用LLM的思維鏈進(jìn)行任務(wù)分解和規(guī)劃。在AI Agent架構(gòu)中,任務(wù)分解和規(guī)劃過(guò)程依賴(lài)于大模型能力。大模型具有思維鏈(CoT)能力,通過(guò)提示模型“逐步思考”,充分利用計(jì)算時(shí)間,將復(fù)雜任務(wù)逐步分解為更小、更簡(jiǎn)單的步驟,從而降低每個(gè)子任務(wù)難度。

wKgZomWDzk-AFhrnAAF4KKHux98339.png

AI Agent 的反思框架

通過(guò)反思與自省框架,Agent不斷提升任務(wù)規(guī)劃能力。其具有對(duì)過(guò)去行為的自我評(píng)估機(jī)制,從中學(xué)習(xí)并改進(jìn)未來(lái)步驟,以提高最終結(jié)果質(zhì)量。自省框架允許Agent修正決策和改正之前錯(cuò)誤,實(shí)現(xiàn)性能不斷優(yōu)化。在任務(wù)執(zhí)行中,嘗試和錯(cuò)誤是常態(tài),而反思和自省在這個(gè)過(guò)程中發(fā)揮著核心作用。

2、記憶:用有限的上下文長(zhǎng)度實(shí)現(xiàn)更多的記憶

AI智能體系統(tǒng)的輸入成為系統(tǒng)記憶,與人類(lèi)的記憶模式一一對(duì)應(yīng)。記憶是獲取、存儲(chǔ)、保留和檢索信息的過(guò)程,包括感覺(jué)記憶、短期記憶和長(zhǎng)期記憶。對(duì)于AI Agent系統(tǒng)而言,與用戶(hù)的交互生成內(nèi)容被視為Agent的記憶。感覺(jué)記憶是學(xué)習(xí)嵌入表示的原始輸入,包括文本、圖像或其他模態(tài);短期記憶是上下文受到有限上下文窗口長(zhǎng)度限制;長(zhǎng)期記憶可看作是Agent在工作中查詢(xún)外部向量數(shù)據(jù)庫(kù),通過(guò)快速檢索進(jìn)行訪問(wèn)。目前,Agent主要利用外部長(zhǎng)期記憶完成復(fù)雜任務(wù),如閱讀PDF、聯(lián)網(wǎng)搜索實(shí)時(shí)新聞等。任務(wù)與結(jié)果存儲(chǔ)在記憶模塊中,當(dāng)信息被調(diào)用時(shí),存儲(chǔ)在記憶中的信息將回到與用戶(hù)的對(duì)話中,創(chuàng)造更加緊密的上下文環(huán)境。

wKgaomWDzk-AM4XbAAPPm9eD9VM815.png

人類(lèi)記憶與 AI Agent 記憶映射

向量數(shù)據(jù)庫(kù)通過(guò)將數(shù)據(jù)轉(zhuǎn)化為向量形式,解決大模型海量知識(shí)存儲(chǔ)、檢索和匹配問(wèn)題。向量成為AI理解世界的通用數(shù)據(jù)形式,而大模型為獲取豐富語(yǔ)義和上下文信息需要龐大訓(xùn)練數(shù)據(jù),導(dǎo)致數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng)。通過(guò)Embedding方法,向量數(shù)據(jù)庫(kù)將非結(jié)構(gòu)化數(shù)據(jù)如圖像、音視頻等抽象為多維向量,實(shí)現(xiàn)結(jié)構(gòu)化管理,從而實(shí)現(xiàn)高效數(shù)據(jù)存儲(chǔ)和檢索過(guò)程,為Agent提供“長(zhǎng)期記憶”。同時(shí),將多模態(tài)數(shù)據(jù)映射到低維空間,大幅降低存儲(chǔ)和計(jì)算成本,向量數(shù)據(jù)庫(kù)存儲(chǔ)成本較存儲(chǔ)在神經(jīng)網(wǎng)絡(luò)中的成本低2到4個(gè)數(shù)量級(jí)。

Embedding技術(shù)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的語(yǔ)言,如地圖對(duì)地理信息的Embedding。通過(guò)Embedding技術(shù),將文本等非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為向量后,使用數(shù)學(xué)方法計(jì)算兩個(gè)向量之間的相似度,從而實(shí)現(xiàn)對(duì)文本的比較。向量數(shù)據(jù)庫(kù)基于向量相似度計(jì)算實(shí)現(xiàn)強(qiáng)大的檢索功能,通過(guò)相似性檢索特性,找出近似匹配結(jié)果,為模糊匹配提供支持,適用于更廣泛的應(yīng)用場(chǎng)景。

wKgZomWDzlKAOSaKAAHZUNk8T-o570.png

不同文本在向量空間中的相似度計(jì)算

3、工具:懂得使用工具才會(huì)更像人類(lèi)

AI Agent與大模型的一個(gè)顯著區(qū)別在于,AI Agent能夠利用外部工具拓展模型能力。與人類(lèi)使用工具相似,為大模型配備外部工具,使其完成原本無(wú)法處理的任務(wù)。例如,ChatGPT的缺陷是其訓(xùn)練數(shù)據(jù)截止到2021年底,無(wú)法直接回答關(guān)于更新知識(shí)的問(wèn)題。雖然OpenAI為ChatGPT添加插件功能,允許調(diào)用瀏覽器插件以獲取最新信息,但仍需用戶(hù)明確指定是否需要使用插件,不能實(shí)現(xiàn)完全自然回答。相比之下,AI Agent具備自主調(diào)用工具能力,對(duì)于每個(gè)子任務(wù),Agent會(huì)判斷是否需要調(diào)用外部工具來(lái)完成,并將外部工具返回信息提供給LLM,以繼續(xù)下一步子任務(wù)。此外,OpenAI在6月為GPT-4和GPT-3.5引入函數(shù)調(diào)用功能,使開(kāi)發(fā)者能夠描述函數(shù),并讓模型智能地選擇輸出函數(shù)調(diào)用參數(shù)的JSON對(duì)象。

wKgaomWDzlKAKprLAAEzjBYqAEo844.png

GPT 模型函數(shù)調(diào)用功能示例

以HuggingGPT為例,將模型社區(qū)HuggingFace和ChatGPT緊密結(jié)合,構(gòu)建成一個(gè)綜合AI Agent。在2023年4月,浙江大學(xué)和微軟聯(lián)合團(tuán)隊(duì)推出HuggingGPT,這一系統(tǒng)能夠連接不同的AI模型來(lái)解決用戶(hù)提出的各種任務(wù)。HuggingGPT整合HuggingFace社區(qū)中的眾多模型和GPT,可應(yīng)對(duì)24種任務(wù),包括文本分類(lèi)、對(duì)象檢測(cè)、語(yǔ)義分割、圖像生成、問(wèn)答、文本語(yǔ)音轉(zhuǎn)換以及文本視頻轉(zhuǎn)換。其工作流程分為四步:

1)任務(wù)規(guī)劃:通過(guò)使用ChatGPT獲取用戶(hù)的請(qǐng)求;

2)模型選擇:基于HuggingFace中函數(shù)描述選擇適當(dāng)模型,并使用選中模型執(zhí)行AI任務(wù);

3)任務(wù)執(zhí)行:執(zhí)行由第2步選擇模型完成的任務(wù),將結(jié)果總結(jié)成回答返回給ChatGPT;

4)回答生成:利用ChatGPT整合所有模型推理,生成回答并返回給用戶(hù)。

wKgZomWDzlOAPOFWAAY8UYa0kmo633.png

HuggingGPT 的工作步驟流程

AI Agent智探視野

應(yīng)用領(lǐng)域深入剖析與龍頭公司

一、自主智能體:自動(dòng)化,新一輪生產(chǎn)力革命

1、軟件新范式,非大模型玩家亦有機(jī)會(huì)

自主智能體力圖實(shí)現(xiàn)復(fù)雜流程自動(dòng)化,被類(lèi)比為自動(dòng)駕駛的L4階段,在任務(wù)執(zhí)行中不僅能夠減輕人類(lèi)負(fù)擔(dān),還需外部輔助和監(jiān)督。這一新型智能體有望引發(fā)軟件行業(yè)的交互方式和商業(yè)模式變革。交互方式方面,Agent決策、規(guī)劃、執(zhí)行等環(huán)節(jié)要更深刻理解用戶(hù)需求,需要設(shè)計(jì)更智能架構(gòu)解決問(wèn)題。商業(yè)模式上,服務(wù)內(nèi)容收費(fèi)可能會(huì)向按token收費(fèi)轉(zhuǎn)變,對(duì)Agent功能實(shí)用性提出更高要求。雖然基座大模型能力重要,但在實(shí)際應(yīng)用中,自主智能體架構(gòu)設(shè)計(jì)、工程能力、垂類(lèi)數(shù)據(jù)質(zhì)量同樣至關(guān)重要。在企業(yè)應(yīng)用中,準(zhǔn)確度和效率是關(guān)鍵指標(biāo),同時(shí)也存在對(duì)低門(mén)檻定制Agent的需求。

wKgaomWDzlOAfhGpAAUWZ-smBBY265.png

2、實(shí)驗(yàn)性 VS 實(shí)操性,單智能體 VS 多智能體

行業(yè)內(nèi)對(duì)自主智能體的探索可分為實(shí)驗(yàn)性VS實(shí)操性、單智能體VS多智能體兩大類(lèi)。實(shí)驗(yàn)性項(xiàng)目如AutoGPT雖可能在運(yùn)行中出錯(cuò),但對(duì)開(kāi)發(fā)者提供創(chuàng)意、思路和經(jīng)驗(yàn)的啟發(fā)。實(shí)操性應(yīng)用更注重與實(shí)際場(chǎng)景的適配。在單智能體和多智能體之間,單智能體適用于簡(jiǎn)單任務(wù),在C端應(yīng)用上有潛力,但在B端場(chǎng)景中面臨評(píng)估不足、任務(wù)繁重和大模型幻覺(jué)等挑戰(zhàn),而多智能體在解決復(fù)雜工作上具有更突出優(yōu)勢(shì)。

wKgZomWDzlWAMDoOAAJuuYNfzXc512.png

1)單智能體1:實(shí)驗(yàn)性項(xiàng)目

AutoGPT

AutoGPT是由游戲開(kāi)發(fā)者Toran Bruce Richards于2023年3月開(kāi)源的實(shí)驗(yàn)性AI Agent項(xiàng)目。該項(xiàng)目在GitHub上線5個(gè)月,星標(biāo)數(shù)量已超過(guò)149K,成為代表性實(shí)驗(yàn)性項(xiàng)目,對(duì)后續(xù)Agent發(fā)展有啟發(fā)意義。AutoGPT可以根據(jù)用戶(hù)目標(biāo)自動(dòng)生成提示,利用GPT-4和多種工具API執(zhí)行多步驟項(xiàng)目,無(wú)需人類(lèi)干預(yù)。使用多個(gè)外部工具,包括克隆GitHub倉(cāng)庫(kù)、啟動(dòng)其他Agent、發(fā)言、發(fā)送推文和生成圖片等,同時(shí)支持各種矢量數(shù)據(jù)庫(kù)、LLM提供商、文本到圖片模型和瀏覽器。該項(xiàng)目應(yīng)用場(chǎng)景主要涉及辦公和開(kāi)發(fā)領(lǐng)域,包括自動(dòng)化流程、市場(chǎng)研究、代碼編寫(xiě)和網(wǎng)站/App開(kāi)發(fā)等,但實(shí)際效果一般。

wKgaomWDzlaAaA2WAASFXsZETL0237.png

代碼開(kāi)發(fā)類(lèi) GPTEngineer


GPT Engineer是由Anton Osika于6月11日推出的開(kāi)源代碼生成工具,基于GPT模型,根據(jù)用戶(hù)的指示生成高質(zhì)量代碼,包括創(chuàng)建新函數(shù)、修復(fù)代碼錯(cuò)誤等,支持多種編程語(yǔ)言。截至2023年9月,其在GitHub上的星星數(shù)量接近44k。

wKgZomWDzlaAWSBYAAQgvS1iKMk476.png

科研類(lèi) GPT Researcher

GPT Researcher是哥倫比亞大學(xué)研究團(tuán)隊(duì)推出的網(wǎng)絡(luò)科研任務(wù)專(zhuān)用的AI Agent項(xiàng)目,致力于生成詳盡、精確和客觀的研究報(bào)告。該項(xiàng)目已在GitHub上開(kāi)源,截至2023年9月,星星數(shù)量超過(guò)4k。

GPT Researcher生成一系列研究問(wèn)題,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)Agent從在線資源中收集與任務(wù)相關(guān)信息。每個(gè)獲取資源都會(huì)被概括,并追蹤其來(lái)源。當(dāng)然所有資源都會(huì)被篩選、匯總,形成一份完整的研究報(bào)告。

wKgaomWDzleAEVYdAAHRKIcXA5E350.png

創(chuàng)作類(lèi) ShortGPT

ShortGPT 可實(shí)現(xiàn)自動(dòng)編輯框架、編輯腳本和提、創(chuàng)建配音/內(nèi)容、生成字幕、從互聯(lián)網(wǎng)上獲取圖像和視頻片段等功能,并根據(jù)需要與網(wǎng)絡(luò)和 Pexels API 連接;確保使用 TinyDB 自動(dòng)編輯變量的長(zhǎng)期持久性等功能。

wKgZomWDzliAbeu7AAWBW4N4GMM188.png

2)單智能體 2:實(shí)現(xiàn)交互變革,中心化應(yīng)用

功能升級(jí)后的 ChatGPT

ChatGPT在2023年經(jīng)歷多項(xiàng)功能增強(qiáng):

- 增加近900個(gè)插件,覆蓋多個(gè)領(lǐng)域,但每次最多只能啟動(dòng)3個(gè)插件。

- 推出高級(jí)數(shù)據(jù)分析功能,允許編寫(xiě)和執(zhí)行Python代碼,并能處理文件上傳,提高處理復(fù)雜任務(wù)和數(shù)學(xué)推理準(zhǔn)確度。

- 自定義指令功能允許用戶(hù)預(yù)設(shè)身份和指令,提高ChatGPT的個(gè)性化水平。

- 9月引入多模態(tài)輸入,支持語(yǔ)音對(duì)話和圖像輸入,降低使用門(mén)檻,使其更具廣泛應(yīng)用性。

- 企業(yè)版本提供更多功能和支持,有望推動(dòng)ChatGPT在B端應(yīng)用和商業(yè)領(lǐng)域的發(fā)展。

wKgaomWDzliANJMqAAP8zTMLfDE660.png

Adept AI

AI初創(chuàng)公司Adept于2022年9月發(fā)布大型行動(dòng)模型ACT-1。ACT-1以桌面對(duì)話框形式存在,用戶(hù)通過(guò)自然語(yǔ)言與其進(jìn)行交互,改變過(guò)去鼠標(biāo)/鍵盤(pán)的操作方式。用戶(hù)可通過(guò)在文本框中輸入命令,在電腦上隨時(shí)調(diào)用ACT-1,一步步完成操作,并在需要時(shí)跨多個(gè)工具進(jìn)行協(xié)調(diào)。用戶(hù)可以即時(shí)反饋和修改錯(cuò)誤。使用示例包括在Google Sheet中創(chuàng)建損益欄、更新收入總值、添加新產(chǎn)品和聯(lián)系人,以及在交易平臺(tái)上尋找適合商品

wKgZomWDzlmAUIpXAAVGXl7FagM115.png

3)單智能體 3:實(shí)現(xiàn)交互變革,可定制、平臺(tái)化

Cortex

Cortex是由Kinesys AI推出產(chǎn)品,允許用戶(hù)在其私有數(shù)據(jù)上構(gòu)建AI合作伙伴,提供按使用量計(jì)費(fèi)的定制AI助手服務(wù)。Cortex整合多個(gè)大型模型并通過(guò)調(diào)用向量數(shù)據(jù)、實(shí)時(shí)聯(lián)網(wǎng)搜索和API等方式增強(qiáng)專(zhuān)業(yè)領(lǐng)域的實(shí)用性。在同一公司內(nèi),Cortex根據(jù)不同業(yè)務(wù)部門(mén)的需求,輸出適應(yīng)每個(gè)人崗位關(guān)鍵點(diǎn)信息,實(shí)現(xiàn)個(gè)性化服務(wù)。Cortex的客戶(hù)群體主要包括個(gè)人開(kāi)發(fā)者和早期初創(chuàng)企業(yè),旨在減少?gòu)恼{(diào)試開(kāi)始的工作量。已有10多家付費(fèi)用戶(hù)和上千個(gè)個(gè)人用戶(hù)。

wKgaomWDzlmAVSZMAAPUUJa530g663.png

MindOS

MindOS是心識(shí)宇宙發(fā)布的多功能AI Agent引擎和平臺(tái),用戶(hù)能在短短3分鐘內(nèi)開(kāi)發(fā)獨(dú)特記憶、個(gè)性和專(zhuān)業(yè)知識(shí)的可定制Genius。平臺(tái)提供1000多個(gè)具有性格和功能的預(yù)置Genius,其準(zhǔn)確推斷意圖的準(zhǔn)確率高達(dá)97%。功能包括Marketplace(分享和發(fā)現(xiàn)Genius)、Workflow(通過(guò)拖放和簡(jiǎn)單配置構(gòu)建Genius)、Structured Memory(從對(duì)話中提取結(jié)構(gòu)化信息),未來(lái)還將增加Deep Thinking(深度思考)、Self Learning(自主學(xué)習(xí))和Teamwork(團(tuán)隊(duì)協(xié)作)等板塊。

wKgZomWDzlqALCoqAAe53VEIoIM133.png

4)多智能體:AGENT 團(tuán)隊(duì)完成復(fù)雜開(kāi)發(fā)任務(wù)

MetaGPT

MetaGPT是深度賦智于7月開(kāi)源的多智能體框架,旨在幫助用戶(hù)快速搭建虛擬公司。虛擬公司中的員工都是智能體,涵蓋工程師、產(chǎn)品經(jīng)理、架構(gòu)師和項(xiàng)目經(jīng)理等角色。用戶(hù)只需輸入簡(jiǎn)短需求,MetaGPT能輸出整個(gè)軟件公司的工作流程和詳細(xì)的SOP,如創(chuàng)作故事、競(jìng)品分析等。

該框架包括基礎(chǔ)組件層和協(xié)作層。基礎(chǔ)組件層構(gòu)建單個(gè)Agent操作和全系統(tǒng)信息交換所需的核心構(gòu)件,包括環(huán)境、記憶、角色和工具。協(xié)作層在基礎(chǔ)組件層之上建立,協(xié)調(diào)單個(gè)Agent協(xié)同解決復(fù)雜問(wèn)題,實(shí)現(xiàn)知識(shí)共享和封裝工作流程。知識(shí)共享允許Agent交換信息,而封裝工作流則利用SOP將任務(wù)分解為易于管理的組件,確保符合總體目標(biāo)。

wKgaomWDzlqAaDFoAAVemB-wnjE451.png

MetaGPT在橫向?qū)Ρ戎姓宫F(xiàn)出較高的實(shí)操價(jià)值,在GitHub上開(kāi)源兩個(gè)月內(nèi)獲得超過(guò)24K的STAR數(shù)量。與大模型相比,MetaGPT基于GPT4-32k,利用4個(gè)Agent(工程師、產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理),在MBPP和HumanEval開(kāi)源數(shù)據(jù)集上的單次嘗試通過(guò)率明顯優(yōu)于其他代碼生成LLM,包括GPT4和CODEX等。MetaGPT的獨(dú)特之處在于其能夠生成產(chǎn)品需求文檔和技術(shù)設(shè)計(jì),展示出在不同場(chǎng)景下具有更強(qiáng)通用性項(xiàng)目執(zhí)行方法。實(shí)驗(yàn)證明,在低成本和低門(mén)檻下MetaGPT可以開(kāi)發(fā)簡(jiǎn)易軟件項(xiàng)目,平均每個(gè)項(xiàng)目消耗26.6k token用于prompt,完成任務(wù)后總成本為1.09美元耗時(shí)8-9分鐘,遠(yuǎn)低于傳統(tǒng)軟件工程開(kāi)發(fā)成本和時(shí)間。但MetaGPT偶爾會(huì)引用不存在資源文件,容易在執(zhí)行復(fù)雜任務(wù)時(shí)調(diào)用未定義或未導(dǎo)入的類(lèi)或變量,這些問(wèn)題可以通過(guò)更清晰、更高效的AGENT協(xié)作工作流程來(lái)處理。

wKgZomWDzluAL6I9AAJDJuuOrnQ016.png

ChatDev

ChatDev是由清華大學(xué)NLP實(shí)驗(yàn)室孫茂松教授指導(dǎo),與面壁智能、北京郵電大學(xué)、布朗大學(xué)研究人員聯(lián)合發(fā)布全流程自動(dòng)化軟件開(kāi)發(fā)框架。

wKgaomWDzlyAavaQAAW0LrXmNj4591.png

ChatDev采用gpt3.5-turbo-16k版本ChatGPT API,從Camel指令跟隨對(duì)話數(shù)據(jù)集中隨機(jī)選擇70個(gè)任務(wù),作為CHATDEV軟件開(kāi)發(fā)分析基礎(chǔ)。

該框架驅(qū)動(dòng)智能體對(duì)話的關(guān)鍵機(jī)制包括:

- 角色專(zhuān)業(yè)化通過(guò)角色扮演確保每個(gè)智能體在專(zhuān)業(yè)角色下完成相應(yīng)方案提議和決策討論;

- 記憶流保存每輪對(duì)話記錄以確保思路連貫性;

- 自反思當(dāng)智能體未能滿足要求時(shí),生成一個(gè)“偽我”向instructor反饋問(wèn)題和相關(guān)對(duì)話。

wKgZomWDzlyAIWHZAAg7YPY2-lU936.png

CHATDEV為軟件開(kāi)發(fā)提供一種高效、無(wú)需培訓(xùn)且具有成本效益新方法。與傳統(tǒng)軟件開(kāi)發(fā)相比,CHATDEV平均生產(chǎn)時(shí)間不到7分鐘,成本不到0.3美元,遠(yuǎn)低于傳統(tǒng)軟件開(kāi)發(fā)費(fèi)用和周期(通常需要數(shù)周或數(shù)月)。然而,在使用CHATDEV時(shí)提供更具體的說(shuō)明可以更好地發(fā)揮其功能,尤其適用于中小型軟件項(xiàng)目。

wKgaomWDzl2AaWzQAASiTk64oyM172.png

二、智能體模擬:擬人化,新的精神消費(fèi)品

1、陪伴類(lèi),提供情緒價(jià)值

陪伴類(lèi)智能體強(qiáng)調(diào)人類(lèi)特征,包括情感情商和個(gè)性化"人格",具備記憶用戶(hù)歷史交流能力。隨著大模型情商的不斷迭代和多模態(tài)技術(shù)的發(fā)展,預(yù)計(jì)未來(lái)陪伴類(lèi)智能體將更加立體擬人,能夠提供更高情感價(jià)值。

當(dāng)前,國(guó)內(nèi)情感消費(fèi)市場(chǎng)仍有巨大的發(fā)展空間,尤其在社會(huì)婚姻觀念轉(zhuǎn)變和現(xiàn)代工作生活緊張的情況下,人們對(duì)陪伴的需求不斷增加。陪伴類(lèi)智能體有望成為L(zhǎng)LM時(shí)代的重要原生應(yīng)用。從商業(yè)角度出發(fā),預(yù)計(jì)陪伴類(lèi)智能體的主要商業(yè)價(jià)值將集中在知名IP上。當(dāng)前,那些擁有豐富IP儲(chǔ)備或允許用戶(hù)定制智能體的平臺(tái)將在市場(chǎng)上有廣闊前景。

具體而言,陪伴類(lèi)智能體商業(yè)應(yīng)用包括在線社交和秀場(chǎng)直播,但需要注意在線社交可能面臨用戶(hù)在建立情感聯(lián)系后轉(zhuǎn)向主流社交平臺(tái)問(wèn)題,而秀場(chǎng)直播用戶(hù)價(jià)值可能更加集中在熱門(mén)主播而非平臺(tái)。

1)InflectionAI:高情商個(gè)人 AI——Pi

Inflection AI推出名為Pi的個(gè)人AI產(chǎn)品于2023年5月正式上線。該初創(chuàng)公司成立于2022年估值已達(dá)40億美元,僅次于OpenAI在人工智能領(lǐng)域的地位。Pi與ChatGPT有所不同,并非以專(zhuān)業(yè)性或替代人工方式進(jìn)行宣傳。Pi無(wú)法編寫(xiě)代碼或生成原創(chuàng)內(nèi)容,與通用聊天機(jī)器人不同,Pi專(zhuān)注于友好對(duì)話、提供簡(jiǎn)潔建議,甚至只是傾聽(tīng)。其主要特點(diǎn)包括富有同情心、謙虛好奇、幽默創(chuàng)新,具備較高的情商。Pi的定位是個(gè)人智能(Personal Intelligence),旨在提供個(gè)性化知識(shí)和陪伴,而非僅僅是輔助人工作的工具。

wKgZomWDzl2ADSZ-AAJuVGrEEd0129.png

Inflection-1 可媲美 GPT-3.5 和 LLaMA(65B)

Pi的核心是Inflection AI開(kāi)發(fā)的Inflection-1大模型其性能與GPT-3.5相當(dāng)。Inflection-1在多任務(wù)語(yǔ)言理解和常識(shí)問(wèn)題等方面表現(xiàn)略勝于GPT-3.5和LLaMA等常見(jiàn)大模型,但在代碼方面稍顯不足。然而,這正是公司的差異化競(jìng)爭(zhēng)之處,因?yàn)镻i作為以情感陪伴為主的Agent,無(wú)需具備強(qiáng)大的代碼和輔助工作能力。

與輔助工作的Agent不同,Pi更能滿足情感陪伴需求。作為一個(gè)情商高的AI Agent,Pi能夠使用更日常和生活化的語(yǔ)言與用戶(hù)進(jìn)行交流。Pi的回復(fù)貼近生活,語(yǔ)氣得體,關(guān)心用戶(hù)當(dāng)前狀態(tài)和事態(tài)發(fā)展,就像心理醫(yī)生或最好的朋友一樣。在回答可能涉及負(fù)面情緒問(wèn)題時(shí),Pi避免使用冒犯用戶(hù)的俏皮表情或輕松口吻。甚至使用表情來(lái)增強(qiáng)對(duì)話人性化感覺(jué),使用戶(hù)感覺(jué)像在與真正的人類(lèi)進(jìn)行交流。此外,Pi還能記住與用戶(hù)的對(duì)話,隨著時(shí)間的推移更好地理解用戶(hù)。Pi填補(bǔ)傳統(tǒng)人工智能對(duì)人類(lèi)情感需求忽視,類(lèi)似于Pi這樣提供情感陪伴的個(gè)人AI Agent在市場(chǎng)上具有巨大潛力。

2)平臺(tái)化娛樂(lè)化,如 Character.AI、Glow 等

Character.AI成立于2021年10月,創(chuàng)始團(tuán)隊(duì)專(zhuān)注于深度學(xué)習(xí)、大型語(yǔ)言模型和對(duì)話領(lǐng)域,團(tuán)隊(duì)成員曾在Google Brain和Meta AI工作。在2022年9月推出Beta版本,采用GPT-3大模型,通過(guò)大量虛構(gòu)人物數(shù)據(jù)進(jìn)行訓(xùn)練,使聊天機(jī)器人能夠根據(jù)人物的個(gè)性和特征生成對(duì)話和文本響應(yīng)。據(jù)Character.AI官方透露,Beta版本推出2個(gè)月后,每天生成10億個(gè)單詞,截至2022年12月,用戶(hù)已創(chuàng)建超過(guò)35萬(wàn)個(gè)機(jī)器人,涵蓋信息檢索、教練、教育、娛樂(lè)等多個(gè)領(lǐng)域。類(lèi)似的產(chǎn)品還包括Replika、Glow等。

wKgaomWDzl6AU9nyAAJl2bvVK_0486.png

2、重交互,提高用戶(hù)體驗(yàn)


交互智能體著重于強(qiáng)化與環(huán)境的互動(dòng)能力,使智能體能夠與其他智能體或虛擬世界內(nèi)的事物進(jìn)行實(shí)質(zhì)性互動(dòng)。這種能力可能導(dǎo)致超越設(shè)計(jì)者規(guī)劃的場(chǎng)景和能力,尤其在開(kāi)放世界游戲等領(lǐng)域,創(chuàng)造可信的智能體(主要是可信NPC)是為了賦予虛擬世界以生命的感覺(jué)。這些智能體能夠做出決策并根據(jù)自己的意愿行動(dòng),從而創(chuàng)造出更真實(shí)的游戲體驗(yàn),提升玩家的沉浸感,同時(shí)解決開(kāi)放世界游戲中內(nèi)容消耗過(guò)快的問(wèn)題。隨著可信智能體技術(shù)的成熟,可能會(huì)孕育出新的游戲品類(lèi),并在AIGC中扮演重要角色。

wKgZomWDzl6AXOOHAAHaEVEpRzQ848.png

1)單智能體:游戲世界 AI 玩家,如 Voyager

Voyager是英偉達(dá)推出的首個(gè)大模型游戲智能體于2023年5月開(kāi)源。該智能體在《我的世界》中應(yīng)用,該游戲以無(wú)限可能性的虛擬世界而著稱(chēng)。沒(méi)有預(yù)定的最終目標(biāo)或故事情節(jié)。Voyager被設(shè)計(jì)成一個(gè)高效的終身學(xué)習(xí)Agent類(lèi)似于人類(lèi)玩家的能力,可以根據(jù)當(dāng)前技能水平和世界狀態(tài)發(fā)現(xiàn)適當(dāng)?shù)娜蝿?wù),并通過(guò)反饋學(xué)習(xí)和改進(jìn)技能,持續(xù)探索世界。英偉達(dá)采用“無(wú)梯度”的訓(xùn)練方法,使基于GPT-4的Voyager在游戲中表現(xiàn)出色,獨(dú)特物品增加3.3倍,行進(jìn)距離增加2.3倍,解鎖科技樹(shù)里程碑的速度更是提高15.3倍。

wKgaomWDzl-AJxOFAAf78JjM8ss289.png

Voyager 玩游戲的水平相比之前的方法大幅提升

Voyager引入三個(gè)創(chuàng)新組件:自動(dòng)課程、技能庫(kù)和迭代prompt機(jī)制。自動(dòng)課程設(shè)定開(kāi)放性探索目標(biāo),由GPT-4生成,根據(jù)探索進(jìn)度和Agent狀態(tài)最大程度地實(shí)現(xiàn)探索。技能庫(kù)存儲(chǔ)有助于解決任務(wù)行動(dòng)程序,使Voyager能夠逐步建立起一個(gè)技能庫(kù),并隨時(shí)間增強(qiáng)其能力,有效緩解“災(zāi)難性遺忘”問(wèn)題。迭代prompt機(jī)制通過(guò)環(huán)境反饋、執(zhí)行錯(cuò)誤和自我驗(yàn)證來(lái)更新prompt,使GPT-4能夠自主迭代,直到生成足夠完成當(dāng)前任務(wù)的prompt。

wKgZomWDzl-AZwb0AAQcyxmaj4s479.png

Voyager由三大新型組件組成

Voyager在探索性能、科技樹(shù)掌握速度和地圖覆蓋率等方面顯著優(yōu)于其他Agent框架,特別是在解鎖科技樹(shù)和拓展地圖范圍方面表現(xiàn)突出。然而,與此強(qiáng)大性能相比,Voyager的高昂成本成為一大制約因素。其使用GPT-4的代碼生成能力導(dǎo)致成本居高不下。此外,存在“幻覺(jué)”問(wèn)題,例如自動(dòng)課程可能提出無(wú)法完成的任務(wù)。盡管如此,學(xué)界普遍認(rèn)為Voyager是AI Agent領(lǐng)域的一項(xiàng)重大突破,使得實(shí)現(xiàn)真正的AGI更為接近。

wKgaomWDzmCABo_nAAiWmXXgZD8274.png

Voyager 的探索范圍遠(yuǎn)大于其他 Agent 框架

2)多智能體:Smallville 小鎮(zhèn)、網(wǎng)易《逆水寒》手游、昆侖萬(wàn)維《ClubKoala》虛擬世界

多智能體:Smallville 小鎮(zhèn),類(lèi)西部世界的模擬社會(huì)

斯坦福大學(xué)研究者們?cè)?023年4月首次創(chuàng)造一個(gè)虛擬的西部小鎮(zhèn),其中包含25個(gè)生成式AI代理,構(gòu)成一個(gè)交互式沙盒環(huán)境。這些智能體展現(xiàn)出類(lèi)似人類(lèi)行為,如在公園散步、在咖啡館喝咖啡,甚至規(guī)劃舉辦情人節(jié)派對(duì)。這些Agent具有人類(lèi)特質(zhì)、獨(dú)立決策和長(zhǎng)期記憶等功能,被稱(chēng)為“原生AI Agent”。在這個(gè)虛擬環(huán)境中,這些Agent不僅服務(wù)于人類(lèi)工具,還能夠在數(shù)字世界中相互合作,建立社交關(guān)系。

在西部世界小鎮(zhèn)的AI Agents架構(gòu)中,記憶流是核心要素,包含三大基本要素:記憶、反思和規(guī)劃。記憶流(MemoryStream)存儲(chǔ)Agent的所有經(jīng)歷記錄,每個(gè)觀察包含事件描述、創(chuàng)建時(shí)間和最近訪問(wèn)的時(shí)間戳。檢索過(guò)程考慮最近性、重要性和相關(guān)性三個(gè)因素,通過(guò)分?jǐn)?shù)確定權(quán)重最高記憶,作為prompt傳遞給大模型,決定Agent下一步動(dòng)作。

網(wǎng)易《逆水寒》手游,AINPC 提高玩家體驗(yàn)

《逆水寒》手游于2023年6月30日上線,首日登頂iOS游戲免費(fèi)榜,截至7月3日仍位居榜首。在iOS游戲暢銷(xiāo)榜上,公測(cè)當(dāng)天晚間躍升至第3名,次日晚上進(jìn)一步升至第2名。游戲引入百位AINPC,這些NPC不僅與玩家互動(dòng)自如,還具有記憶功能,極大增加游戲的趣味性。AINPC提供豐富的探索劇情,使游戲內(nèi)容更加豐富多彩。通過(guò)與NPC互動(dòng),玩家可以深入了解游戲世界,獲取寶貴信息,例如了解boss的弱點(diǎn)。此外,NPC之間的關(guān)系網(wǎng)還能幫助玩家巧妙解決難題。

wKgZomWDzmCAX9O0AAZ1PzZLGw0236.png

昆侖萬(wàn)維《ClubKoala》虛擬世界更可信

引入AI NPC,賦予虛擬世界更真實(shí)的體驗(yàn)。采用Play for Fun的Atom AI系統(tǒng),每個(gè)AI NPC都具備獨(dú)特的性格和行為模式,自主安排日程并相互影響。加入記憶系統(tǒng)后,AI NPC能夠記住與玩家的互動(dòng),根據(jù)玩家行為調(diào)整自身,展現(xiàn)出逐漸發(fā)展的“自我意識(shí)”,實(shí)現(xiàn)更自然、真實(shí)的動(dòng)作和對(duì)話。與AI NPC的互動(dòng)將被NPC牢記,分析玩家行為并在后續(xù)互動(dòng)中反映,構(gòu)建真正的玩家與NPC紐帶。

wKgaomWDzmGAbTJIAAczK66l-h0798.png

三、AI Agent 應(yīng)用領(lǐng)域

1、AI Agent 有望多個(gè)領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用

AI Agent是釋放大型語(yǔ)言模型(LLM)潛能的關(guān)鍵,未來(lái)將與人類(lèi)合作更加密切。當(dāng)前的大模型如GPT-4擁有強(qiáng)大的能力,但其性能仍受用戶(hù)prompt質(zhì)量限制。AI Agent出現(xiàn)將用戶(hù)從prompt工程中解放出來(lái),只需提供任務(wù)目標(biāo),以大模型為核心的AI Agent即可為其提供行動(dòng)能力,實(shí)現(xiàn)任務(wù)完成。雖然目前AI Agent主要處理簡(jiǎn)單任務(wù),但隨著研究的深入,人類(lèi)與AI Agent的合作將不斷增多,形成一個(gè)自動(dòng)化的合作體系,推動(dòng)人類(lèi)社會(huì)的生產(chǎn)結(jié)構(gòu)變革。AI Agent有望在多個(gè)領(lǐng)域?qū)崿F(xiàn)實(shí)際應(yīng)用,一些演示產(chǎn)品已經(jīng)表現(xiàn)出色。AI Agent已初步應(yīng)用于各領(lǐng)域,并有望成為AI應(yīng)用的基礎(chǔ)架構(gòu),涵蓋toC、toB等產(chǎn)品領(lǐng)域。

wKgZomWDzmKAB0bIAAi9jCNkvDo769.png

Al Agent 可能的應(yīng)用領(lǐng)域

2、2B+垂類(lèi) Agent 認(rèn)知正在形成,有望率先落地

AI Agents在2B和垂直領(lǐng)域有望率先實(shí)現(xiàn)實(shí)際應(yīng)用。由于Agent對(duì)環(huán)境反饋的依賴(lài)性,特定的企業(yè)環(huán)境更適合Agent建立對(duì)某一垂直領(lǐng)域認(rèn)知。傳統(tǒng)企業(yè)與AI結(jié)合應(yīng)用主要集中在流程任務(wù)自動(dòng)化,而Agent能夠進(jìn)一步提升一線員工工作質(zhì)量。通過(guò)將企業(yè)在私域業(yè)務(wù)上的知識(shí)傳授給Agent,使其成為領(lǐng)域的虛擬專(zhuān)家,指導(dǎo)并幫助一線員工。從時(shí)間角度看,經(jīng)驗(yàn)豐富的高級(jí)員工需要長(zhǎng)時(shí)間培養(yǎng),而訓(xùn)練得到的垂類(lèi)Agent可以低成本規(guī)模化復(fù)制。

大模型時(shí)代的到來(lái)加速AI技術(shù)平民化,未來(lái)5-10年內(nèi)AI智能成本有望迅速降低,從而實(shí)現(xiàn)企業(yè)為每一位員工搭配Agent愿景。用戶(hù)對(duì)Agent的認(rèn)知逐漸形成,初創(chuàng)企業(yè)正在積極布局。盡管AI Agent的未來(lái)形態(tài)尚未確定,但用戶(hù)對(duì)Agent的關(guān)注度正在上升,對(duì)于提升效率的認(rèn)知也在形成。未來(lái)幾年可能涌現(xiàn)出大量以Agent為核心的產(chǎn)品應(yīng)用于各行各業(yè)。

四、龍頭企業(yè)公司

大模型賦能讓進(jìn)一步智能化的 AI Agent 成為可能。具備底層大模型算法技術(shù)的公司以及相關(guān)的應(yīng)用軟件公司有望基于 AI Agent 實(shí)現(xiàn)應(yīng)用的落地。

1、OpenAI:OpenAI GPTs 展現(xiàn) AI Agent 初級(jí)形態(tài)

GPTs+Assistants API為用戶(hù)提供創(chuàng)建自定義AI Agent的簡(jiǎn)便途徑。通過(guò)自然語(yǔ)言構(gòu)建專(zhuān)屬GPT,整合個(gè)性化知識(shí),并通過(guò)API調(diào)用外部功能,使每個(gè)人都有可能擁有自己的人工智能助理。

在GPTs方面,OpenAI推出自定義GPT功能,用戶(hù)可添加知識(shí)、操作和說(shuō)明,并選擇私有、專(zhuān)屬或公開(kāi)發(fā)布。企業(yè)版用戶(hù)還可為特定客戶(hù)或部門(mén)創(chuàng)建專(zhuān)屬ChatGPT。通過(guò)GPT Builder,用戶(hù)可以以自然語(yǔ)言交互方式創(chuàng)建自定義的GPT,大幅降低開(kāi)發(fā)門(mén)檻,GPT應(yīng)用生態(tài)正在迅速發(fā)展。

另一方面,Assistants API是OpenAI專(zhuān)為開(kāi)發(fā)者設(shè)計(jì)的全面API開(kāi)發(fā)助手。提供代碼解釋器、檢索和函數(shù)調(diào)用等功能,代碼解釋器支持在沙盒中編寫(xiě)和運(yùn)行Python代碼,檢索功能增強(qiáng)助手的知識(shí),而函數(shù)調(diào)用允許助手調(diào)用開(kāi)發(fā)者定義的函數(shù),并將函數(shù)響應(yīng)合并到消息中。

wKgaomWDzmKAM_yBAAbZfx46XgU652.png

OpenAl發(fā)布的官方 GPTs

OpenAI即將推出GPT Store成為官方應(yīng)用商店,為用戶(hù)提供GPT iPhone時(shí)代可能性。在插件系統(tǒng)基礎(chǔ)上升級(jí),GPT Store將允許開(kāi)發(fā)者分享和提交自定義GPTs,驗(yàn)證后可供用戶(hù)下載使用,并由此創(chuàng)造收入將與OpenAI共享。插件系統(tǒng)已經(jīng)開(kāi)放70多個(gè)插件,包括網(wǎng)頁(yè)創(chuàng)建、視頻編輯、數(shù)據(jù)分析等功能。自ChatGPT推出以來(lái),已有超過(guò)200萬(wàn)開(kāi)發(fā)者使用API,92%的財(cái)富500強(qiáng)公司也在使用API,周活躍用戶(hù)已超過(guò)1億。

2、科大訊飛:訊飛構(gòu)建星火助手生態(tài)

訊飛星火插件推出AI工具集市,將第三方生產(chǎn)力工具整合到訊飛星火SparkDesk和星火App中。這些插件實(shí)現(xiàn)對(duì)大模型的即時(shí)信息更新和互聯(lián)網(wǎng)接入,消除數(shù)據(jù)集滯后問(wèn)題有很大幫助。同時(shí),插件擴(kuò)展模型應(yīng)用場(chǎng)景,使其適應(yīng)更多場(chǎng)景和需求,并支持企業(yè)私有化部署,確保內(nèi)部信息隱私和安全。目前,訊飛星火已接入8款插件,包括PPT生成、文檔問(wèn)答、簡(jiǎn)歷生成、ProcessOn、智能翻譯、內(nèi)容運(yùn)營(yíng)、AI面試官、郵件生成等,覆蓋18個(gè)主要應(yīng)用場(chǎng)景,如營(yíng)銷(xiāo)、工具、旅游、購(gòu)物、教育和招聘

wKgZomWDzmOAdTdIAAMkc2eiRJU542.png

星火插件為大模型賦能助力

3、昆侖萬(wàn)維:昆侖發(fā)布天工 SkyAgents

昆侖萬(wàn)維于12月1日正式發(fā)布基于“天工大模型”的全新平臺(tái)“天工 SkyAgents”,旨在幫助用戶(hù)構(gòu)建具有自主學(xué)習(xí)和獨(dú)立思考能力的AI個(gè)人助理。該平臺(tái)涵蓋從感知到?jīng)Q策再到執(zhí)行的全方位智能,用戶(hù)可以通過(guò)自然語(yǔ)言構(gòu)建個(gè)性化的“私人助理”,實(shí)現(xiàn)協(xié)同作業(yè),跨部門(mén)和業(yè)務(wù)流程進(jìn)行信息整合與傳遞,為每個(gè)用戶(hù)提供智能管理助手。此外,平臺(tái)采用任務(wù)模塊化的方式,類(lèi)似操作系統(tǒng)的模塊,覆蓋問(wèn)題預(yù)設(shè)、指定回復(fù)、知識(shí)庫(kù)創(chuàng)建與檢索、意圖識(shí)別、文本提取、HTTP請(qǐng)求等多個(gè)任務(wù)方面。

wKgaomWDzmOART_fAAKjyV5TIxE682.png

SkyAgents 六大優(yōu)勢(shì)

SkyAgents的使用無(wú)需編碼,用戶(hù)能夠通過(guò)可視化設(shè)計(jì)自主定義和配置AI Agent的行為,使搭建過(guò)程變得簡(jiǎn)單高效。昆侖萬(wàn)維通過(guò)簡(jiǎn)化開(kāi)發(fā)流程和降低技術(shù)門(mén)檻,讓所有開(kāi)發(fā)者都能輕松創(chuàng)建自己的個(gè)性化AI。平臺(tái)提供多種AI能力模塊組件,覆蓋工作、編輯、金融、寫(xiě)作、助手、翻譯、營(yíng)銷(xiāo)、生活等多個(gè)應(yīng)用場(chǎng)景。用戶(hù)還可以建立個(gè)人的“我的Agents”列表,方便管理和使用。

4、拓爾思:“拓天大模型”發(fā)布,AIGC 業(yè)務(wù)加速進(jìn)展及落地

公司專(zhuān)注于NLP、知識(shí)圖譜、OCR、圖像視頻結(jié)構(gòu)化等多模態(tài)內(nèi)容處理底層技術(shù),構(gòu)建全面的多模態(tài)人工智能產(chǎn)品體系,為客戶(hù)提供文本、音視頻、多模態(tài)等全棧服務(wù)。AIGC業(yè)務(wù)實(shí)現(xiàn)營(yíng)收782.18萬(wàn)元同比增長(zhǎng)206.02%,主要應(yīng)用于消保報(bào)告自動(dòng)生成和媒體智能輔助寫(xiě)稿等領(lǐng)域。

公司當(dāng)前致力于研發(fā)拓天大模型Agent技術(shù),側(cè)重提升Agent的任務(wù)規(guī)劃、記憶、外部工具使用、多Agent協(xié)同等能力。拓天大模型主要服務(wù)金融、媒體、政務(wù)等領(lǐng)域,公司建立基于各行業(yè)的主題數(shù)據(jù)庫(kù),為不同行業(yè)提供整合大模型產(chǎn)品,包括內(nèi)容生成、多輪對(duì)話、語(yǔ)義理解、跨模態(tài)交互、知識(shí)型搜索、邏輯推理、安全合規(guī)、數(shù)學(xué)計(jì)算、編程能力和插件擴(kuò)展等基礎(chǔ)能力。

5、彩訊股份:國(guó)產(chǎn)郵箱領(lǐng)軍者,AI、信創(chuàng)鑄就新機(jī)遇

公司初期專(zhuān)注基礎(chǔ)互聯(lián)網(wǎng)業(yè)務(wù),后轉(zhuǎn)型為產(chǎn)業(yè)互聯(lián)網(wǎng)技術(shù)及服務(wù)提供商,聚焦協(xié)助企業(yè)打造新型產(chǎn)品和渠道。在信創(chuàng)領(lǐng)域,公司的Richmail郵箱產(chǎn)品成為國(guó)內(nèi)主力,其信創(chuàng)適配與數(shù)據(jù)安全技術(shù)領(lǐng)先,已被中央集采郵箱項(xiàng)目采用,并備受政企客戶(hù)好評(píng)。

隨著大模型技術(shù)發(fā)展,公司在AI技術(shù)領(lǐng)域布局,于2023年發(fā)布了下一代智能郵箱demo產(chǎn)品,具備秘書(shū)級(jí)主動(dòng)服務(wù)、大模型信息整合處理及跨域信息獲取與存儲(chǔ)等核心功能,提升日常郵件辦公效率超過(guò)20%。

6、金山辦公:AIGC+Copilot+Insight 三箭齊發(fā),AI 全面賦能 WPS 八大應(yīng)用

金山辦公是國(guó)內(nèi)領(lǐng)先的辦公軟件及服務(wù)提供商,旗下產(chǎn)品包括WPS Office、金山文檔、WPS 365和WPS AI等,具備全球競(jìng)爭(zhēng)力,毛利率長(zhǎng)期保持在80%以上。公司持續(xù)投入高強(qiáng)度研發(fā),并在行業(yè)信創(chuàng)和辦公軟件數(shù)智化趨勢(shì)下,WPS AI與WPS 365預(yù)計(jì)將迎來(lái)新的黃金發(fā)展期。

WPS AI是國(guó)內(nèi)首個(gè)實(shí)現(xiàn)AI+辦公軟件的產(chǎn)品,擁有三層次產(chǎn)品結(jié)構(gòu),包括AIGC輔助文章生成、Copilot實(shí)現(xiàn)自動(dòng)操作和Insight提供個(gè)性化知識(shí)庫(kù)檢索。WPSAI已經(jīng)在WPS的八大應(yīng)用中實(shí)現(xiàn)全面賦能,涵蓋文檔、表格、文字和演示,通過(guò)公測(cè)展示在各個(gè)場(chǎng)景中的出色表現(xiàn),實(shí)現(xiàn)工作自動(dòng)化和智能化,提高用戶(hù)效率和產(chǎn)品體驗(yàn)。

WPS AI整合外部和自研模型,采用混合部署策略。與百度文心一言、MiniMax、智譜 AI、科大訊飛、阿里等廠商建立合作關(guān)系,同時(shí)公司自研的7B和13B模型共同支持WPS AI功能,提高在特定場(chǎng)景中的推理效率和性?xún)r(jià)比,也滿足具備私有化部署需求的客戶(hù)。

六、AI Agent 可能面臨的挑戰(zhàn)

1、安全與隱私

智能體的安全性和隱私性直接關(guān)系到用戶(hù)和社會(huì)的信任和保護(hù)。如OpenAI的GPTs在發(fā)布后出現(xiàn)的安全漏洞,可能導(dǎo)致用戶(hù)數(shù)據(jù)泄露。

2、倫理與責(zé)任

智能體的核心原則包括倫理和責(zé)任,不公平、不透明或不可靠的智能體可能會(huì)引起用戶(hù)和社會(huì)擔(dān)憂。此外,責(zé)任的明確歸屬是重要的議題。

3、經(jīng)濟(jì)和社會(huì)影響

智能體的發(fā)展對(duì)未來(lái)工作和社會(huì)就業(yè)產(chǎn)生影響。例如,智能體平臺(tái)可能對(duì)傳統(tǒng)自由職業(yè)者造成沖擊,而在社會(huì)工作中,雇主可能更趨向于減少人力投入,這引發(fā)對(duì)智能體技術(shù)對(duì)職業(yè)生涯的長(zhǎng)期影響的關(guān)注。

未來(lái)3年,AI Agent能在哪些場(chǎng)景

為企業(yè)帶來(lái)業(yè)務(wù)增長(zhǎng)與變革

一、AI Agent在企業(yè)內(nèi)的落地方式

盡管AI Agent的概念自今年五、六月份開(kāi)始引起關(guān)注,并在國(guó)外涌現(xiàn)多個(gè)實(shí)際應(yīng)用場(chǎng)景和案例,但從企業(yè)用戶(hù)、廠商和學(xué)術(shù)界的角度來(lái)看,對(duì)AI Agent的定義存在差異。在企業(yè)用戶(hù)實(shí)施AI Agent的具體方案中,大致將其分為兩類(lèi)。

1、與整體大模型能力建設(shè)密切相關(guān)的方案。企業(yè)用戶(hù)通常認(rèn)為大模型適用于多種場(chǎng)景,傾向于從中臺(tái)或能力層次來(lái)考慮大模型的運(yùn)用。例如,某股份制銀行表示計(jì)劃在明年在六到七個(gè)特定場(chǎng)景中使用大模型,強(qiáng)調(diào)需要構(gòu)建整體大模型能力。

2、AI Agent在具體應(yīng)用場(chǎng)景中的應(yīng)用,如問(wèn)答、運(yùn)維管理、客服、數(shù)字人等,以及與RPA結(jié)合用于流程自動(dòng)化,擔(dān)任招聘助理、人力資源助理、財(cái)務(wù)助理等。

這兩類(lèi)方案指引企業(yè)用戶(hù)在大模型部署中的不同方向,同時(shí)需要注意AI Agent是被視為一種能力建設(shè)還是一個(gè)具體的應(yīng)用場(chǎng)景建設(shè)。

wKgZomWDzmSACTG5AAIvVYxeQq0139.png

二、打造Agent中臺(tái),建設(shè)大模型能力

AI Agent架構(gòu)的核心組件聚焦于四個(gè)關(guān)鍵因素:長(zhǎng)短時(shí)記憶、相關(guān)配置工具、整體實(shí)現(xiàn)路徑規(guī)劃和最終執(zhí)行。在底層能力方面,依賴(lài)于大模型的支持,而這些模型可以是通用、商業(yè)或?qū)儆?xùn)練的。

在能力組件層面,AI Agent包括多種通用能力組件,如多模態(tài)檢索、內(nèi)容生成,以及Text to SQL、Text to Chart、Text to BI等數(shù)據(jù)分析中的處理能力。記憶組件主要依賴(lài)于向量數(shù)據(jù)庫(kù)和實(shí)時(shí)數(shù)據(jù)庫(kù),賦予Agent特定的記憶功能。AI Agent借鑒RPA機(jī)器人的整體構(gòu)建思路,涵蓋單個(gè)設(shè)計(jì)、整體執(zhí)行、執(zhí)行環(huán)節(jié)實(shí)現(xiàn)以及用戶(hù)端互動(dòng)。

在構(gòu)建AI Agent的整體平臺(tái)時(shí),企業(yè)需考慮資源投入、底層計(jì)算能力、產(chǎn)品工具以及擁有深厚NLP經(jīng)驗(yàn)的團(tuán)隊(duì)。不過(guò),大多數(shù)企業(yè)在初期可能不需直接進(jìn)行這樣的建設(shè),而可專(zhuān)注于實(shí)際應(yīng)用的需求。

wKgZomWDzmSAI68uAAHZeKmJAvI533.png

三、AI Agent未來(lái)應(yīng)用場(chǎng)景規(guī)劃

企業(yè)通過(guò)AI Agent在四個(gè)方向中尋求不同的價(jià)值:變革類(lèi)、增收類(lèi)、體驗(yàn)類(lèi)和降本類(lèi)。盡管變革和增收是更大的價(jià)值所在,當(dāng)前許多公司,特別是面向消費(fèi)者的企業(yè),更傾向于體驗(yàn)類(lèi)價(jià)值,因?yàn)閷?duì)C端用戶(hù)具有高比重,并通過(guò)提升用戶(hù)體驗(yàn)收集更多交互數(shù)據(jù)。

在技術(shù)方面,Agent的能力組件包括記憶、相關(guān)配置工具、實(shí)現(xiàn)路徑規(guī)劃和執(zhí)行。對(duì)于大模型的支持,特別是記憶組件的建設(shè),仍面臨挑戰(zhàn),但體驗(yàn)類(lèi)場(chǎng)景為企業(yè)提供收集用戶(hù)交互數(shù)據(jù)的機(jī)會(huì),彌補(bǔ)一些企業(yè)在數(shù)據(jù)建設(shè)方面的不足。

在應(yīng)用方面,辦公助理和知識(shí)庫(kù)問(wèn)答是實(shí)際應(yīng)用較好的領(lǐng)域,而面向整個(gè)公司層面的應(yīng)用尚有提升空間。運(yùn)維管理、客服領(lǐng)域以及數(shù)據(jù)分析被認(rèn)為是未來(lái)重要的發(fā)展方向。數(shù)據(jù)分析的價(jià)值在于滿足短期和長(zhǎng)期的管理和業(yè)務(wù)需求,促使企業(yè)建立更完善的數(shù)據(jù)文化,提升決策依據(jù)。零售場(chǎng)景的導(dǎo)購(gòu)賦能和銷(xiāo)售賦能也被認(rèn)為是未來(lái)帶來(lái)收入增長(zhǎng)的關(guān)鍵領(lǐng)域。

wKgaomWDzmWAbv1FAAGjdkHs_3E934.png

大型模型訓(xùn)練

GPU 內(nèi)存需求與優(yōu)化筆記

在處理大型模型時(shí),必須綜合考慮計(jì)算能力、內(nèi)存使用以及GPU的適配情況。這不僅影響GPU在推理大型模型時(shí)的性能,還直接決定在訓(xùn)練集群中可用的總GPU內(nèi)存,從而對(duì)能夠訓(xùn)練的模型規(guī)模產(chǎn)生影響。

推理大型模型的內(nèi)存計(jì)算只需考慮模型權(quán)重。而在進(jìn)行大型模型訓(xùn)練時(shí),內(nèi)存計(jì)算則需要考慮模型權(quán)重、反向傳播的梯度、優(yōu)化器所需的內(nèi)存以及正向傳播的激活狀態(tài)內(nèi)存。

以ChatGLM-6B為例,其參數(shù)設(shè)置包括隱藏層神經(jīng)元數(shù)量(hidden_size)為4096,層數(shù)(num_layers)為28,token長(zhǎng)度為2048,注意力頭數(shù)(attention heads)為32。下面將詳細(xì)講解如何計(jì)算推理內(nèi)存和訓(xùn)練內(nèi)存。

一、推理內(nèi)存

1、模型權(quán)重

對(duì)于不同精度的模型內(nèi)存計(jì)算,可以使用以下簡(jiǎn)化規(guī)則:

int8精度模型內(nèi)存=參數(shù)量的1倍(6GB)

fp16和bf16精度模型內(nèi)存=參數(shù)量的2倍(12GB)

fp32精度模型內(nèi)存=參數(shù)量的4倍(24GB)

因?yàn)? GB ≈ 1B字節(jié),這種簡(jiǎn)化規(guī)則使得估算ChatGLM-6B模型在不同精度下的內(nèi)存需求更為便捷。

2、推理總內(nèi)存

在進(jìn)行前向傳播時(shí),除了用于存儲(chǔ)模型權(quán)重的內(nèi)存之外,通常會(huì)有一些額外的開(kāi)銷(xiāo)。根據(jù)以往經(jīng)驗(yàn),通常被控制在總內(nèi)存的20%以?xún)?nèi)。因此,可以估算推理總內(nèi)存≈1.2×模型內(nèi)存。

二、訓(xùn)練

1、模型權(quán)重

模型權(quán)重的內(nèi)存需求在訓(xùn)練階段涉及不同精度的訓(xùn)練,包括純fp32、純fp16以及混合精度(fp16/bf16 + fp32):

純fp32訓(xùn)練模型內(nèi)存=4 * 參數(shù)量(字節(jié))

純fp16訓(xùn)練模型內(nèi)存=2 * 參數(shù)量(字節(jié))

混合精度訓(xùn)練(fp16/bf16 + fp32)模型內(nèi)存=2 * 參數(shù)量(字節(jié))

對(duì)于ChatGLM-6B,這意味著:

純fp32訓(xùn)練模型內(nèi)存=4 * 6GB=24GB

純fp16訓(xùn)練模型內(nèi)存=2 * 6GB=12GB

混合精度訓(xùn)練模型內(nèi)存=2 * 6GB=12GB

這樣的設(shè)定允許在訓(xùn)練過(guò)程中選擇不同的精度,權(quán)衡模型性能和內(nèi)存開(kāi)銷(xiāo)。

2、優(yōu)化器狀態(tài)

不同優(yōu)化器在內(nèi)存使用上有不同的計(jì)算方式:

純AdamW優(yōu)化器內(nèi)存=12 * 參數(shù)量(字節(jié))

8位優(yōu)化器(如bitsandbytes)內(nèi)存=6 * 參數(shù)量(字節(jié))

帶動(dòng)量的類(lèi)SGD優(yōu)化器內(nèi)存=8 * 參數(shù)量(字節(jié))

對(duì)于ChatGLM-6B,具體內(nèi)存計(jì)算如下:

純AdamW優(yōu)化器內(nèi)存=12 * 6GB=72GB

8位優(yōu)化器內(nèi)存=6 * 6GB=36GB

帶動(dòng)量的類(lèi)SGD優(yōu)化器內(nèi)存=8 * 6GB=48GB

這些設(shè)定允許在訓(xùn)練過(guò)程中選擇不同的優(yōu)化器,權(quán)衡模型訓(xùn)練速度和內(nèi)存開(kāi)銷(xiāo)。

3、梯度

梯度的內(nèi)存需求取決于存儲(chǔ)的數(shù)據(jù)類(lèi)型,通常為fp32或fp16。對(duì)于不同的數(shù)據(jù)類(lèi)型,梯度內(nèi)存的計(jì)算方式如下:

fp32梯度內(nèi)存=4 * 參數(shù)量(字節(jié))

fp16梯度內(nèi)存=2 * 參數(shù)量(字節(jié))

對(duì)于ChatGLM-6B,具體梯度內(nèi)存計(jì)算如下:

fp32梯度內(nèi)存=4 * 6GB=24GB

fp16梯度內(nèi)存=2 * 6GB=12GB

這些設(shè)定允許在混合精度訓(xùn)練過(guò)程中選擇不同的梯度存儲(chǔ)類(lèi)型,權(quán)衡訓(xùn)練速度和數(shù)值穩(wěn)定性。

訓(xùn)練總內(nèi)存=模型內(nèi)存+優(yōu)化器內(nèi)存+激活內(nèi)存+梯度內(nèi)存 = 12GB + 72GB + 12Gb + 7.8GB = 103GB

wKgZomWDzmWASQ0tAADm9fTLAK8939.png

AI Agent對(duì)算力的需求

解析人工智能發(fā)展中的計(jì)算力挑戰(zhàn)

隨著人工智能技術(shù)的不斷發(fā)展,AI Agent作為其中的關(guān)鍵組成部分,對(duì)算力的需求日益增加。下面將深入分析AI Agent對(duì)算力的具體需求,以及這一需求在人工智能領(lǐng)域中所帶來(lái)的挑戰(zhàn)和影響。

一、AI Agent與算力的密切關(guān)系

AI Agent作為自主智能體,具備學(xué)習(xí)、推理和決策的能力,其運(yùn)行和發(fā)揮功能需要強(qiáng)大的算力支持。在訓(xùn)練階段,AI Agent需要處理大量的數(shù)據(jù)和復(fù)雜的模型,而這就需要大規(guī)模的計(jì)算資源。算力的提供決定模型的規(guī)模、訓(xùn)練速度和推理效率,直接影響到AI Agent的性能和智能水平。

二、AI Agent的算力需求分析

大規(guī)模神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練需要處理龐大的數(shù)據(jù)集和復(fù)雜的模型結(jié)構(gòu)。如GPT-3和BERT,其訓(xùn)練過(guò)程更是對(duì)算力提出極高要求。隨著模型規(guī)模和復(fù)雜性的不斷增加,AI Agent對(duì)算力的需求也呈現(xiàn)出指數(shù)級(jí)的增長(zhǎng)。大模型在處理更多參數(shù)和更復(fù)雜的模型結(jié)構(gòu)時(shí)能夠獲得更好的性能,但這也帶來(lái)訓(xùn)練和推理時(shí)的計(jì)算負(fù)擔(dān)。硬件供應(yīng)商和云服務(wù)提供商需要不斷提升計(jì)算資源的性能和規(guī)模,以滿足Agent日益增加的需求。

除訓(xùn)練過(guò)程,AI Agent在推理和實(shí)時(shí)決策中同樣對(duì)算力有著高效響應(yīng)需求。在處理實(shí)時(shí)數(shù)據(jù)和作出即時(shí)決策情境下,算力的快速響應(yīng)成為保證Agent高效運(yùn)行關(guān)鍵因素。這對(duì)硬件架構(gòu)和計(jì)算資源的設(shè)計(jì)提出更高的要求,需要實(shí)現(xiàn)低延遲和高吞吐量。

AI Agent算力需求不僅僅影響到硬件供應(yīng)鏈,還對(duì)云服務(wù)行業(yè)和數(shù)據(jù)中心產(chǎn)業(yè)產(chǎn)生深遠(yuǎn)影響。云服務(wù)提供商需要提供彈性的計(jì)算資源,以適應(yīng)用戶(hù)對(duì)于AI Agent使用的不斷增長(zhǎng)。數(shù)據(jù)中心的設(shè)計(jì)和運(yùn)維也需要根據(jù)算力需求的變化進(jìn)行不斷優(yōu)化和升級(jí)。

三、大模型訓(xùn)練常用配置推薦

1、處理器CPU:

- Intel Xeon Gold 8358P 32C/64T 2.6GHz 48MB,DDR4 3200,Turbo,HT 240W

- Intel Xeon Platinum 8350C 32C/64T 2.6GHz 48MB,DDR4 3200,Turbo,HT 240W

- Intel Xeon Platinum 8458P 28C/56T 2.7GHz 38.5MB,DDR4 2933,Turbo,HT 205W

- Intel Xeon Platinum 8468 Processor 48C/64T 2.1GHz 105M Cache 350W

- AMD EPYC? 7742 64C/128T,2.25GHz to 3.4GHz,256MB,DDR4 3200MT/s,225W

-AMD EPYC? 9654 96C/192T,2.4GHz to 3.55GHz to 3.7GHz,384MB,DDR5 4800MT/s,360W

2、顯卡GPU:

- NVIDIA L40S GPU 48GB

- NVIDIA NVLink-A100-SXM640GB

- NVIDIA HGX A800 80GB

- NVIDIA Tesla H800 80GB HBM2

- NVIDIA A800-80GB-400Wx8-NvlinkSW

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35096

    瀏覽量

    279538
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    93

    瀏覽量

    10514
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1193

    瀏覽量

    15643
  • 模型訓(xùn)練
    +關(guān)注

    關(guān)注

    0

    文章

    20

    瀏覽量

    1455
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3138

    瀏覽量

    4060
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    即國(guó)力,比克電池如何為AI時(shí)代“蓄能

    從車(chē)路協(xié)同破解出行困局,到AI醫(yī)生實(shí)現(xiàn)千萬(wàn)級(jí)問(wèn)診,再到智能工廠的全球零時(shí)差協(xié)同——人類(lèi)正加速邁入以定義生產(chǎn)的“智紀(jì)元”。2024年,
    的頭像 發(fā)表于 06-04 14:22 ?409次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>即國(guó)力,比克電池如何為<b class='flag-5'>AI</b><b class='flag-5'>時(shí)代</b>“蓄能

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+Agent開(kāi)發(fā)平臺(tái)

    開(kāi)發(fā)平臺(tái)有4大特點(diǎn) 1)技術(shù)集成性 Agent開(kāi)發(fā)平臺(tái)集成了大模型調(diào)用、提示詞工程、插件、線上編程運(yùn)行環(huán)境、知識(shí)庫(kù)、工作流、數(shù)據(jù)庫(kù)等多種功能模塊,為開(kāi)發(fā)者提供了一站式的技術(shù)解決方案,能夠滿足Agent
    發(fā)表于 05-13 12:24

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+ 入門(mén)篇學(xué)習(xí)

    很高興又有機(jī)會(huì)學(xué)習(xí)ai技術(shù),這次試讀的是「零基礎(chǔ)開(kāi)發(fā)AI Agent」,作者葉濤、管鍇、張心雨。 大模型的普及是近年來(lái)的一件大事,萬(wàn)物皆可
    發(fā)表于 05-02 09:26

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+初品Agent

    期待中的《零基礎(chǔ)開(kāi)發(fā)AI Agent——手把手教你用扣子做智能體》終于寄到了,該書(shū)由葉濤、 管鍇、張心雨完成,并由電子工業(yè)出版社出版發(fā)行。 全書(shū)分為個(gè)部分,即入門(mén)篇、工具篇及實(shí)踐篇。由此可見(jiàn)這是
    發(fā)表于 04-22 11:51

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對(duì)
    發(fā)表于 03-25 12:00

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開(kāi)發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書(shū)學(xué)習(xí)如何構(gòu)建開(kāi)發(fā)一個(gè)視頻應(yīng)用。AI Agent是一種智能
    發(fā)表于 03-05 19:52

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺(tái)的應(yīng)用

    是LLM的元年,那么2025年可謂是AI Agent的元年了。2025年伊始,OpenAI 便以O(shè)perator和Deep Research兩款產(chǎn)品正式揭示了 AGI層 ——
    發(fā)表于 02-19 16:35

    模型遭遇墻,探索超級(jí)應(yīng)用的發(fā)展路徑

    最近,開(kāi)源中國(guó) OSCHINA、Gitee 與 Gitee AI? 全文如下: 大模型撞上 “墻”,超級(jí)應(yīng)用的探尋之路 文 / 傅聰 近日,大
    的頭像 發(fā)表于 02-10 17:24 ?1175次閱讀
    大<b class='flag-5'>模型</b>遭遇<b class='flag-5'>算</b><b class='flag-5'>力</b>墻,探索超級(jí)應(yīng)用的發(fā)展路徑

    AI:智能時(shí)代的核心驅(qū)動(dòng)力

    引言在當(dāng)今數(shù)字化時(shí)代的重要性不言而喻。12月28日,央視和國(guó)務(wù)院國(guó)資委聯(lián)合制作的紀(jì)錄片《大國(guó)基石》第期《
    的頭像 發(fā)表于 01-22 12:58 ?728次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>:智能<b class='flag-5'>時(shí)代</b>的核心驅(qū)動(dòng)力

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.55】AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)

    日程預(yù)測(cè)性地調(diào)整了今天的工作安排。 在近日的Agent OpenDay上,智譜AI展示了在AI Agent(智能體)方面最新成果,發(fā)布了用AI
    發(fā)表于 01-13 11:04

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級(jí)。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1207次閱讀

    AI時(shí)代的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

    AI時(shí)代扮演著至關(guān)重要的角色。如果說(shuō)數(shù)據(jù)是AI模型的“燃料”,那么
    的頭像 發(fā)表于 11-04 11:45 ?1149次閱讀

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

    國(guó)慶前就收到《大模型時(shí)代的基礎(chǔ)架構(gòu)》一書(shū),感謝電子發(fā)燒友論壇。歡度國(guó)慶之余,今天才靜下心來(lái)體驗(yàn)此書(shū),書(shū)不厚,200余頁(yè),彩色圖例,印刷精美! 當(dāng)初申請(qǐng)此書(shū),主要是看到副標(biāo)題“大模型
    發(fā)表于 10-08 10:40

    模型時(shí)代需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型
    發(fā)表于 08-20 09:04

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu):大模型中心建設(shè)指南

    工作日內(nèi)未聯(lián)系,視為放棄本次試用評(píng)測(cè)資格! 書(shū)籍介紹 大模型是近年來(lái)引人注目的熱點(diǎn)之一。大模型蓬勃發(fā)展的基礎(chǔ),是針對(duì)其需求設(shè)計(jì)的及基礎(chǔ)架構(gòu)。本書(shū)針對(duì)如何為大
    發(fā)表于 08-16 18:33
    主站蜘蛛池模板: 4虎影视国产在线观看精品 4虎影院永久地址www | 免费人成黄页在线观看1024 | 欧洲综合色 | 精品亚洲成a人片在线观看 精品亚洲大全 | 插吧插吧综合网 | 亚洲色图偷窥自拍 | 午夜视频1000部免费看 | 天天干天天操天天摸 | 美女被免费网站在线视频九色 | 啪啪午夜视频 | 亚洲人成网站在线观看妞妞网 | 影院在线观看免费 | 午夜免费网站 | 欧美激情片网站 | 天天操中文字幕 | 天堂视频网 | 狠狠色噜噜狠狠狠狠色综合久 | 三级不卡 | 五月激情婷婷综合 | 色综合天天网 | 美女喷白浆 | 黄色欧美| 啪啪网免费视频 | 四虎永久免费网站免费观看 | 欧美一级免费看 | 二级黄绝大片中国免费视频 | 欧美午夜剧场 | 国内色综合精品视频在线 | zzji国产精品视频 | 狠狠色噜噜狠狠狠狠2018 | 一级黄色毛片播放 | 色综合久久中文字幕网 | 国产三级精品视频 | 97久草 | 天堂网在线视频 | 欧美性色黄在线视 | 日本三级人妇 | 男人边吃奶边做视频免费网站 | 午夜三级国产精品理论三级 | 超薄肉色丝袜精品足j福利 超黄视频在线观看 | 国产一级特黄老妇女大片免费 |