在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

2024年AI開發者中間件工具生態全面總結

OSC開源社區 ? 來源:OSC開源社區 ? 2025-02-14 09:45 ? 次閱讀

最近,開源中國 OSCHINA、Gitee 與 Gitee AI聯合發布了《2024 中國開源開發者報告》。 報告聚焦 AI 大模型領域,對過去一年的技術演進動態、技術趨勢、以及開源開發者生態數據進行多方位的總結和梳理。

在第二章《TOP 101-2024 大模型觀點》中,生成式 AI 開發者莫爾索總結了 2024 年 AI 開發者中間件工具生態。

全文如下:

AI 開發者中間件工具生態 2024 年總結

文 / 莫爾索 AI 應用開發者工具自下而上涵蓋了模型托管與推理服務、代理工作流編排、大型模型應用的監控與追蹤、模型輸出的可控性以及安全工具等多個層面。模型是 AI 應用的核心組成部分,其服務需依賴推理引擎實現。開發者接入模型的方式大致可分為四類:

首先是以模型初創企業為代表,提供先進的商業閉源模型,如 OpenAI、Anthropic、智譜及 MiniMax 等。

其次是由 TogetherAI、Groq、Fireworks、Replicate、硅基流動等組成的 GPU 推理集群服務提供商,它們處理擴展與縮減等技術難題,并在基本計算費用基礎上收取額外費用,從而讓應用公司無需承擔構建和管理 GPU 推理集群的高昂成本,而是可以直接利用抽象化的 AI 基礎設施服務。

第三類是傳統的云計算平臺,例如亞馬遜的 Amazon Bedrock、阿里云百煉平臺、微軟的 Azure AI、谷歌 Vertex AI 等,允許應用開發者輕松部署和使用標準化或定制化的 AI 模型,并通過 API 接口調用這些模型。

最后一類是本地推理,SGLang、vLLM、TensorRT-LLM 在生產級 GPU 服務負載中表現出色,受到許多有本地托管模型需求的應用開發者的歡迎,此外,Ollama 和 LM Studio 也是在個人計算機上運行模型的優選方案。

除模型層面外,應用層面的工具同樣在快速發展,工具的進步緊密跟隨 AI 應用的發展趨勢。自 ChatGPT 發布以來,應用構建方式大致經歷了三個階段。

首先是基于單一提示詞模板的聊天助手類應用,此階段重點關注模型和提示詞的安全性以及模型輸出的可控性。例如,garak 可用于檢測模型幻覺、數據泄露和生成毒性內容等問題;rebuff 則針對提示詞注入進行檢測;DSPy 框架提供了系統高效的編程方法,幫助解決應用開發中的提示編寫問題;而 LMFormat Enforcer、Guidance 及 Outlines 等項目旨在幫助開發者控制模型輸出的結構,以獲得高質量的輸出。

第二個階段涉及通過組合一系列提示詞和第三方工具或 API 來編排復雜的工作流,這是目前成熟的 AI 應用構建思路之一。值得注意的是,RAG 技術的出現,得益于大語言模型天然適合處理知識密集型任務,RAG 通過從外部記憶源檢索相關信息,不僅提高了模型生成的精確性和相關性,還解決了大語言模型在數據隱私保護、實時數據處理和減少幻覺問題等方面的局限。RAG 技術在數據預處理和索引構建方面的努力,直接影響最終應用的效果。 尤其是在本地數據預處理方面,PDF 內容處理成為一大難點,眾多開源項目應運而生,如基于傳統 OCR 技術和版面分析的 Unstructured 和 Marker 庫,以及結合了多模態大模型識別能力的 ZeroX 和 GPTPDF 庫。

此外,還有融合了 OCR 和多模態大模型方案的 PDF-Extract-API 庫。在公開在線數據處理方面,Jina Reader、Crawl4AI 和 Markdowner 等開源項目,能夠將網頁內容轉換成適合大模型處理的上下文,從而利用最新信息提升問題回答的質量。這些項目的共同目標是將原始數據轉化為有價值的資產,助力企業大規模部署 AI。 對于結構化數據,如對話歷史記錄和其他數據源的存儲管理同樣重要。向量數據庫如 Chrom、Weaviate、Pinecone、Milvus 等,提供了語義檢索和向量存儲功能,使得 AI 應用能夠利用超出模型上下文限制的數據源。傳統數據庫 PostgreSQL 現在也支持通過 pgvector 擴展進行向量搜索,基于 PostgreSQL 的公司如 Neon 和 Supabase 為 AI 應用提供了基于嵌入的搜索和存儲解決方案。 為了有效管理 AI 應用的復雜工作流程,市場上涌現了 Dify、Wordware、扣子等低代碼平臺,它們集成了多種大模型,支持外部數據接入、知識庫管理和豐富的插件庫,通過拖拽式配置幫助初學者快速構建 AI 應用。 同時,在開源生態系統中,LangChain、Haystack、Semantic Kernel 等編排框架的出現,使開發者能夠構建、定制和測試 Pipeline,確保這些 Pipeline 的組合能夠達到特定應用場景的最佳生成效果。 對于 RAG 應用,這是一種由多個環節構成的工作流應用,出現了許多端到端的開源解決方案,如 LlamaIndex 框架,它集成了數據預處理、索引構建、 多樣化檢索方法等功能,專為大語言模型設計;RAGFlow 是一個基于深度文檔理解的開源 RAG 引擎,提供高質量的問答能力,適用于處理大規模的復雜格式數據;Verba 是向量數據庫廠商 Weaviate 開源的一個模塊化 RAG 框架,允許開發者根據不同的應用場景靈活定制 RAG 應用的不同環節。

第三個階段,一些產品團隊正探索開發完全由大模型驅動的代理應用。這類代理應用具備從歷史記憶中反思、自主規劃和使用工具執行特定動作的能力。大語言模型負責選擇要調用的工具及其參數,而具體的執行動作則在沙箱環境中進行,以確保安全。 E2B、Modal 等服務提供商正是為了滿足這一需求而誕生。代理通過 OpenAI 定義的 JSON 模式調用工具,這使得代理和工具能夠在不同的框架中兼容,促進了代理工具生態系統的增長。例如,Composio 是一個支持授權管理的通用工具庫,Exa 則提供了一個專門用于網絡搜索的工具。隨著更多代理應用的構建,工具生態系統將持續擴展,提供更多新功能,如認證和訪問控制。 在代理應用中,記憶管理同樣關鍵。開源項目 Mem0 將記憶分為短期記憶和長期記憶,后者進一步細分為事件記憶、語義記憶和程序記憶,并基于此抽象出一套記憶管理 SDK。Zep 通過時態知識圖譜管理和更新用戶信息,跟蹤事實變化并提供最新數據線索。MemGPT 借鑒了計算機操作系統內存管理機制,模擬虛擬內存工作原理,構建了一套記憶管理系統。這些項目使 AI 應用能夠記住對話歷史,提供更個性化、上下文感知的交互體驗,極大地增強了用戶的滿意度。

此外,代理應用的另一個探索方向是多個代理之間的協同工作。開源社區中出現了許多解決方案,如 CrewAI 和 AutoGen 具備原生的多代理通信抽象,而 LangGraph 和 Letta 中的代理可以互相調用,良好的多代理系統設計使得跨代理協作變得更加容易實現。 鑒于生成模型本質上是一個概率黑盒,AI 應用作為一個復雜的系統,其在生產環境中的質量評估與監控尤為重要。實際應用中最大的挑戰之一就是輸出結果的不確定性。 面對這些挑戰,需要采用科學的評估方法。LangSmith、Arise、Langfuse、Ragas 和 DeepEval 等項目提供了評估和監控所需的各種指標和工具,幫助開發者量化測量、監控和調試他們的 AI 應用系統。 展望未來,o1 模型的發布標志著大模型研究進入了新的時代。o1 模型的推理能力提升對 AI 基礎設施提出了更高的要求,例如并行計算部分思維鏈路、減少不必要的思維過程等。研究的重點重新回到了算法層面,而非簡單的算力堆砌,這對于中小型模型開發公司和學術界而言是一大利好。o1 模型的更強推理能力推動了越來越多真正的 autopilot 類產品進入?常生活,預示著 AI 技術將更加深入地融入人類社會的方方面面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31834

    瀏覽量

    270609
  • 開發者
    +關注

    關注

    1

    文章

    594

    瀏覽量

    17106

原文標題:AI開發者中間件工具生態2024年總結

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    2024AI編程技術與工具發展總結

    最近,開源中國 OSCHINA、Gitee 與 Gitee AI? 聯合發布了《2024 中國開源開發者報告》 。 報告聚焦 AI 大模型領域,對過去一
    的頭像 發表于 02-13 09:11 ?123次閱讀
    <b class='flag-5'>2024</b><b class='flag-5'>年</b><b class='flag-5'>AI</b>編程技術與<b class='flag-5'>工具</b>發展<b class='flag-5'>總結</b>

    AI行業大咖云集 2024邊緣智能開發者生態大會圓滿落幕

    12月5日,2024邊緣智能開發者生態大會暨2024高通邊緣智能創新應用大賽頒獎典禮隆重舉行。全球眾多邊緣智能行業專家、開發者齊聚四川成都,
    的頭像 發表于 12-09 14:48 ?303次閱讀
    <b class='flag-5'>AI</b>行業大咖云集 <b class='flag-5'>2024</b>邊緣智能<b class='flag-5'>開發者</b><b class='flag-5'>生態</b>大會圓滿落幕

    云端AI開發者工具怎么用

    云端AI開發者工具通常包括代碼編輯器、模型訓練平臺、自動化測試工具、代碼管理工具等。這些工具不僅
    的頭像 發表于 12-05 13:31 ?195次閱讀

    AI驅動智慧未來,2024 TUYA全球開發者大會(中東)圓滿落幕

    202410月17日,涂鴉智能聯手阿里云共同舉辦的TUYA全球開發者大會在迪拜正式召開。這是涂鴉開發者大會首次落地中東,涂鴉攜手海內外行業領袖,為
    的頭像 發表于 10-19 08:05 ?383次閱讀
    <b class='flag-5'>AI</b>驅動智慧未來,<b class='flag-5'>2024</b> TUYA全球<b class='flag-5'>開發者</b>大會(中東)圓滿落幕

    2024 OPPO開發者盛會:共創全民參與的AI新紀元

     202410月17日,OPPO開發者大會(ODC24)在杭州盛大開幕,以“AI 更近一步”為主題,聚焦于OPPO AI技術的革新與構建開
    的頭像 發表于 10-17 16:28 ?728次閱讀

    2024快應用開發者大會:攜手AI,共筑未來智慧服務新生態

    8月8日,在北京望京凱悅酒店舉辦的2024快應用開發者大會正式落下帷幕。 本屆快應用開發者大會以「快意無界,與AI同行」為主題,聚焦于快應用服務的
    的頭像 發表于 08-09 15:27 ?509次閱讀
    <b class='flag-5'>2024</b>快應用<b class='flag-5'>開發者</b>大會:攜手<b class='flag-5'>AI</b>,共筑未來智慧服務新<b class='flag-5'>生態</b>

    云原生中間件,構筑軟件安全可信的連接橋梁

    近日,在華為云開發者大會 2024 期間,來自華為云 PaaS 服務,中間件領域產品團隊的資深專家、技術總監、高級產品經理等大咖們發表了以“云原生中間件,構筑軟件安全可信的連接橋梁”為
    的頭像 發表于 07-10 20:55 ?562次閱讀
    云原生<b class='flag-5'>中間件</b>,構筑軟件安全可信的連接橋梁

    北京靈奧科技基于亞馬遜云科技打造大模型中間件

    助力企業加速應用生成式AI 北京20246月27日?/美通社/ --?北京靈奧科技基于亞馬遜云科技的生成式AI、數據庫和容器等云服務,打造大模型
    的頭像 發表于 06-27 21:21 ?631次閱讀

    2024 TUYA全球開發者大會盛大啟幕,Cube AI大模型重磅首發!

    2024TUYA全球開發者大會上,重磅推出AI大模型、AI開發工具AI小程序
    的頭像 發表于 05-31 08:15 ?421次閱讀
    <b class='flag-5'>2024</b> TUYA全球<b class='flag-5'>開發者</b>大會盛大啟幕,Cube <b class='flag-5'>AI</b>大模型重磅首發!

    2024 TUYA全球開發者大會盛大啟幕,Cube AI大模型重磅首發!

    2024 TUYA全球開發者大會上,重磅推出AI大模型、AI開發工具AI小程序
    發表于 05-30 09:13 ?253次閱讀
    <b class='flag-5'>2024</b> TUYA全球<b class='flag-5'>開發者</b>大會盛大啟幕,Cube <b class='flag-5'>AI</b>大模型重磅首發!

    報名開啟!第二屆OpenHarmony開發者大會2024重磅來襲!

    OpenHarmony 開發者大會2024,為開發者、產業組織、生態伙伴和行業用戶搭建一個交流、分享和學習的平臺。大會以 OpenHarmony 4.1 Release版本根技術特性
    發表于 05-14 15:23

    MediaTek 天璣開發者大會MDDC 2024啟幕

    Conference, 簡稱MDDC)是一場面向全球開發者的行業盛會,旨在與生態合作伙伴和開發者共同探討行業發展趨勢,分享知識、經驗和先進技術成果。本屆大會的主題為“AI予萬物”,屆
    的頭像 發表于 05-07 10:25 ?737次閱讀

    Create2024百度AI開發者大會深圳開幕

    2024是第六屆。 百度Create大會是全球首個AI開發者大會,更是2024科技圈最重要
    的頭像 發表于 04-16 15:13 ?943次閱讀
    Create<b class='flag-5'>2024</b>百度<b class='flag-5'>AI</b><b class='flag-5'>開發者</b>大會深圳開幕

    中間件廠商中創股份成功上市

    近日,國內領先的基礎軟件中間件產品與服務提供商——山東中創軟件商用中間件股份有限公司(以下簡稱“中創股份”)在上海證券交易所科創板上市,股票代碼為“688695”。這一里程碑事件標志著中創股份在基礎軟件中間件領域的實力和影響力得
    的頭像 發表于 03-14 15:25 ?979次閱讀

    基礎軟件中間件產品與服務提供商中創股份成功上市

    山東中創軟件商用中間件股份有限公司(股票簡稱:中創股份,股票代碼:688695)今日在上海證券交易所科創板成功上市,開啟了公司發展的新篇章。作為中間件技術標準的主要推動和制定,中創
    的頭像 發表于 03-13 14:21 ?811次閱讀
    主站蜘蛛池模板: 99久久久精品免费观看国产 | 永久免费mv网站入口 | 久久精品2020 | 成人国产精品毛片 | 一级特色黄色片 | 天堂网视频 | 亚洲色网址 | 日韩成人一级 | 亚洲网站免费看 | 欧美一区二区三区不卡免费观看 | 91精品日本久久久久久牛牛 | 午夜视频1000 | 免费公开视频人人人人人人人 | 美女扒开尿口给男人爽免费视频 | 日本在线观看www | 免费成人黄色网址 | 五月香婷婷 | 日韩手机看片 | 奇米影色777四色在线首页 | 在线观看视频免费入口 | 欧美影院 | 日日干天天爽 | 久久国产免费观看精品1 | 国产性较精品视频免费 | 人人草97 | 97夜夜澡人人爽人人喊一欧美 | 国产成年美女毛片80s | 久久福利青草精品资源站免费 | 天堂网在线.www天堂在线资源 | 国产99色 | 黄 色 成 年人在线 黄a大片 | 操片| 日本黄色大片免费 | 久久99国产精品免费观看 | 成 人 免 费 黄 色 | 午夜 福利 | 亚洲综合丁香婷婷六月香 | 国产三级a三级三级野外 | 日韩欧美亚洲综合久久影院d3 | 久久久久久国产精品免费免费 | 久久免费精品高清麻豆 |