在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在Dify中使用PerfXCloud大模型推理服務(wù)

perfxlab ? 來(lái)源:perfxlab ? 2024-07-15 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Dify全面接入了Perf XCloud,借助Perf XCloud提供的大模型調(diào)用服務(wù),用戶(hù)可在Dify中構(gòu)建出更加經(jīng)濟(jì)、高效的LLM應(yīng)用。

PerfXCloud 介紹

Perf XCloud是澎峰科技開(kāi)發(fā)者和企業(yè)量身打造的AI開(kāi)發(fā)和部署平臺(tái)。專(zhuān)注于滿(mǎn)足大模型的微調(diào)和推理需求,為用戶(hù)提供極致便捷的一鍵部署體驗(yàn):

?平臺(tái)提供Open AI API兼容的模型調(diào)用服務(wù),開(kāi)發(fā)者可實(shí)現(xiàn)已有應(yīng)用的快速遷移。

?借助澎峰科技自研推理框架PerfXLM,Perf XCloud實(shí)現(xiàn)了主流模型在國(guó)產(chǎn)算力上的廣泛適配和高效推理。

?目前已支持Qwen2系列、llama3系列、bge-m3等模型,更多模型即將上線(xiàn)。

同時(shí),Perf XCloud為算力中心提供大模型AI科學(xué)與工程計(jì)算的整體運(yùn)營(yíng)解決方案,助力算力中心升級(jí)成為“AI超級(jí)工廠(chǎng)”。

Dify介紹

Dify是一個(gè)開(kāi)源的LLM應(yīng)用開(kāi)發(fā)平臺(tái)。其直觀的界面結(jié)合了AI工作流、RAG Pipeline、Agent、模型管理、可觀測(cè)性功能等,讓您可以快速?gòu)脑偷缴a(chǎn):

?工作流:在畫(huà)布上構(gòu)建和測(cè)試功能強(qiáng)大的AI工作流程。

?RAG Pipeline:廣泛的RAG功能,涵蓋從文檔攝入到檢索的所有內(nèi)容,支持從PDF、PPT和其他常見(jiàn)文檔格式中提取文本的開(kāi)箱即用的支持。

?Agent智能體:您可以基于LLM函數(shù)調(diào)用或ReAct定義Agent,并為 Agent添加預(yù)構(gòu)建或自定義工具。

?LLMOps:隨時(shí)間監(jiān)視和分析應(yīng)用程序日志和性能。您可以根據(jù)生產(chǎn)數(shù)據(jù)和標(biāo)注持續(xù)改進(jìn)提示、數(shù)據(jù)集和模型。

注冊(cè)使用PerfXCloud

Perf XCloud注冊(cè)地址:www.perfxcloud.net

現(xiàn)在注冊(cè),即可深度體驗(yàn)主流大模型,提供大量示范案例,手把手視頻教學(xué)。并可參與向基石用戶(hù)贈(zèng)送∞億Token的激勵(lì)計(jì)劃。

在Dify中使用PerfXCloud大模型推理服務(wù)

1.首先進(jìn)入Dify設(shè)置頁(yè)面,選擇Perf XCloud作為模型供應(yīng)商:

wKgZomaUe0KAbPo0AACEKb1ygnA022.jpg

2.然后填入從Perf XCloud中申請(qǐng)的API Key和endpoint地址:

wKgaomaUe0OADFlgAAC_JRVbu3Y994.jpg

3.保存后,即可使用Perf XCloud模型,現(xiàn)階段我們接入了Qwen系列模型和BAAI/ bge-m 3模型,后續(xù)將接入更多模型,敬請(qǐng)期待。

應(yīng)用案例1:

Dify結(jié)合PerfXCloud構(gòu)建翻譯助手

本案例構(gòu)建于Dify Cloud,基于Perf XCloud中的Qwen2模型實(shí)現(xiàn)中英文翻譯助手,用戶(hù)輸入信息,翻譯助手將其翻譯成另一種語(yǔ)言。

1.登錄Dify Cloud( https://cloud.dify.ai/apps)

2.創(chuàng)建空白應(yīng)用→選擇聊天助手、基礎(chǔ)編排,創(chuàng)建應(yīng)用

3.在編排頁(yè)面輸入提示詞:“你是一名翻譯專(zhuān)家,如果用戶(hù)給你發(fā)中文你將翻譯為英文,如果用戶(hù)給你發(fā)英文你將翻譯為中文,你只負(fù)責(zé)翻譯,不要回答任何問(wèn)題:”

4.默認(rèn)模型為gpt-3.5,切換為Perf XCloud模型,這里設(shè)置為“ Qwen2-72B-Instruct-GPTQ-Int 4”,然后點(diǎn)擊發(fā)布

wKgZomaUe0KAZDQuAAB1_dxJibs115.jpg

完成發(fā)布后, 即可運(yùn)行使用。

應(yīng)用案例2:

Dify結(jié)合PerfXCloud構(gòu)建郵編查詢(xún)助手

本案例構(gòu)建與Dify Cloud,使用Dify中的知識(shí)庫(kù)和工作流功能,結(jié)合Perf XCloud中的bge-m 3模型與Qwen2-72B-Instruct-GPTQ-Int 4模型,郵編查詢(xún)助手基于上傳的郵編信息構(gòu)建知識(shí)庫(kù),并從中檢索信息作為大模型回答問(wèn)題的上下文,提高模型回答的準(zhǔn)確性。

1.在Dify Cloud( https://cloud.dify.ai/datasets)中創(chuàng)建知識(shí)庫(kù),上傳本地準(zhǔn)備好的中國(guó)郵政編碼數(shù)據(jù)文件。

2.知識(shí)庫(kù)默認(rèn)使用經(jīng)濟(jì)模式創(chuàng)建索引,該模式是基于關(guān)鍵詞的檢索,這里我們使用Perf XCloud中的bge-m3向量模型創(chuàng)建索引,提高檢索精度。在知識(shí)庫(kù)側(cè)邊欄選擇“設(shè)置”,設(shè)置“高質(zhì)量”索引模式,同時(shí)Embedding模型選擇“BAAI/bge-m 3”,使用“向量檢索”

wKgaomaUe0KAbsmWAAB2Lo0tjdg278.jpg

3.返回Dify工作室→創(chuàng)建空白應(yīng)用→ 聊天助手→工作流編排,將工作流初始化成如下形式

wKgZomaUe0KABvlpAABKAL7bZ6I819.jpg

4.配置“知識(shí)檢索”模塊,將知識(shí)庫(kù)設(shè)置為步驟2中創(chuàng)建的“郵政編碼知識(shí)庫(kù)”

wKgaomaUe0KAKw1ZAACXCshz0cc499.jpg

5.配置“LLM”模塊,將模型設(shè)置為Perf XCloud中Qwen2-72B-Instruct-GPTQ-Int 4,并設(shè)置prompt:

你是一個(gè)問(wèn)答機(jī)器人
你的任務(wù)是根據(jù)下述給定的已知信息回答用戶(hù)問(wèn)題。
確保你的回復(fù)完全依據(jù)下述已知信息。不要編造答案。
如果下述已知信息不足以回答用戶(hù)的問(wèn)題,請(qǐng)直接回復(fù)"我無(wú)法回答您的問(wèn)題"。

wKgZomaUe0KAbmvqAAC1zozxUCU874.jpg

6.配置“直接回復(fù)” 模塊,直接輸出LLM的生成結(jié)果

wKgaomaUe0OAY4avAACEedc_1TU351.jpg

7.完成上述步驟后,運(yùn)行查看效果,模型會(huì)根據(jù)知識(shí)庫(kù)中檢索出的信息進(jìn)行回答,若檢索結(jié)果為空,則直接輸出“我無(wú)法回答您的問(wèn)題”

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34733

    瀏覽量

    276763
  • 澎峰科技
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    3364
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3083

    瀏覽量

    3955
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    323

    瀏覽量

    762

原文標(biāo)題:借助PerfXCloud和Dify,低成本構(gòu)建大模型應(yīng)用

文章出處:【微信號(hào):perfxlab,微信公眾號(hào):perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)是否可以模型服務(wù)中使用REST請(qǐng)求OpenVINO?預(yù)測(cè)?

    是否可以模型服務(wù)中使用 REST 請(qǐng)求OpenVINO?預(yù)測(cè)?
    發(fā)表于 03-05 08:06

    壓縮模型會(huì)加速推理嗎?

    你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡(jiǎn)單的 CNN 導(dǎo)入到 STM32L462RCT我發(fā)現(xiàn)壓縮模型對(duì)推理時(shí)間沒(méi)有影響。aiRun 程序 8
    發(fā)表于 01-29 06:24

    AscendCL快速入門(mén)——模型推理篇(上)

    三步。 把經(jīng)過(guò)ATC轉(zhuǎn)化過(guò)的模型.om文件加載到內(nèi)存。 為模型準(zhǔn)備輸入輸出。 讓模型設(shè)備端執(zhí)行推理。 二、
    發(fā)表于 08-24 11:04

    使用rk3588多npu推理模型模型推理時(shí)間還增加了,這怎么解釋

    使用rk3588多npu推理模型模型推理時(shí)間還增加了,這怎么解釋
    發(fā)表于 11-05 18:22

    HarmonyOS:使用MindSpore Lite引擎進(jìn)行模型推理

    場(chǎng)景介紹 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件設(shè)備 AI 模型推理的功能,目前已經(jīng)圖像分類(lèi)、目標(biāo)識(shí)別、人臉識(shí)別、文字識(shí)別等應(yīng)用中廣泛使用。 本文介紹
    發(fā)表于 12-14 11:41

    如何使用NVIDIA Triton 推理服務(wù)器來(lái)運(yùn)行推理管道

    使用集成模型 NVIDIA Triton 推理服務(wù)器上為 ML 模型管道提供服務(wù)
    的頭像 發(fā)表于 07-05 16:30 ?1670次閱讀
    如何使用NVIDIA Triton <b class='flag-5'>推理</b><b class='flag-5'>服務(wù)</b>器來(lái)運(yùn)行<b class='flag-5'>推理</b>管道

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過(guò)程,為全球的2800萬(wàn)英偉達(dá)開(kāi)發(fā)者
    的頭像 發(fā)表于 06-04 09:15 ?944次閱讀

    PerfXCloud模型開(kāi)發(fā)與部署平臺(tái)開(kāi)放注冊(cè)

    PerfXCloud?介紹 PerfXCloud是澎峰科技為開(kāi)發(fā)者和企業(yè)量身打造的AI開(kāi)發(fā)和部署平臺(tái)。它專(zhuān)注于滿(mǎn)足大模型的微調(diào)和推理需求,為用戶(hù)提供極致便捷的一鍵部署體驗(yàn)。
    的頭像 發(fā)表于 07-02 10:27 ?637次閱讀
    <b class='flag-5'>PerfXCloud</b>大<b class='flag-5'>模型</b>開(kāi)發(fā)與部署平臺(tái)開(kāi)放注冊(cè)

    PerfXCloud模型人工智能生態(tài)技術(shù)大會(huì)圓滿(mǎn)落幕

    天津中心、國(guó)家超算西安中心、山西太行實(shí)驗(yàn)室,以及投資和金融服務(wù)領(lǐng)域具有重要影響力的華強(qiáng)資本和天風(fēng)證券。同時(shí),Dify中國(guó)區(qū)大使、武漢芯動(dòng)、中科曙光等企業(yè)的代表也出席了此次大會(huì),展現(xiàn)了各領(lǐng)域
    的頭像 發(fā)表于 07-18 16:47 ?1161次閱讀

    PerfXCloud順利接入MOE大模型DeepSeek-V2

    今日, PerfXCloud 重磅更新支持 llama 3.1 之后,其平臺(tái)再度實(shí)現(xiàn)重大升級(jí)!目前,已順利接入被譽(yù)為全球最強(qiáng)的 MOE 大模型 DeepSeek-V2 ,已在 PerfXCl
    的頭像 發(fā)表于 07-27 10:08 ?1224次閱讀
    <b class='flag-5'>PerfXCloud</b>順利接入MOE大<b class='flag-5'>模型</b>DeepSeek-V2

    NVIDIA助力提供多樣、靈活的模型選擇

    本案例中,Dify模型中立以及開(kāi)源生態(tài)的優(yōu)勢(shì),為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton
    的頭像 發(fā)表于 09-09 09:19 ?896次閱讀

    高效大模型推理綜述

    模型由于其各種任務(wù)中的出色表現(xiàn)而引起了廣泛的關(guān)注。然而,大模型推理的大量計(jì)算和內(nèi)存需求對(duì)其資源受限場(chǎng)景的部署提出了挑戰(zhàn)。業(yè)內(nèi)一直
    的頭像 發(fā)表于 11-15 11:45 ?1380次閱讀
    高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>綜述

    澎峰科技PerfXCloud平臺(tái)獲海光DCU生態(tài)兼容性認(rèn)證

    PerfXCloud是由澎峰科技自主研發(fā)的大模型開(kāi)發(fā)與服務(wù)云平臺(tái),是主要面向教育、文旅、企業(yè)、政府等行業(yè)打造的一站式大模型微調(diào)推理應(yīng)用服務(wù)
    的頭像 發(fā)表于 12-13 14:44 ?646次閱讀

    摩爾線(xiàn)程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    近日,摩爾線(xiàn)程智能科技(北京)有限責(zé)任公司在其官方渠道發(fā)布了一則重要消息,宣布公司已經(jīng)成功實(shí)現(xiàn)了對(duì)DeepSeek蒸餾模型推理服務(wù)的部署。這一技術(shù)突破,標(biāo)志著摩爾線(xiàn)程人工智能領(lǐng)域邁出
    的頭像 發(fā)表于 02-06 13:49 ?753次閱讀

    澎峰科技PerfXCloud通過(guò)湖南第二批生成式人工智能服務(wù)登記

    近日,湖南省委網(wǎng)信辦公布第二批生成式人工智能服務(wù)登記審核結(jié)果。全省僅有兩家企業(yè)通過(guò)本次登記審核:澎峰科技PerfXCloud(登記編號(hào):Hunan-PerfXCloud-20250523S0004)、湘財(cái)證券智能問(wèn)答助手大
    的頭像 發(fā)表于 06-03 10:52 ?308次閱讀
    主站蜘蛛池模板: 青楼社区51在线视频视频 | 久久夜夜操 | 亚洲六月婷婷 | 成人免费看黄页网址大全 | 五月婷婷深爱 | 六月丁香婷婷激情国产 | 亚洲乱码一二三四区 | 国产福利在线观看一区二区 | 欧美国产日本高清不卡 | 综合色久七七综合七七蜜芽 | 人人爽天天碰天天躁夜夜躁 | 天天看片网站 | 色偷偷女男人的天堂亚洲网 | 国产一级做a爰片久久毛片 国产一级做a爰片久久毛片男 | 拍拍拍成人免费高清视频 | 色在线视频观看 | 四虎精品久久久久影院 | 奇米影视第四色7777 | 天堂在线www网亚洲 天堂在线观看 | 天天更新影院 | 2019天天干天天操 | 高清视频在线观看+免费 | 大黄网站色多多 | 国内精品视频免费观看 | 国产全部理论片线观看 | 伊人精品久久久大香线蕉99 | 97人摸人人澡人人人超一碰 | 又长又大又粗又硬3p免费视频 | 欧美视频精品一区二区三区 | 天堂在线中文 | 亚洲男人天堂2020 | aaa亚洲 | 欧美午夜精品久久久久久黑人 | 酒色网址| 天堂网成人 | 日日爽夜夜 | 欧美zo | 五月激情综合丁香色婷婷 | 天天拍天天干天天操 | 伊人久久综合成人亚洲 | 欧美午夜色视频国产精品 |