在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2024-05-14 17:35 ? 次閱讀


隨著人工智能技術的飛速發展,大語言模型(Large Language Models, LLMs)在各行各業的應用日益廣泛,尤其是在軟件開發、數據分析、客戶服務等領域。蘑菇云創客空間[445期開放夜]就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測評。開放夜現場測評了十幾個國內外大語言模型,測評角度從邏輯、數學、翻譯、倫理等方面,深入探討和體驗了這些大語言模型的實際效能。

測評的大語言模型:

1.Kimi 智能助手:由月之暗面科技有限公司開發的先進AI。

2.智譜清言:由智言科技開發的大語言模型,以深度學習和自然語言處理技術見長。

3.訊飛星火:科大訊飛推出的創新語言模型。

4.文心一言:百度的前沿語言模型,致力于理解和生成自然語言。

5.豆包:專注于提供個性化的智能對話服務。

6.通義千問:以廣泛的知識庫和靈活的對話能力著稱。

7.海螺AI:新興的語言模型,擅長處理復雜的語言任務。

8.騰訊混元助手:騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開發的大語言模型。

10.ChatGPT:由OpenAI開發,國際上廣受認可的更大規模、功能更全面的語言模型。

11.Claude:Anthropic開發的先進語言模型,注重安全性和可靠性。

12.groq:以其專為AI設計的硬件加速器而聞名。

13.Gemini: OpenAI 開發的較小規模的語言模型,旨在提供更高效的計算和資源利用。

14.Mixtral:開源人工智能初創公司 MistralAI開發的超越GPT-3.5的AI模型

測評問題一: 雞兔同籠的數學問題

雞兔同籠是一個經典的數學問題,通過觀察雞兔的頭和腳的數量關系,可以利用代數方程來解決問題,從而確定籠子里雞和兔子的數量。這個問題常常展示了代數方程組的應用。

針對雞兔同籠的問題,除了Gemini Pro沒有得出正確的結果,其余的大語言模型都可以給出正確結果。

測評問題二:翻譯(詩句中翻英)

詩人馬致遠的詩句“斷腸人在天涯”,描寫了“夕陽向西緩緩落下,只有孤獨的旅人漂泊在遙遠的地方。”詩句的翻譯涉及到文化差異和詩人獨特情感。Mixtral 的語言模型正確的解釋了詩句本身的含義,幫助翻譯者很好地理解這句詩句。 Claude的語言模型對于詩句的本身理解是不正確的。

這句詩翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見,大語言模型可以幫助翻譯者分析這句詩基本的意思,但是涉及文化層面的深層含義,還是做不到意譯的。

開放夜也探討了如下涉及生活、工作的一些問題,比如:

過年福字要倒著貼,那為什么不直接生產倒過來的福字呢?

收到公司的裁員通知郵件,你應該怎么回復郵件來保住工作?

一個烏龜掉進了井里,井里有30米深。烏龜白天爬3米,晚上滑下2米。問這只烏龜需要多長時間才能爬出井口?

DFRobot AIGC小組主理人夏青在開放夜的現場測評了十幾個國內外大語言模型,通過多維度問題的測評,他認為:對于處理綜合性問題,OpenAI的ChatGPT 4.0邏輯清楚,能提供非常有用的信息。盡管在回答一些較為復雜的問題上略顯不足,但在大多數場合下,其性能仍然令人滿意。然而,ChatGPT 4.0在國內的使用成本是一個不容忽視的問題,不僅涉及訂閱費用,也包括使用的技術門檻。

與此同時,Gemini和Claude等海外語言模型,盡管在遵循指令方面略顯不足,但已達到了實用水平。令人驚喜的是,國內的Qwen1.5 72b開源模型在中文理解和特定任務,幾乎能與ChatGPT4.0匹敵此外,其他開源模型如Mixtral和新發布的LLaMA3雖在邏輯性上略遜于商業模型如ChatGPT,但總體表現已超越了ChatGPT 3.5。

綜合分析來看,盡管ChatGPT 4.0仍然是目前市場上最優秀的大語言模型,但不可忽視的是,無論是國際市場還是國內市場,其他廠商的模型均顯示出迅速的進步。開源模型的崛起也證明了開源社區在AI時代的巨大潛力。當前的大語言模型在處理理性問題方面表現一致,但通常無法提供情緒價值回應。例如,一些國內模型如“豆包”將展現其在情緒回應方面的潛力。這種能力的發展可能為未來陪伴型機器人的商業模型提供新的方向。

蘑菇云創客空間

蘑菇云創客空間是上海浦東的一家創客空間,是科技部授牌的首批國家級創客空間,由浦軟孵化器提供場地支持、上海智位機器人提供硬件及技術支持的一家為創客服務的開放式創客空間。擁有獨立的加工室、公共協作區域以及儲物、耗材商店,為硬件愛好者、程序員、設計師、DIY 發燒友等各類創客,甚至包括進行創新研發的科創團隊提供一個開放式的社區化會員空間。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    65

    瀏覽量

    7875
  • 語言模型
    +關注

    關注

    0

    文章

    561

    瀏覽量

    10706
  • ChatGPT
    +關注

    關注

    29

    文章

    1588

    瀏覽量

    8855
  • 通義千問
    +關注

    關注

    1

    文章

    35

    瀏覽量

    419
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Arm CPU適配通義Qwen3系列模型

    近日,阿里巴巴開源了新通義模型 Qwen3,Arm 率先成為首批成功適配該模型的計算平臺
    的頭像 發表于 05-12 16:37 ?481次閱讀

    壁仞科技完成阿里巴巴通義Qwen3全系列模型支持

    4月29日,阿里巴巴通義發布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發布后數小時內,壁仞科技完成全系列支持,并率先在壁仞科技開發者云平臺上線。
    的頭像 發表于 04-30 15:19 ?628次閱讀

    上線!國產AI語音開發板,定制你的聊天伙伴助手,可直接調用DeepSeek/豆包/通義

    AiPi-PalChatV1 ,可直接調用三大國產AI模型(DeepSeek/豆包/通義),輕松實現自然語言交互。 01概述 AiPi
    的頭像 發表于 04-15 17:11 ?343次閱讀
    上線!國產AI語音開發板,定制你的聊天伙伴助手,可直接調用DeepSeek/豆包/<b class='flag-5'>通義</b><b class='flag-5'>千</b><b class='flag-5'>問</b>

    低至¥2.27/h!就能使用全球最強開元模型—— QwQ-32B

    ABSTRACT摘要捷智算平臺上新全球最強開元模型——QwQ-32B。JAEALOT2025年3月18日3月17日,阿里通義
    的頭像 發表于 03-19 12:34 ?447次閱讀
    低至¥2.27/h!就能使用全球最強開元<b class='flag-5'>模型</b>——<b class='flag-5'>千</b><b class='flag-5'>問</b> QwQ-32B

    阿里最新消息:國家超算互聯網平臺、廣州算力中心、多所高校接入通義模型

    ? 國家超算互聯網平臺 接入阿里通義模型 ? 3月10日,國家超算互聯網平臺接入阿里巴巴通義
    的頭像 發表于 03-14 11:54 ?691次閱讀

    Manus與阿里通義達成合作

    據媒體報道,火爆異常的AI Agent新秀Manus和阿里云旗下大語言模型通義達成合作。雙方將基于
    的頭像 發表于 03-12 15:47 ?808次閱讀

    摩爾線程支持阿里云通義QwQ-32B開源模型

    近日,阿里云團隊正式開源全新推理模型——通義QwQ-32B。摩爾線程在該模型發布后2小時內,迅速且高效完成了對
    的頭像 發表于 03-07 17:48 ?637次閱讀
    摩爾線程支持阿里云<b class='flag-5'>通義</b><b class='flag-5'>千</b><b class='flag-5'>問</b>QwQ-32B開源<b class='flag-5'>模型</b>

    阿里通義發布Qwen2.5-Turbo開源AI模型

    近日,阿里通義官方宣布,經過數月的精心優化與改進,正式推出了Qwen2.5-Turbo開源AI模型。這款新模型旨在滿足社區對更長上下文長
    的頭像 發表于 11-19 18:07 ?1168次閱讀

    阿里通義代碼模型全系列開源

    近日,阿里云通義模型團隊宣布了項重大決策:將通義代碼
    的頭像 發表于 11-14 15:26 ?904次閱讀

    通義三款主力模型再降價

    阿里云百煉平臺再次掀起降價風暴,三款通義主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,繼5月首次大幅度降價后,再次迎來價格調整。此次降價力度空前,Qwen
    的頭像 發表于 09-20 16:46 ?1481次閱讀

    通義發布第二代視覺語言模型Qwen2-VL

    阿里巴巴旗下的通義近日宣布,其第二代視覺語言模型Qwen2-VL正式問世,并宣布旗艦模型Qw
    的頭像 發表于 09-03 16:31 ?819次閱讀

    【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型(星火大模型、文心言、豆包、kimi、智譜glm、通義

    接入文心言、通義、豆包、智譜glm、kimi國內的大模型,但由于各家接口和數據格式不
    發表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文心言、豆包、kimi、智譜glm、通義示例)

    接入文心言、通義、豆包、智譜glm、kimi國內的大模型,這個是必須可以的。但由于各家接
    發表于 08-21 19:13

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    松。 入門篇主要偏應用,比如大語言模型的三種交互方式,分析了提示工程、工作記憶和長短期記憶,此篇最后講了ChatGPT的接口和擴展功能應用,適合
    發表于 07-21 13:35

    llm模型chatGPT的區別

    LLM(Large Language Model)是指大型語言模型,它們是類使用深度學習技術構建的自然語言處理(NLP)模型。LLM
    的頭像 發表于 07-09 09:55 ?1915次閱讀
    主站蜘蛛池模板: 波多野结衣一级毛片 | 婷婷综合网站 | 四虎国产精品成人永久免费影视 | 亚洲色图21p | 男人操女人视频在线观看 | 日本不卡一区二区三区在线观看 | 国模一区二区三区私啪啪 | 免费又爽又黄1000禁片 | 天天操天天干天天做 | 日本黄色片免费看 | 精品伊人久久大线蕉地址 | 亚洲精品系列 | 日韩综合色 | 亚洲夂夂婷婷色拍ww47 | 天堂a| 欧美性生活一级 | 久热中文字幕在线精品免费 | 色国产视频 | 色视频网站大全免费 | 成zzzwww日本免费 | 亚洲午夜大片 | aaa在线观看高清免费 | 成人综合婷婷国产精品久久免费 | 中文字幕一区二区三区四区 | 五月婷婷激情网 | ts人妖系列在线专区 | 天天艹夜夜 | 久久黄视频| 香港三级在线视频 | 精品国产第一国产综合精品gif | 亚洲啊v在线 | 中文字幕不卡免费高清视频 | 天天爽夜夜爽夜夜爽精品视频 | 丁香婷婷综合网 | 综合色视频| 中文天堂在线最新版在线www | 成人免费一区二区三区 | 黄色视屏免费在线观看 | 久久久久久久久久久9精品视频 | 你懂的网站在线 | h网站在线免费观看 |