在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|谷歌深夜發(fā)布復(fù)仇神器Gemini,原生多模態(tài)碾壓GPT-4?

新火種 ? 來(lái)源:新火種 ? 作者:新火種 ? 2023-12-08 09:09 ? 次閱讀

作者:一號(hào)

GPT-4最強(qiáng)的對(duì)手出現(xiàn)了。

北京時(shí)間12月7日凌晨,谷歌CEO“劈柴”突然發(fā)布重磅AI殺手锏——Gemini。就在前幾天,還有消息說(shuō)Gemini要推遲一個(gè)月才上線,結(jié)果現(xiàn)在這么突然地發(fā)布,著實(shí)讓AI圈料不到。以谷歌以往的實(shí)力,不用想,這又是AI界的一個(gè)“不眠之夜”。

在去年ChatGPT發(fā)布不到兩周,谷歌就拉響了「警報(bào)」來(lái)應(yīng)戰(zhàn),好不容易搞出來(lái)的Bard,在首次亮相的時(shí)候卻出現(xiàn)了失誤,讓谷歌市值一夜蒸發(fā)了1000億美元。

而且,GPT(Generative Pre-training Transformer)還是基于Transformer開發(fā)的,而這個(gè)Transformer模型最早還是谷歌提出來(lái),要想谷歌心甘情愿地服輸,可不是那么容易。

果然,這一年的時(shí)間里,關(guān)于Gemini的消息就層出不窮,有的說(shuō)谷歌大腦和DeepMind部門合并,幾乎耗盡谷歌內(nèi)部算力資源,就是為了背水一戰(zhàn),和OpenAI決戰(zhàn)。

不過(guò)前段時(shí)間,OpenAI的發(fā)布會(huì)把AI界炸了一圈,還上演了一出“宮斗劇”,甚至還傳出讓人浮想聯(lián)翩的Q*,谷歌都沒一點(diǎn)新消息,差點(diǎn)就讓人以為AI圈的王者已定。

就在一個(gè)月之前,英偉達(dá)科學(xué)家Jim Fan就曾說(shuō)過(guò),“人們對(duì)谷歌Gemini的期望高得離譜!谷歌要想重奪當(dāng)年AlphaGo的輝煌,Gemini不僅要100%達(dá)到GPT-4的能力,還要在成本或者速度上比GPT-4更好。”

wKgZomVx5m-ARkC3AAMUeHCh2m0257.jpg

生來(lái)就是全才

還好,從Gemini公布的演示視頻來(lái)看,它沒讓人失望。

“Gemini,從第一天起就是多模態(tài)大模型——跨越文本、圖像、視頻、音頻和代碼的無(wú)縫推理。”這是谷歌官網(wǎng)上,介紹Gemini的第一句話。

與ChatGPT通過(guò)升級(jí)迭代,逐步加上視覺、音頻等多模態(tài)能力,形成“合體金剛”的路徑不同,Gemini生來(lái)就是一位全才。它從第一天起就被設(shè)計(jì)成原生多模態(tài)結(jié)構(gòu),文本、圖像、音視頻能力從最開始就一起訓(xùn)練,從這一點(diǎn)上來(lái)看,Gemini的學(xué)習(xí)更像人類。這就意味著,Gemini可以無(wú)縫調(diào)動(dòng)多模態(tài)能力,抽象和理解、操作和組合不同類型的信息。

舉個(gè)例子,如果你同時(shí)上傳一張圖片給ChatGPT和Gemini,那么ChatGPT的處理將會(huì)是這樣的,先借助GPT-4V認(rèn)出來(lái)圖里是什么,然后轉(zhuǎn)成文本交給GPT去進(jìn)行語(yǔ)義理解,然后再作回答;而Gemini則可以基于圖像直接進(jìn)行理解并回應(yīng),不用進(jìn)行不同模型之間的調(diào)動(dòng)。因此,在實(shí)操過(guò)程中,Gemini可以減少信息的丟失,回應(yīng)也可以更加迅速和絲滑。

這從谷歌給到的演示視頻中便可以看出:

wKgaomVx5m-ATxr4AAaNqEAfdFk912.jpg

演示者一邊畫畫,Gemini就可以一邊辨認(rèn),并且用自然、流利的語(yǔ)音和演示者對(duì)話,在演示者拿出藍(lán)色的玩具鴨實(shí)物后,它還會(huì)幽默的回應(yīng):“看起來(lái)藍(lán)色的鴨子比我想象中更常見。”

很顯然,這樣的體驗(yàn)更接近漫威中的“賈維斯”——一個(gè)高級(jí)人工智能,能與人類自如地進(jìn)行交互。

而這樣的體驗(yàn),離不開Gemini的原生多模態(tài)架構(gòu)

Gemini VS GPT-4

除了擁有令人驚嘆的原生多模態(tài)能力,在性能上,Gemini也是相當(dāng)強(qiáng)悍

按照尺寸的不同,Gemini共有“中杯”、“大杯”還有“超大杯”三種,即Ultra、Pro和Nano三個(gè)不同的版本。它們?cè)谛阅芎瓦m配任務(wù)上的側(cè)重點(diǎn)各有不同。

wKgZomVx5nCAAlrsAAQdwAiMIp4903.jpg

·Gemini Ultra —規(guī)模最大且功能最強(qiáng)大的模型,適用于高度復(fù)雜的任務(wù),預(yù)計(jì)2024年初推出。

·Gemini Pro — 適用于各種任務(wù)的最佳模型,已經(jīng)被用在了谷歌聊天機(jī)器人Bard的升級(jí)版上。

·Gemini Nano — 可以在端端側(cè)設(shè)備上運(yùn)行的高效模型,已經(jīng)可以跑在谷歌Pixel 8 Pro手機(jī)上了。

根據(jù)谷歌給到的資料,從自然圖像、音頻和視頻理解,再到數(shù)學(xué)推理,Gemini Ultra的性能在32個(gè)常見的大語(yǔ)言模型(LLM)研究和開發(fā)的學(xué)術(shù)基準(zhǔn)測(cè)試中,拿下了30個(gè)SOTA

其中,它在通用、推理、數(shù)學(xué)和編程等大方向的成績(jī)?nèi)缦拢?/p>

wKgaomVx5nCAIyIhAANdlxvRA2o279.jpg

更讓人驚奇的是,在MMLU(大規(guī)模多任務(wù)語(yǔ)言理解)任務(wù)上,Gemini Ultra的得分達(dá)到了90.0%,超越了人類專家89.8%的成績(jī),首次達(dá)到了超越人類專家水平

wKgZomVx5nGASGIoAAD4e_iIynk849.jpg

MMLU測(cè)試包括數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)等57個(gè)學(xué)科,主要是用來(lái)考察大語(yǔ)言模型世界知識(shí)和解決問(wèn)題的能力,而在這些學(xué)科中的每一個(gè),Gemini都達(dá)到了甚至超過(guò)了行業(yè)專家的水準(zhǔn)。

在圖像基準(zhǔn)測(cè)試中,Gemini Ultra在不使用OCR(對(duì)象字符識(shí)別)來(lái)提取圖像文本進(jìn)行下一步處理的情況下,表現(xiàn)優(yōu)于GPT-4V

各種測(cè)試都表明,Gemini在多模態(tài)處理上表現(xiàn)出了強(qiáng)大的能力,并且在更復(fù)雜的推理上也有很大的潛力。

實(shí)際能力被質(zhì)疑

然而,在模型發(fā)布后不久,就有人在谷歌給到的60頁(yè)技術(shù)報(bào)告中發(fā)現(xiàn)了一些“小技巧”。

在MMLU測(cè)試中,Gemini的結(jié)果下面用灰色小字標(biāo)注著CoT@32,這表示,這個(gè)結(jié)果是使用了思維練提示技巧,嘗試了32次后選出來(lái)的最好結(jié)果,而對(duì)比GPT-4,則是無(wú)提示詞技巧,只嘗試了5次的結(jié)果,這測(cè)試結(jié)果,變量確實(shí)控制得不是很好。

wKgaomVx5nKACzbBAACicmHlaP0009.jpg

而且在顯示超越人類專家的示意圖里,比例尺上也有問(wèn)題,讓人以為超越了人類專家很多,但實(shí)際上并沒有相差多少。

HuggingFace的技術(shù)主管Philipp Schmind“修復(fù)”了這張圖,表示實(shí)際上應(yīng)該是這樣:

wKgZomVx5nKAaE0IAALmdPXcCwY271.jpg

并且,在谷歌給到的一篇解釋多模態(tài)交互過(guò)程的博客中,似乎表明了演示視頻里,Gemini實(shí)時(shí)互動(dòng)并不是真的,而是使用了靜態(tài)圖片,通過(guò)多段提示詞拼湊,最后再剪輯視頻,才達(dá)到了演示視頻里的效果。

wKgaomVx5nOANtJfAALLPAPOdSk302.jpg

不管谷歌是不是有意使用“障眼法”,Gemini的發(fā)布無(wú)疑給看似穩(wěn)定的AI界帶來(lái)了一些“動(dòng)蕩”。

并且,谷歌還宣布推出了迄今為止最強(qiáng)大、最高效、最可擴(kuò)展的TPU系統(tǒng):Cloud TPU v5p,Gemini正式在此基礎(chǔ)上訓(xùn)練的,這意味著谷歌將有能力拜托英偉達(dá)的算力限制,也算給了AI芯片市場(chǎng)帶來(lái)了一些變化。

大模型的多模態(tài)探索

隨著ChatGPT通過(guò)升級(jí)迭代,擁有了多模態(tài)能力,以及Gemini所展現(xiàn)出來(lái)的原生多模態(tài)能力,我們可以清晰地感受到,AI大模型浪潮已經(jīng)進(jìn)入了一個(gè)全新的階段,即從大語(yǔ)言模型轉(zhuǎn)向多模態(tài)模型。后者將更符合人類和世界交互最自然的方式:用眼睛看,用耳朵聽,用嘴巴說(shuō),用文字記錄與決策。

wKgaomVx5nSAT2CIAAmclVNR7hE455.jpg

多模態(tài)領(lǐng)域的技術(shù)探索,與互聯(lián)網(wǎng)媒介形式的變化也十分吻合,即從文字媒體,再到

音視頻媒體。如今,隨著抖音以及TikTok等短視頻平臺(tái)的興起,視頻已經(jīng)成為了我們這個(gè)信息時(shí)代的主流。

根據(jù)思科的年度互聯(lián)網(wǎng)報(bào)告,視頻已經(jīng)占據(jù)了互聯(lián)網(wǎng)超過(guò)80%的流量

很明顯,如果一個(gè)AI大模型不具備識(shí)別圖像以及音視頻的能力,那么其訓(xùn)練數(shù)據(jù)將會(huì)跟不上信息迭代的速度,其能力也將大打折扣。

現(xiàn)如今,在多模態(tài)模型道路的探索上,除了GPT,Gemini也加入了進(jìn)來(lái),不知道未來(lái)Meta的Llama還有馬斯克的Grok等等,是否也將加入角逐?


審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    7861
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34378

    瀏覽量

    275596
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    15957
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3039

    瀏覽量

    3853
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌AI霸主歸來(lái)!線反擊OpenAI,開啟安卓Gemini時(shí)代

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)北京時(shí)間5月21日,谷歌2025 Google I/O開發(fā)者大會(huì)正式召開,從其發(fā)布的新品來(lái)看,這可以說(shuō)是一場(chǎng)AI盛會(huì)。 在AI大模型方面,
    的頭像 發(fā)表于 05-22 09:01 ?4994次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>AI</b>霸主歸來(lái)!<b class='flag-5'>多</b>線反擊OpenAI,開啟安卓<b class='flag-5'>Gemini</b>時(shí)代

    Android Studio中的Gemini支持模態(tài)輸入功能

    Gemini 現(xiàn)已支持模態(tài)輸入,您可在提示中直接添加圖像!這為團(tuán)隊(duì)協(xié)作和界面開發(fā)工作流程解鎖了更多新的可能性。
    的頭像 發(fā)表于 05-14 16:44 ?345次閱讀

    OpenAI即將發(fā)布GPT-4.5與GPT-5

    GPT-4.5將在未來(lái)幾周內(nèi)率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術(shù)上進(jìn)行了諸多優(yōu)化和升級(jí),旨在為用戶提供更加精準(zhǔn)、高效的AI服務(wù)。 而在GPT-4
    的頭像 發(fā)表于 02-13 13:43 ?585次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以
    的頭像 發(fā)表于 02-07 15:07 ?646次閱讀

    谷歌Gemini AI目標(biāo)年底用戶達(dá)5億

    近日,谷歌CEO桑達(dá)爾·皮查伊在內(nèi)部會(huì)議上向員工透露,他對(duì)公司自主研發(fā)的Gemini AI技術(shù)充滿信心,認(rèn)為其能力已經(jīng)超越了當(dāng)前的競(jìng)爭(zhēng)對(duì)手。這一表態(tài)不僅彰顯了谷歌
    的頭像 發(fā)表于 01-18 11:30 ?866次閱讀

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語(yǔ)言模型,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)信息的高效檢索與深度挖掘,進(jìn)一步滿足了用戶對(duì)精準(zhǔn)、詳盡信息的
    的頭像 發(fā)表于 12-16 09:35 ?631次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時(shí)代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款AI模型不僅在性能上實(shí)現(xiàn)了顯著提升,更是在
    的頭像 發(fā)表于 12-12 14:22 ?757次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報(bào)告撰寫輔助。 Gemini 2.0通過(guò)高
    的頭像 發(fā)表于 12-12 10:13 ?591次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動(dòng)駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車業(yè)務(wù)引入了一種基于谷歌模態(tài)大語(yǔ)言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“端到端
    的頭像 發(fā)表于 10-31 16:55 ?1585次閱讀

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)?b class='flag-5'>谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而
    的頭像 發(fā)表于 10-29 11:02 ?1072次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來(lái)革命性的變化。在這場(chǎng)技術(shù)競(jìng)賽中,Llama 3和GPT-4作為兩個(gè)備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?1061次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

    超過(guò)GPT-4 Turbo,數(shù)學(xué)能力和代碼能力更是超過(guò)了Open AI最新一代GPT模型GPT-4o。此外,其效率相對(duì)提升50%。
    的頭像 發(fā)表于 10-24 11:39 ?940次閱讀

    谷歌借助Gemini AI系統(tǒng)深化對(duì)機(jī)器人的訓(xùn)練

    7月12日,國(guó)際科技界傳來(lái)新動(dòng)態(tài),谷歌正借助其先進(jìn)的Gemini AI系統(tǒng),深化對(duì)旗下機(jī)器人的訓(xùn)練,旨在顯著提升它們的導(dǎo)航能力和任務(wù)執(zhí)行能力。DeepMind機(jī)器人團(tuán)隊(duì)最新發(fā)布的研究論
    的頭像 發(fā)表于 07-12 16:29 ?880次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯(cuò)

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯(cuò)誤而設(shè)計(jì),其獨(dú)特的作用在于,讓人們能夠用GPT-4來(lái)查找GPT-4的錯(cuò)誤。
    的頭像 發(fā)表于 06-29 09:55 ?794次閱讀

    OpenAI API Key獲取:開發(fā)人員申請(qǐng)GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語(yǔ)言理解和生成能力,成為了許多開發(fā)者的首選工具。獲取GPT-4 API Key并將其應(yīng)用于項(xiàng)目,如開發(fā)一個(gè)ChatGPT聊天應(yīng)用,不僅是實(shí)踐人工智能技術(shù)
    的頭像 發(fā)表于 06-24 17:40 ?3692次閱讀
    OpenAI API Key獲取:開發(fā)人員申請(qǐng)<b class='flag-5'>GPT-4</b> API Key教程
    主站蜘蛛池模板: 色噜噜狠狠狠狠色综合久一 | 视频一区 日韩 | 免费日本黄色片 | 久热九九 | 四虎影院美女 | 色综合久久98天天综合 | 丁香八月婷婷 | 欧美精品videosex极品 | 日日噜夜夜噜 | jlzzjlzz亚洲日本| 五月综合激情视频在线观看 | 你懂得网址在线观看 | 人人插人人 | 韩国三级视频在线 | 美女视频黄a视频免费全过程 | 日本黄色高清视频 | 三级毛片在线 | 在线亚洲一区二区 | 国产肥女bbwbbw | 91九色porny蝌蚪| 国产高清一区二区三区四区 | 色视频在线观看完整免费版 | 狠狠操夜夜爽 | 狠狠色噜噜狠狠狠狠97 | 日本亚洲成人 | 欧美xxxx日本 | 中国一级特黄真人毛片 | 国产亚洲第一伦理第一区 | 劳拉淫欲护士bd字幕 | 国产伦精品一区二区三区在线观看 | 在线国产播放 | 亚洲乱亚洲乱妇41p 亚洲乱亚洲乱妇41p国产成人 | 人人看人人干 | 午夜影剧院 | 男女同床爽爽视频免费 | 亚洲国产精品嫩草影院 | 99久久精品免费看国产免费 | 天天艹天天 | 99热手机在线观看 | fc2 ppv sss级素人美女 | 欧美视频色 |