在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌聲稱Gemini超越GPT-4,你有何看法呢?

人工智能與大數(shù)據(jù)技術(shù) ? 來源:CSDN ? 2023-12-14 09:54 ? 次閱讀

誰能想到,一夜之間,人們對于谷歌 Gemini 的看法竟發(fā)生了 180° 轉(zhuǎn)變。

昨天,谷歌在 X 上展示 Gemini 原生多模態(tài)能力的 6 分半鐘視頻下,幾乎是清一色的贊揚(yáng):

efe279ee-9a21-11ee-8b88-92fbcf53809c.png

eff0c878-9a21-11ee-8b88-92fbcf53809c.png

eff52e90-9a21-11ee-8b88-92fbcf53809c.png

而到了今天,Gemini 還是那個 Gemini,但網(wǎng)友已經(jīng)不買賬了:

f003b7c6-9a21-11ee-8b88-92fbcf53809c.png

f00849f8-9a21-11ee-8b88-92fbcf53809c.png

發(fā)生了什么,才會讓人們的態(tài)度一夜轉(zhuǎn)變?原因在于那個 6 分半的 Gemini 演示視頻:它是假的,是經(jīng)過剪輯的,甚至在被質(zhì)疑后,谷歌還承認(rèn)了!

1、Gemini 的視頻演示效果,是假的

相信看過 Gemini 演示視頻的人,多數(shù)都對它的“多模態(tài)能力”印象深刻。例如,Gemini 看到一只鴨子從草圖到填色的整個過程,可實時給出解釋和反饋,還能在換杯游戲中追蹤紙團(tuán)、辨別各種手勢、重新排列行星草圖等——短短 6 分半的視頻,Gemini 給人的感覺是:仿佛可以實時觀察周圍世界并及時做出反應(yīng),還能與人類進(jìn)行流暢的語音對話。

對于 Gemini 如此強(qiáng)大的能力,谷歌給出的解釋是:Gemini 是 AI 的新品種,即“原生多模態(tài)”。

“我們將 Gemini 設(shè)計為原生多模態(tài),從一開始就針對不同模式進(jìn)行了預(yù)訓(xùn)練。然后我們使用額外的多模態(tài)數(shù)據(jù)對其進(jìn)行微調(diào),以進(jìn)一步完善其有效性,這有助于 Gemini 從頭開始無縫地理解和推理各種輸入,因此遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有的多模式模型。此外,Gemini 的多模態(tài)功能幾乎在每個領(lǐng)域都是最先進(jìn)的?!?/p>

聽起來似乎有理有據(jù),于是當(dāng)一眾網(wǎng)友都沉浸于 Gemini 的強(qiáng)大、好奇它能否真正超越 GPT-4 的時候,彭博社作家 Parmy Olsen 突然發(fā)出了一個“不太和諧”的聲音:Gemini 的視頻演示效果,是假的。

一石激起千層浪!好在 Parmy Olsen 并沒有吊人胃口,很干脆地將谷歌的作假手法和證據(jù)全部公開:Gemini 并不能像視頻中那樣實時語音回答——它看到的只是視頻片段中的靜態(tài)圖像,其語音也只是在讀出人類給它的文本提示,且響應(yīng)時間比視頻中展示的要長。

2、背后的人工提示過程,全部省略

舉個例子,Gemini 演示視頻中有一段識別動態(tài)手勢的片段:通過觀察左邊不斷變化的手勢,Gemini 回答道,“我知道你在干嘛!你在玩石頭剪刀布!”

這段視頻乍看之下,你是不是以為可以實時向 Gemini 展示不同的東西,并與它交流?但事實并非如此:Gemini 僅支持文本交流,并不能進(jìn)行語音對話。

根據(jù)谷歌公布的文檔內(nèi)容顯示,這段視頻顯然是經(jīng)過“加工”的:

(1)先給 Gemini 陸續(xù)展示三張單個手勢的圖片,問它分別看到了什么;

(2)再把三張手勢圖片一起發(fā)給 Gemini,問它這是在干什么,并提示是一個“游戲”;

(3)通過以上一步步的提示和引導(dǎo),Gemini 最終給出了答案:你在玩石頭剪刀布。

針對以上步驟,一位谷歌發(fā)言人解釋道:“為了測試 Gemini 在各種挑戰(zhàn)中的能力,我們通過捕捉錄像來制作演示。然后我們使用錄像中的靜態(tài)圖像幀提示 Gemini,并通過文本進(jìn)行提示?!?/p>

Parmy Olsen 將其簡單翻譯了一下:“谷歌拍下了那雙手做很多事情的畫面,然后一張一張地向 Gemini 展示了這些鏡頭的照片。所以根本沒有語音對話,而是跟 ChatGPT 和 Bard 一樣的文本交流?!?/p>

此外,谷歌發(fā)言人還補(bǔ)充稱,用戶的配音都是從實際提示中摘錄的真實內(nèi)容,用于生成隨后的Gemini輸出結(jié)果——對此,Parmy Olsen 的翻譯是:“你在視頻中聽到的聲音,只是在朗讀文字提示。”

也就是說,谷歌所展示的 Gemini 演示視頻,是省略了所有引導(dǎo)提示、跳過了等待響應(yīng)的時間、并用配音合成的最終結(jié)果。

3、都是真實的,只是“為了簡潔”剪輯視頻

當(dāng)然,Gemini 可能也真的做到了在視頻中展示的所有事情,但這兩種表現(xiàn)形式完全不同:

以文字形式,通過人工提示分步驟直接展示其多模態(tài)效果,對于 Gemini 的能力沒有過多修飾;

以視頻形式,經(jīng)過剪輯、省略其背后大量引導(dǎo)過程的視頻來呈現(xiàn),極大暗示了 Gemini 的實時高效。

由于 Parmy Olsen 的曝光,網(wǎng)友對于 Gemini 的態(tài)度瞬間改變,并發(fā)出了無數(shù)質(zhì)疑。而對于被質(zhì)疑造假的這個視頻,谷歌 DeepMind 研究副總裁 Oriol Vinyals 今天給出了回應(yīng):

“視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔起見進(jìn)行了縮短。該視頻展示了使用 Gemini 構(gòu)建的多模態(tài)用戶體驗可能是什么樣子,我們制作該視頻是為了激發(fā)開發(fā)人員的靈感?!?/p>

換句話說,Oriol Vinyals 承認(rèn) Gemini 演示視頻經(jīng)過了剪輯,原因是“為了簡潔”。不論其剪輯初衷是否真的只是為了“簡潔”,但不得不說:在谷歌沒明確說明視頻經(jīng)過剪輯之前,多數(shù)人對于 Gemini 的速度、準(zhǔn)確性以及與交互的基本模式,都產(chǎn)生了誤解。

如果在這個視頻開頭,谷歌就說“這是我們研究人員測試過的 Gemini 交互的理想化表現(xiàn)”,那網(wǎng)友就會有心理預(yù)期:哦,那這個視頻一半是現(xiàn)實,一半是理想化——但事實上,該視頻的開頭是,“本視頻重點介紹了我們與 Gemini 的一些有趣互動”,因此人們很難意識到這個視頻中 Gemini 的表現(xiàn)是經(jīng)過“加工”的。

4、網(wǎng)友:“這就是虛假和誤導(dǎo)”

于是意料之中,Oriol Vinyals 的回應(yīng)并沒有受到網(wǎng)友的理解,其 X 帖子下多是譴責(zé)谷歌虛假、夸大營銷:

“如果你想激勵開發(fā)者,那為什么不發(fā)布真實的內(nèi)容呢?提示不可能既‘真實’又‘縮短’,這就是虛假和誤導(dǎo)?!?/p>

如今的 AI 初創(chuàng)公司,不就是像你們這樣夸張的演示來騙取資金的嗎?

“‘真實,縮短’,真的嗎?只是營銷罷了?!?/p>

另外值得一提的是,還有網(wǎng)友指出,谷歌Gemini 對比GPT-4 的測試基準(zhǔn)也并不相同:“在MMLU測試中,Gemini下面有個灰色小字標(biāo)CoT@32,即使用了思維鏈提示技巧、選取了32次中的最好結(jié)果,GSM8K 的性能也是用 Maj1@32 與 GPT-4 的 5-Shot CoT 進(jìn)行對比的?!?/p>

f02f184e-9a21-11ee-8b88-92fbcf53809c.png

那么對于谷歌聲稱Gemini 超越GPT-4 的說法,你又有何看法呢?

本文轉(zhuǎn)自公眾號“CSDN”,ID:CSDNnews







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6228

    瀏覽量

    107743
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    15979
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1589

    瀏覽量

    8860

原文標(biāo)題:Gemini 超越 GPT-4 靠作弊?谷歌承認(rèn):是的,演示視頻經(jīng)過了剪輯

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型
    的頭像 發(fā)表于 02-07 15:07 ?665次閱讀

    DeepSeek用戶量超越谷歌Gemini

    在聊天AI領(lǐng)域的競爭中,中國AI產(chǎn)品DeepSeek展現(xiàn)出了強(qiáng)勁的增長勢頭。據(jù)最新數(shù)據(jù)顯示,1月底,DeepSeek的用戶量已經(jīng)成功超越谷歌Gemini。 具體來看,1月31日這一天
    的頭像 發(fā)表于 02-07 14:59 ?516次閱讀

    如何在邊緣端獲得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

    本 OpenCompass 榜單上(綜合 8 個主流多模態(tài)評測基準(zhǔn))平均得分 65.2,以8B量級的大小在單圖理解方面超越GPT-4o mini、GPT-4V、Gemini 1.5
    的頭像 發(fā)表于 01-20 13:40 ?568次閱讀
    如何在邊緣端獲得<b class='flag-5'>GPT4</b>-V的能力:算力魔方+MiniCPM-V 2.6

    谷歌Gemini AI目標(biāo)年底用戶達(dá)5億

    近日,谷歌CEO桑達(dá)爾·皮查伊在內(nèi)部會議上向員工透露,他對公司自主研發(fā)的Gemini AI技術(shù)充滿信心,認(rèn)為其能力已經(jīng)超越了當(dāng)前的競爭對手。這一表態(tài)不僅彰顯了谷歌在AI領(lǐng)域的雄心壯志,
    的頭像 發(fā)表于 01-18 11:30 ?878次閱讀

    谷歌CEO:Gemini AI技術(shù)超越競品,目標(biāo)年底5億用戶

    近日,谷歌CEO皮查伊近期向員工傳達(dá)了他對公司Gemini AI技術(shù)的信心。據(jù)悉,皮查伊認(rèn)為Gemini的能力已經(jīng)超越了當(dāng)前的競爭對手。 皮查伊表示,他期望到今年年底,全球能有5億人
    的頭像 發(fā)表于 01-17 10:37 ?512次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍

    在智能體時代,谷歌再次引領(lǐng)技術(shù)潮流,正式發(fā)布了其最新力作——Gemini 2.0。這款A(yù)I模型不僅在性能上實現(xiàn)了顯著提升,更是在多模態(tài)表現(xiàn)和原生工具應(yīng)用方面展現(xiàn)了前所未有的強(qiáng)大功能。 Gemini
    的頭像 發(fā)表于 12-12 14:22 ?776次閱讀

    谷歌發(fā)布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復(fù)雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發(fā)表于 12-12 10:13 ?613次閱讀

    谷歌計劃12月發(fā)布Gemini 2.0模型

    近日,消息稱谷歌計劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因為谷歌在人工智能領(lǐng)域一直保持著領(lǐng)先地位,而
    的頭像 發(fā)表于 10-29 11:02 ?1093次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來革命性的變化。在這場技術(shù)競賽中,Llama 3和GPT-4作為兩個備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?1097次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

    超過GPT-4 Turbo,數(shù)學(xué)能力和代碼能力更是超過了Open AI最新一代GPT模型GPT-4o。此外,其效率相對提升50%。
    的頭像 發(fā)表于 10-24 11:39 ?974次閱讀

    Snapchat聊天機(jī)器人集成谷歌Gemini技術(shù)

    Snap與谷歌云的戰(zhàn)略合作再升級,為Snapchat平臺注入了新的智能活力。雙方宣布,Snapchat的My AI聊天機(jī)器人將深度集成谷歌Gemini技術(shù),這一創(chuàng)新舉措標(biāo)志著Snapchat在人工智能應(yīng)用領(lǐng)域的又一次飛躍。
    的頭像 發(fā)表于 09-25 14:51 ?539次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀(jì)元

    在萬眾矚目的Pixel 9系列手機(jī)發(fā)布會上,谷歌震撼宣布了一項創(chuàng)新服務(wù)——Gemini Live,該服務(wù)自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉措標(biāo)志著
    的頭像 發(fā)表于 08-15 17:29 ?1007次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%, 在LMSYS排行榜上的聊天偏好測試中表現(xiàn)優(yōu)于
    的頭像 發(fā)表于 07-21 10:20 ?1625次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4</b>o mini 取代<b class='flag-5'>GPT</b> 3.5 性能<b class='flag-5'>超越</b><b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設(shè)計,其獨(dú)特的作用在于,讓人們能夠用GPT-4來查找GPT-4的錯誤。
    的頭像 發(fā)表于 06-29 09:55 ?817次閱讀

    OpenAI API Key獲?。洪_發(fā)人員申請GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力,成為了許多開發(fā)者的首選工具。獲取GPT-4 API Key并將其應(yīng)用于項目,如開發(fā)一個ChatGPT聊天應(yīng)用,不僅是實踐人工智能技術(shù)
    的頭像 發(fā)表于 06-24 17:40 ?3740次閱讀
    OpenAI API Key獲?。洪_發(fā)人員申請<b class='flag-5'>GPT-4</b> API Key教程
    主站蜘蛛池模板: 久久婷婷久久一区二区三区 | 免费看日本大片免费 | 在线免费午夜视频 | 亚洲第一区精品日韩在线播放 | 午夜久久久久久亚洲国产精品 | 亚洲天堂免费看 | 国产色网 | 456成人 | 欧美日穴 | 中国高清性色生活片 | 日本三级在线播放线观看2021 | 91大神在线精品视频一区 | 在线看欧美成人中文字幕视频 | 人人干国产 | 日本级毛片免费观看 | 午夜欧美日韩 | 午夜高清在线 | 美女视频久久 | 国产美女一区二区三区 | 日本免费不卡一区 | 91大神精品在线观看 | 久久手机看片你懂的日韩1024 | 中国xxxxx高清免费看视频 | h视频在线免费 | 美女把尿口扒开让男人桶出水 | 久草视频在线免费看 | 久久亚洲精品国产亚洲老地址 | 韩国床戏合集三小时hd中字 | 好紧好爽太大了h快穿 | 日本拍拍拍 | 黄色大片日本 | 黄网站在线观看永久免费 | 久久精品国产大片免费观看 | 天天碰免费视频 | 四虎成人在线视频 | 成人伊人青草久久综合网 | 六月丁香婷婷综合 | 俄罗斯久久 | 黄色永久免费 | 嫩草影院入口一二三免费 | 久久久久免费 |