在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌聲稱Gemini超越GPT-4,你有何看法呢?

人工智能與大數(shù)據(jù)技術 ? 來源:CSDN ? 2023-12-14 09:54 ? 次閱讀

誰能想到,一夜之間,人們對于谷歌 Gemini 的看法竟發(fā)生了 180° 轉變。

昨天,谷歌在 X 上展示 Gemini 原生多模態(tài)能力的 6 分半鐘視頻下,幾乎是清一色的贊揚:

efe279ee-9a21-11ee-8b88-92fbcf53809c.png

eff0c878-9a21-11ee-8b88-92fbcf53809c.png

eff52e90-9a21-11ee-8b88-92fbcf53809c.png

而到了今天,Gemini 還是那個 Gemini,但網(wǎng)友已經不買賬了:

f003b7c6-9a21-11ee-8b88-92fbcf53809c.png

f00849f8-9a21-11ee-8b88-92fbcf53809c.png

發(fā)生了什么,才會讓人們的態(tài)度一夜轉變?原因在于那個 6 分半的 Gemini 演示視頻:它是假的,是經過剪輯的,甚至在被質疑后,谷歌還承認了!

1、Gemini 的視頻演示效果,是假的

相信看過 Gemini 演示視頻的人,多數(shù)都對它的“多模態(tài)能力”印象深刻。例如,Gemini 看到一只鴨子從草圖到填色的整個過程,可實時給出解釋和反饋,還能在換杯游戲中追蹤紙團、辨別各種手勢、重新排列行星草圖等——短短 6 分半的視頻,Gemini 給人的感覺是:仿佛可以實時觀察周圍世界并及時做出反應,還能與人類進行流暢的語音對話。

對于 Gemini 如此強大的能力,谷歌給出的解釋是:Gemini 是 AI 的新品種,即“原生多模態(tài)”。

“我們將 Gemini 設計為原生多模態(tài),從一開始就針對不同模式進行了預訓練。然后我們使用額外的多模態(tài)數(shù)據(jù)對其進行微調,以進一步完善其有效性,這有助于 Gemini 從頭開始無縫地理解和推理各種輸入,因此遠遠優(yōu)于現(xiàn)有的多模式模型。此外,Gemini 的多模態(tài)功能幾乎在每個領域都是最先進的。”

聽起來似乎有理有據(jù),于是當一眾網(wǎng)友都沉浸于 Gemini 的強大、好奇它能否真正超越 GPT-4 的時候,彭博社作家 Parmy Olsen 突然發(fā)出了一個“不太和諧”的聲音:Gemini 的視頻演示效果,是假的。

一石激起千層浪!好在 Parmy Olsen 并沒有吊人胃口,很干脆地將谷歌的作假手法和證據(jù)全部公開:Gemini 并不能像視頻中那樣實時語音回答——它看到的只是視頻片段中的靜態(tài)圖像,其語音也只是在讀出人類給它的文本提示,且響應時間比視頻中展示的要長。

2、背后的人工提示過程,全部省略

舉個例子,Gemini 演示視頻中有一段識別動態(tài)手勢的片段:通過觀察左邊不斷變化的手勢,Gemini 回答道,“我知道你在干嘛!你在玩石頭剪刀布!”

這段視頻乍看之下,你是不是以為可以實時向 Gemini 展示不同的東西,并與它交流?但事實并非如此:Gemini 僅支持文本交流,并不能進行語音對話。

根據(jù)谷歌公布的文檔內容顯示,這段視頻顯然是經過“加工”的:

(1)先給 Gemini 陸續(xù)展示三張單個手勢的圖片,問它分別看到了什么;

(2)再把三張手勢圖片一起發(fā)給 Gemini,問它這是在干什么,并提示是一個“游戲”;

(3)通過以上一步步的提示和引導,Gemini 最終給出了答案:你在玩石頭剪刀布。

針對以上步驟,一位谷歌發(fā)言人解釋道:“為了測試 Gemini 在各種挑戰(zhàn)中的能力,我們通過捕捉錄像來制作演示。然后我們使用錄像中的靜態(tài)圖像幀提示 Gemini,并通過文本進行提示。”

Parmy Olsen 將其簡單翻譯了一下:“谷歌拍下了那雙手做很多事情的畫面,然后一張一張地向 Gemini 展示了這些鏡頭的照片。所以根本沒有語音對話,而是跟 ChatGPT 和 Bard 一樣的文本交流。”

此外,谷歌發(fā)言人還補充稱,用戶的配音都是從實際提示中摘錄的真實內容,用于生成隨后的Gemini輸出結果——對此,Parmy Olsen 的翻譯是:“你在視頻中聽到的聲音,只是在朗讀文字提示。”

也就是說,谷歌所展示的 Gemini 演示視頻,是省略了所有引導提示、跳過了等待響應的時間、并用配音合成的最終結果。

3、都是真實的,只是“為了簡潔”剪輯視頻

當然,Gemini 可能也真的做到了在視頻中展示的所有事情,但這兩種表現(xiàn)形式完全不同:

以文字形式,通過人工提示分步驟直接展示其多模態(tài)效果,對于 Gemini 的能力沒有過多修飾;

以視頻形式,經過剪輯、省略其背后大量引導過程的視頻來呈現(xiàn),極大暗示了 Gemini 的實時高效。

由于 Parmy Olsen 的曝光,網(wǎng)友對于 Gemini 的態(tài)度瞬間改變,并發(fā)出了無數(shù)質疑。而對于被質疑造假的這個視頻,谷歌 DeepMind 研究副總裁 Oriol Vinyals 今天給出了回應:

“視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。該視頻展示了使用 Gemini 構建的多模態(tài)用戶體驗可能是什么樣子,我們制作該視頻是為了激發(fā)開發(fā)人員的靈感。”

換句話說,Oriol Vinyals 承認 Gemini 演示視頻經過了剪輯,原因是“為了簡潔”。不論其剪輯初衷是否真的只是為了“簡潔”,但不得不說:在谷歌沒明確說明視頻經過剪輯之前,多數(shù)人對于 Gemini 的速度、準確性以及與交互的基本模式,都產生了誤解。

如果在這個視頻開頭,谷歌就說“這是我們研究人員測試過的 Gemini 交互的理想化表現(xiàn)”,那網(wǎng)友就會有心理預期:哦,那這個視頻一半是現(xiàn)實,一半是理想化——但事實上,該視頻的開頭是,“本視頻重點介紹了我們與 Gemini 的一些有趣互動”,因此人們很難意識到這個視頻中 Gemini 的表現(xiàn)是經過“加工”的。

4、網(wǎng)友:“這就是虛假和誤導”

于是意料之中,Oriol Vinyals 的回應并沒有受到網(wǎng)友的理解,其 X 帖子下多是譴責谷歌虛假、夸大營銷:

“如果你想激勵開發(fā)者,那為什么不發(fā)布真實的內容呢?提示不可能既‘真實’又‘縮短’,這就是虛假和誤導。”

如今的 AI 初創(chuàng)公司,不就是像你們這樣夸張的演示來騙取資金的嗎?

“‘真實,縮短’,真的嗎?只是營銷罷了。”

另外值得一提的是,還有網(wǎng)友指出,谷歌Gemini 對比GPT-4 的測試基準也并不相同:“在MMLU測試中,Gemini下面有個灰色小字標CoT@32,即使用了思維鏈提示技巧、選取了32次中的最好結果,GSM8K 的性能也是用 Maj1@32 與 GPT-4 的 5-Shot CoT 進行對比的。”

f02f184e-9a21-11ee-8b88-92fbcf53809c.png

那么對于谷歌聲稱Gemini 超越GPT-4 的說法,你又有何看法呢?

本文轉自公眾號“CSDN”,ID:CSDNnews







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6196

    瀏覽量

    106020
  • GPT
    GPT
    +關注

    關注

    0

    文章

    360

    瀏覽量

    15508
  • ChatGPT
    +關注

    關注

    29

    文章

    1570

    瀏覽量

    8067

原文標題:Gemini 超越 GPT-4 靠作弊?谷歌承認:是的,演示視頻經過了剪輯

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    谷歌CEO:Gemini AI技術超越競品,目標年底5億用戶

    近日,谷歌CEO皮查伊近期向員工傳達了他對公司Gemini AI技術的信心。據(jù)悉,皮查伊認為Gemini的能力已經超越了當前的競爭對手。 皮查伊表示,他期望到今年年底,全球能有5億人
    的頭像 發(fā)表于 01-17 10:37 ?205次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術的飛速發(fā)展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來革命性的變化。在這場技術競賽中,Llama 3和GPT-4作為兩個備受矚目的模型,它們代表了當前AI領域的最前
    的頭像 發(fā)表于 10-27 14:17 ?546次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計,其獨特的作用在于,讓人們能夠用GPT-4來查找GPT-4的錯誤。
    的頭像 發(fā)表于 06-29 09:55 ?599次閱讀

    OpenAI API Key獲取:開發(fā)人員申請GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力,成為了許多開發(fā)者的首選工具。獲取GPT-4 API Key并將其應用于項目,如開發(fā)一個ChatGPT聊天應用,不僅是實踐人工智能技術
    的頭像 發(fā)表于 06-24 17:40 ?2549次閱讀
    OpenAI API Key獲取:開發(fā)人員申請<b class='flag-5'>GPT-4</b> API Key教程

    開發(fā)者如何調用OpenAI的GPT-4o API以及價格詳情指南

    ?目前,OpenAI新模型GPT-4o和GPT-4 Turbo的價格如下: GPT-4o 對比 GPT-4 Turbo GPT-4o 擁有與
    的頭像 發(fā)表于 05-29 16:00 ?1.3w次閱讀
    開發(fā)者如何調用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南

    GPT-4人工智能模型預測公司未來盈利勝過人類分析師

    據(jù)悉,本次研究中,研究人員僅向GPT-4提供了匿名的財務數(shù)據(jù),包括資產負債表和損益表,并要求其預測未來盈利增長。盡管未獲得其他信息,GPT-4仍能達到60%的準確度,遠超人類分析師的平均水平(53%-57%)。
    的頭像 發(fā)表于 05-27 16:41 ?665次閱讀

    阿里云正式發(fā)布通義千問2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發(fā)布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型之巔。
    的頭像 發(fā)表于 05-13 11:16 ?1070次閱讀

    阿里云發(fā)布通義千問2.5大模型,多項能力超越GPT-4

    阿里云隆重推出了通義千問 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環(huán)境中的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方面表現(xiàn)出色,超越
    的頭像 發(fā)表于 05-09 14:17 ?1042次閱讀

    訊飛星火大模型V3.5春季升級,多領域知識問答超越GPT-4 Turbo?

    劉慶峰指出,現(xiàn)如今,星火大模型在通用長文本處理能力方面已相當成熟,覆蓋長文檔信息抽取、知識問答、歸納總結、文本生成等諸多領域,整體表現(xiàn)已達GPT-4 Turbo今年4月最新版的97%水準;
    的頭像 發(fā)表于 04-26 14:26 ?1148次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無疑將使得Copilot功能再上新臺階。
    的頭像 發(fā)表于 03-13 13:42 ?783次閱讀

    Anthropic推出Claude 3大型語言模型,在認知任務性能上創(chuàng)新高

    據(jù)官方披露,Claude 3 旗艦 Opus 在大學生和研究生范疇的學術知識、復雜數(shù)理任務了解部分超越 OpenAI 的 GPT-4 以及谷歌Gemini 1.0 Ultra。
    的頭像 發(fā)表于 03-05 11:16 ?584次閱讀

    全球最強大模型易主,GPT-4超越

    近日,AI領域的領軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強版Claude 3 Opus。據(jù)該公司稱,Claude 3系列在推理、數(shù)學、編碼、多語言理解和視覺方面全面超越了包括GPT-4在內的所有大型模型,重新樹立了行業(yè)基準。
    的頭像 發(fā)表于 03-05 09:58 ?705次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標桿

    近日,AI領域的領軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關鍵領域展現(xiàn)出卓越性能,成功擊敗了此前被廣泛認為是全球最強AI模型的GPT-4,樹立了新的行業(yè)基準。
    的頭像 發(fā)表于 03-05 09:49 ?744次閱讀

    全球最強大模型易主:GPT-4超越,Claude 3系列嶄露頭角

    近日,人工智能領域迎來了一場革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語言能力等關鍵指標上展現(xiàn)出卓越性能,成功超越了此前被廣泛認為是全球最強AI模型的GPT-4,樹立了新的行業(yè)標桿。
    的頭像 發(fā)表于 03-05 09:42 ?712次閱讀

    谷歌推出Gemini for Workspace,提供AI輔助功能,定價信息頗受關注

    谷歌聲稱通過此篇博客文章詳盡地介紹了新的更新。最基礎的“Starter”套餐收費為每個月每人6美元,如果想使用“Gemini擴展”則需額外支付20美元(折合人民幣約為144元)。
    的頭像 發(fā)表于 02-22 10:38 ?769次閱讀
    主站蜘蛛池模板: 国产在线播放一区 | 日本一区二区免费看 | 天天鲁天天爽精品视频 | 福利视频自拍偷拍 | 免费福利影院 | a级毛片毛片免费很很综合 a级男女性高爱潮高清试 | 国产欧美视频在线 | 日本a级片在线播放 | 色综合色综合色综合 | 狠狠色综合网站久久久久久久 | 老色皮永久免费网站 | 在线观看二区三区午夜 | 久久午夜精品 | 2021国内精品久久久久影院 | 国产一级特黄的片子 | 奇米影视四色7777久久精品 | 日韩免费精品视频 | 色黄视频 | 夜夜爽天天操 | 色婷婷精品视频 | 天天成人综合网 | 日本黄大片在线观看 | 欧美性一级交视频 | 免费高清在线观看a网站 | 色五阁| 色综合亚洲天天综合网站 | 午夜日 | 色综合色综合色综合网址 | 午夜视频福利在线观看 | 视频一二三区 | 久久99久久精品国产99热 | 天天摸天天澡天天碰天天弄 | 亚洲一区二区色 | 婷婷综合久久 | 国产午夜三区视频在线 | 亚洲伊人电影 | 久久香蕉综合精品国产 | 国产牛牛 | 日本免费一区二区三区视频 | 久久久久国产一级毛片高清片 | 一级做a爱免费观看视频 |