谷歌首席執(zhí)行官Sundar Pichai表示,這是人工智能新時(shí)代的開始:Gemini時(shí)代。Gemini是谷歌最新的大型語言模型,Pichai在6月份的I/O開發(fā)者大會(huì)上首次提出,現(xiàn)在向公眾發(fā)布。聽Pichai和谷歌DeepMind首席執(zhí)行官Demis Hassabis描述,這是人工智能模型的一個(gè)巨大飛躍,最終將影響谷歌幾乎所有的產(chǎn)品。Pichai說:“這一時(shí)刻的一個(gè)強(qiáng)大之處是,你可以研究一種底層技術(shù),并使其變得更好,并且它會(huì)立即衍生到我們的產(chǎn)品中。”
Gemini不僅僅是一個(gè)單一的人工智能模型。有一個(gè)簡(jiǎn)單版本叫Gemini Nano,旨在在安卓設(shè)備上離線運(yùn)行。有一個(gè)更強(qiáng)大的版本叫Gemini Pro,很快將為谷歌的許多人工智能服務(wù)提供動(dòng)力,從今天開始,它是Bard的支柱。還有一個(gè)功能更強(qiáng)大的模型叫Gemini Ultra,這是谷歌迄今為止創(chuàng)建的最強(qiáng)大的LLM,似乎主要是為數(shù)據(jù)中心和企業(yè)應(yīng)用程序設(shè)計(jì)的。
從12月13日開始,開發(fā)者和企業(yè)客戶將能夠通過谷歌Generative AI Studio或谷歌云中的Vertex AI訪問Gemini Pro。Gemini目前只提供英語版本,其他語言顯然很快就會(huì)出現(xiàn)。但Pichai表示,該模式最終將在全球范圍內(nèi)集成到谷歌的搜索引擎、廣告產(chǎn)品、Chrome瀏覽器等中。這是谷歌的未來,它馬上就要到來了。
OpenAI在一年多前推出了ChatGPT,該公司和產(chǎn)品立即成為人工智能領(lǐng)域最火爆的內(nèi)容。現(xiàn)在,谷歌——這家創(chuàng)造了當(dāng)前人工智能繁榮背后大部分基礎(chǔ)技術(shù)的公司,近十年來一直稱自己為“人工智能第一”組織,終于準(zhǔn)備好反擊了。
Hassabis表示:“我們已經(jīng)對(duì)系統(tǒng)進(jìn)行了非常徹底的并排分析和基準(zhǔn)測(cè)試。” 谷歌運(yùn)行了32個(gè)完善的基準(zhǔn)測(cè)試來比較這兩個(gè)模型,從廣泛的整體測(cè)試(如多任務(wù)語言理解基準(zhǔn)測(cè)試)到比較兩個(gè)模型生成Python代碼的能力的測(cè)試。Hassabis面帶微笑地說:“我認(rèn)為我們?cè)?2個(gè)基準(zhǔn)中有30個(gè)基本領(lǐng)先。”
在這些基準(zhǔn)(實(shí)際上大多非常接近)中,Gemini最明顯的優(yōu)勢(shì)來自于它理解視頻和音頻并與之互動(dòng)的能力。這在很大程度上是有意為之:多模式從一開始就是Gemini計(jì)劃的一部分。谷歌沒有像OpenAI創(chuàng)建DALL-E和Whisper那樣,為圖像和語音訓(xùn)練單獨(dú)的模型;它從一開始就建立了一個(gè)多感官模型。“我們一直對(duì)非常、非常通用的系統(tǒng)感興趣,”Hassabis說。他特別感興趣的是如何混合所有這些模式——從任何數(shù)量的輸入和感覺中收集盡可能多的數(shù)據(jù),然后給出盡可能多種類的響應(yīng)。
目前,Gemini最基本的模型是文本輸入和文本輸出,但像Gemini Ultra這樣功能更強(qiáng)大的模型可以處理圖像、視頻和音頻。Hassabis說:“這將變得更加普遍。還有一些東西,比如動(dòng)作和觸摸,更像機(jī)器人類型的東西。” 他說,隨著時(shí)間的推移,Gemini會(huì)有更多的感覺,在這個(gè)過程中變得更準(zhǔn)確、更接地氣。Hassabis表示,這些模型知道的越多,他們就會(huì)得到更好的結(jié)果。
不過,基準(zhǔn)測(cè)試只是基準(zhǔn)測(cè)試,最終,對(duì)Gemini能力的真正考驗(yàn)將來自那些想用它集思廣益、查找信息、編寫代碼等的日常用戶。谷歌似乎特別將編碼視為Gemini的殺手級(jí)應(yīng)用;它使用了一種名為AlphaCode 2的新代碼生成系統(tǒng),稱其性能優(yōu)于85%的編碼比賽參與者,高于原始AlphaCode的50%。但Pichai表示,用戶會(huì)注意到該模型所涉及的幾乎所有方面都有所改進(jìn)。
對(duì)谷歌來說同樣重要的是,Gemini顯然是一個(gè)效率高得多的模式。它是在谷歌自己的張量處理單元上訓(xùn)練的,運(yùn)行起來比谷歌以前的模型(如PaLM)更快、更便宜。除了新模型,谷歌還推出了其TPU系統(tǒng)的新版本TPU v5p,這是一種設(shè)計(jì)用于數(shù)據(jù)中心的計(jì)算系統(tǒng),用于訓(xùn)練和運(yùn)行大型模型。
與Pichai和Hassabis交談發(fā)現(xiàn),很明顯,他們認(rèn)為Gemini的發(fā)布既是一個(gè)更大項(xiàng)目的開始,也是其本身的一個(gè)階段性變化。Gemini是谷歌一直在等待的模式,也是它多年來一直在努力打造的模式,甚至可能是它在OpenAI和ChatGPT“接管”世界之前就應(yīng)該準(zhǔn)備好的模式。
谷歌在ChatGPT發(fā)布后宣布進(jìn)入“code red”,此后一直被認(rèn)為在迎頭趕上,似乎仍在努力堅(jiān)持其“大膽而負(fù)責(zé)任”的口號(hào)。Hassabis和Pichai都表示,他們不愿意為了跟上而走得太快,尤其是在我們離終極人工智能夢(mèng)想通用人工智能越來越近的時(shí)候。通用人工智能是一種自我塑造、比人類更聰明并準(zhǔn)備改變世界的人工智能。“隨著我們接近AGI,情況將有所不同,”Hassabis說,“這是一種積極的技術(shù),所以我認(rèn)為我們必須謹(jǐn)慎、謹(jǐn)慎但樂觀地對(duì)待它。”谷歌表示,它通過內(nèi)部和外部測(cè)試以及紅隊(duì)合作,努力確保Gemini的安全和責(zé)任。Pichai指出,確保數(shù)據(jù)安全性和可靠性對(duì)于企業(yè)優(yōu)先的產(chǎn)品尤為重要,而這正是最具生成性的人工智能賺錢的地方。
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
107963 -
Gemini
+關(guān)注
關(guān)注
0文章
67瀏覽量
7895 -
人工智能
+關(guān)注
關(guān)注
1806文章
48960瀏覽量
248587
原文標(biāo)題:谷歌推出Gemini 希望擊敗GPT-4
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
OpenAI即將發(fā)布GPT-4.5與GPT-5
谷歌 Gemini 2.0 Flash 系列 AI 模型上新
三星 Galaxy S25 系列與谷歌 Gemini 深度整合
谷歌Gemini AI目標(biāo)年底用戶達(dá)5億
谷歌CEO:Gemini AI技術(shù)超越競(jìng)品,目標(biāo)年底5億用戶
谷歌推出Gemini 2.0 Flash體驗(yàn)版
谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍
谷歌發(fā)布Gemini 2.0 AI模型
谷歌計(jì)劃12月發(fā)布Gemini 2.0模型
Llama 3 與 GPT-4 比較
科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo
Snapchat聊天機(jī)器人集成谷歌Gemini技術(shù)
谷歌Gemini 1.5 Flash模型升級(jí),AI聊天速度飆升50%
谷歌推出Gemini Live,開啟AI語音聊天新紀(jì)元
OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

評(píng)論