在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPT-4o怎么搶了Midjourney的飯碗

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-04-14 16:26 ? 次閱讀
wKgZPGf8xpqAZ54cAAnUu5Z7UrQ901.jpg

2025年3月26日,OpenAI凌晨官宣,GPT-4o的原生多模態圖像生成功能正式上線。用戶不再需要登錄OpenAI的文生圖模型DALL-E,可以直接在ChatGPT應用里調用4o生成、修改圖片。

一夜之間,AI生成的吉卜力圖像在X等社交媒體上瘋傳,互聯網被一場溫柔的二次元畫風浪潮淹沒。人們上傳自拍照,輸入“吉卜力風格”,幾秒后,宮崎駿動畫中的唯美與夢幻便流淌在發絲衣角間,甚至連OpenAI創始人奧特曼也曬出自己的吉卜力頭像,為這場熱潮添了一把火。

wKgZO2f8xpuAYoeWAAez9qjDr8c129.jpg

不過,吉卜力的火爆只是其一,更關鍵的是,GPT-4o的繪圖能力出圈打破了文生圖領域的固有格局,以Midjourney等垂類應用為首的賽道第一次遭到了大模型的挑戰。

原來,人們用Midjourney生圖時,仍面臨著一個致命問題:隨機性太強,在提示詞過于復雜的時候,細節還原度就會顯著降低,而GPT-4o控圖能力的躍升,讓人類第一次感受到了與AI藝術家在多輪對話中精準改圖的魅力。

那么,一個人類印象里只會聊天的通用大模型GPT-4o,是如何趕超文生圖領域專業選手Midjourney的呢?

wKgZPGf8xpuAeKEQAAH061xOKH4649.jpg

實際上,類似Midjourney一樣的應用早在一年前就能生成吉卜力、賽博朋克、超現實等多種風格的圖像,甚至在畫面細膩感、解析力上略勝于GPT-4o。但GPT-4o的聰明之處在于,它沒有選擇正面硬剛其藝術領域的生圖質量,而是在應用門檻、修圖改圖、跨學科能力等細分賽道彎道超車。

一是自然語言對話能力的提升大大降低了使用門檻。傳統文生圖領域,用戶必須掌握一套復雜的結構化提示指令,比如風格、鏡頭、色彩、角度、背景、主體等,差之毫厘、謬以千里。而GPT-4o可以精準理解自然語言命令,只需要像跟好友一樣交流,張嘴畫圖成為現實。

自然語言就是大白話,日常生活中的口頭語。比如,如果你需要一張瀑布圖,只需要告訴GPT-4o,“幫我生成一幅清晨茂密森林里的彩虹瀑布”就可以了。但面對Midjourney就需要像下圖一般,用高度結構化的prompt指令告訴它:這個圖像的主體有什么,背景是什么顏色,仰角、俯角還是平視,風格是油畫、古典或者賽博朋克,需要細分到這種程度才可能達到理想效果,但就算分得這么細了,依然會有一些無關緊要的畫面元素跳出來畫蛇添足。

wKgZO2f8xpyAfHG5AAITB3qSHaM989.jpg

二是多模態能力帶來的圖生圖、圖改圖功能的上線。類似Midjourney一樣的應用只能發文字指令,不支持上傳一張圖片再做修改,或者說不支持AI生圖后,再調整圖像的分辨率、色彩、背景。如果成圖效果不理想,只能回到第一步重寫提示詞碰運氣,之前生成的圖像等同作廢。

GPT-4o的強悍就在于用戶可以隨便上傳一張圖片多次修改,可以是AI生成的,也可以是自己拍的。比如,你可以上傳一張全身照,把頭型換成大波浪,把衣服換成購物車里的裙子看上身效果。它支持在現有的圖片上去p圖去修改,相當于我們不用學習PS這種具有高壁壘性質的修圖技術。

更牛的是它還可以多輪對話,支持在原圖上不限次數地一直改,直到滿意為止。你可以一會兒改一個頭發,一會兒把背景換成沙漠,或者一會兒調整濾鏡風格。只要你想,它便滿足。

wKgZPGf8xpyAQuZWAAD5qLQhPdc858.jpg

圖源:小紅書@Mr.湯先森

除了交互門檻的降低和控圖能力的提升,GPT-4o的跨學科知識儲備也讓人驚艷。集成了大語言模型原有知識庫的GPT-4o相當于一個知天文、曉地理的畫家,不僅能解高數、做物理題,還原建筑草圖也不在話下。相比之下,Midjourney作為垂類應用始終局限在藝術領域里,為電影宣發、廣告等文娛產業服務。

GPT-4o有多牛?給一個題目就可以生成函數圖像,相當于一款畫圖指導版的拍照搜題應用。甚至于你給他一個沒有任何色彩的鉛筆畫建筑草圖,它都能生成出施工后的房屋實景,完全跨越了學科的邊界,是一個文理雙全的全能型選手。

wKgZO2f8xp2AAEBWAALEOtIijqw600.jpg

圖源:小紅書@云安

既然GPT-4o生圖改圖功能如此驚艷,我們就要發問了,在其火爆出圈背后,能夠為普通人帶來什么實際價值呢?

wKgZO2f8xp2AY_mQAAIAkKdrNC4833.jpg

就在其上線一周內,Midjourney CEO大衛·霍爾茲坐不住了,發文稱:GPT-4o只是花架子,Midjourney-v7下周上線。

wKgZPGf8xp6AavWTAALS3JyPCNk038.jpg

wKgZO2f8xp6AOt3AAAJjcTjPqgQ855.jpg

GPT-4o和Midjourney孰優孰劣,現在還難以定論。但能夠肯定的是,GPT-4o火出圈了,它沖出了設計師這個小眾的圈子,走入了大多數人的工作場景里,就算完全不知道AI生圖是什么,但一定也知道社交媒體上突然冒出一個能用嘴P圖的網絡工具。

那么,GPT-4o為什么這么火,給我們帶來的一個最實際的價值點在哪里?

首先,它真的做到了應用零門檻,用戶甚至不需要任何藝術功底和AI基礎,毫無基礎的普通人也能直接上手。用Midjourney,你必須知道一些基本的流派、色彩、光學、框架等繪畫知識以及/imagine(生成圖像)、--ar(圖像寬高比)等基礎英文提示指令。但用GPT-4o,你也可以不懂透視、框架、光線,也不需要知道什么是結構化提示詞,完全不用任何專業基礎,就像跟朋友對話一般交流就可以修圖。

wKgZPGf8xp6AEIY9AAVEKBk9Usw691.jpg

圖源:小紅書@Geek4Fun

除了使用門檻降低,模型產品的質量和效能也大幅提升。一是生圖更快,以前用Midjourney解析復雜指令需要1min左右,GPT-4o在20s內就可以還原。

第二,生圖和改圖的控制性提高了,GPT-4o能夠完全還原你給它的指令。比如同樣的一個指令“給我生成一個貓貓和狗狗在草地里玩耍的場景”,GPT-4o生成的就是一只貓和一只狗在草地上玩,沒有任何其他會突然冒出的元素,但Midjourney可能在草坪上多一個公園或建筑,不會完全按指令來。通俗地講,就是GPT-4o更能聽你的人話了,它就像你的電子仆人一樣,你讓他干嘛,他就干嘛,多余的事一件不做,該做的事也絕不少干,精確度更強了。

由此,GPT-4o打開全民賽道,進入到我們工作場景里。之前,普通用戶用Midjourney更多還是出于興趣,娛樂屬性強、工具屬性弱。生成的油畫、動漫等各種風格的圖像雖好看,但既不能提升工作效率,也不能賺錢,主要起到了一個造型上的作用。

wKgZO2f8xp-AKw8qAAK3axc5e8Q076.jpg

而GPT-4o的用嘴P圖讓AI繪圖能夠落地的行業增多,從娛樂化與藝術性走向了專業化與生產力,可以應用到電商、教育、建筑、設計等各行各業。比如你的小孩不會做題,以前需要請教課老師或者下載作業幫,輔導費用貴而作業幫的講解只有干巴巴的一段文字,令人費解。但是GPT-4o完全可以生成一張講解草稿圖,函數怎么生成的,答案怎么得來的,推導過程流暢自然。

再比如電商行業的宣傳海報,甲方需要你生成一個針對歐美市場的英語海報,其中設計元素和語言都需要做本地化潤色。之前的流程是對接設計師修改元素、去翻譯軟件潤色,再導入PS軟件修改,費時費力。但現在GPT-4o只需要一句話,“把這張海報改成歐美風,語言變成英語”,它就很快就能設計一張符合要求的海報,跨領域跨學科的集成能力非常強悍。

wKgZO2f8xp-ABZw3AAJRRcXacnI633.jpg

聊完GPT-4o的畫圖出圈,不如再聊聊,GPT-4o作為一種底層模型還有什么可挖掘的地方。

我們都知道,Midjourney是一個架構在模型上的應用,但GPT-4o本身就是一個模型,生圖是它的能力之一。2022年剛出道的ChatGPT只是一個能夠文字交流的對話助手,后來可以語音打電話,現在又能畫圖,一直不停在不同維度上迭代升級。

wKgZPGf8xqCACXenAAItBfa8-sU360.jpg

而此次GPT-4o能繪圖賽道突出重圍,真要感謝其原生多模態模型能力的大幅涌現。跟Midjourney不一樣,GPT-4o有更多技術路徑可走。現在文生圖領域應用普遍用的底層模型叫擴散模型diffusion model,原理是先生成一個大概的圖像,再消除噪點,就像雪中作畫、霧里看花,還原能力不強。而GPT-4o沿用文生圖自回歸模型,相當于把之前預測token的邏輯推理能力進一步延伸到了文生圖領域,通過逐幀繪制的方式,從已生成的像素推測下一個像素,本質是模仿人類畫畫。這意味著,與垂類應用不同,大模型可以從底層架構上選擇不同的技術路徑,而架構的升級通常會帶來性能的躍升,基于GPT-4o等原生模型的功能有更多的生長空間。

wKgZO2f8xqCANpCRAAA-XRvo8Rw830.jpg

第二個是,多模態融合會帶來跨領域的融會貫通,GPT-4o作為一種通用大模型,擁有整合文字、音頻、圖像等不同格式信息的能力,現階段已經可以打電話、生圖改圖了。而在未來,是不是可以直接生成音樂和視頻,也值得期待。實際上,GPT-4o本次上線的生圖功能就脫胎于OpenAI的文生圖模型DALL-E。或許,OpenAI旗下的文生視頻模型Sora也可能通過某種技術被整合到GPT模型里。屆時,在一個模型里交叉處理多種模態的信息將不再遙遠。

而多模態創新也進一步說明,模型走向多功能后,處理各種任務的能力越來越強,帶來的總AI使用成本降低。一個可以預見的趨勢是,大模型正在試圖成為一個一站式打包站點,將代碼、設計、音樂、數據處理等多種任務集成在一起。可能在未來某一天,類似于ChatGPT一樣的模型強悍到在任何領域都能做到前三,我們也不再需要下載畫圖的Midjourney、寫代碼的coze、做音樂的suno等垂類應用,直接下載類似于ChatGPT一樣的模型,就能解決所有的事情。這樣一來,手機的內存更大了,運行效率也快了。每個月還可以省下了垂類應用一百塊左右的會員定制費,性價比更高了。

簡言之,GPT-4o繪圖能力的出圈讓我們看到了底層大模型集成多應用的能力。而從這個能力衍生出的愿景是,我們未來可以在一個一站式的模型里面同時使用繪畫、音樂、代碼等多維能力。并且,它的使用門檻是非常低的,低到任何一個毫無技術基礎,甚至連AI都不了解的人都能用。

而這或許才是人類發明AI的終極目標——讓技術普惠到每一個角落。

wKgZO2f8xqGAMsfEAAH25UQCaj4498.jpg
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    33377

    瀏覽量

    273877
  • OpenAI
    +關注

    關注

    9

    文章

    1194

    瀏覽量

    7703
  • ChatGPT
    +關注

    關注

    29

    文章

    1584

    瀏覽量

    8620
  • 大模型
    +關注

    關注

    2

    文章

    2908

    瀏覽量

    3660
收藏 人收藏

    評論

    相關推薦

    OpenAI報告GPT-4o4o-mini模型性能下降,正緊急調查

    近日,全球領先的AI研究機構OpenAI發布了一份事故報告,引起了業界的廣泛關注。報告中指出,OpenAI目前正面臨GPT-4o4o-mini這兩款重要模型性能下降的問題。 據OpenAI方面透露
    的頭像 發表于 01-23 10:22 ?703次閱讀

    OpenAI:GPT-4o4o-mini模型性能下降,正展開調查

    近期,OpenAI發布了一份事故報告,指出其GPT-4o4o-mini模型遭遇了性能下降的問題。這一消息引起了業界的廣泛關注和討論。 據OpenAI官方透露,他們目前正在積極調查這一性能下降的原因
    的頭像 發表于 01-21 10:34 ?524次閱讀

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承諾 Plus 用戶享有更快的響應速度、優先使用新功能及最新模型,包括強大的 GPT-4o。本文將分享 2024 年 ChatGPT
    的頭像 發表于 10-29 18:17 ?1903次閱讀

    OpenAI提前解鎖GPT-4o語音模式,引領對話新紀元

    OpenAI近日宣布了一項令人振奮的消息:即日起,部分ChatGPT Plus用戶將率先體驗到GPT-4o的語音模式,這一創新功能標志著自然語言處理與人工智能交互技術邁出了重要一步。GPT-4o的高級語音模式以其卓越的實時對話能力和對用戶情緒的細膩感知,為用戶帶來了前所未
    的頭像 發表于 08-01 18:24 ?1382次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%, 在LMSYS排行榜上的聊天偏好測試中表現優于
    的頭像 發表于 07-21 10:20 ?1478次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4o</b> mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

    國內直聯使用ChatGPT 4.0 API Key使用和多模態GPT4o API調用開發教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的強大工具,可用于自然語言處理和多模態任務。在國內直聯使用這些服務需要一些配置和技巧。本文將詳細介紹GPT-4o模型以及如何獲取
    的頭像 發表于 06-08 00:33 ?6455次閱讀
    國內直聯使用ChatGPT 4.0 API Key使用和多模態<b class='flag-5'>GPT4o</b> API調用開發教程!

    開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

    ?目前,OpenAI新模型GPT-4oGPT-4 Turbo的價格如下: GPT-4o 對比 GPT-4 Turbo GPT-4o 擁有與
    的頭像 發表于 05-29 16:00 ?1.5w次閱讀
    開發者如何調用OpenAI的<b class='flag-5'>GPT-4o</b> API以及價格詳情指南

    GPT-4o更像“人”,AI“疾步”走向商業化應用

    5月14日,OpenAI發布了最新的多模態大模型GPT-4o,這一次的更新,更注重使用體驗了。現場展示的互動效果包括:更快速的響應對話交互,視頻識別環境情況,視頻指導做題,感知人的情緒(嘆息/笑聲
    的頭像 發表于 05-22 08:04 ?497次閱讀
    <b class='flag-5'>GPT-4o</b>更像“人”,AI“疾步”走向商業化應用

    OpenAI發布全新GPT-4o模型

    近日,OpenAI宣布推出全新的GPT-4o模型,標志著人工智能領域的一大技術飛躍。這款模型不僅具備強大的生成能力,還能精準理解用戶意圖,提供智能化的回答。
    的頭像 發表于 05-17 11:48 ?784次閱讀

    OpenAI正式推出GPT-4o模型,支持實時音頻、視覺和文本推理處理

    緊接著,OpenAI總裁暨聯合創始人Greg Brockman發布了詳細演示,展示了兩部搭載GPT-4o的設備如何實現語音或視頻交互。
    的頭像 發表于 05-15 10:26 ?706次閱讀

    OpenAI推出面向所有用戶的AI模型GPT-4o

    在周一的直播盛會上,OpenAI揭開了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機器人ChatGPT提供更強大、更經濟的支持。GPT-4o是此前備受矚目的GPT-4模型的升級版,自推出以來已滿一年有
    的頭像 發表于 05-15 09:23 ?531次閱讀

    GPT-4o深夜炸場!AI實時視頻通話絲滑如人類,Plus功能免費可用

    轉自:量子位|公眾號QbitAI不開玩笑,電影《她》真的來了。OpenAI最新旗艦大模型GPT-4o,不僅免費可用,能力更是橫跨聽、看、說,絲滑流暢毫無延遲,就像在打一個視頻電話。現場直播的效果更是
    的頭像 發表于 05-15 08:27 ?765次閱讀
    <b class='flag-5'>GPT-4o</b>深夜炸場!AI實時視頻通話絲滑如人類,Plus功能免費可用

    OpenAI全新GPT-4o能力炸場!速度快/成本低,能讀懂人類情緒

    電子發燒友網報道(文/李彎彎)當地時間5月13日,OpenAI舉行春季發布會,宣布將推出桌面版ChatGPT,并發布全新旗艦AI模型GPT-4o
    的頭像 發表于 05-15 00:15 ?8113次閱讀

    OpenAI發布GPT-4o模型,支持文本、圖像、音頻信息,速度提升一倍,價格不變

     此外,該模型還具備128K的上下文記憶能力,知識截止日期設定為2023年10月。微軟方面也宣布,已通過Azure OpenAI服務提供GPT-4o的預覽版。
    的頭像 發表于 05-14 17:12 ?1031次閱讀

    OpenAI發布GPT-4o模型,供全體用戶免費使用

    OpenAI首席技術官穆里·穆拉蒂(Muri Murati)指出,GPT-4o具備與GPT-4相同的智能水平,且在文本、圖像及語音處理方面有顯著進步。
    的頭像 發表于 05-14 11:17 ?709次閱讀
    主站蜘蛛池模板: 香蕉视频一级 | 四月婷婷七月婷婷综合 | 一级视频片 | 天天做天天做天天综合网 | 四虎国产精品永久在线 | 在厨房乱子伦在线观看 | 天天操狠狠操夜夜操 | 午夜网站免费版在线观看 | 天天躁日日2018躁狠狠躁 | 亚洲综合色一区 | 国产 麻豆 欧美亚洲综合久久 | 美女被猛男躁免费视频网站 | 爽好舒服快受不了了老师 | 国产手机在线国内精品 | 亚洲人成网站在线 | 四虎最新视频 | 最新版天堂资源中文官网 | 日韩一级视频免费观看 | 亚洲情a成黄在线观看动 | 全部在线播放免费毛片 | 免费看你懂的 | 一二三四日本视频社区 | 日本不卡视频一区二区 | 99伊人 | 2022国产情侣真实露脸在线 | 国产毛片久久国产 | 免费中国jlzzjlzz在线播放 | 色中色资源 | 免费国产不卡午夜福在线观看 | 成人a一级毛片免费看 | 182tv免费视视频线路一二三 | 五月婷婷深爱五月 | 香焦视频在线观看黄 | 天堂电影在线观看免费入口 | 美女视频永久黄网站在线观看 | 一级待一黄aaa大片在线还看 | 手机精品在线 | 婷婷综合在线观看丁香 | 不卡一区二区在线观看 | 亚洲jizzjizz妇女 | 成年网站在线播放 |