在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPT4做Leetcode的能力

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-04-28 15:27 ? 次閱讀

雖然一次周賽的幾個題目說明不了太多問題,比如這個周賽的Hard題目就是板子題,算不上Hard,也許把第三題和第四題的順序換一下比較合適。但是,GPT4的表現已經嚴重超出了我的預期。對于這次周賽的四個題目,GPT4的表現如下:題目1: 錯了一次,簡單提示后修正了錯誤,2A了。題目2: 1A。題目3: 無法通過提示的方法讓GPT4做對,WA。題目4: 1A。不得不說,GPT4在模擬,模板題方面已經具備了不錯的理解和處理能力,感覺在更強大的數據和更大模型的加持下以后大語言模型的做題能力能趕上一大半人類。| 從提升算法能力的角度來說,我不建議任何讀者使用GPT4來做Leetcode。

0x0. 前言

GPT4論文(https://cdn.openai.com/papers/gpt-4.pdf)的第4節展示了GPT4的各種能力,在表格的最后三行展示了GPT4做Leetcode的能力,我比較感興趣,所以本文打算來探索一下這種能力。看一下GPT4配合一個只發出prompt的人的表現如何。

4c3d0b6c-e593-11ed-ab56-dac502259ad0.png

為了公平起見,我這里選取了LeetCode第 102 場雙周賽(https://leetcode.cn/contest/biweekly-contest-102/)也就是2023年4月15日的這一場。我打算用GPT4來嘗試解開這場周賽的4道題目,但是不一定能都解開,只是測試一下GPT4的寫算法的能力。

我將全程只指揮GPT4寫代碼來解題,我自己不做任何的Coding工作。

先建立一個GPT4的新對話:

4c4b8c64-e593-11ed-ab56-dac502259ad0.png

在這里插入圖片描述

0x1. 第一題

第一題是個Easy的題目,描述如下:

4c5276fa-e593-11ed-ab56-dac502259ad0.png

接下來,我們先把題面輸入到GPT4。

4c5c017a-e593-11ed-ab56-dac502259ad0.png

4c653dd0-e593-11ed-ab56-dac502259ad0.png

4c6da7ae-e593-11ed-ab56-dac502259ad0.png



GPT4給了我們一個回復,感覺挺對的,但是這種格式不能讓Leetcode直接通過,我們再讓GPT4更新一下格式:

4c79d510-e593-11ed-ab56-dac502259ad0.png

4c82a1fe-e593-11ed-ab56-dac502259ad0.png

接下來就是緊張的時刻,我們把這個類的代碼提交給Leetcode。

4c89800a-e593-11ed-ab56-dac502259ad0.png

結果錯誤,Leetcode返回了錯誤的例子。我們把這個錯誤的例子再返回給GPT4讓它自己debug。

4c93b7d2-e593-11ed-ab56-dac502259ad0.png

我們把它修正后的代碼提交給Leetcode。

4c9e6628-e593-11ed-ab56-dac502259ad0.png

現在GPT4順利通過了第一道題目。

0x2. 第二題

4ca9fae2-e593-11ed-ab56-dac502259ad0.png

在這里插入圖片描述

我們問一下GPT4

4cb18d0c-e593-11ed-ab56-dac502259ad0.png

4cbfb45e-e593-11ed-ab56-dac502259ad0.png

4cccf588-e593-11ed-ab56-dac502259ad0.png

我們提交給Leetcode試試。

4cd3e7c6-e593-11ed-ab56-dac502259ad0.png

直接通過,GPT4真有點強。

0x3. 第三題

4cde24a2-e593-11ed-ab56-dac502259ad0.png

問問GPT4:

4ce8c628-e593-11ed-ab56-dac502259ad0.png

4cefd8a0-e593-11ed-ab56-dac502259ad0.png

4cf592d6-e593-11ed-ab56-dac502259ad0.png

4cfd17d6-e593-11ed-ab56-dac502259ad0.png

這個問題感覺還是比較麻煩的,GPT4給出的方案感覺一眼假,不過我們不妨運行一下它給的代碼。

4d05a6d0-e593-11ed-ab56-dac502259ad0.png

我們發現編譯就報錯了。我們返回這個結果給GPT4:

4d0c43e6-e593-11ed-ab56-dac502259ad0.png

4d154662-e593-11ed-ab56-dac502259ad0.png

現在確實可以編譯了,但我們發現這個程序連樣例都無法通過。顯然,GPT4根本沒有理解這道題目的意思,結果傾向于是“胡說八道”。再加強一些提示:

4d1fe52c-e593-11ed-ab56-dac502259ad0.png

4d28223c-e593-11ed-ab56-dac502259ad0.png

4d33024c-e593-11ed-ab56-dac502259ad0.png

最后GPT4輸出的代碼仍然無法通過樣例。這道題,GPT4應該是無能為力了。

從這道題目,我們可以看到GPT4的局限性,那就是對于這種思維性的題目,GPT4很難理解這道題目暗含的意思,設計的算法也是錯誤的。

題解可以參考:https://leetcode.cn/problems/cousins-in-binary-tree-ii/solution/bfssuan-liang-ci-pythonjavacgo-by-endles-b72a/

0x4. 第4題

接下來我們看一下第4題,這個題是比較模板的題,我們看一下GPT4能否解開。

4d3dcc9a-e593-11ed-ab56-dac502259ad0.png

4d4be8ac-e593-11ed-ab56-dac502259ad0.png

4d5668cc-e593-11ed-ab56-dac502259ad0.png

4d624a02-e593-11ed-ab56-dac502259ad0.png

在這里插入圖片描述

我們來看一下GPT4給出的答案能否通過樣例。

4d6cab00-e593-11ed-ab56-dac502259ad0.png

是可以通過給出的樣例的。我們提交試試。

4d77415a-e593-11ed-ab56-dac502259ad0.png

這道題GPT4的完整代碼實現如下:

classGraph{
public:
Graph(intn,vector<vector<int>>&edges){
this->n=n;
for(constauto&edge:edges){
adjList[edge[0]].push_back({edge[1],edge[2]});
}
}

voidaddEdge(vector<int>edge){
adjList[edge[0]].push_back({edge[1],edge[2]});
}

intshortestPath(intnode1,intnode2){
vector<int>dist(n,INT_MAX);
dist[node1]=0;

priority_queueint,int>,vectorint,int>>,greaterint,int>>>pq;
pq.push({0,node1});

while(!pq.empty()){
intcurrNode=pq.top().second;
intcurrDist=pq.top().first;
pq.pop();

if(currNode==node2)returncurrDist;

if(currDist>dist[currNode])continue;

for(constauto&neighbor:adjList[currNode]){
intnextNode=neighbor.first;
intedgeCost=neighbor.second;

if(currDist+edgeCostreturn-1;
}

private:
intn;
unordered_map<int,vectorint,int>>>adjList;
};

雖然這道題很難說是Hrad的難度,但1A真的太嚇人了。。。

0x5. 總結+預測

雖然一次周賽的幾個題目說明不了太多問題,比如這個周賽的Hard題目就是板子題,算不上Hard,也許把第三題和第四題的順序換一下比較合適。但是,GPT4的表現已經嚴重超出了我的預期。

對于這次周賽的四個題目,GPT4的表現如下:

題目1: 錯了一次,簡單提示后修正了錯誤,2A了。題目2: 1A題目3: 無法通過提示的方法讓GPT4做對,WA。題目4: 1A。

不得不說,GPT4在模擬,模板題方面已經具備了不錯的理解和處理能力,感覺在更強大的數據和更大模型的加持下以后大語言模型的做題能力能趕上一大半人類。| 從提升算法能力的角度來說,我不建議任何讀者使用GPT4來做Leetcode。

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93366
  • 代碼
    +關注

    關注

    30

    文章

    4828

    瀏覽量

    69064
  • GPT
    GPT
    +關注

    關注

    0

    文章

    360

    瀏覽量

    15508

原文標題:0x5. 總結+預測

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPT4再升級,更強大更便宜!不懂代碼也能生成應用,享受分成

    GPT-4 Turbo以及ChatGPT的一系列升級內容。 ? OpenAI自去年底推出ChatGPT之后享譽全球,近一年來不斷推進技術和應用創新。該公司強調,其今年3月發布的GPT-4至今仍是世界上能力
    的頭像 發表于 11-14 00:23 ?2047次閱讀

    OpenAI全新GPT-4o能力炸場!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為GPT-4
    的頭像 發表于 05-15 00:15 ?7912次閱讀

    淺談ChatGPT的最新“升級版本”——GPT4模型

    瀏覽OpenAI發布的演示視頻發現,GPT4的語言理解和生成能力均超過了ChatGPT,可以解答ChatGPT無法
    的頭像 發表于 03-22 22:26 ?3196次閱讀

    GPT4搞電機?

    GPT4可以搞電機嗎?
    的頭像 發表于 04-06 10:08 ?1463次閱讀
    用<b class='flag-5'>GPT4</b>搞電機?

    微軟GPT-4搜索引擎重大升級 新Bing開放AI能力

    微軟GPT-4搜索引擎重大升級 新Bing開放AI能力 微軟和OpenAI合作將人工智能技術應用于必應搜索帶來了更多不一樣的搜索體驗。 此前Open AI發布了新一代大型人工智能語言訓練模型
    的頭像 發表于 05-05 17:15 ?2693次閱讀

    如何利用LLM多模態任務?

    大型語言模型LLM(Large Language Model)具有很強的通用知識理解以及較強的邏輯推理能力,但其只能處理文本數據。雖然已經發布的GPT4具備圖片理解能力,但目前還未開放多模態輸入接口并且不會透露任何模型上技術細節
    的頭像 發表于 05-11 17:09 ?958次閱讀
    如何利用LLM<b class='flag-5'>做</b>多模態任務?

    GPT-4創造力竟全面碾壓人類!最新創造力測試GPT4排名前1%

    來源:新智元最近,一項有關GPT-4的創造力思維測試火了。來自蒙大拿大學和UMWestern大學的研究團隊發現,GPT-4在Torrance創造性思維測試(TTCT)中的得分直接排在了前1%。不管是
    的頭像 發表于 06-26 10:06 ?599次閱讀
    <b class='flag-5'>GPT-4</b>創造力竟全面碾壓人類!最新創造力測試<b class='flag-5'>GPT4</b>排名前1%

    你考慮用GPT4搞電機嗎?

    最近的GPT4有多火這里不需要贅述了。微軟,蘋果,baidu等各巨頭紛紛跟進。這個賽道最近是各種資本涌入,猶如PC互聯網轉型到移動互聯網時的爆發。
    發表于 07-05 09:16 ?364次閱讀
    你考慮用<b class='flag-5'>GPT4</b>搞電機嗎?

    gpt-4怎么用 英特爾Gaudi2加速卡GPT-4詳細參數

    介紹GPT-4 詳細參數及英特爾發布 Gaudi2 加速器相關內容,對大模型及 GPU 生態進行探討和展望。英特爾發布高性價比Gaudi2加速卡GPT4詳細參數分析。
    發表于 07-21 10:50 ?928次閱讀
    <b class='flag-5'>gpt-4</b>怎么用 英特爾Gaudi2加速卡<b class='flag-5'>GPT-4</b>詳細參數

    chatGPT和GPT4有什么區別

    chatGPT和GPT4有什么區別 GPT(Generative Pre-trained Transformer)系列模型由OpenAI公司開發,是一組用于自然語言處理(NLP)任務的人工智能模型
    的頭像 發表于 08-09 15:18 ?3267次閱讀

    GPT-4沒有推理能力嗎?

    今年三月,OpenAI 重磅發布了 GPT-4 大模型,帶來了比 ChatGPT 背后 GPT-3.5 更強的推理、計算、邏輯能力,也引發了全民使用的熱潮。在各行各領域研究人員、開發者、設計師的使用過程中,「
    的頭像 發表于 08-11 14:20 ?963次閱讀
    <b class='flag-5'>GPT-4</b>沒有推理<b class='flag-5'>能力</b>嗎?

    ChatGPT Plus怎么支付 GPT4得訂閱嗎?

    自去年年底 OpenAI 轉型發布 ChatGPT 以來,生成式 AI 成為許多硅谷投資者關注的焦點。該聊天機器人使用從互聯網和其他地方抓取的大量數據來對人類提示產生預測響應。GPT-4 的許多方面
    的頭像 發表于 10-10 12:16 ?1848次閱讀
    ChatGPT Plus怎么支付 <b class='flag-5'>GPT4</b>得訂閱嗎?

    股價久違飆漲,商湯要用自己的Scaling law挑戰GPT4

    前一天的“2024年商湯技術交流日”上,商湯發布了對標GPT4-Turbo的大模型日日新大模型SenseNova5.0,追趕GPT4可能是當下中國大模型行業的集體目
    的頭像 發表于 05-08 08:05 ?276次閱讀
    股價久違飆漲,商湯要用自己的Scaling law挑戰<b class='flag-5'>GPT4</b>

    開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

    ,高達每分鐘1000萬字符。 速度 :GPT-4o的速度是GPT-4 Turbo的兩倍。 視覺能力 :在視覺能力相關的評估中,GPT-4o表
    的頭像 發表于 05-29 16:00 ?1.3w次閱讀
    開發者如何調用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南

    科大訊飛發布訊飛星火4.0 Turbo:七大能力GPT-4 Turbo

    超過GPT-4 Turbo,數學能力和代碼能力更是超過了Open AI最新一代GPT模型GPT-4o。此外,其效率相對提升50%。
    的頭像 發表于 10-24 11:39 ?559次閱讀
    主站蜘蛛池模板: а中文在线天堂 | 爱爱永久免费视频网站 | 九九热精品视频在线播放 | 拍拍拍无挡视频免费全程1000 | 国产视频一二区 | 美女扒开尿口让男生添 漫画 | 亚洲天堂一区二区三区 | 成年视频xxxxx免费播放软件 | dyav午夜片 | 91福利网站 | 国产18到20岁美女毛片 | 高清性欧美xxx | 成人小视频在线 | 91在线免费看 | 一级特一级特色生活片 | 亚洲国产成人久久笫一页 | 亚洲成成品网站有线 | 国产精品午夜久久久久久99热 | 四虎影视永久在线 yin56xyz | 欧美黄色片在线播放 | 国产亚洲婷婷香蕉久久精品 | 四虎新网址| 亚洲系列_1页_mmyy11 | 酒色激情网| 国产午夜一区二区在线观看 | 久久男人网 | 日本a级影院| 免费又爽又黄禁片视频在线播放 | 不卡中文字幕在线 | 久久99热精品免费观看k影院 | 国产手机在线国内精品 | 久久天天躁狠狠躁夜夜2020一 | 亚洲色图21p | 一级视频在线观看免费 | 黑人边吃奶边扎下面激情视频 | 欧美一级欧美一级高清 | 在线黄色网 | 性欧美暴力猛交69hd | 一级a爱片久久毛片 | 日韩精品网址 | 国产黄mmd在线观看免费 |