在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

第二屆大會回顧第12期 | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2024-02-25 17:58 ? 次閱讀

演講嘉賓 | 石 琳

回顧整理 | 廖 濤

排版校對 | 李萍萍

嘉賓介紹

開發者工具分論壇

石琳,北京航空航天大學軟件學院教授,CCF高級會員,2022年度中國科學院軟件研究所杰出青年科技人才。研究方向為智能軟件工程,包括代碼智能、智能需求工程、經驗軟件工程、開源軟件、可信AI等。曾在軟件工程、人工智能領域的高水平國際會議發表論文50余篇,三次獲得杰出論文獎;主持參與多項國家自然科學基金項目、國家重點研發項目等;擔任多個國際知名會議期刊審稿人。

視頻回顧

打開嗶哩嗶哩APP,觀看更清晰視頻

正文內容

隨著AI大模型能力的大幅提升,軟件開發已經逐步走向新智能化時代。然而,目前代碼大模型在可靠性、隱私和合規以及用戶意圖識別等方面仍存在一定局限性。如何基于交互式需求澄清方法,讓大模型更好地理解用戶意圖,并給出更準確的答案?北京航空航天大學教授石琳在第二屆OpenHarmony技術大會上進行了精彩分享。

72dbb404-cf89-11ee-b759-92fbcf53809c.png

2022年11月,OpenAI發布ChatGPT,利用GitHub數據與RLFH強化學習技術,在輔助編程取得進展;2023年1月,微軟Copilot平臺用戶超過1億,CEO表示Copilot很快就會替代程序員完成80%的代碼開發。在GitHub的報告中,使用Copilot的開發者的開發效率幾乎提升了一倍,一個用Copilot的初學者就能夠像專業程序員一樣,從零開始開發出最小可行產品程序。此外,清華大學推出的ChatDev項目,支持多個智能體分工合作,能夠根據用戶指令生成休閑小游戲、效率管理工具、繪畫板、數學計算器、網絡爬蟲等軟件。

通過前文可知,代碼大模型在軟件開發方面“一鳴驚人”,給開發者們帶來了極大的便利。但是,代碼大模型的快速發展同時也帶來了新的問題,如:

模型問題:可靠性、幻覺、更新、形式重于內容

數據問題:數據演化、質量問題、安全問題、隱私和合規

應用問題:用戶意圖不明確、復雜問題抽象和分解、項目上下文、領域專業知識、遺留系統維護

7302e79a-cf89-11ee-b759-92fbcf53809c.png

其中,用戶的意圖表述不明確是代碼大模型在實踐中遇到的巨大阻礙。開發者想寫出一個清晰明確且全面的Prompt并不容易。既然開發者寫的Prompt不清晰,有沒有辦法讓大模型幫開發者改寫?目前,業界已經有一些嘗試,例如GPT Engineer。GPT Engineer是一個基于需求描述自動生成項目源碼的開源項目,主打輕量,靈活生成項目源碼,可以在AI生成與人工生成之間進行切換。在接收到Prompt時,GPT Engineer不會直接生成代碼,而是先梳理有哪些事項需要用戶進一步澄清,然后讓用戶把需要澄清的事項輸入后,再進一步生成代碼。然而,GPT Engineer經常會問一些在Prompt中已經提供了答案的問題,對用戶造成困擾。

如何找到Prompt中“不清楚”的地方,從而進行精準提問?石琳教授所在團隊提出了ClarifyGPT工具。ClarifyGPT會先識別是否應該提問,再利用大模型生成問題。

ClarifyGPT的模塊1:基于測試結果的代碼多樣性評價模塊

如何判斷是否應該向用戶做Prompt澄清呢?這里我們從代碼大模型的輸出結果出發,提出一個基本假設:如果Prompt清晰,大模型生成的代碼應該行為一致;如果Prompt模糊,大模型生成的代碼可能五花八門。因此,ClarifyGPT會先通過種子輸入進行代碼多樣性測試,并基于測試結果判斷是否要做向用戶做Prompt的澄清。

具體而言,(1)先進行種子測試輸入初始化。構建prompt用于生成種子輸入,Prompt包含三部分:Instruction,Demonstrations,Query。將Prompt輸入LLM中生成一些測試輸入,并用它們初始化一個種子池;(2)再進行類型感知的測試輸入變異(采用了標準的基于變異的模糊流程)。在每次迭代時,從種子池中隨機選擇一個輸入;對于選定的輸入,我們檢查其數據類型并執行與其類型一致的單個變異操作以創建新的測試用例;完成一輪突變后,我們將新生成的輸入添加到種子池中,并重復上述過程,直到獲得所需的生成輸入數量。

7318fa44-cf89-11ee-b759-92fbcf53809c.png

ClarifyGPT的模塊2:基于推理的LLM問題生成模塊

在確定了需要向用戶做Prompt澄清后,應該問什么內容呢?為了解決這個以問題,ClarifyGPT會進一步分析代碼的細節差異,區分不一致的代碼,比較solution的不同點,再基于推理進行LLM問題生成。

具體而言,首先生成中間推理步驟(分析導致歧義的因素),然后基于這些中間推理步驟產生最終結果(有針對性的澄清問題)。此外,ClarifyGPT鼓勵LLM進行“超前規劃”,使他們能夠更好地利用他們的推理和理解能力來提高生成問題的質量。

73279cca-cf89-11ee-b759-92fbcf53809c.png

經過評測,ClarifyGPT將GPT-4在MBPP-sanitized上的表現(Pass@1)從70.96%提高到80.8%;將MBPP-ET的性能從51.52%提高到60.19%。相對改善平均為15.35%,優于基線。且增加Prompt中示例的數量會帶來ClarifyGPT性能提升。

ClarifyGPT是一個交互式代碼生成框架,會引導用戶先澄清意圖,再利用大模型幫助用戶生成代碼。后續,ClarifyGPT也會在其他生成類任務上進行進一步的研究和探索。

大模型加速了研發人員的工作效率,但同時也提出了新的挑戰。我們必須大膽嘗試LLM在改進軟件開發方面的潛力,但同時也要謹慎行事,不要忘記工程思維、嚴謹性和經驗驗證的基本原則。 【材料分享】 [1] 論文原文下載 http://arxiv.org/abs/2310.10996 [2] 開源原型工具 https://github.com/ClarifyGPT/ClarifyGPT(點擊閱讀原文可跳轉)

E N D

關注我們,獲取更多精彩。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34000

    瀏覽量

    275077
  • 代碼
    +關注

    關注

    30

    文章

    4886

    瀏覽量

    70203
  • OpenHarmony
    +關注

    關注

    26

    文章

    3814

    瀏覽量

    18063
  • 大模型
    +關注

    關注

    2

    文章

    3002

    瀏覽量

    3773
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    主線科技亮相第二屆中國具身智能大會

    此前,2025年3月29日至30日,由中國人工智能學會(以下簡稱CAAI)主辦的第二屆中國具身智能大會(CEAI 2025)在北京召開。
    的頭像 發表于 04-01 17:48 ?464次閱讀

    利爾達攜明星模組亮相第二屆移動物聯網大會(2024)

    //2024年12月20日,第二屆移動物聯網大會(2024)(以下簡稱“大會”)在安徽省合肥市舉行。作為一站5G應用解決方案供應商,利爾達
    的頭像 發表于 12-31 16:59 ?901次閱讀
    利爾達攜明星模組亮相<b class='flag-5'>第二屆</b>移動物聯網<b class='flag-5'>大會</b>(2024)

    翱捷科技亮相第二屆移動物聯網大會

    近日,由中國互聯網協會、中國信息通信研究院、中國通信標準化協會等聯合主辦的第二屆移動物聯網大會在安徽省合肥市召開,翱捷科技作為芯片企業代表應邀出席,并發表題為“翱翔芯海 加速推進5G輕量化普及”的主題演講,分享其在5G輕量化技術及產品創新的最新成果。
    的頭像 發表于 12-23 16:14 ?713次閱讀

    第二屆開放原子大賽首批賽項頒獎儀式在武漢舉辦

    近日,在2024開放原子開發者大會暨首屆開源技術學術大會開幕上,第二屆開放原子大賽首批賽項頒獎儀式成功舉辦。
    的頭像 發表于 12-23 11:24 ?493次閱讀

    第二屆開放原子大賽首批創新成果集結武漢

    12月20日至21日,武漢將迎來一場開源技術的盛會——2024開放原子開發者大會暨首屆開源技術學術大會。屆時,第二屆開放原子大賽的首批獲獎團隊將閃耀亮相,展示他們的創新成果。
    的頭像 發表于 12-18 15:22 ?533次閱讀

    谷東科技受邀參加2024第二屆元宇宙大會

    近日,2024第二屆元宇宙大會在海口開幕。本屆大會以“賦能應用場景,智見廣闊未來”為主題,匯聚了國內外的百余位頂尖專家、學者和行業領袖,就AI賦能產業健康發展和文體旅行業數字化融合等議題展開討論,深入交流。谷東科技受邀參加,并獲
    的頭像 發表于 12-16 15:16 ?618次閱讀

    美光科技第二屆鏈博會精彩回顧

    此前,11月26-30日,歷時5天,第二屆中國國際供應鏈促進博覽會在北京圓滿落幕,一起來回顧美光科技在本次鏈博會的精彩時刻吧。
    的頭像 發表于 12-03 13:35 ?425次閱讀

    智芯公司亮相2024第二屆中國電氣工程大會

    近日,由智芯公司和北京郵電大學協同組織的2024第二屆中國電氣工程大會“先進通信技術賦能新型電力系統”專題分會場在安徽合肥成功舉辦。
    的頭像 發表于 12-02 14:18 ?642次閱讀

    帝奧微第二屆代理商大會圓滿召開

    近日,“帝奧微2024年第二屆全國代理商大會” 在上海研發中心圓滿召開。本次大會聚焦“智領芯程,合作共贏”主題,齊聚 80+代理商代表,共同探討未來發展趨勢。
    的頭像 發表于 11-29 13:45 ?970次閱讀

    成都華微亮相第二屆腦機接口大會

    日前,第二屆腦機接口大會在武漢市成功舉辦。本次大會以“腦機互聯·共創未來”為主題,匯聚了來自全球各地的1500余位醫學科學、腦科學、腦機接口領域企業代表,共同探討腦機接口技術最新進展、應用前景以及產業發展趨勢。成都華微作為國內相
    的頭像 發表于 11-27 11:06 ?635次閱讀

    知存科技邀您相約第二屆集成芯片和芯粒大會

    2024年11月8日-10日,以“集成芯片:邁進大芯片時代”為主題的第二屆集成芯片和芯粒大會將在北京嘉里大酒店舉行。本次大會由基金委集成芯片前沿科學基礎重大研究計劃指導專家組指導,由中
    的頭像 發表于 11-06 15:25 ?854次閱讀

    第二屆openEuler生態大會圓滿結束

    近日,第二屆openEuler生態大會(中國·湖南)成功舉辦。大會以“根植openEuler共建開源生態”為主題,旨在響應國家開源產業發展戰略,推動建設以openEuler為根技術的開源操作系統在湖南創新發展,構建openEul
    的頭像 發表于 10-31 16:02 ?580次閱讀

    第二屆開放原子大賽火熱進行中

    第二屆開放原子大賽(簡稱“大賽”)是由開放原子開源基金會組織舉辦的開源技術領域專業賽事,聚焦解決“真問題”,重點覆蓋基礎軟件、工業軟件、人工智能大模型等領域。
    的頭像 發表于 10-31 10:04 ?620次閱讀

    第二屆開放原子大賽火熱開啟

    第二屆開放原子大賽(簡稱“大賽”)是由開放原子開源基金會組織舉辦的開源技術領域專業賽事,聚焦解決“真問題”,重點覆蓋基礎軟件、工業軟件、人工智能大模型等領域。
    的頭像 發表于 10-18 11:39 ?813次閱讀

    第二屆大會回顧24 | 面向OpenHarmony的軟件工程研究:機遇與挑戰

    隨著萬物智聯時代的到來,OpenHarmony作為一個開源的智能終端設備操作系統的框架和平臺,將會遇到哪些機遇和挑戰?北京航空航天大學教授、OpenHarmony技術俱樂部主任黎立在第二屆OpenHarmony技術大會上帶來了精
    的頭像 發表于 08-07 18:14 ?1443次閱讀
    <b class='flag-5'>第二屆</b><b class='flag-5'>大會</b><b class='flag-5'>回顧</b><b class='flag-5'>第</b>24<b class='flag-5'>期</b> | 面向OpenHarmony的軟件工程研究:機遇與挑戰
    主站蜘蛛池模板: 老色批午夜免费视频网站 | 午夜免费啪啪 | 色www亚洲国产张柏芝 | 国产色司机在线视频免费观看 | 亚洲性久久久影院 | 欧美三级 欧美一级 | 精品一区 二区三区免费毛片 | 康熙古代高h细节肉爽文全文 | 色免费在线观看 | 又粗又长又大又黄的日本视频 | 免费网站黄成人影院 | 国产女人伦码一区二区三区不卡 | 免费观看黄a一级视频 | 伊人久久大香线蕉综合网站 | 欧美线人一区二区三区 | 亚洲国产精品日韩专区avtube | 一本到在线观看视频不卡 | 日本黄色生活片 | 一级毛片美国一级j毛片不卡 | 欧美1024 | 手机精品视频在线观看免费 | 午夜影视网站 | 99热官网 | 色偷偷中文字幕 | 6080伦理久久亚洲精品 | 美女扒开尿口让男人桶 | 大量真实偷拍情侣视频野战 | 成熟妇女毛耸耸性视频 | 国产九色在线 | 色婷婷亚洲精品综合影院 | 性欧美护士18xxxxhd | 美女大黄三级视频在线观看 | 伦理片日本韩国电影三级在线观看 | 91网站网站网站在线 | 成人午夜啪啪免费网站 | 四虎影视国产精品 | 在线国产你懂的 | 欧美性性性性性ⅹxxbbbb | 日本人的色道www免费一区 | 亚洲三级成人 | 中文字幕精品一区二区2021年 |