在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦于用LLMs模擬國際沖突的研究

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 2023-12-04 13:51 ? 次閱讀

作者:Winnie

戰(zhàn)爭與和平一直是塑造人類歷史的重要元素。最近的一項(xiàng)研究聚焦于用LLMs模擬國際沖突,特別是第一次世界大戰(zhàn)、第二次世界大戰(zhàn)以及中國古代的戰(zhàn)國時(shí)期。通過這些歷史事件的詳細(xì)模擬,研究團(tuán)隊(duì)探索了國際關(guān)系動態(tài)和觸發(fā)戰(zhàn)爭的關(guān)鍵因素。具體來說,這項(xiàng)研究關(guān)注于三個(gè)主要問題:首先是探索基于LLM的MAS在模擬戰(zhàn)略規(guī)劃和決策制定過程中的有效性;其次是識別那些在歷史上觸發(fā)戰(zhàn)爭的關(guān)鍵因素;最后是評估歷史事件的不可避免性,特別是那些導(dǎo)致戰(zhàn)爭或和平的條件。

讓我們一起來看看LLM在國際沖突中是怎么表現(xiàn)的吧!

國家代理

在這篇研究中,一個(gè)關(guān)鍵組成部分是國家代理人。這些代理人在模擬國際沖突中扮演至關(guān)重要的角色。每個(gè)國家代理都由其對應(yīng)的國家檔案定義。在每一輪中,代理根據(jù)行動空間中可用的行動,通過精心構(gòu)建的提示來對當(dāng)前情況做出反應(yīng)。引導(dǎo)提示將代理引導(dǎo)通過復(fù)雜的國際關(guān)系情況,確保他們的行動和決策經(jīng)過深思熟慮。它通過分析聯(lián)盟和敵對關(guān)系、權(quán)衡利益和導(dǎo)航?jīng)Q策步驟等來引導(dǎo)代理。

6d2a07fa-90ef-11ee-939d-92fbcf53809c.png

國家代理檔案

國家代理檔案基于六個(gè)基本維度:領(lǐng)導(dǎo)力、軍事能力、資源、歷史背景、關(guān)鍵政策和民眾士氣。每個(gè)維度都為我們理解這些代理人在模擬中的行為和決策提供了多維度的視角。

以下是一個(gè)英國代理檔案的例子。

6d80f24a-90ef-11ee-939d-92fbcf53809c.png

6d93ac8c-90ef-11ee-939d-92fbcf53809c.png

國家代理行動空間

國家代理的行動空間被分為七個(gè)不同的類別:

Wait for action:這允許代理人采取被動態(tài)度,觀察其他參與者的行為及背景的變化。

General mobilization:使國家能夠?yàn)闈撛跊_突做好準(zhǔn)備。

Declare war:這是國家對另一國家采取敵對行動的正式聲明。

Military alliance:是多個(gè)國家之間提供相互支持的正式協(xié)議。

Non-intervention treaty:是國家間承諾不干預(yù)對方內(nèi)政的外交協(xié)議。

Peace agreement:旨在結(jié)束沖突,建立未來關(guān)系的框架。

Send message:是代理人進(jìn)行非正式溝通的方式。

行動的屬性被細(xì)致地定義,包括公開性、輸入類型和是否需要回應(yīng)。公開性決定了行動的可見度和公眾意識水平,分為公開和私人兩種。輸入類型指定了行動啟動所需的信息或資源,而是否需要回應(yīng)則指明了行動是否需要其他實(shí)體的反饋。

WarAgent多智能體系統(tǒng)(MAS)

WarAgent圍繞四個(gè)基本構(gòu)建塊展開:國家代理、秘書代理、委員會和Stick:

國家代理:每個(gè)國家代理由對應(yīng)的國家檔案定義,并根據(jù)行動空間中可用的行動做出反應(yīng)。引導(dǎo)提示幫助代理導(dǎo)航復(fù)雜的國際關(guān)系環(huán)境,并確保其行動和決策經(jīng)過深思熟慮。

秘書代理:作為LLMs的補(bǔ)充,秘書代理負(fù)責(zé)驗(yàn)證國家代理的行動適當(dāng)性和基本邏輯一致性。這個(gè)角色不僅確保行動符合已定義的參數(shù),還負(fù)責(zé)驗(yàn)證行動的邏輯連貫性。

委員會:委員會管理國際關(guān)系,作為動態(tài)記錄平臺,收集并顯示模擬中的關(guān)系動態(tài)。它幫助代理根據(jù)最新信息做出決策。

Stick:作為內(nèi)部記錄系統(tǒng),棒跟蹤關(guān)鍵指標(biāo),如動員情況、內(nèi)部穩(wěn)定性和戰(zhàn)備預(yù)測,以確保國家代理的行動與預(yù)定義的協(xié)議和標(biāo)準(zhǔn)保持一致。

如下圖所示,委員會類可以跟蹤和管理不同國家之間四種類型的國際關(guān)系。如戰(zhàn)爭宣言(W)表示國家之間的沖突或戰(zhàn)爭,用符號“×”表示。軍事聯(lián)盟(M)表示國家之間的正式軍事合作伙伴關(guān)系,用符號“&”表示。Stick側(cè)重于跟蹤對國家的決策過程至關(guān)重要的關(guān)鍵指標(biāo),包括動員、內(nèi)部穩(wěn)定性和戰(zhàn)備預(yù)測。

6d9dbcb8-90ef-11ee-939d-92fbcf53809c.png

每個(gè)國家代理與其秘書代理之間存在指定的互動。秘書代理評估國家代理提出的行動計(jì)劃,確保其符合格式、內(nèi)容和邏輯一致性。國家代理之間的互動由歷史背景下的觸發(fā)事件引發(fā)。代理們共同對觸發(fā)事件作出反應(yīng),并通過各種行動和溝通互動進(jìn)行交流。

6dbb1060-90ef-11ee-939d-92fbcf53809c.png

在MAS中,每個(gè)代理的初始行動都是由觸發(fā)事件引發(fā)的。在歷史背景下,觸發(fā)事件指的是引發(fā)各國之間一系列反應(yīng)的事件,最終導(dǎo)致重大歷史事件的發(fā)展。在模擬中,觸發(fā)事件作為所有代理響應(yīng)的初始情景。例如,在第一次世界大戰(zhàn)的情況下,奧地利-匈牙利的弗朗茨·費(fèi)迪南大公被暗殺被廣泛認(rèn)為是觸發(fā)事件。類似地,在第二次世界大戰(zhàn)中,觸發(fā)事件通常被認(rèn)為是德意志帝國入侵波蘭。在戰(zhàn)國時(shí)期的背景下,金國在韓國、趙國和魏國之間的分裂通常被視為觸發(fā)事件。

實(shí)驗(yàn)設(shè)置

本實(shí)驗(yàn)旨在驗(yàn)證LLM在模擬復(fù)雜歷史事件方面的有效性。實(shí)驗(yàn)選用了OpenAI開發(fā)的GPT-4作為后端模型,討論以下問題。

模擬效果(RQ1):在歷史上準(zhǔn)確的條件下展示模擬結(jié)果,旨在證明WarAgent系統(tǒng)在提供可信模擬方面的能力。采用人工評估和多次運(yùn)行計(jì)算準(zhǔn)確性得分的方法來驗(yàn)證結(jié)果。

戰(zhàn)爭的導(dǎo)火索(RQ2):通過探索性“假設(shè)”情景,重點(diǎn)是評估歷史背景下觸發(fā)事件的重要性,特別是在第一次世界大戰(zhàn)的情況下。

戰(zhàn)爭不可避免性(RQ3):考察不同的初始條件下各種場景,通過改變決策過程或國家條件來構(gòu)建替代歷史敘事,并分析其對歷史軌跡的影響。

評估

人工評估: 檢查國家代理執(zhí)行的行動是否與其國家配置文件一致,評估行動是否符合國家利益,以及代理在不同回合中的一致性。

Board連通性評估: 根據(jù)Wikipedia描述和總結(jié),嚴(yán)格評估模擬場景與實(shí)際歷史事件的忠實(shí)度,特別是軍事聯(lián)盟的形成、宣戰(zhàn)和全面動員的實(shí)施。

聯(lián)盟準(zhǔn)確度分?jǐn)?shù): 使用“兩個(gè)分區(qū)的互信息分?jǐn)?shù)”來評估模擬聯(lián)盟與歷史聯(lián)盟的一致性,采用Python中SciPy的標(biāo)準(zhǔn)實(shí)現(xiàn)。宣戰(zhàn)/全面動員準(zhǔn)確度分?jǐn)?shù):使用Jaccard集相似性指數(shù)來評估這兩個(gè)領(lǐng)域的模擬準(zhǔn)確度。

實(shí)驗(yàn)分析

人類評估

實(shí)驗(yàn)從以下三個(gè)方面對模擬結(jié)果進(jìn)行了觀察:軍事聯(lián)盟、宣戰(zhàn)和不干涉條約。

軍事聯(lián)盟: 在所有模擬中,英國與法國、德意志帝國與奧匈帝國、塞爾維亞與俄羅斯之間均形成了一致的聯(lián)盟。模擬結(jié)果顯示,由于德意志帝國的擴(kuò)張政策,英國和法國視其為潛在對手。德意志帝國與奧匈帝國的聯(lián)盟則基于語言和民族共性及外交孤立法國的共同目標(biāo)。塞爾維亞和俄羅斯的聯(lián)盟基于共同的民族背景和戰(zhàn)略利益。

宣戰(zhàn): 在所有模擬中,奧匈帝國不斷地向塞爾維亞和俄羅斯宣戰(zhàn),德意志帝國也對俄羅斯宣戰(zhàn)。法國和英國對德意志帝國的宣戰(zhàn)在大部分模擬中也發(fā)生了。這些宣戰(zhàn)行為反映了當(dāng)時(shí)的聯(lián)盟結(jié)構(gòu)和歷史敵意。

不干涉條約: 在每次模擬中,美國總是參與至少一項(xiàng)不干涉條約。美國的外交策略傾向于避免沖突,通過不干涉條約保持距離。奧斯曼帝國也在大多數(shù)模擬中采取了類似的策略。

實(shí)驗(yàn)中還觀察到了兩種特殊情況:一是沒有聯(lián)盟支持的消息,二是背叛聯(lián)盟。這些情況表明國家代理在不斷變化的政治背景下作出了戰(zhàn)略性的決策。

這些發(fā)現(xiàn)表明,模擬在復(fù)制歷史情景方面是有效的,特別是在將刺殺事件視為觸發(fā)事件的情況下。模擬行動展現(xiàn)了高度的合理性,忠實(shí)于實(shí)際歷史背景,從而證明了基于LLM的MAS在模擬復(fù)雜歷史事件方面的有效性。

準(zhǔn)確性分析

6e21fd2a-90ef-11ee-939d-92fbcf53809c.png

聯(lián)盟準(zhǔn)確性: 在七次模擬中,英國和法國、俄羅斯和塞爾維亞、奧匈帝國和德意志帝國、俄羅斯和法國、奧斯曼帝國和德意志帝國等歷史上的聯(lián)盟在模擬中得到了再現(xiàn)。

宣戰(zhàn)準(zhǔn)確性: 在模擬中,列日戰(zhàn)役之前的宣戰(zhàn)行為如奧地利對塞爾維亞、俄羅斯對奧匈帝國、德意志帝國對塞爾維亞、俄羅斯對德意志帝國、法國對德意志帝國的宣戰(zhàn)均被重現(xiàn)。

動員狀態(tài)準(zhǔn)確性: 除了美國之外,所有國家在這一時(shí)期都進(jìn)入了動員狀態(tài),與歷史情況相符。

錯(cuò)誤分析

聯(lián)盟形成錯(cuò)誤:在七次模擬中,英國和法國與德意志帝國-奧匈帝國聯(lián)盟結(jié)成意外聯(lián)盟的情況出現(xiàn)了一次,這與歷史上的情況不符。

宣戰(zhàn)錯(cuò)誤:英國和法國是否向奧匈帝國或德意志帝國宣戰(zhàn)的選擇,有時(shí)與歷史上的情況不一致。歷史上,這些國家最初與德意志帝國發(fā)生沖突,但在某些模擬中,它們錯(cuò)誤地被描繪為與奧匈帝國對抗。

動員錯(cuò)誤:美國的軍事動員描繪有誤。歷史上,美國在1917年較晚加入一戰(zhàn),但在部分模擬中,美國與英國結(jié)成聯(lián)盟并早期進(jìn)行動員。

總結(jié)

WarAgent模擬系統(tǒng)已經(jīng)證明了其作為理解國際沖突動態(tài)的工具的可靠性。它展示了基于LLM的多智能體AI系統(tǒng)的能力,可以原型化和分析復(fù)雜的人類行為。通過比較不同的Casus Belli設(shè)置,實(shí)驗(yàn)揭示了即使是最小或null的觸發(fā)因素也可能演變成類似于冷戰(zhàn)的情況。這強(qiáng)調(diào)了在一定情況下通向戰(zhàn)爭的路徑往往是不可避免的性質(zhì)。實(shí)驗(yàn)進(jìn)一步支持了這一觀點(diǎn),通過對國家設(shè)置的反事實(shí)改變,暗示國家政策的偏差是改變這些看似注定的結(jié)果的必要手段。

這些發(fā)現(xiàn)突顯了沖突在特定情況下的決定性本質(zhì),但也指出了通過修改國家政策或關(guān)系的戰(zhàn)略性調(diào)整的潛力,以改變這些看似注定的結(jié)果。我們也認(rèn)識到了當(dāng)前框架在充分捕捉國際關(guān)系復(fù)雜性方面存在局限,因此為未來研究提供了方向。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1204

    瀏覽量

    8689
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    322

    瀏覽量

    716

原文標(biāo)題:LLM來模擬世界大戰(zhàn),會發(fā)生什么?

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    GLAD應(yīng)用:高斯光束的吸收和自聚焦效應(yīng)

    的,這將使不同空間位置的光所經(jīng)歷的光程長度不同,即介質(zhì)對入射光束的作用等價(jià)光學(xué)透鏡,從而導(dǎo)致光束的自行聚焦效果。 特別地,當(dāng)入射光束強(qiáng)度沿垂直光軸的界面內(nèi)呈高斯形時(shí),且強(qiáng)度足夠產(chǎn)生非線性效應(yīng)的情況下
    發(fā)表于 05-16 08:47

    GLAD應(yīng)用:高斯光束的吸收和自聚焦效應(yīng)

    的,這將使不同空間位置的光所經(jīng)歷的光程長度不同,即介質(zhì)對入射光束的作用等價(jià)光學(xué)透鏡,從而導(dǎo)致光束的自行聚焦效果。 特別地,當(dāng)入射光束強(qiáng)度沿垂直光軸的界面內(nèi)呈高斯形時(shí),且強(qiáng)度足夠產(chǎn)生非線性效應(yīng)的情況下
    發(fā)表于 06-17 08:52

    【直播預(yù)告】聚焦模擬|先積集成(Linearin)線上直播

    模擬 | 先積集成先積集成(Linearin)作為一家聚焦高端模擬及混合信號芯片的企業(yè),匯聚了業(yè)界一流的信號鏈類模擬芯片設(shè)計(jì)團(tuán)隊(duì)、資深技術(shù)應(yīng)用和產(chǎn)品市場人才,專注
    發(fā)表于 07-25 18:22

    電子聚焦什么原理?

    聚焦的原理:  如果一個(gè)帶電粒子進(jìn)入勻強(qiáng)磁場時(shí),其速度V的方向與磁感強(qiáng)度 的方向成任意角度θ,則可將V分解成平行B和垂直B的兩個(gè)分量V∥和V⊥。因磁場的作用,垂直B的速度分量V
    發(fā)表于 09-25 10:50

    基于DOCSIS的沖突解決算法的研究

    研究了基于DOCSIS規(guī)范的沖突解決算法——二進(jìn)制指數(shù)后退,提出了一種全新的逆向二進(jìn)制指數(shù)后退算法,對兩種算法進(jìn)行了仿真實(shí)驗(yàn),仿真結(jié)果表明逆向二進(jìn)制指數(shù)后退算法比二
    發(fā)表于 02-28 10:33 ?16次下載

    周期永磁聚焦行波管離子噪聲的粒子模擬

    采用混合模型研究了周期永磁聚焦行波管中的離子噪聲,編寫了一維粒子模擬程序,并對行波管的離子噪聲特性進(jìn)行了分析;計(jì)算表明相同氣壓下,周期永磁聚焦離子噪聲的頻率
    發(fā)表于 03-01 23:32 ?20次下載
    周期永磁<b class='flag-5'>聚焦</b>行波管離子噪聲的粒子<b class='flag-5'>模擬</b>

    基于TRIZ的計(jì)算機(jī)輔助沖突解決系統(tǒng)研究

    介紹了創(chuàng)新設(shè)計(jì)理論——TRIZ,說明了應(yīng)用TRIZ 理論解決問題的流程。Delphi編程實(shí)現(xiàn)了計(jì)算機(jī)輔助沖突解決,詳細(xì)論述了系統(tǒng)的設(shè)計(jì)和技術(shù)細(xì)節(jié)。對于解決工程技術(shù)沖突有較大的
    發(fā)表于 08-11 11:05 ?12次下載

    醫(yī)院護(hù)理呼叫通訊系統(tǒng)設(shè)計(jì)及防沖突算法研究

    醫(yī)院護(hù)理呼叫通訊系統(tǒng)設(shè)計(jì)及防沖突算法研究 醫(yī)院護(hù)理呼叫系統(tǒng)是傳輸臨床信息的重要手段,是提高護(hù)理人員的工作效率和保證醫(yī)院服務(wù)質(zhì)量的有效途徑,也是提高醫(yī)院信
    發(fā)表于 11-07 09:55 ?1209次閱讀

    進(jìn)近雷達(dá)管制沖突調(diào)配專家系統(tǒng)研究_劉然

    進(jìn)近雷達(dá)管制沖突調(diào)配專家系統(tǒng)研究_劉然
    發(fā)表于 01-16 14:04 ?1次下載

    圖的著色方法解決排課沖突問題_安衛(wèi)鋼

    圖的著色方法解決排課沖突問題_安衛(wèi)鋼
    發(fā)表于 03-20 09:29 ?0次下載

    基于約束的沖突檢測模型

    進(jìn)行沖突檢測。采用區(qū)間傳播算法驗(yàn)證已知約束關(guān)系集合;提出免疫算法優(yōu)化反向傳播(BP)神經(jīng)網(wǎng)絡(luò)來模擬未知約束關(guān)系集合進(jìn)行沖突檢測,并與遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對比,收斂速度提高了6
    發(fā)表于 01-05 11:30 ?1次下載
    基于約束的<b class='flag-5'>沖突</b>檢測模型

    中芯國際聚焦MEMS與功率器件 為未來工藝市場添薪加柴

    中芯國際告訴DIGITIMES,隨著智能化社會的到來,智能化設(shè)備中應(yīng)用廣泛的微機(jī)電和功率器件市場需求激增,目前市場處于供不應(yīng)求的狀態(tài)。中芯國際看好,未來市場增長需求,規(guī)劃紹興項(xiàng)目聚焦
    的頭像 發(fā)表于 05-28 14:38 ?6606次閱讀

    LLMs時(shí)代進(jìn)行無害性評估的基準(zhǔn)解析

    隨著對LLMs的不斷應(yīng)用,大家也發(fā)現(xiàn)了諸多問題。比如常見的幻覺現(xiàn)象,LLMs可喜歡一本正經(jīng)地說著胡話呢。除此之外,LLMs也有可能生成一些歧視某些身份群體的內(nèi)容,還有一些傷害我們小小心靈的有毒內(nèi)容(這可不行)。
    發(fā)表于 01-05 14:14 ?544次閱讀
    <b class='flag-5'>LLMs</b>時(shí)代進(jìn)行無害性評估的基準(zhǔn)解析

    大語言模型(LLMs)如何處理多語言輸入問題

    研究者們提出了一個(gè)框架來描述LLMs在處理多語言輸入時(shí)的內(nèi)部處理過程,并探討了模型中是否存在特定于語言的神經(jīng)元。
    發(fā)表于 03-07 14:44 ?1029次閱讀
    大語言模型(<b class='flag-5'>LLMs</b>)如何處理多語言輸入問題

    RAG系統(tǒng)中答案無關(guān)片段對LLMs生成結(jié)果的影響分析

    與常見語義無關(guān)的答案無關(guān)片段相比,LLMs更容易受到高度語義相關(guān)的答案無關(guān)片段的影響;
    發(fā)表于 04-15 09:49 ?581次閱讀
    RAG系統(tǒng)中答案無關(guān)片段對<b class='flag-5'>LLMs</b>生成結(jié)果的影響分析
    主站蜘蛛池模板: 日本在线亚洲 | 天天干天天拍 | 免费看啪啪网站 | 乱码一区二区三区完整视频 | 亚洲视频一区网站 | 色婷婷综合缴情综六月 | 免费播放一区二区三区 | 直接黄91麻豆网站 | 久久久噜噜噜www成人网 | 天天射夜夜骑 | 日鲁夜鲁鲁狠狠综合视频 | 中文一区二区在线观看 | 手机看片福利盒子久久 | www.嫩草影院 | 日本免费一级视频 | 免费黄色大片在线观看 | 亚洲爱爱网 | 91色视频网站 | 美女视频一区二区三区 | 欧美日韩乱国产 | 免费爱爱网 | 中文字幕一区二区三区视频在线 | 日本一卡精品视频免费 | 欧美+日本+国产+在线观看 | 有没有免费的视频在线观看 | 国产成人精品高清免费 | 在线高清一级欧美精品 | 1024你懂的在线观看 | 日本免费一区二区三区视频 | 在线视频h | 免费的黄色大片 | 国产小视频免费观看 | 成人女人a毛片在线看 | 天天操天天干天天做 | 国产在线精品美女观看 | 亚洲主播自拍 | 四虎影视院| 天天干夜夜笙歌 | 202z国产高清日本在线播放 | 亚洲国产成人最新精品资源 | 欧美无遮挡国产欧美另类 |