好看的课外书,完美世界小说下载,君子以泽

來(lái)自卡內(nèi)基梅隆大學(xué)（CMU）的研究人員發(fā)布了 LLM Attacks，這是一種可以針對(duì)各種大型語(yǔ)言模型（LLM）構(gòu)建對(duì)抗性攻擊的算法，包括 ChatGPT、Claude 和 Bard。這些自動(dòng)生成的攻擊，在 GPT-3.5 和 GPT-4 上的成功率為 84%，在 PaLM-2 上的成功率為 66%。

與大多數(shù)“越獄”攻擊通過(guò)試錯(cuò)手工構(gòu)建不同，CMU 的團(tuán)隊(duì)設(shè)計(jì)了一個(gè)三步流程來(lái)自動(dòng)生成提示后綴，它們可以繞過(guò) LLM 的安全機(jī)制，導(dǎo)致有害的響應(yīng)。而且，這些提示還是可轉(zhuǎn)移（transferrable）的，也就是說(shuō)，一個(gè)給定的后綴通常可以用于許多不同的 LLM，甚至是閉源模型。為了衡量算法的有效性，研究人員創(chuàng)建了一個(gè)名為 AdvBench 的基準(zhǔn)測(cè)試；在此基準(zhǔn)測(cè)試上進(jìn)行評(píng)估時(shí)，LLM 攻擊對(duì) Vicuna 的成功率為 88%，而基線(xiàn)對(duì)抗算法的成功率為 25%。根據(jù) CMU 團(tuán)隊(duì)的說(shuō)法：

最令人擔(dān)憂(yōu)的也許是，目前尚不清楚 LLM 提供商是否能夠完全修復(fù)此類(lèi)行為。在過(guò)去的 10 年里，在計(jì)算機(jī)視覺(jué)領(lǐng)域，類(lèi)似的對(duì)抗性攻擊已經(jīng)被證明是一個(gè)非常棘手的問(wèn)題。有可能深度學(xué)習(xí)模型根本就無(wú)法避免這種威脅。因此，我們認(rèn)為，在增加對(duì)此類(lèi)人工智能模型的使用和依賴(lài)時(shí)，應(yīng)該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發(fā)布，出現(xiàn)了許多破解這些模型的技術(shù)，其中就包括可能導(dǎo)致模型繞過(guò)其保護(hù)措施并輸出潛在有害響應(yīng)的提示。雖然這些提示通常是通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)的，但 LLM Attacks 算法提供了一種自動(dòng)創(chuàng)建它們的方法。第一步是創(chuàng)建一個(gè)目標(biāo)令牌序列：“Sure, here is (content of query)”，其中“content of query”是用戶(hù)實(shí)際輸入的提示，要求進(jìn)行有害的響應(yīng)。

接下來(lái)，該算法會(huì)查找可能導(dǎo)致 LLM 輸出目標(biāo)序列的令牌序列，基于貪婪坐標(biāo)梯度（GCG）算法為提示生成一個(gè)對(duì)抗性后綴。雖然這確實(shí)需要訪(fǎng)問(wèn) LLM 的神經(jīng)網(wǎng)絡(luò)，但研究團(tuán)隊(duì)發(fā)現(xiàn)，在許多開(kāi)源模型上運(yùn)行 GCG 所獲得的結(jié)果甚至可以轉(zhuǎn)移到封閉模型中。

在 CMU 發(fā)布的一條介紹其研究成果的新聞中，論文合著者 Matt Fredrikson 表示：

令人擔(dān)憂(yōu)的是，這些模型將在沒(méi)有人類(lèi)監(jiān)督的自主系統(tǒng)中發(fā)揮更大的作用。隨著自主系統(tǒng)越來(lái)越真實(shí)，我們要確保有一種可靠的方法來(lái)阻止它們被這類(lèi)攻擊所劫持，這將非常重要……現(xiàn)在，我們根本沒(méi)有一個(gè)令人信服的方法來(lái)防止這種事情的發(fā)生，所以下一步，我們要找出如何修復(fù)這些模型……了解如何發(fā)動(dòng)這些攻擊通常是建立強(qiáng)大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項(xiàng)研究。他寫(xiě)道：

盡管存在風(fēng)險(xiǎn)，但我們認(rèn)為還是應(yīng)該把它們?nèi)颗冻鰜?lái)。這里介紹的攻擊很容易實(shí)現(xiàn)，以前也出現(xiàn)過(guò)形式類(lèi)似的攻擊，并且最終也會(huì)被致力于濫用 LLM 的團(tuán)隊(duì)所發(fā)現(xiàn)。

劍橋大學(xué)助理教授 David Krueger 回復(fù)了 Zou 的帖子，他說(shuō)：

在圖像模型中，10 年的研究和成千上萬(wàn)的出版物都未能找出解決對(duì)抗樣本的方法，考慮到這一點(diǎn)，我們有充分的理由相信，LLM 同樣會(huì)如此。

在 Hacker News 上關(guān)于這項(xiàng)工作的討論中，有一位用戶(hù)指出：

別忘了，本研究的重點(diǎn)是，這些攻擊不需要使用目標(biāo)系統(tǒng)來(lái)開(kāi)發(fā)。作者談到，攻擊是“通用的”，他們的意思是說(shuō)，他們可以在自己的計(jì)算機(jī)上完全使用本地模型來(lái)生成這些攻擊，然后將它們復(fù)制并粘貼到 GPT-3.5 中，并看到了有意義的成功率。速率限制并不能幫你避免這種情況，因?yàn)楣羰窃诒镜厣傻模皇怯媚愕姆?wù)器生成的。你的服務(wù)器收到的第一個(gè)提示已經(jīng)包含了生成好的攻擊字符串——研究人員發(fā)現(xiàn)，在某些情況下，即使是對(duì) GPT-4，成功率也在 50% 左右。

GitHub 上提供了代碼，你可以在 AdvBench 數(shù)據(jù)上重現(xiàn) LLM Attacks 實(shí)驗(yàn)。項(xiàng)目網(wǎng)站上還提供了幾個(gè)對(duì)抗性攻擊的演示。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

網(wǎng)絡(luò)安全

網(wǎng)絡(luò)安全

+關(guān)注

關(guān)注
11

文章
3263

瀏覽量
60964
GitHub

GitHub

+關(guān)注

關(guān)注
3

文章
480

瀏覽量
17299
LLM

LLM

+關(guān)注

關(guān)注
1

文章
316

瀏覽量
628

原文標(biāo)題：新型威脅：探索 LLM 攻擊對(duì)網(wǎng)絡(luò)安全的沖擊

文章出處：【微信號(hào)：AI前線(xiàn)，微信公眾號(hào)：AI前線(xiàn)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

戴爾科技如何助力企業(yè)網(wǎng)絡(luò)安全

數(shù)據(jù)安全如同懸在企業(yè)頭頂?shù)摹斑_(dá)摩克利斯之劍”，隨著新技術(shù)的飛速發(fā)展，企業(yè)運(yùn)營(yíng)愈發(fā)依賴(lài)網(wǎng)絡(luò)與數(shù)據(jù)，然而這也為網(wǎng)絡(luò)威脅和攻擊敞開(kāi)了大門(mén)，特別是勒

發(fā)表于 03-10 15:51 ?303次閱讀

Lansweeper:強(qiáng)化網(wǎng)絡(luò)安全與資產(chǎn)管理

使用 Lansweeper 全面了解您的 IT 資產(chǎn)清單保護(hù)任何東西的第一步是知道你擁有什么全可見(jiàn)性發(fā)現(xiàn)您甚至不知道的資產(chǎn)并消除盲點(diǎn)。風(fēng)險(xiǎn)緩解通過(guò)審計(jì)預(yù)防措施預(yù)測(cè)潛在的網(wǎng)絡(luò)安全攻擊。威脅

發(fā)表于 02-19 13:59 ?245次閱讀

探索國(guó)產(chǎn)網(wǎng)絡(luò)安全整機(jī)，共筑5G時(shí)代網(wǎng)絡(luò)安全防護(hù)線(xiàn)

由于現(xiàn)代5G時(shí)代的快速發(fā)展，黑客攻擊、信息泄露、網(wǎng)絡(luò)詐騙以及病毒軟件入侵等網(wǎng)絡(luò)安全問(wèn)題也隨之浮出水面，為防止這類(lèi)問(wèn)題的發(fā)生，使用網(wǎng)絡(luò)安全整機(jī)就成為了我們必不可少的防護(hù)手段之一。

發(fā)表于 02-08 08:47 ?276次閱讀

DeepSeek?遭受?DDoS?攻擊敲響警鐘，企業(yè)如何筑起網(wǎng)絡(luò)安全防線(xiàn)？

限制+86手機(jī)號(hào)以外的注冊(cè)方式，以保障服務(wù)穩(wěn)定。這一事件再次提醒我們： 網(wǎng)絡(luò)安全已成為企業(yè)生存和發(fā)展的生命線(xiàn) 。在數(shù)字化時(shí)代，網(wǎng)絡(luò)攻擊的規(guī)模和復(fù)雜性日益增加，尤其是DDoS攻擊，已成

發(fā)表于 02-07 14:39 ?237次閱讀

DeepSeek?遭受?DDoS?<b class='flag-5'>攻擊</b>敲響警鐘，企業(yè)如何筑起<b class='flag-5'>網(wǎng)絡(luò)安全</b>防線(xiàn)？

華納云企業(yè)建立全面的網(wǎng)絡(luò)安全策略的流程

照規(guī)定操作。定期對(duì)員工進(jìn)行網(wǎng)絡(luò)安全培訓(xùn)，提高他們識(shí)別和防范網(wǎng)絡(luò)威脅的能力。確保數(shù)據(jù)中心和服務(wù)器的物理安全，包括訪(fǎng)問(wèn)控制和監(jiān)控系統(tǒng)。通過(guò)網(wǎng)絡(luò)

發(fā)表于 12-31 15:12 ?367次閱讀

龍芯3A5000網(wǎng)絡(luò)安全整機(jī)，助力保護(hù)網(wǎng)絡(luò)信息安全

在當(dāng)今互聯(lián)網(wǎng)信息普及的時(shí)代，我們的網(wǎng)絡(luò)安全問(wèn)題更加突顯。個(gè)人信息泄露、病毒軟件侵占、黑客攻擊等網(wǎng)絡(luò)安全問(wèn)題日益增多。想要解決這個(gè)問(wèn)題，就得更加發(fā)展我們的防護(hù)科技。

發(fā)表于 12-23 09:59 ?341次閱讀

純凈IP：守護(hù)網(wǎng)絡(luò)安全的重要道防線(xiàn)

純凈IP，作為守護(hù)網(wǎng)絡(luò)安全的道防線(xiàn)，扮演著至關(guān)重要的角色。它不僅關(guān)乎網(wǎng)絡(luò)流量的順暢與高效，更是確保用戶(hù)數(shù)據(jù)安全、防止惡意攻擊和非法訪(fǎng)問(wèn)的關(guān)鍵所在。

發(fā)表于 10-25 07:34 ?396次閱讀

隨著全球網(wǎng)絡(luò)安全威脅日益升級(jí)，3只網(wǎng)絡(luò)安全美股值得投資者關(guān)注

在科技和人工智能迅速發(fā)展的今天，科技雖然給我們帶來(lái)了很多便利，但也讓我們更容易受到網(wǎng)絡(luò)安全威脅和隱私泄露的影響。而且這些危險(xiǎn)并不局限于一個(gè)國(guó)家，而是具有全球影響，這就使得網(wǎng)絡(luò)安全解決方案在現(xiàn)如今的世界中比以往任何時(shí)候都更加重要。

發(fā)表于 09-23 17:18 ?497次閱讀

隨著全球<b class='flag-5'>網(wǎng)絡(luò)安全</b><b class='flag-5'>威脅</b>日益升級(jí)，3只<b class='flag-5'>網(wǎng)絡(luò)安全</b>美股值得投資者關(guān)注

國(guó)產(chǎn)網(wǎng)絡(luò)安全主板在防御網(wǎng)絡(luò)攻擊中的實(shí)際應(yīng)用

在現(xiàn)代信息技術(shù)迅猛發(fā)展的背景下，網(wǎng)絡(luò)安全問(wèn)題變得越來(lái)越復(fù)雜和嚴(yán)峻。從企業(yè)到個(gè)人用戶(hù)，各類(lèi)網(wǎng)絡(luò)攻擊事件頻繁發(fā)生，威脅著數(shù)據(jù)的安全和系統(tǒng)的穩(wěn)定。

發(fā)表于 09-18 10:47 ?541次閱讀

IP定位技術(shù)追蹤網(wǎng)絡(luò)攻擊源的方法

如今，網(wǎng)絡(luò)安全受到黑客威脅和病毒攻擊越來(lái)越頻繁，追蹤攻擊源頭對(duì)于維護(hù)網(wǎng)絡(luò)安全變得尤為重要。當(dāng)我們?cè)馐?b class='flag-5'>網(wǎng)絡(luò)

發(fā)表于 08-29 16:14 ?633次閱讀

網(wǎng)絡(luò)安全技術(shù)商CrowdStrike與英偉達(dá)合作

網(wǎng)絡(luò)安全技術(shù)商CrowdStrike與英偉達(dá)合作共同研發(fā)更先進(jìn)的網(wǎng)絡(luò)防御解決方案；提升CrowdStrike Falcon平臺(tái)的威脅檢測(cè)速度和準(zhǔn)確性。將通過(guò)人工智能原生平臺(tái)CrowdStrike

發(fā)表于 08-28 16:30 ?1626次閱讀

網(wǎng)絡(luò)世界網(wǎng)絡(luò)風(fēng)險(xiǎn)時(shí)刻存在，威脅人們網(wǎng)絡(luò)安全，冒犯人們網(wǎng)絡(luò)隱私#網(wǎng)絡(luò)隱私

網(wǎng)絡(luò)安全

jf_62215197

發(fā)布于 :2024年08月02日 07:53:25

海外高防服務(wù)器對(duì)網(wǎng)絡(luò)安全保護(hù)的影響

海外高防服務(wù)器作為一種專(zhuān)門(mén)設(shè)計(jì)用于抵御分布式拒絕服務(wù)(DDoS)攻擊和其他網(wǎng)絡(luò)威脅的強(qiáng)大工具，對(duì)網(wǎng)絡(luò)安全保護(hù)起著至關(guān)重要的作用。這類(lèi)服務(wù)器通常部署在具有豐富帶寬資源和先進(jìn)防御機(jī)制的國(guó)際

發(fā)表于 07-16 10:18 ?412次閱讀

工業(yè)控制系統(tǒng)面臨的網(wǎng)絡(luò)安全威脅有哪些

，隨著技術(shù)的發(fā)展，工業(yè)控制系統(tǒng)也面臨著越來(lái)越多的網(wǎng)絡(luò)安全威脅。本文將詳細(xì)介紹工業(yè)控制系統(tǒng)面臨的網(wǎng)絡(luò)安全威脅，并提出相應(yīng)的防護(hù)措施。惡意軟件攻擊

發(fā)表于 06-16 11:43 ?1954次閱讀

專(zhuān)家解讀 | NIST網(wǎng)絡(luò)安全框架（1）：框架概覽

本文主要探討NIST CSF框架的起源目標(biāo)、內(nèi)容組成，及其在網(wǎng)絡(luò)安全風(fēng)險(xiǎn)管理中的關(guān)鍵作用，通過(guò)采用該框架，組織能夠更有效地實(shí)施風(fēng)險(xiǎn)識(shí)別、安全保護(hù)、威脅檢測(cè)和事件響應(yīng)，從而構(gòu)建更加堅(jiān)固和彈性的網(wǎng)

發(fā)表于 05-06 10:30 ?1608次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

新型威脅：探索LLM攻擊對(duì)網(wǎng)絡(luò)安全的沖擊