4月17日公布,第27屆聯合國科技大會于4月15至19日在瑞士日內瓦舉行,期間,世界數字技術院(WDTA)于4月16日發布了多項重要科研成果,包括《生成式人工智能應用安全測試標準》與《大語言模型安全測試方法》兩款國際標準。
據悉,上述兩款標準主要針對大型模型與生成式AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等多家知名企業,其中,《大語言模型安全測試方法》由螞蟻集團主導完成。
這兩份標準為生成式AI應用(特別是基于大語言模型的應用)的安全性測試提供了明確的框架,涵蓋了基礎模型選取、嵌入和矢量數據庫、RAG或檢索增強生成、AI應用運行時的安全等多個方面。
另一方面,《大語言模型安全測試方法》為大模型自身的安全性評估提供了全面、嚴謹且實用性強的解決方案,提出了大語言模型的安全風險分類、攻擊分類分級方法以及測試方法。據稱,該方法能有效應對大語言模型的復雜性,全面測試其防御敵對攻擊的能力,幫助開發者和組織識別并修復潛在漏洞,從而提升使用大語言模型構建的人工智能系統的安全性與可靠性。
值得注意的是,WDTA是一個總部位于日內瓦的國際非政府組織,遵循聯合國的指導原則,致力于推動全球數字技術發展和國際合作。AI STR(安全、可信、負責任)計劃是WDTA的核心倡議,旨在保障人工智能系統的安全性、可信性和責任感。
-
人工智能
+關注
關注
1796文章
47791瀏覽量
240552 -
語言模型
+關注
關注
0文章
542瀏覽量
10344 -
OpenAI
+關注
關注
9文章
1158瀏覽量
6747
發布評論請先 登錄
相關推薦
Google兩款先進生成式AI模型登陸Vertex AI平臺
三行代碼完成生成式AI部署
![三行代碼完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署](https://file1.elecfans.com/web2/M00/05/A5/wKgaombRh8-AU8uhAAG1HPVlRwE861.png)
評論