據報道,英國人工智能安全研究院近日發布了名為“Inspect”的AI模型安全評估平臺,此平臺采用開源技術且對全球AI工程師免費開放,旨在提升模型性能與安全測評效率。
Inspect平臺包括“數據集”、“求解器(Solver)”、“評分器”三大模塊,用于評估AI模型在核心知識儲備、推理能力和自主能力等方面的表現。
根據模型測試結果,這些模塊會對各項指標進行評分。此外,Inspect平臺還支持Python外掛其他測試框架。
英國AI安全研究院院長Ian Hogarth表示,他們推出Inspect平臺的初衷在于“堅信開源的力量”,希望通過該平臺激發更多人參與貢獻,提高AI模型透明度和可重復性,并降低工程師的研發成本。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
人工智能
+關注
關注
1805文章
48833瀏覽量
247343 -
模型
+關注
關注
1文章
3500瀏覽量
50113 -
開源技術
+關注
關注
0文章
389瀏覽量
8133
發布評論請先 登錄
相關推薦
熱點推薦
威盛電子推出天車安全AI監控方案
近日,威盛電子宣布推出”威盛天車安全AI監控方案”。該方案基于自主研發的AI技術,集成行人姿態識別、精準防撞預警和智能分區警示等功能,大幅提升橋式起重機(天車)的
萬里紅入選安全大模型及Agentic AI賦能網絡安全代表性廠商
近日,專注于網絡安全和數字風險管理的第三方研究機構安全牛,正式發布了《Agentic AI安全技術應用報告》(以下簡稱“報告”)。報告依托多
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的支持,即可完成目標或其他自研大模型輕松
發表于 04-13 19:52
《AI Agent 應用與項目實戰》----- 學習如何開發視頻應用
開發一個視頻內容生成Agent。
訪問語聚AI平臺官網 ,進行注冊或登錄。
在平臺首頁,了解語聚AI的功能和應用場景,特別是其支持的視頻生成相關的
發表于 03-05 19:52
IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型
,進一步增強企業在安全、治理以及規模化部署方面的能力。 DeepSeek R1是IBM在AI領域的一項重要創新,它采用了蒸餾模型技術,能夠在保持模型性能的同時,顯著減小
美商務部推動AI模型預部署測試
性和可靠性,同時推動行業的健康發展。 除了與這些企業的合作,美國人工智能安全研究所還與英國的安全研究所攜手,共同發布了首個聯合政府高級人工智
芯盾時代的“AI+安全”之道
近日,全球領先的IT市場研究和咨詢公司IDC發布《生成式AI推動下的中國網絡安全軟件市場現狀和技術發展趨勢,2024》報告(以下簡稱《報告》),評估眾多廠商
使用NVIDIA AI平臺確保醫療數據安全
三井物產株式會社子公司借助 NVIDIA AI 平臺實現數據集的安全共享并使用在這些數據集上建立的強大模型加速藥物研發。
AI即服務平臺的安全性分析
AIaaS平臺降低AI應用門檻,但面臨數據泄露、惡意攻擊等安全威脅。需加強數據加密、訪問控制、模型加固、供應鏈安全等措施,確保合法合規,提供
如何評估AI大模型的效果
評估AI大模型的效果是一個復雜且多維度的過程,涉及多個方面的考量。以下是一些關鍵的評估方法和步驟: 一、基準測試(Benchmarking) 使用標準數據集和任務來
AI大模型的最新研究進展
AI大模型的最新研究進展體現在多個方面,以下是對其最新進展的介紹: 一、技術創新與突破 生成式AI技術的爆發 : 生成式AI技術正在迅速發展
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
的訓練和推理提供了強大的算力支持,使得AI在科學研究中的應用更加廣泛和深入。
3. 數據驅動的研究范式
第二章還強調了數據在AI for Science中的核心地位。數據是
發表于 10-14 09:16
OpenAI與Anthropic新模型將受美政府評估
近日,美國政府宣布了一項重要合作,旨在加強人工智能安全監管。根據協議,OpenAI與Anthropic兩大AI領軍企業同意,在推出新的AI模型
評論