【消費電子實驗室-2024/4/17】4 月 15-19 日,第 27 屆聯合國科技大會在瑞士日內瓦召開。其間,世界數字技術院(WDTA)于 4 月 16 日發布了一系列突破性成果,包括《生成式人工智能應用安全測試標準》和《大語言模型安全測試方法》兩項國際標準。 這兩項國際標準為大模型及生成式 AI 應用方面的安全測試標準,代表著全球人工智能安全評估和測試進入新的基準。由 OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數十家單位的多名專家學者共同編制而成,其中《大語言模型安全測試方法》由螞蟻集團牽頭編制。 《標準》為測試、驗證生成式 AI 應用(尤其是使用大語言模型構建的應用程序)的安全性提供框架,定義了 AI 應用程序架構每層測試驗證范圍,包括不限于這方面:基礎模型選擇、嵌入和矢量數據庫、RAG 或檢索增強生成、AI 應用運行時的安全。 《方法》則為大模型本身安全性評估提供了“全面、嚴謹且實操性強”的結構性方案,提出了大語言模型的安全風險分類、攻擊的分類分級方法以及測試方法。據報道,《方法》可以解決大語言模型固有的復雜性,全面測試其抵御敵對攻擊的能力,使開發人員和組織能夠識別和緩解潛在漏洞,并最終提高使用大語言模型構建的人工智能系統的安全性和可靠性。 消費電子實驗室注:WDTA 系國際非政府組織,于日內瓦注冊。該機構遵從聯合國指導框架,致力于在全球范圍內推進數字技術,促進國際合作。AI STR(安全、可信、負責任)計劃是 WDTA 的核心倡議,旨在確保人工智能系統的安全性、可信性和責任性。 |
網站介紹 廣告業務 歡迎投稿 招聘信息 聯系我們 友情鏈接 法律顧問 網站地圖
CopyRight 2012消費電子實驗室 版權所有 京ICP備12048044號-4號
電話:13701384402 郵編:100040 郵箱:BICQ6688@QQ.COM