韓國進行人工智慧模型安全評估，提升韓語應用環境安全性

[標題]最新消息

韓國進行人工智慧模型安全評估，提升韓語應用環境安全性

韓國科學技術情報通信部(MSIT)聯同人工智慧安全研究所(AISI)及韓國資訊通信技術協會(TTA)，於2025年12月30日正式公布了針對本土AI模型Kanana的安全性評估結果。這是韓國首個利用國內研究團隊開發之資料集進行的AI安全性驗證，此項評估是在韓國《人工智慧基本法》的政策背景下進行，旨在協助企業為AI模型提供安全性諮詢支援。本次評估的核心對象是韓國Kakao公司開發的｢Kanana Essence 1.5｣模型，評估結果顯示Kanana模型在處理各類風險情況時的技術穩定性，並與國外同等規模模型進行比較。

此次評估的核心工具是專為韓語環境設計的基準測試資料集｢AssurAI｣，由韓國科學技術院(KAIST)與TTA等多學科專家團隊聯合開發，旨在解決現有安全性評估工具過於集中於英語、無法反映韓國特殊語言細微差別及文化規範的問題。AssurAI包含文本、圖像、影片及音訊的高品質多模態資料集，總計達11,480項實例。評估範圍將風險歸納為六大類別，並細分為35項風險因子，包括有害與暴力內容、人際傷害、敏感與成人內容、錯誤訊息與操控、非法與不道德活動，以及社會經濟與認知風險。為了確保數據的可靠性，AssurAI採用的審查與品質控管流程包括由專家引導生成種子數據與群眾外包規模化生產數據的兩階段構建法、三方獨立標註以確保客觀性，以及多學科專家團隊的迭代式紅隊審查機制。

此次評估為韓國系統性人工智慧安全評估奠定了堅實的基礎，讓國內外研究人員得以定量分析韓語生成模型的漏洞，並進一步強化其安全性。韓國政府計畫未來將AssurAI推向ISO/IEC等國際標準，並加強與美國、英國、日本等10國組成的國際AI安全研究所網絡合作。韓國正致力於減輕AI對社會的負面影響，推動負責任且值得信賴的全球人工智慧生態系統。

相關連結:

韓國首次進行AI模型安全評估，擴展AI安全生態系統的第一步 (另開視窗)