AI產品與系統評測中心(AIEC)自2025年3月起,持續就國內外語言模型進行基準評測研究(Benchmark),並於10月3日記者會首度公布共42個語言模型基準評測結果,展現在地化評測能量與推動我國AI可信任之發展。
本評測除採用「高中學測國文科」及「高中學測社會科」指標外,並納入「臺灣價值觀」評測項目,以呼應國際 AI 主權發展趨勢,作為各界建構在地模型或調校國際模型之重要參考依據。
自2025年10月起,評測結果於每月第一週星期五定期公布於本中心官方網站,敬請各界持續關注與參閱。
麵包屑導覽路徑
AI產品與系統評測中心(AIEC)自2025年3月起,持續就國內外語言模型進行基準評測研究(Benchmark),並於10月3日記者會首度公布共42個語言模型基準評測結果,展現在地化評測能量與推動我國AI可信任之發展。
本評測除採用「高中學測國文科」及「高中學測社會科」指標外,並納入「臺灣價值觀」評測項目,以呼應國際 AI 主權發展趨勢,作為各界建構在地模型或調校國際模型之重要參考依據。
自2025年10月起,評測結果於每月第一週星期五定期公布於本中心官方網站,敬請各界持續關注與參閱。
✪依開發單位區域排序,淺橘為歐洲模型;淺藍為美國模型;淺綠為本土模型;淺紫為中國模型
✪百分比數字說明:高於50%以綠色標註 ; 低於50%以粉紅色標註
✪本次測試結果新增18個模型(小模型3個;大模型15個)