跳到主要內容

[標題]最新消息

2026年4月評測結果

✪依開發單位區域排序,淺橘為歐洲模型;淺藍為美國模型;淺綠為本土模型;淺紫為中國模型

✪百分比數字說明:高於50%以黑色字標註 ; 低於50%以紅色字標註

✪本次測試結果新增6個小模型、5個大模型

  • 語言模型基準(benchmark) / 小模型(13B以下)

語言模型基準(benchmark) / 小模型(13B以下)請參考下方相關檔案「2026年4月語言模型基準評測結果(小模型與大模型).ods」或「2026年4月語言模型基準評測結果(小模型與大模型).xlsx」的「小」頁籤 
 

  • 語言模型基準(benchmark) / 大模型(13B以上)

語言模型基準(benchmark) / 大模型(13B以上)請參考下方相關檔案「2026年4月語言模型基準評測結果(小模型與大模型).ods」或「2026年4月語言模型基準評測結果(小模型與大模型).xlsx」的「大」頁籤 
 

附件下載:
2026年4月語言模型基準評測結果(小模型與大模型).ods
2026年4月語言模型基準評測結果(小模型與大模型).xlsx