跳到主要內容

[標題]最新消息

2026年1月評測結果

✪依開發單位區域排序,淺橘為歐洲模型;淺藍為美國模型;淺綠為本土模型;淺紫為中國模型

✪百分比數字說明:高於50%以黑色字標註 ; 低於50%以紅色字標註

✪本次測試結果新增11個模型(小模型6個;大模型5個)

  • 語言模型基準(benchmark) / 小模型(13B以下)

語言模型基準(benchmark) / 小模型(13B以下)請參考下方相關檔案,2026年1月語言模型基準評測結果(小模型).ods

  • 語言模型基準(benchmark) / 大模型(13B以上)

語言模型基準(benchmark) / 大模型(13B以上)請參考下方相關檔案,2026年1月語言模型基準評測結果(大模型).ods

附件下載:
2026年1月語言模型基準評測結果(小模型).ods
2026年1月語言模型基準評測結果(大模型).ods