首個AI高考全卷評測結果發佈:最高分303 數學全不及格
《科創板日報》19日訊,上海人工智能實驗室旗下司南評測體系OpenCompass選取了7個大模型進行高考“語數外”全卷能力測試。OpenCompass發佈了首個大模型高考全卷評測結果。語數外三科加起來的滿分爲420分,此次高考測試結果顯示,阿里通義千問2-72B排名第一,爲303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能實驗室的書生·浦語2.0排名第三,三個大模型的得分率均超過70%。來自法國大模型初創公司的Mistral排名末尾。從結果來看,大模型的語文、英語考試水平普遍不錯,但數學都不及格,最高分也只有75分。
相關資訊
- ▣ 首個AI大模型高考全卷評測結果發佈
- ▣ 2010高考數學全國I卷試卷點評
- ▣ 速遞!2024年高考數學全國卷試題評析來了
- 中國保險汽車安全指數發佈五款車型測評結果
- 中國保險汽車安全指數五款車型測評結果發佈
- ▣ 全球140+大模型全方位評測結果出爐,智源評測體系發佈
- 最全彙總!2020全國高考31省分數線及一分一段表
- 全國31個省份高考分數線均已公佈
- ▣ 教育部考試中心命題專家評析2021年高考數學全國卷試題
- ▣ 蘋果AI高考最後交卷,用戶:就這?
- 學測數學「近3年最難」! 教師團隊:考高分不容易
- ▣ 圖個明白丨最全彙總 31省份公佈2024年高考分數線
- 最全!31省市區2019年高考分數線及一分一段表
- ▣ 高考評卷過程:嚴格評卷質量監控
- ▣ 果然更難,2024英語新高考全國一卷聽力部分,詞組短語數量達48個
- 北京高考評卷現場:評卷人隔座背對而坐,數學各題均有滿分者
- ▣ 2021 年全國乙卷高考語文試卷點評
- ▣ 首個AI數學大賽開考:563支AI隊伍與人類挑戰同一份考卷
- ▣ 2024年高考數學(北京卷)試題評析來了!
- 數乙明年納入分科測驗 大考中心首公佈參考試卷
- ▣ 全國各地高考分數線陸續公佈
- ▣ 中國保險汽車安全指數(C-IASI)2022年測評車型第一次結果發佈
- ▣ 教育部考試中心命題專家評析2021高考化學全國卷
- 全班最高33分!名師「出太難」遭解聘 網PO卷:都學測題
- ▣ 北大AI奧數評測,o1-mini比o1-preview分數還高
- ▣ 專家評甘肅高考數學卷:試題難度較大
- ▣ 數學家李大潛:初中時搶交卷結果只考了18分
- ▣ 全國高考首位狀元誕生,總分715分,數學、物理獲得滿分
- ▣ 檢驗大模型數學推理能力,司南發佈全新評測指標與評測集