☰

通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o

《科創板日報》9日訊，阿里通義團隊開源新一代數學模型Qwen2-Math，包含1.5B、7B、72B三個參數的基礎模型和指令微調模型。Qwen2-Math基於通義千問開源大語言模型Qwen2研發，旗艦模型 Qwen2-Math-72B-Instruct在權威測評集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等，以84%的準確率處理了代數、幾何、計數與概率、數論等多種數學問題。（記者黃心怡）

相關資訊

▣ 阿里發佈Qwen2-Math：數學推理全球第一，超越GPT-4o和Claude-3.5
▣ 通義千問開源視覺語言模型Qwen2-VL
▣ 阿里發佈開源多模態模型Qwen2-VL，多項性能超越GPT-4o
▣ 阿里通義千問Qwen2大模型發佈並同步開源
▣ 通義千問升級旗艦模型Qwen-Max，性能接近GPT-4o
▣ 智源最新模型評測：百度文心大模型4.0登頂閉源榜超GPT-4o等
▣ 通義千問開源千億級參數模型
▣ 通義千問開源320億參數模型
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 通義千問發佈首個千億級參數開源模型
▣ Nvidia的新開源AI模型在基準測試中擊敗了GPT-4o
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 數智早參｜快手可靈AI全面開放內測；Meta最強大模型超越GPT-4o
▣ 阿里通義千問開源首個MoE模型
▣ 開源視覺大模型黑馬Molmo AI 來襲！超越GPT-4o 和 Claude 3.5
▣ 剛剛，開源大模型的新王誕生了：超越GPT-4o，模型還能自動糾錯
▣ AI早知道｜B 站開源輕量級 AI 語言模型；阿里通義Qwen2成最強開源大模型
▣ Anthropic大模型測評首超GPT-4
▣ 通義千問開源模型下載量突破2000萬
▣ 阿里雲發佈開源模型Qwen2
▣ 數智早參｜OpenAI官宣推出新的大語言模型GPT-4o；騰訊混元文生圖大模型開源
▣ 通義千問開源Qwen2.5開源模型，累計下載量突破4000萬
▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
性能超越GPT-4Turbo 通義千問2.5問世
▣ 國內首個官方大模型評測結果出爐阿里雲通義千問首批通過評測
▣ OpenAI開戰小模型，GPT-4o mini成本再降60%
▣ 智譜「超大杯」模型全家桶亮相KDD，部分任務超越GPT-4o
▣ 百川智能發佈超千億大模型Baichuan 3，中文評測超越GPT-4
▣ 87.8%準確率趕超GPT-4o登頂！谷歌DeepMind發佈自動評估模型FLAMe

DMCA | PRIVACY | s@bg3.co