通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
《科創板日報》9日訊,阿里通義團隊開源新一代數學模型Qwen2-Math,包含1.5B、7B、72B三個參數的基礎模型和指令微調模型。Qwen2-Math基於通義千問開源大語言模型Qwen2研發,旗艦模型 Qwen2-Math-72B-Instruct在權威測評集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的準確率處理了代數、幾何、計數與概率、數論等多種數學問題。(記者 黃心怡)
相關資訊
- ▣ 阿里發佈Qwen2-Math:數學推理全球第一,超越GPT-4o和Claude-3.5
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- ▣ 阿里發佈開源多模態模型Qwen2-VL,多項性能超越GPT-4o
- ▣ 阿里通義千問Qwen2大模型發佈並同步開源
- ▣ 通義千問升級旗艦模型Qwen-Max,性能接近GPT-4o
- ▣ 智源最新模型評測:百度文心大模型4.0登頂閉源榜 超GPT-4o等
- ▣ 通義千問開源千億級參數模型
- ▣ 通義千問開源320億參數模型
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 通義千問發佈首個千億級參數開源模型
- ▣ Nvidia的新開源AI模型在基準測試中擊敗了GPT-4o
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 數智早參|快手可靈AI全面開放內測;Meta最強大模型超越GPT-4o
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 開源視覺大模型黑馬Molmo AI 來襲!超越GPT-4o 和 Claude 3.5
- ▣ 剛剛,開源大模型的新王誕生了:超越GPT-4o,模型還能自動糾錯
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ Anthropic大模型測評首超GPT-4
- ▣ 通義千問開源模型下載量突破2000萬
- ▣ 阿里雲發佈開源模型Qwen2
- ▣ 數智早參|OpenAI官宣推出新的大語言模型GPT-4o;騰訊混元文生圖大模型開源
- ▣ 通義千問開源Qwen2.5開源模型,累計下載量突破4000萬
- ▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
- 性能超越GPT-4Turbo 通義千問2.5問世
- ▣ 國內首個官方大模型評測結果出爐 阿里雲通義千問首批通過評測
- ▣ OpenAI開戰小模型,GPT-4o mini成本再降60%
- ▣ 智譜「超大杯」模型全家桶亮相KDD,部分任務超越GPT-4o
- ▣ 百川智能發佈超千億大模型Baichuan 3,中文評測超越GPT-4
- ▣ 87.8%準確率趕超GPT-4o登頂!谷歌DeepMind發佈自動評估模型FLAMe