☰

Anthropic大模型測評首超GPT-4

據外媒Ars Technica報道，在大模型評估排行榜Chatbot Arena上，AI創企Anthropic的Claude 3 Opus大模型首次超越OpenAI的GPT-4。Chatbot Arena由大型模型系統組織（LMSYS ORG）運營，由加州大學伯克利分校、加州大學聖地亞哥分校和卡內基梅隆大學的學生和教師合作運作。這是GPT-4自從2023年5月10日左右被納入Chatbot Arena以來首次在該榜單上被超越。

本文源自金融界AI電報

相關資訊

▣ Anthropic發佈“GPT-4 對手”Claude 2大語言模型
▣ 百川智能發佈超千億大模型Baichuan 3，中文評測超越GPT-4
▣ 智源最新模型評測：百度文心大模型4.0登頂閉源榜超GPT-4o等
▣ 通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
▣ 超越GPT-4，OpenAI前高管發佈"最強"大模型
李彥宏：文心大模型4.0在中文已超過GPT-4
▣ 大模型權威測試被曝翻車！偏袒GPT-4等閉源模型，提示詞區別對待
▣ 超越GPT-4V，蘋果多模態大模型上新！
▣ UC伯克利：給大模型測MBTI，Llama更敢說但GPT-4像理工男
▣ 快手：快意通用大語言模型能力已超GPT-3.5 營銷能力齊平GPT-4
Anthropic釋出新款聊天機器人服務模型Claude 3.5 Sonnet 標榜性能超越OpenAI的GPT-4o
▣ 微軟 GPT 模型可信度綜合評估：GPT-4 通常比 GPT-3.5 更值得信賴，但也有例外
▣ 87 GB 大模型種子，GPT-4 縮小版，超越GPT3.5，在線體驗
▣ OpenAI宣佈發佈GPT-4 Turbo模型
▣ 法律 AI 公司 EvenUp 獲 1.35 億美元，模型超 GPT-4
▣ 對標 OpenAI GPT-4，MiniMax 國內首個 MoE 大語言模型全量上線
▣ Anthropic旗下大模型公開測試新功能，可模擬人機交互方式
▣ 李彥宏：文心大模型4.0在中文上已經超過了GPT-4
▣ 哪吒L車型首次OTA升級，應用大模型NETA GPT
▣ 科大訊飛宣佈星火大模型4.0發佈，整體性能超GPT-4 Turbo
▣ 微軟開源最強小模型Phi-4，超GPT-4o、可商用
▣ 字節“開盒”OpenAI所有大模型，揭秘GPT-3到GPT-4進化路徑
▣ 微軟Bing Chat接入GPT-4 Turbo模型
▣ OpenAI o1模型問世，比 GPT-4 還強！
▣ AI週報| 大模型測不出9.11和9.9哪個大；OpenAI發佈輕量化模型GPT-4o mini
OpenAI推出新版嵌入模型、新版GPT-4 Turbo預覽模型再度調降GPT-3.5 Turbo模型使用費用
▣ OpenAI發佈會：GPT-4 Turbo模型、GPT應用商店等登場
▣ 性能超越 GPT-4 Turbo！「商湯日日新」大升級，國產大模型超市開張了
▣ 首個AI大模型高考全卷評測結果發佈

DMCA | PRIVACY | s@bg3.co