百川智能發佈超千億大模型Baichuan 3,中文評測超越GPT-4

1月29日,基礎大模型初創公司百川智能發佈了超千億參數的大語言模型Baichuan 3。在多個權威通用能力評測如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3在中文任務上都超越了GPT-4。此外,在對邏輯推理能力及專業性要求極高的MCMLE、MedExam、CMExam等權威醫療評測上,Baichuan 3的中文效果同樣超過了GPT-4,是目前中文醫療任務表現最佳的大模型。

Baichuan 3本次進一步提升了語義理解和生成能力,在詩詞創作的格式、韻律、表意等方面表現比前任更好。