商湯發佈日日新5.0大模型,推理上下文窗口200K

4月23日下午,在2024年商湯技術交流日上,商湯科技正式發佈“日日新5.0”大模型,該模型採用MoE混合專家架構,基於超過10TB tokens訓練,推理上下文窗口200K,知識、推理、數學、代碼全面對標GPT-4 Turbo。