巖芯數智發佈自研大模型

1月24日,巖芯數智正式發佈自研大模型“Yan模型”。Yan模型採用非Transformer架構,爲非Attention機制的通用自然語言大模型。據瞭解,該大模型有相較於同等參數Transformer的7倍訓練效率、5倍推理吞吐和3倍記憶能力。