一个强大的混合专家 (MoE) 语言模型,总参数量为 6710 亿,每个 token 激活 370 亿参数。

671b

159.4K 3 周前

5 个标签
5da0e2d4a9e0 • 404GB • 3 周前
5da0e2d4a9e0 • 404GB • 3 周前
7770bf5a5ed8 • 1.3TB • 3 周前
5da0e2d4a9e0 • 404GB • 3 周前
96061c74c1a5 • 713GB • 3 周前