一个性能优异的混合专家模型,使用高质量数据微调。

8x7b

22K 10 个月前

自述文件

该模型是 Mixtral 的微调版本,使用高质量的精选数据集进行训练。截至 2023 年 12 月 26 日,该模型在 Hugging Face 开放式 LLM 排行榜 上排名第一的 MoE(混合专家)模型。

参考资料

HuggingFace

Argilla