一个性能顶尖的专家混合模型,使用高质量数据进行微调。

8x7b

24.4K 14 个月前

自述文件

这个模型是 Mixtral 的微调版本,使用了高质量、精心策划的数据集。截至 2023 年 12 月 26 日,该模型是 Hugging Face Open LLM Leaderboard 上排名最高的 MoE(专家混合)模型。

参考文献

HuggingFace

Argilla