dbrx:instruct

DBRX 需要 Ollama 0.1.32 版本

DBRX 是一个基于 Transformer 的仅解码器大型语言模型 (LLM)，它使用下一个 token 预测进行训练。它使用细粒度的混合专家 (MoE) 架构，总共有 1320 亿个参数，其中 360 亿个参数在任何输入上都是活跃的。它在 12T tokens 的文本和代码数据上进行了预训练。

除了作为通用 LLM 的优势外，它还是一个功能特别强大的代码模型，在编程方面超越了像 CodeLLaMA-70B 这样的专用模型。

参考