DBRX 是一个由 Databricks 创建的开放式通用 LLM。

132b

16.3K 6 个月前

自述文件

DBRX 需要 Ollama 0.1.32

DBRX 是一种基于 Transformer 的仅解码器大型语言模型 (LLM),使用下一个词预测训练。它使用细粒度的专家混合 (MoE) 架构,总参数为 132B,其中 36B 参数在任何输入上都是活动的。它是在 12T 个文本和代码数据标记上预训练的。

它是一个特别强大的代码模型,在编程方面超越了 CodeLLaMA-70B 等专业模型,除了作为通用 LLM 的优势之外。

参考文献

博客文章

HuggingFace