DBRX是由Databricks创建的开放的通用大型语言模型。

132b

16.8K 7个月前

自述文件

DBRX 需要 Ollama 0.1.32

DBRX 是一个基于 Transformer 的仅解码器大型语言模型 (LLM),其训练使用的是下一个令牌预测方法。它采用细粒度的混合专家 (MoE) 架构,拥有总计 132B 个参数,其中任何输入上都有 36B 个参数处于活动状态。它在 12T 个文本和代码数据令牌上进行了预训练。

它是一个特别强大的代码模型,在编程方面超越了 CodeLLaMA-70B 等专用模型,此外它也作为通用 LLM 具有很强的实力。

参考文献

博客文章

HuggingFace