DBRX 是 Databricks 创建的开放式通用 LLM。

132b

16.3K 6 个月前

自述文件

DBRX 需要 Ollama 0.1.32

DBRX 是一种基于 transformer 的解码器专用大型语言模型 (LLM),它使用下一个令牌预测进行训练。它使用细粒度的专家混合 (MoE) 架构,共有 1320 亿个参数,其中 360 亿个参数在任何输入上都处于活动状态。它是在 12T 个文本和代码数据令牌上预训练的。

它是一款特别强大的代码模型,在编程方面超越了 CodeLLaMA-70B 等专门模型,此外它还是一款强大的通用 LLM。

参考资料

博客文章

HuggingFace