DBRX是由Databricks创建的开放的通用大型语言模型(LLM)。

132b

16.8K 7个月前

自述文件

DBRX需要Ollama 0.1.32

DBRX是一个基于Transformer的仅解码器大型语言模型(LLM),它是使用下一个token预测进行训练的。它使用细粒度的专家混合(MoE)架构,共有132B个参数,其中任何输入上都有36B个参数处于活动状态。它是在12T个文本和代码数据token上进行预训练的。

它是一个特别强大的代码模型,在编程方面超越了CodeLLaMA-70B等专业模型,此外它还是一个通用的LLM。

参考文献

博客文章

HuggingFace