一个先进的 120 亿参数模型,具有 128k 上下文长度,由 Mistral AI 与 NVIDIA 合作构建。

工具 120亿参数

64.6万 4 个月前

自述文件

Mistral NeMo 是一个 120 亿参数模型,由 NVIDIA 合作构建。Mistral NeMo 提供了一个高达 128k 标记的大型上下文窗口。它的推理、世界知识和编码准确性在其规模类别中是最先进的。由于它依赖于标准架构,Mistral NeMo 易于使用,并且可以在任何使用 Mistral 7B 的系统中直接替换。

nemo-base-performance.png

参考

博客

Hugging Face