一个最先进的12B参数模型,拥有128k上下文长度,由Mistral AI与NVIDIA合作开发。

工具 12b

646K 4个月前

自述文件

Mistral NeMo 是一个由 Mistral AI 与 NVIDIA 合作开发的 12B 参数模型。Mistral NeMo 提供高达 128k token 的大上下文窗口。其推理能力、世界知识和编码准确性在其规模类别中处于最先进水平。由于它依赖于标准架构,Mistral NeMo 易于使用,并且可以作为任何使用 Mistral 7B 的系统的直接替代品。

nemo-base-performance.png

参考

博客

Hugging Face