Mistral AI与NVIDIA合作开发的最先进的12B参数模型,上下文长度达128k。

工具 12b

646K 4个月前

自述文件

Mistral NeMo是由Mistral AI与NVIDIA合作开发的12B参数模型。Mistral NeMo具有高达128k token 的大上下文窗口。在同等规模的模型中,其推理能力、世界知识和编码准确性均处于最先进水平。由于它基于标准架构,Mistral NeMo易于使用,并且可以作为任何使用Mistral 7B的系统的直接替代品。

nemo-base-performance.png

参考

博客

Hugging Face