一个由 Mistral AI 与 NVIDIA 合作构建的 12B 模型,拥有 128k 上下文长度,在同等规模的模型中,其推理能力、世界知识和代码准确率都处于领先地位。由于它依赖于标准架构,因此 Mistral NeMo 易于使用,可以作为任何使用 Mistral 7B 的系统的直接替代品。

工具 12b

488.4K 3 个月前

自述文件

Mistral NeMo 是一个由 Mistral AI 与 NVIDIA 合作构建的 12B 模型。Mistral NeMo 提供高达 128k 个标记的大上下文窗口。在同等规模的模型中,其推理能力、世界知识和代码准确率都处于领先地位。由于它依赖于标准架构,因此 Mistral NeMo 易于使用,可以作为任何使用 Mistral 7B 的系统的直接替代品。

nemo-base-performance.png

参考

博客

Hugging Face