由 Mistral AI 与 NVIDIA 合作打造的 12B 最先进模型,上下文长度为 128k。

工具 12b

488.2K 3 个月前

自述文件

Mistral NeMo 是一个由 Mistral AI 与 NVIDIA 合作打造的 12B 模型。 Mistral NeMo 提供高达 128k 个 token 的大上下文窗口。 它的推理能力、世界知识和代码准确性在同等规模的模型中处于领先水平。 由于它依赖于标准架构,因此 Mistral NeMo 易于使用,并且可以轻松地替代任何使用 Mistral 7B 的系统。

nemo-base-performance.png

参考

博客

Hugging Face