由 NVIDIA 提供的商业友好型小型语言模型,针对角色扮演、RAG 问答和函数调用进行了优化。

工具 4b

34.2K 7 周前

自述文件

Nemotron-Mini-4B-Instruct 是一个用于生成角色扮演、检索增强生成和函数调用的响应的模型。它是一个小型语言模型(SLM),通过蒸馏、剪枝和量化进行了优化,以提高速度和设备上的部署能力。

此指令模型针对英语中的角色扮演、RAG 问答和函数调用进行了优化。它支持 4,096 个标记的上下文长度。此模型已准备好进行商业使用。

参考

博客

HuggingFace