nemotron-mini:4b-instruct-q2_K - Ollama 框架

nemotron-mini

NVIDIA 商业友好的小型语言模型，针对角色扮演、RAG QA 和函数调用进行了优化。

工具 4b

59.3K 下载量更新时间 4 months ago

4 个月前更新

4 个月前

71c1aed58cc4 · 1.9GB

{{- if (or .Tools .System) }}<extra_id_0>System {{ if .System }}{{ .System }} {{ end }} {{- if .To

NVIDIA AI 基础模型社区许可协议重要提示 – 请阅读并同意 B

自述文件

Nemotron-Mini-4B-Instruct 是一个用于生成角色扮演、检索增强生成和函数调用响应的模型。它是一个小型语言模型 (SLM)，通过蒸馏、剪枝和量化进行优化，以提高速度和实现设备端部署。

此 instruct 模型针对英语的角色扮演、RAG QA 和函数调用进行了优化。它支持 4,096 个 tokens 的上下文长度。此模型已准备好用于商业用途。

参考资料