nemotron-mini:4b-instruct-q8_0 - Ollama 框架

nemotron-mini

NVIDIA 的商业友好型小型语言模型，针对角色扮演、检索增强生成问答和函数调用进行了优化。

工具 4b

59.3K 拉取次数更新于 4 个月前

更新于 4 个月前

4 个月前

fe86a4d04f9f · 4.5GB

{{- if (or .Tools .System) }}<extra_id_0>System {{ if .System }}{{ .System }} {{ end }} {{- if .To

NVIDIA AI Foundation Models Community License Agreement IMPORTANT NOTICE – PLEASE READ AND AGREE B

说明

Nemotron-Mini-4B-Instruct 是一个用于为角色扮演、检索增强生成和函数调用生成响应的模型。它是一个通过蒸馏、剪枝和量化优化的小型语言模型 (SLM)，旨在提高速度和实现设备端部署。

此指令模型针对英语的角色扮演、检索增强生成问答和函数调用进行了优化。它支持 4,096 个 token 的上下文长度。此模型已准备好用于商业用途。

参考