NVIDIA 的商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。
工具 4b
59.3K Pulls Updated 4 months ago
4 个月前更新
4 个月前
9e36e563dbdd · 3.1GB
模型
archnemotron
·
parameters4.19B
·
quantizationQ5_K_M
3.1GB
模板
{{- if (or .Tools .System) }}<extra_id_0>System {{ if .System }}{{ .System }} {{ end }} {{- if .To
773B
许可证
NVIDIA AI Foundation Models Community License Agreement IMPORTANT NOTICE – PLEASE READ AND AGREE B
15kB
自述文件
Nemotron-Mini-4B-Instruct 是一个用于为角色扮演、检索增强生成和函数调用生成响应的模型。它是一个小型语言模型 (SLM),通过蒸馏、剪枝和量化进行优化,以提高速度和实现设备端部署。
此 instruct 模型针对英语的角色扮演、RAG QA 和函数调用进行了优化。它支持 4,096 个 tokens 的上下文长度。此模型已准备好用于商业用途。