26.1K 拉取请求 更新时间 12 个月前
更新时间 12 个月前
12 个月前
ebf457323d7d · 3.2GB
Mistrallite 是基于 Mistral 的微调模型,具有处理长上下文(最多 32K 个token)的能力增强。该模型能够在几个长上下文检索和回答任务上表现得更好。
Hugging Face