MistralLite 是一个基于 Mistral 的微调模型,具有增强的长上下文处理能力。

7b

27.1K 13个月前

自述文件

Mistrallite 是一个基于 Mistral 的微调模型,具有增强的长上下文处理能力(最多 32K 个 token)。该模型在几个长上下文检索和回答任务上能够表现得更好。

参考

Hugging Face