MistralLite 是基于 Mistral 的微调模型,具有处理长上下文的能力增强。

7b

26.1K 12 个月前

自述文件

Mistrallite 是基于 Mistral 的微调模型,具有处理长上下文(最多 32K 个token)的能力增强。该模型能够在几个长上下文检索和回答任务上表现得更好。

参考资料

Hugging Face