MistralLite 是基于 Mistral 的一个微调模型,具有处理长上下文的能力。

7b

26.1K 12 个月前

自述文件

Mistrallite 是基于 Mistral 的一个微调模型,具有处理长上下文(最多 32K 个 token)的能力。该模型能够在多个长上下文检索和回答任务中取得显著更好的性能。

参考

Hugging Face