MistralLite 是基于 Mistral 的微调模型,具有处理长上下文的增强功能。

7b

26.1K 12 个月前

自述文件

Mistrallite 是基于 Mistral 的微调模型,具有处理长上下文(高达 32K 个 token)的增强功能。该模型能够在几个长上下文检索和问答任务中显著提升性能。

参考

Hugging Face