一个轻量级人工智能模型,拥有38亿参数,性能超越了同等规模甚至更大的模型。

3.8b

165K 2 个月前

自述文件

Phi-3.5-mini 是一个轻量级的、最先进的开放模型,基于用于 Phi-3 的数据集构建,这些数据集包括合成数据和经过过滤的公开网站,重点关注非常高质量的、推理密集的数据。

该模型属于 Phi-3 模型系列,支持 128K 个 token 的上下文长度。该模型经过严格的增强过程,结合了监督微调、近端策略优化和直接偏好优化,以确保精确的指令遵守和强大的安全措施。

长上下文

Phi-3.5-mini 支持 128K 的上下文长度,因此该模型能够执行多个长上下文任务,包括长文档/会议摘要、长文档问答、长文档信息检索。

参考文献

Hugging Face