Phi-4 是微软开发的 140 亿参数的、最先进的开源模型。

14b

31.04万 3 周前

自述文件

Phi-4 是一个 140 亿参数的、最先进的开源模型,它建立在合成数据集、来自过滤后的公共领域网站的数据以及获取的学术书籍和问答数据集的混合之上。

Phi-4 benchmark

该模型经过了严格的增强和对齐过程,结合了监督微调和直接偏好优化,以确保精确的指令遵循和强大的安全措施。

上下文长度:16k tokens

Phi-4 performance eval by Microsoft

主要用例

该模型旨在加速语言模型的研究,用作生成式人工智能驱动功能的构建模块。它为通用人工智能系统和应用程序(主要为英语)提供用途,这些系统和应用程序需要

  1. 内存/计算受限的环境。
  2. 延迟受限的场景。
  3. 推理和逻辑。

超出范围的用例

这些模型并非专门为所有下游目的而设计或评估,因此

  1. 开发人员在选择用例时应考虑语言模型的常见限制,并在特定下游用例(特别是高风险场景)中使用之前评估和减轻准确性、安全性及公平性。
  2. 开发人员应了解并遵守适用于其用例的相关法律或法规(包括隐私、贸易合规法律等),包括该模型对英语的侧重。
  3. 本自述文件中包含的任何内容均不应被解释或视为对模型发布所依据的许可证的限制或修改。