Phi-4 是来自 Microsoft 的最先进的 140 亿参数开源模型。

14b

100 万 2 个月前

自述文件

Phi-4 是一个 140 亿参数的、最先进的开源模型,它建立在合成数据集、来自经过滤的公共领域网站的数据以及获得的学术书籍和问答数据集的混合之上。

Phi-4 benchmark

该模型经过了严格的增强和对齐过程,结合了监督式微调和直接偏好优化,以确保精确的指令遵循和强大的安全措施。

上下文长度: 16k 个 token

Phi-4 performance eval by Microsoft

主要用例

该模型旨在加速对语言模型的研究,用作生成式人工智能驱动功能的构建块。它为通用人工智能系统和应用程序(主要以英语)提供用途,这些系统和应用程序需要

  1. 内存/计算受限的环境。
  2. 延迟受限的场景。
  3. 推理和逻辑。

超出范围的用例

这些模型并非专门为所有下游目的而设计或评估,因此

  1. 开发人员在选择用例时应考虑语言模型的常见限制,并在特定下游用例中使用之前评估和减轻准确性、安全性和公平性,尤其是在高风险场景中。
  2. 开发人员应了解并遵守适用于其用例的适用法律或法规(包括隐私、贸易合规法律等),包括该模型对英语的关注。
  3. 本自述文件中包含的任何内容均不应被解释为或视为对模型发布所依据的许可的限制或修改。