更新于 3周前
3周前
ac896e5b8b34 · 9.1GB
model
archphi3
·
parameters14.7B
·
quantizationQ4_K_M
9.1GB
params
{ "stop": [ "<|im_start|>", "<|im_end|>", "<|im_sep|>" ] }
82B
template
{{- range $i, $_ := .Messages }} {{- $last := eq (len (slice $.Messages $i)) 1 -}} <|im_start|>{{ .R
275B
license
Microsoft. Copyright (c) Microsoft Corporation. MIT License Permission is hereby granted, free of
1.1kB
Readme
Phi-4 是一个 140 亿参数的先进开源模型,它基于合成数据集、来自过滤后的公共领域网站的数据以及获得的学术书籍和问答数据集构建。
该模型经过了严格的增强和对齐过程,结合了监督微调和直接偏好优化,以确保精确的指令遵循和强大的安全措施。
上下文长度: 16k tokens
主要用例
该模型旨在加速语言模型的研究,用作生成式人工智能驱动功能的构建块。它为通用人工智能系统和应用(主要为英语)提供用途,这些系统和应用需要
- 内存/计算受限的环境。
- 延迟受限的场景。
- 推理和逻辑。
超出范围的用例
这些模型并非专门为所有下游目的而设计或评估,因此
- 开发者在选择用例时应考虑语言模型的常见限制,并在特定下游用例(尤其是高风险场景)中使用之前,评估和减轻准确性、安全性和公平性。
- 开发者应了解并遵守适用于其用例的相关法律或法规(包括隐私、贸易合规法律等),包括模型对英语的关注。
- 本自述文件中包含的任何内容均不应被解释或视为对模型发布所依据的许可的限制或修改。