最新
2.2GB q4_0 最新
2.2GB 25次拉取 5周前更新
6周前更新
6周前
20f273a9eec3 · 2.2GB
calibration_datav3.txt
此仓库包含Phi-3-mini-4K-instruct模型,通过CPO-SimPO技术增强。CPO-SimPO结合了对比偏好优化(CPO)和简单偏好优化(SimPO)。
Phi-3-mini-4K-instruct是一种适用于基于指令任务的模型。这种方法在关键基准测试中表现出显著的改进,推动了AI偏好学习的前沿。
CPO-SimPO是一种新技术,它结合了来自CPO和SimPO的元素。
即将推出!