latest
2.2GB q4_0 latest
2.2GB 25 Pulls Updated 6 weeks ago
更新于6周前
6周前
fc4faf44578a · 1.7GB
calibration_datav3.txt
进行量化此存储库包含增强 CPO-SimPO 技术的 Phi-3-mini-4K-instruct 模型。CPO-SimPO 结合了对比偏好优化 (CPO) 和简单偏好优化 (SimPO)。
Phi-3-mini-4K-instruct 是一种适用于指令任务的模型。这种方法在关键基准测试中表现出显著的改进,推动了 AI 偏好学习的新边界。
CPO-SimPO是一种新技术,它结合了CPO和SimPO的元素。
即将推出!