最新
2.2GB q4_0 最新
2.2GB 25 Pulls 更新于6周前
6周前更新
6周前
281460f31cc0 · 4.1GB
calibration_datav3.txt
进行量化本存储库包含增强CPO-SimPO技术的Phi-3-mini-4K-instruct模型。CPO-SimPO结合了对比偏好优化(CPO)和简单偏好优化(SimPO)。
Phi-3-mini-4K-instruct是一种针对指令任务优化的模型。这种方法在关键基准测试中表现出显著改进,推动了AI偏好学习的发展边界。
CPO-SimPO是一项新技术,它结合了CPO和SimPO的元素。
即将推出!