在第3次迭代中,通过自我播放偏好优化进行语言模型对齐的Meta Llama-3-8b

8B

168 拉取 更新于7周前

21 标签
379b5e986817 • 4.7GB • 更新于7周前
q4_0
最新
379b5e986817 • 4.7GB • 更新于7周前
da9defb0d385 • 2.8GB • 更新于7周前
ccadd7fcd444 • 2.6GB • 更新于7周前
2a7f26fe46c1 • 3.7GB • 更新于7周前
82887c324edf • 3.3GB • 更新于7周前
deb49f988d37 • 4.7GB • 更新于7周前
569035230314 • 4.4GB • 更新于7周前
3c5baed8baf1 • 3.2GB • 更新于7周前
1f3635d3f96e • 3.7GB • 更新于7周前
99627e2857dd • 4.0GB • 更新于7周前
9d89820e7b63 • 4.3GB • 更新于7周前
82e35a0bdb00 • 5.1GB • 更新于7周前
f3e3f7c1c201 • 4.7GB • 更新于7周前
9e303f62e401 • 4.9GB • 更新于7周前
da0dc2fa0a46 • 5.6GB • 更新于7周前
146dcb9df8ab • 6.1GB • 更新于7周前
0d5792850346 • 5.6GB • 更新于7周前
161e2a16f8aa • 5.7GB • 更新于7周前
b19229efd5a9 • 6.6GB • 更新于7周前
4b2f19a50676 • 8.5GB • 更新于7周前