115.1K Pulls 更新于 10 个月前
更新于 10 个月前
10 个月前
bb9a71d66b29 · 3.5GB
OpenChat 是一个开源语言模型集合,使用 C-RLFT 微调:一种受离线强化学习启发的策略。
更新至 OpenChat-3.5-1210,这个新版本的模型在编码任务中表现出色,在许多开源 LLM 基准测试中得分很高。
GitHub
HuggingFace