121.1K Pull请求 更新于 11个月前
11个月前更新
11个月前
cdab528998e3 · 3.8GB
OpenChat 是一套开源语言模型,使用 C-RLFT(一种受离线强化学习启发的策略)进行微调。
更新至 OpenChat-3.5-1210,这个新版本的模型在编码任务中表现出色,并在许多开源 LLM 基准测试中获得非常高的分数。
GitHub
HuggingFace