115.1K 拉取 更新于 10 个月前
更新于 10 个月前
10 个月前
95a82d202137 · 5.9GB
OpenChat 是一套开源语言模型,使用 C-RLFT 微调,该策略借鉴了离线强化学习。
更新至 OpenChat-3.5-1210,这个新版本的模型在编码任务方面表现出色,并且在许多开源 LLM 基准测试中得分很高。
GitHub
HuggingFace