🎩 Magicoder 是一个 7B 参数模型家族,使用 OSS-Instruct 在 75K 个合成指令数据上训练,OSS-Instruct 是一种新颖的方法,通过开源代码片段来启发 LLM。

7b

28.7K 11 个月前

自述文件

🎩

Magicoder 是一个由 OSS-Instruct 支持的模型家族,OSS-Instruct 是一种新颖的方法,通过开源代码片段来启发 LLM,以生成低偏差和高质量的代码指令数据。

OSS-Instruct 通过为 LLM 提供大量的开源参考来缓解 LLM 合成指令数据的内在偏差,从而产生更多样化、真实且可控的数据。

参考

GitHub

HuggingFace