🎩 Magicoder 是一个 7B 参数模型系列,它使用 OSS-Instruct(一种利用开源代码片段启发 LLM 的新颖方法)在 75K 合成指令数据上进行训练,以生成低偏差和高质量的代码指令数据。

7b

31.3K 14 个月前

Readme

🎩

Magicoder 是一个模型家族,由 OSS-Instruct 驱动,OSS-Instruct 是一种利用开源代码片段启发 LLM 的新颖方法,用于生成低偏差和高质量的代码指令数据。

OSS-Instruct 通过利用丰富的开源参考来增强 LLM 合成指令数据,从而减轻了 LLM 合成指令数据的内在偏差,以生成更多样化、更真实和可控的数据。

参考

GitHub

HuggingFace