🎩 Magicoder 是一个由 75K 个合成指令数据训练的 7B 参数模型家族,使用 OSS-Instruct,一种用开源代码片段启发 LLM 的新方法。

7b

28.7K 11 个月前

自述文件

🎩

Magicoder 是一个由 OSS-Instruct 支持的模型家族,OSS-Instruct 是一种利用开源代码片段来启发 LLM 的新方法,用于生成低偏差、高质量的代码指令数据。

OSS-Instruct 通过为 LLM 提供丰富的开源参考,从而减轻了 LLM 合成指令数据的固有偏差,从而生成更加多样化、现实和可控的数据。

参考文献

GitHub

HuggingFace