🎩 Magicoder 是一个 70 亿参数模型系列,训练于 75,000 个合成指令数据,使用 OSS-Instruct,一种通过开源代码片段启发 LLM 的新方法。

7b

28.7K 11 个月前

自述文件

🎩

Magicoder 是一个由 OSS-Instruct 支持的模型系列,OSS-Instruct 是一种通过开源代码片段启发 LLM 的新方法,用于生成低偏差和高质量的代码指令数据。

OSS-Instruct 通过利用大量开源参考资料来增强 LLM 合成的指令数据,从而缓解了 LLM 合成指令数据固有的偏差,产生更多样化、现实和可控的数据。

参考资料

GitHub

HuggingFace