🎩 Magicoder 是一个包含 70 亿参数的模型系列,它使用 OSS-Instruct 在 7.5 万个合成指令数据上进行训练。OSS-Instruct 是一种新颖的方法,它利用开源代码片段来提升大型语言模型的能力。

7b

29.7K 12个月前

自述文件

🎩

Magicoder 是一个由 OSS-Instruct 赋能的模型系列,OSS-Instruct 是一种新颖的方法,它利用开源代码片段来生成低偏差、高质量的代码指令数据。

OSS-Instruct 通过提供丰富的开源参考来缓解大型语言模型合成指令数据固有的偏差问题,从而生成更多样化、更真实、更可控的数据。

参考资料

GitHub

HuggingFace