🎩 Magicoder是一个包含70亿参数的模型家族,它使用7.5万个合成指令数据进行训练,这些数据是通过OSS-Instruct生成的。OSS-Instruct是一种新方法,它利用开源代码片段来提升大型语言模型的能力。

70亿参数

29.7K 12个月前

自述文件

🎩

Magicoder是一个由OSS-Instruct支持的模型家族,OSS-Instruct是一种新方法,它利用开源代码片段来生成低偏差、高质量的代码指令数据,从而增强大型语言模型的能力。

OSS-Instruct通过提供丰富的开源参考资源,减轻了大型语言模型合成指令数据中固有的偏差,从而生成更多样化、更真实、更可控的数据。

参考

GitHub

HuggingFace