🎩 Magicoder是一个包含70亿参数的模型家族,它使用7.5万个合成指令数据进行训练,使用了OSS-Instruct,这是一种利用开源代码片段来提升大型语言模型能力的新方法。

70亿参数 (7b)

29.7K 12个月前 (12 months ago)

自述文件 (Readme)

🎩

Magicoder是一个由OSS-Instruct赋能的模型家族,OSS-Instruct是一种利用开源代码片段来生成低偏差、高质量指令数据的新方法,用于代码生成。

OSS-Instruct通过提供大量的开源参考,减轻了大型语言模型合成指令数据固有的偏差,从而产生更多样化、更真实和更可控的数据。

参考 (References)

GitHub

HuggingFace