🎩 Magicoder是一个包含70亿参数的模型家族,它使用7.5万个合成指令数据进行训练,这些数据采用OSS-Instruct方法生成,这是一种利用开源代码片段来改进大型语言模型的新方法。

7b

29.7K 12个月前

自述文件

🎩

Magicoder 是一个由 OSS-Instruct 支持的模型家族,OSS-Instruct 是一种利用开源代码片段改进大型语言模型的新方法,用于生成低偏差、高质量的代码指令数据。

OSS-Instruct 通过利用丰富的开源参考来增强大型语言模型,从而减轻大型语言模型合成指令数据固有的偏差,产生更多样化、更真实、更可控的数据。

参考

GitHub

HuggingFace