🎩 Magicoder是一个包含70亿参数的模型家族,使用7.5万条合成指令数据进行训练,这些数据利用OSS-Instruct生成,OSS-Instruct是一种利用开源代码片段来改进大型语言模型的新方法。
7b
29.7K 拉取 更新于 12个月前
自述文件
🎩
Magicoder是一个由OSS-Instruct赋能的模型家族,OSS-Instruct是一种利用开源代码片段来改进大型语言模型的新方法,用于生成低偏差、高质量的代码指令数据。
OSS-Instruct通过为大型语言模型提供丰富的开源参考,减轻了LLM合成指令数据固有的偏差,从而产生更多样化、更真实、更可控的数据。