自述文件
StarCoder2支持高达16,384个tokens的上下文窗口,是下一代透明训练的开源代码LLM。
starcoder2:instruct
:一个遵循自然和人为编写的指令的15B模型starcoder2:15b
在600多种编程语言和4+万亿个tokens上进行了训练。starcoder2:7b
在17种编程语言和3.5+万亿个tokens上进行了训练。starcoder2:3b
在17种编程语言和3+万亿个tokens上进行了训练。
StarCoder2-15B是同尺寸级别中最好的模型,并在许多评估中与33B+模型相匹配。StarCoder2-3B的性能与StarCoder1-15B相匹配。