Qwen2 是阿里巴巴集团新推出的大型语言模型系列

tools 0.5b 1.5b 7b 72b

4.1M 4 months ago

Readme

Qwen2 使用 29 种语言的数据进行训练,包括英语和中文

它提供 4 种参数尺寸:0.5B1.5B7B72B

在 7B 和 72B 模型中,上下文长度已扩展至 128k tokens

Models Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-72B
Params 0.49B 1.54B 7.07B 72.71B
Non-Emb Params 0.35B 1.31B 5.98B 70.21B
GQA True True True True
Tie Embedding True True False False
Context Length 32K 32K 128K 128K

Supported languages

这是对英语和中文的补充

Regions Languages
Western Europe 德语、法语、西班牙语、葡萄牙语、意大利语、荷兰语
Eastern & Central Europe 俄语、捷克语、波兰语
Middle East 阿拉伯语、波斯语、希伯来语、土耳其语
Eastern Asia 日语、韩语
South-Eastern Asia 越南语、泰语、印尼语、马来语、老挝语、缅甸语、宿务语、高棉语、他加禄语
Southern Asia 印地语、孟加拉语、乌尔都语

Performance

image.png

image.png

image.png

image.png

License

除 Qwen2 72B(instruct 和 base 模型)之外的所有模型均已获得 Apache 2.0 许可。

Qwen2 72B 模型仍然使用原始的 Qianwen 许可证。