Qwen2 是阿里巴巴集团推出的一系列全新的大型语言模型

工具 0.5b 1.5b 7b 72b

3.9M 8 周前

自述文件

Qwen229 种语言 的数据上训练,包括 英语和中文

它提供 4 种参数大小:0.5B1.5B7B72B

在 7B 和 72B 模型中,上下文长度已扩展到 128k 个标记

模型 Qwen2-0.5B Qwen2-1.5B Qwen2-7B Qwen2-72B
参数 0.49B 1.54B 7.07B 72.71B
非嵌入参数 0.35B 1.31B 5.98B 70.21B
GQA
绑定嵌入
上下文长度 32K 32K 128K 128K

支持的语言

这是除了英语和中文之外的

地区 语言
西欧 德语、法语、西班牙语、葡萄牙语、意大利语、荷兰语
东欧和中欧 俄语、捷克语、波兰语
中东 阿拉伯语、波斯语、希伯来语、土耳其语
东亚 日语、韩语
东南亚 越南语、泰语、印尼语、马来语、老挝语、缅甸语、宿务语、高棉语、菲律宾语
南亚 印地语、孟加拉语、乌尔都语

性能

image.png

image.png

image.png

image.png

许可证

除了 Qwen2 72B(指令模型和基础模型)之外的所有模型都采用 Apache 2.0 许可证。

Qwen2 72B 模型仍使用原始的 Qianwen 许可证。