5 个月前更新
5 个月前
1993d079c16b · 44GB
模型
架构qwen2
·
参数72.7B
·
量化Q4_K_S
44GB
许可证
Tongyi Qianwen 许可协议 Tongyi Qianwen 发布日期:2023 年 8 月 3 日 点击同意
6.9kB
自述文件
Qwen2 在29 种语言的数据上训练,包括英语和中文。
它有 4 种参数大小:0.5B、1.5B、7B、72B。
在 7B 和 72B 模型中,上下文长度已扩展至128k 个token。
模型 | Qwen2-0.5B | Qwen2-1.5B | Qwen2-7B | Qwen2-72B |
---|---|---|---|---|
参数 | 0.49B | 1.54B | 7.07B | 72.71B |
非嵌入参数 | 0.35B | 1.31B | 5.98B | 70.21B |
GQA | True | True | True | True |
绑定嵌入 | True | True | False | False |
上下文长度 | 32K | 32K | 128K | 128K |
支持的语言
除此之外还有英语和中文
地区 | 语言 |
---|---|
西欧 | 德语、法语、西班牙语、葡萄牙语、意大利语、荷兰语 |
东欧和中欧 | 俄语、捷克语、波兰语 |
中东 | 阿拉伯语、波斯语、希伯来语、土耳其语 |
东亚 | 日语、韩语 |
东南亚 | 越南语、泰语、印尼语、马来语、老挝语、缅甸语、宿务语、高棉语、他加禄语 |
南亚 | 印地语、孟加拉语、乌尔都语 |
性能
许可证
除 Qwen2 72B(指令模型和基础模型)之外的所有模型均采用 Apache 2.0 许可证。
Qwen2 72B 模型仍然使用原始的 Qianwen 许可证。