7天前更新
7天前
46407beda5c0 · 20GB
模型
架构qwen2
·
参数32.8B
·
量化Q4_K_M
20GB
参数
{ "stop": [ "<|im_start|>", "<|im_end|>" ] }
59B
系统
你是一个乐于助人且无害的助手。你由阿里巴巴开发的Qwen。你应该逐步思考
107B
模板
{{- if or .System .Tools }}<|im_start|>system {{- if .System }} {{ .System }} {{- end }} {{- if .Too
1.2kB
许可证
Apache License Version 2.0, January 2004
11kB
自述文件
QwQ是由Qwen团队开发的一个拥有320亿参数的实验性研究模型,专注于推进AI推理能力。
QwQ在这些基准测试中展现了卓越的性能
- **在GPQA上取得65.2%的成绩**,展现了其研究生级别的科学推理能力
- **在AIME上取得50.0%的成绩**,突显了其强大的数学问题解决能力
- **在MATH-500上取得90.6%的成绩**,展现了其在不同数学主题上的出色理解能力
- **在LiveCodeBench上取得50.0%的成绩**,验证了其在现实场景中强大的编程能力。
这些结果突显了QwQ在分析和问题解决能力方面的显著进步,尤其是在需要深度推理的技术领域。
作为预览版本,它展现了很有前景的分析能力,但也存在一些重要的局限性
**语言混合和代码切换:** 模型可能会意外地混合语言或在语言之间切换,影响响应的清晰度。
**递归推理循环:** 模型可能会进入循环推理模式,导致冗长的响应而没有结论性的答案。
**安全性和伦理考虑:** 模型需要增强的安全措施以确保可靠和安全的性能,用户在部署时应谨慎。
**性能和基准测试的局限性:** 模型在数学和编码方面表现出色,但在其他方面,例如常识推理和细微的语言理解方面仍有改进空间。