更新于 2 个月前
2 个月前
9c62a2e770b7 · 35 GB
模型
架构qwen2
·
参数32.8B
·
量化Q8_0
35GB
参数
{ "stop": [ "<|im_start|>", "<|im_end|>" ] }
59B
系统
你是一个乐于助人且无害的助手。 你是由阿里巴巴开发的 Qwen。 你应该逐步思考
107B
模板
{{- if or .System .Tools }}<|im_start|>system {{- if .System }} {{ .System }} {{- end }} {{- if .Too
1.2kB
许可
Apache 许可证 2.0 版,2004 年 1 月
11kB
自述文件
QwQ 是一个由 Qwen 团队开发的 320 亿参数实验性研究模型,专注于提升人工智能推理能力。
QwQ 在这些基准测试中展现了卓越的性能
- GPQA 上达到 65.2%,展示了其研究生水平的科学推理能力
- AIME 上达到 50.0%,突显了其强大的数学问题解决能力
- MATH-500 上达到 90.6%,展示了在不同主题中出色的数学理解能力
- LiveCodeBench 上达到 50.0%,验证了其在真实场景中强大的编程能力。
这些结果强调了 QwQ 在分析和问题解决能力方面的显著进步,尤其是在需要深入推理的技术领域。
作为一个预览版本,它展示了有希望的分析能力,但也存在一些重要的局限性
语言混合和代码切换:模型可能会混合语言或意外地在语言之间切换,从而影响响应的清晰度。
递归推理循环:模型可能会进入循环推理模式,导致冗长的响应而没有结论性的答案。
安全和伦理考量:该模型需要加强安全措施以确保可靠和安全的性能,用户在部署时应谨慎。
性能和基准测试局限性:该模型在数学和编程方面表现出色,但在其他领域仍有改进空间,例如常识推理和细致的语言理解。