更新于 5 周前
5 周前
71cf19d4f87a · 6.8GB
模型
archqwen2
·
parameters3.4B
·
quantizationF16
6.8GB
系统
You are a helpful assistant.
28B
模板
{{- range $i, $_ := .Messages }} {{- $last := eq (len (slice $.Messages $i)) 1 -}} <|im_start|>{{ .R
255B
许可证
Qwen RESEARCH LICENSE AGREEMENT Qwen RESEARCH LICENSE AGREEMENT Release Date: September 19, 2024 B
7.4kB
自述文件
一个基于 Qwen2.5-3b-Instruct 模型微调的新模型。
SmallThinker 专为以下用例设计
- 边缘部署:其小尺寸使其成为在资源受限设备上部署的理想选择。
- 草稿模型,用于 QwQ-32B-Preview:SmallThinker 可以作为更大的 QwQ-32B-Preview 模型的快速高效草稿模型,从而实现 70% 的加速。
为了实现推理能力,生成长的 COT 推理链至关重要。因此,基于 QWQ-32B-Preview,作者使用了各种合成技术(例如 personahub)来创建 QWQ-LONGCOT-500K 数据集。与其他类似数据集相比,超过 75% 的作者样本的输出 tokens 超过 8K。为了鼓励开源社区的研究,该数据集也已公开提供。