DeepSeek-V2 的升级版本,它集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。
236b
8,681 拉取请求 更新于 8 周前
更新于 8 周前
8 周前
409b2dd8a3c4 · 133GB
模型
架构deepseek2
·
参数236B
·
量化Q4_0
133GB
参数
{"stop":["\u003c|begin of sentence|\u003e","\u003c|end of sentence|\u003e","\u003c�
241B
模板
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
493B
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-V2.5 是一个升级版本,它结合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。新模型集成了两个先前版本的通用和编码能力。
DeepSeek-V2.5 更好地符合人类偏好,并在写作和指令遵循等各个方面进行了优化。
指标 | DeepSeek-V2-0628 | DeepSeek-Coder-V2-0724 | DeepSeek-V2.5 |
---|---|---|---|
AlpacaEval 2.0 | 46.6 | 44.5 | 50.5 |
ArenaHard | 68.3 | 66.3 | 76.2 |
AlignBench | 7.88 | 7.91 | 8.04 |
MT-Bench | 8.85 | 8.91 | 9.02 |
HumanEval python | 84.5 | 87.2 | 89 |
HumanEval Multi | 73.8 | 74.8 | 73.8 |
LiveCodeBench(01-09) | 36.6 | 39.7 | 41.8 |
Aider | 69.9 | 72.9 | 72.2 |
SWE-verified | N/A | 19 | 16.8 |
DS-FIM-Eval | N/A | 73.2 | 78.3 |
DS-Arena-Code | N/A | 49.5 | 63.1 |