更新于 2 个月前
2 个月前
6710a3c300fc · 167GB
模型
架构deepseek2
·
参数236B
·
量化Q5_K_M
167GB
参数
{"stop":["System:","User:","Assistant:","\u003c|begin_of_text|\u003e"]}
72B
模板
{{- if .Suffix }}<|fim_begin|>{{ .Prompt }}<|fim_hole|>{{ .Suffix }}<|fim_end|> {{- else }}{{ .Promp
115B
许可证
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2 是一个开源的混合专家 (MoE) 代码语言模型,在特定代码任务中的表现与 GPT4-Turbo 相当。DeepSeek-Coder-V2 是从 DeepSeek-Coder-V2-Base 预训练而来,使用了 6 万亿个来自高质量多源语料库的标记。