一个开源的混合专家模型代码语言模型,在代码特定任务中性能可与 GPT4-Turbo 相媲美。
16b 236b
536.5K 下载量 更新于 5 个月前
更新于 5 个月前
5 个月前
eea8c1bb07d9 · 9.5GB
模型
archdeepseek2
·
parameters15.7B
·
quantizationQ4_K_S
9.5GB
template
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
133B
许可证
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
Readme
DeepSeek-Coder-V2 是一个开源的混合专家 (MoE) 代码语言模型,在代码特定任务中,其性能可与 GPT4-Turbo 相媲美。DeepSeek-Coder-V2 基于 DeepSeek-Coder-V2-Base 进一步预训练,使用了来自高质量和多来源语料库的 6 万亿个 tokens。