一个开源的专家混合(Mixture-of-Experts)代码语言模型,其在特定代码任务中的性能可与GPT4-Turbo媲美。
16b 236b
423.5K 拉取请求 更新于 3个月前
更新于3个月前
3个月前
eea8c1bb07d9 · 9.5GB
模型
架构deepseek2
·
参数15.7B
·
量化Q4_K_S
9.5GB
模板
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
133B
许可证
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2是一个开源的专家混合(MoE)代码语言模型,其在特定代码任务中的性能可与GPT4-Turbo媲美。DeepSeek-Coder-V2在DeepSeek-Coder-V2-Base的基础上进行了进一步的预训练,使用了来自高质量多源语料库的6万亿个token。