一个开源的专家混合代码语言模型,在特定于代码的任务中取得了与 GPT4-Turbo 相当的性能。
16b 236b
395.3K Pulls 更新 2 个月前
2 个月前更新
2 个月前
bd60a2f7c8bc · 472GB
模型
架构deepseek2
·
参数236B
·
量化F16
472GB
参数
{"stop":["System:","User:","Assistant:","\u003c|begin_of_text|\u003e"]}
72B
模板
{{- if .Suffix }}<|fim_begin|>{{ .Prompt }}<|fim_hole|>{{ .Suffix }}<|fim_end|> {{- else }}{{ .Promp
115B
许可证
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2 是一个开源的专家混合 (MoE) 代码语言模型,在特定于代码的任务中取得了与 GPT4-Turbo 相当的性能。DeepSeek-Coder-V2 从 DeepSeek-Coder-V2-Base 进一步预训练,使用了来自高质量和多来源语料库的 6 万亿个词元。