一个开源的混合专家模型代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。
16b 236b
536.5K Pulls Updated 5 months ago
Updated 5 months ago
5 months ago
2432b4ab9079 · 113GB
model
archdeepseek2
·
parameters236B
·
quantizationQ3_K_M
113GB
params
{ "stop": [ "User:", "Assistant:" ] }
32B
template
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
705B
license
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
license
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
Readme
DeepSeek-Coder-V2 是一个开源的混合专家模型 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。 DeepSeek-Coder-V2 是从 DeepSeek-Coder-V2-Base 进一步预训练而来,使用了来自高质量和多来源语料库的 6 万亿个 tokens。