一个开源的混合专家模型代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。
16b 236b
536.5K 下载量 更新时间 5 个月前
更新时间 5 个月前
5 个月前
4e723bdb7e50 · 167GB
模型
archdeepseek2
·
parameters236B
·
quantizationQ5_K_M
167GB
参数
{ "stop": [ "User:", "Assistant:" ] }
32B
模板
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
705B
许可
MIT License Copyright (c) 2023 DeepSeek Permission is hereby granted, free of charge, to any perso
1.1kB
许可
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
介绍
DeepSeek-Coder-V2 是一个开源的混合专家 (MoE) 代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。DeepSeek-Coder-V2 还在 DeepSeek-Coder-V2-Base 的基础上,使用来自高质量和多来源语料库的 6 万亿 tokens 进行了进一步的预训练。