一个开源的混合专家代码语言模型,在特定于代码的任务中实现了与 GPT4-Turbo 相当的性能。
16b 236b
395.3K 拉取请求 更新 2 个月前
2 个月前更新
2 个月前
94111aa16b14 · 11GB
模型
架构deepseek2
·
参数15.7B
·
量化Q5_K_S
11GB
模板
{{- if .Suffix }}<|fim begin|>{{ .Prompt }}<|fim hole|>{{ .Suffix }}<|fim end|> {{
133B
许可证
MIT 许可证 版权所有 (c) 2023 DeepSeek hereby granted, free of charge, to any perso
1.1kB
许可证
DEEPSEEK LICENSE AGREEMENT Version 1.0, 23 October 2023 Copyright (c) 2023 DeepSeek Section I: PR
14kB
自述文件
DeepSeek-Coder-V2 是一个开源的混合专家 (MoE) 代码语言模型,在特定于代码的任务中实现了与 GPT4-Turbo 相当的性能。DeepSeek-Coder-V2 进一步从 DeepSeek-Coder-V2-Base 预训练,使用了来自高质量和多源语料库的 6 万亿个标记。