CodeQwen1.5 是一个基于大量代码数据预训练的大型语言模型。

7b

126.4K 7 months ago

自述文件

CodeQwen1.5 基于 Qwen1.5。它使用 3 万亿个代码 tokens 数据进行训练。其主要功能包括

  • 强大的代码生成能力和在一系列基准测试中具有竞争力的性能
  • 支持长上下文理解和生成,最大上下文长度为 64K tokens
  • 支持 92 种编程语言
  • 在 Text-to-SQL、修复错误和其他编码用例中表现出色。

参考

博客文章

GitHub

HuggingFace