Mistral Large 2 是 Mistral 全新的旗舰模型,在代码生成、数学和推理方面能力显著提升,拥有 128k 上下文窗口并支持数十种语言。

工具 123b

119K 2 个月前

自述文件

Mistral-Large-Instruct-2411 是一个先进的密集型大型语言模型 (LLM),拥有 1230 亿参数,具备最先进的推理、知识和编码能力。

主要特点

  • 多语言设计:支持数十种语言,包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语。
  • 精通编码:使用 80 多种编码语言进行训练,例如 Python、Java、C、C++、JavaScript 和 Bash。还使用更专业的语言进行训练,例如 Swift 和 Fortran。
  • 以 Agent 为中心:一流的 Agent 能力,具有原生函数调用和 JSON 输出。
  • 高级推理:最先进的数学和推理能力。
  • Mistral 研究许可:允许为研究和非商业用途使用和修改。
  • 大上下文:128k 的大上下文窗口。

参考

博客文章

Hugging Face