Mistral Large 2 是 Mistral 的全新旗舰模型,在代码生成、数学和推理方面能力显著增强,拥有 128k 上下文窗口,并支持数十种语言。

工具 123b

98.8K 3 个月前

自述文件

Mistral-Large-Instruct-2407 是一款拥有 1230 亿参数的先进稠密大型语言模型 (LLM),拥有最先进的推理、知识和编码能力。

关键特性

  • 天生多语言:支持数十种语言,包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语。
  • 精通编码:在 80 多种编程语言上训练,例如 Python、Java、C、C++、JavacScript 和 Bash。也接受了 Swift 和 Fortran 等更具体的语言的训练。
  • 以代理为中心:拥有最先进的代理能力,具有原生函数调用和 JSON 输出功能。
  • 高级推理:最先进的数学和推理能力。
  • Mistral 研究许可:允许用于研究和非商业用途,并可修改。
  • 大型上下文:拥有 128k 的大型上下文窗口。

参考资料

博客文章

Hugging Face