来自 Groq 的一系列模型,代表了用于工具使用/函数调用的开源 AI 功能的重大进步。

工具 8b 70b

56.2K 7 个月前

自述文件

这些模型与 Glaive 合作开发,代表了用于工具使用/函数调用的开源 AI 功能的重大进步。

基准测试结果

这些模型取得了显著的成果,为具有工具使用功能的大型语言模型树立了新的基准

  • Llama-3-Groq-70B-Tool-Use:总体准确率 90.76%(发布时(2024 年 7 月)BFCL 排名第一)
  • Llama-3-Groq-8B-Tool-Use:总体准确率 89.06%(发布时(2024 年 7 月)BFCL 排名第三)

参考文献

Hugging Face

博客