Groq推出的一系列模型,代表了开源人工智能在工具使用/函数调用方面的重大进步。

工具 8b 70b

39.4K 4个月前

自述文件

这些模型是与 Glaive 合作开发的,代表了开源人工智能在工具使用/函数调用方面的重大进步。

基准测试结果

这些模型取得了显著的成果,为具有工具使用能力的大型语言模型设定了新的基准。

  • Llama-3-Groq-70B-Tool-Use: 90.76% 的总体准确率(截至发布时在 BFCL 上排名第一 - 2024 年 7 月)
  • Llama-3-Groq-8B-Tool-Use: 89.06% 的总体准确率(截至发布时在 BFCL 上排名第三 - 2024 年 7 月)

参考文献

Hugging Face

博客