Groq 提供的一系列模型,代表了开源 AI 在工具使用/函数调用能力方面的重大进步。

tools 8b 70b

46.9K 6 个月前

Readme

这些模型是与 Glaive 合作开发的,代表了开源 AI 在工具使用/函数调用能力方面的重大进步。

Benchmark Results

这些模型取得了显著的成果,为具有工具使用能力的大型语言模型设定了新的基准

  • Llama-3-Groq-70B-Tool-Use:总体准确率 90.76%(在发布时(2024 年 7 月)在 BFCL 上排名第一)
  • Llama-3-Groq-8B-Tool-Use:总体准确率 89.06%(在发布时(2024 年 7 月)在 BFCL 上排名第三)

References

Hugging Face

Blog