一系列来自 Groq 的模型,代表着开源 AI 在工具使用/函数调用能力方面的一项重大进步。

工具 8b 70b

39.4K 4个月前

自述文件

这些模型是与Glaive合作开发的,代表着开源 AI 在工具使用/函数调用能力方面的一项重大进步。

基准测试结果

这些模型取得了显著的成果,为具有工具使用能力的大型语言模型设定了新的基准。

  • Llama-3-Groq-70B-Tool-Use:整体准确率 90.76%(在发布时(2024年7月)BFCL 排名第一)
  • Llama-3-Groq-8B-Tool-Use:整体准确率 89.06%(在发布时(2024年7月)BFCL 排名第三)

参考资料

Hugging Face

博客