一系列来自 Groq 的模型,代表了开源 AI 在工具使用/函数调用方面的重要进步。

工具 8b 70b

35.9K 3 个月前

自述文件

这些模型是在与 Glaive 合作开发的,代表了开源 AI 在工具使用/函数调用方面的重要进步。

基准测试结果

这些模型取得了非凡的成果,为具有工具使用功能的大型语言模型设定了新的基准。

  • Llama-3-Groq-70B-工具使用:90.76% 的总体准确率(在发布时 - 2024 年 7 月 - BFCL 排行榜第一名)
  • Llama-3-Groq-8B-工具使用:89.06% 的总体准确率(在发布时 - 2024 年 7 月 - BFCL 排行榜第三名)

参考资料

Hugging Face

博客