由技术创新研究所 (TII) 构建的大型语言模型,用于摘要、文本生成和聊天机器人。

7b 40b 180b

70.2K 16 个月前

自述文件

Technology Innovation Institute Logo

Falcon 是由技术创新研究所 (TII) 构建的高性能大型语言模型系列,TII 是阿布扎比政府高级技术研究委员会下属的一个研究中心,负责监督技术研究。

CLI (命令行界面)

ollama run falcon "Why is the sky blue?"

API (应用程序编程接口)

curl -X POST https://127.0.0.1:11434/api/generate -d '{
  "model": "falcon",
  "prompt": "Why is the sky blue?"
}'

参数计数

参数计数 推荐内存
70 亿 8GB 查看 ollama run falcon:7b
400 亿 32GB 查看 ollama run falcon:40b
1800 亿 192GB 查看 ollama run falcon:180b

变体

chat (聊天) 聊天模型在聊天和指令数据集上进行了微调,其中混合了几个大规模对话数据集。
instruct (指令) 指令模型遵循指令,并在 baize 指令数据集上进行了微调。
text (文本) 文本模型是基础模型,没有经过任何针对对话的微调,最适合用于简单的文本补全。

Falcon 180B

截至 2023 年 9 月,拥有 1800 亿参数的模型 Falcon 180B 是性能最佳的公开版本 LLM。 它介于 OpenAI 的 GPT 3.5 和 GPT 4 之间。 对于运行 Falcon 180B,建议使用至少具有 192GB 总内存的强大系统。

注意:Falcon 180B 的发布协议与其较小的同级产品不同,在某些条件下限制商业用途。 有关更多信息,请参见模型详细信息和许可。

更多信息