一个由技术创新研究院 (TII) 创建的大型语言模型,用于摘要、文本生成和聊天机器人。

7b 40b 180b

59.7K 12 个月前

14 个月前

3573ccb06045 · 44GB

模型
falcon
·
41.8B
·
Q8_0

自述文件

Technology Innovation Institute Logo

Falcon 是一个由技术创新研究院 (TII) 创建的高性能大型语言模型家族,TII 是阿布扎比政府先进技术研究委员会的一部分,负责监督技术研究。

CLI

ollama run falcon "Why is the sky blue?"

API

curl -X POST https://127.0.0.1:11434/api/generate -d '{
  "model": "falcon",
  "prompt": "Why is the sky blue?"
}'

参数计数

参数数量 推荐内存
70 亿 8GB 查看 ollama run falcon:7b
400 亿 32GB 查看 ollama run falcon:40b
1800 亿 192GB 查看 ollama run falcon:180b

变体

聊天 聊天模型在聊天和指令数据集上进行了微调,这些数据集混合了几个大型对话数据集。
指令 指令模型遵循指令,并在 baize 指令数据集上进行了微调。
文本 文本模型是基础基础模型,没有针对对话进行微调,最适合用于简单的文本补全。

Falcon 180B

截至 2023 年 9 月,1800 亿参数模型 Falcon 180B 是性能最佳的公开发布的 LLM。它介于 OpenAI 的 GPT 3.5 和 GPT 4 之间。为了运行 Falcon 180B,建议使用至少 192GB 内存的强大系统。

注意:Falcon 180B 在不同的许可下发布,与它的小型兄弟姐妹不同,它在某些条件下限制商业使用。请参阅 模型详情 和许可证以获取更多信息。

更多信息