更新于 12 个月前
12 个月前
753deb72fbcd · 29GB
模型
架构falcon
·
参数41.8B
·
量化Q5_0
29GB
自述文件
Falcon 是一个由技术创新研究院 (TII) 开发的高性能大型语言模型家族,TII 是阿布扎比政府高级技术研究委员会的一部分,负责监督技术研究。
命令行界面
ollama run falcon "Why is the sky blue?"
API
curl -X POST https://127.0.0.1:11434/api/generate -d '{
"model": "falcon",
"prompt": "Why is the sky blue?"
}'
参数计数
参数数量 | 推荐内存 | ||
---|---|---|---|
70 亿 | 8GB | 查看 | ollama run falcon:7b |
400 亿 | 32GB | 查看 | ollama run falcon:40b |
1800 亿 | 192GB | 查看 | ollama run falcon:180b |
变体
聊天 |
聊天模型是在聊天和指令数据集上微调的,这些数据集混合了多个大型对话数据集。 |
指令 |
指令模型遵循指令,并在 baize 指令数据集上微调。 |
文本 |
文本模型是基础基础模型,没有针对对话进行任何微调,最适合用于简单的文本补全。 |
Falcon 180B
截至 2023 年 9 月,1800 亿参数模型 Falcon 180B 是性能最好的公开发布的 LLM。它的性能介于 OpenAI 的 GPT 3.5 和 GPT 4 之间。要运行 Falcon 180B,建议使用至少 192GB 总内存的强大系统。
注意:Falcon 180B 在与更小的兄弟模型不同的许可下发布,该许可在某些情况下限制商业使用。有关更多信息,请查看 模型详细信息 和许可证。