IBM Granite 2B 和 8B 模型是仅文本密集型 LLM,使用超过 12 万亿个 token 的数据进行训练,在 IBM 的初步测试中,其性能和速度相比前代产品有了显著提升。
工具 2b 8b
46.3K 拉取 更新于 2 周前
更新于 2 周前
2 周前
fba1ad01113e · 1.6GB
模型
archgranite
·
parameters2.53B
·
quantizationQ4_K_M
1.6GB
系统
知识截止日期:2024 年 4 月。您是 Granite,由 IBM 开发。
69B
模板
<|start_of_role|>system<|end_of_role|> {{- if and (gt (len .Messages) 0) (eq (index .Messages 0).Rol
1.4kB
许可证
Apache License Version 2.0, January 2004
11kB
自述
Granite 密集模型
IBM Granite 2B 和 8B 模型是仅文本密集型 LLM,使用超过 12 万亿个 token 的数据进行训练,在 IBM 的初步测试中,其性能和速度相比前代产品有了显著提升。
它们旨在支持基于工具的用例和检索增强生成 (RAG),从而简化代码生成、翻译和错误修复。
参数大小
2B
ollama run granite3.1-dense:2b
8B
ollama run granite3.1-dense:8b
支持的语言
英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语、中文(简体)
功能
- 摘要
- 文本分类
- 文本提取
- 问答
- 检索增强生成 (RAG)
- 代码相关任务
- 函数调用任务
- 多语言对话用例
- 长上下文任务,包括长文档/会议摘要、长文档问答等。
Granite 混合专家模型
Granite 混合专家模型提供 1B 和 3B 参数大小,专为低延迟使用而设计。
了解更多
- 开发者: IBM 研究院
- GitHub 仓库: ibm-granite/granite-language-models
- 网站: Granite 文档
- 发布日期:2024 年 12 月 18 日
- 许可证: Apache 2.0。