Meta 的 Llama 3.2 推出了 1B 和 3B 的小型模型。
2.4M 拉取 63 标签 更新于 6 周前
Llama 3.1 是 Meta 推出的最新一代最先进模型,提供 8B、70B 和 405B 三种参数规模。
8.8M 拉取 93 标签 更新于 8 周前
Qwen2.5 模型是在阿里巴巴最新的超大规模数据集上预训练的,包含高达 18 万亿个 token。该模型支持高达 128K 个 token,并具有多语言支持。
1.9M 拉取 133 标签 更新于 7 周前
由 NVIDIA 推出的商业友好型小型语言模型,针对角色扮演、RAG 问答和函数调用进行了优化。
34.2K 拉取 17 标签 更新于 7 周前
Mistral Small 是一款轻量级模型,专为翻译和摘要等任务的经济高效使用而设计。
40.7K 拉取 17 标签 更新于 7 周前
Mistral AI 与 NVIDIA 合作打造的最新一代 12B 模型,具有 128k 上下文长度。
488.3K 拉取 17 标签 更新于 3 个月前
Mistral AI 发布的 7B 模型,更新至 0.3 版本。
5M 拉取 84 标签 更新于 3 个月前
Mistral AI 推出的一组 Mixture of Experts (MoE) 模型,具有开放权重,参数大小为 8x7b 和 8x22b。
473.9K 拉取 69 标签 更新于 3 个月前
Command R 是一款针对对话交互和长上下文任务进行优化的 大型语言模型。
238.6K 拉取 32 标签 更新于 2 个月前
Command R+ 是一款功能强大、可扩展的 大型语言模型,专为在现实世界的企业用例中表现出色而设计。
103.6K 拉取 21 标签 更新于 2 个月前
Qwen2 是阿里巴巴集团推出的一系列新型大型语言模型。
3.9M 拉取 97 标签 更新于 8 周前
最新系列的代码专用 Qwen 模型,在代码生成、代码推理和代码修复方面有了显著改进。
269.4K 拉取 67 标签 更新于 4 周前
Mistral Large 2 是 Mistral 的新旗舰模型,在代码生成、数学和推理方面能力显著提升,拥有 128k 上下文窗口,支持数十种语言。
98.8K 拉取 17 标签 更新于 3 个月前
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本。
54.6K 拉取 49 标签 更新于 2 个月前
Groq 推出的模型系列,代表了开源 AI 在工具使用/函数调用方面的重大进步。
35.9K 拉取 33 标签 更新于 3 个月前
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的用户查询响应的帮助性。
28.8K 拉取 17 标签 更新于 3 周前
IBM Granite 2B 和 8B 模型旨在支持基于工具的用例和检索增强生成 (RAG) 的支持,简化代码生成、翻译和错误修复。
17.2K 拉取 33 标签 更新于 2 周前
基于 Llama 3 的开放权重函数调用模型,与 GPT-4o 函数调用功能相媲美。
13.8K 拉取 17 标签 更新于 3 个月前
IBM Granite 1B 和 3B 模型是 IBM 推出的第一个混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
11.5K 拉取 33 标签 更新于 2 周前
Cohere For AI 的语言模型经过训练,可以在 23 种不同的语言中表现出色。
9,922 拉取 33 标签 更新于 2 周前
SmolLM2 是一个紧凑型语言模型家族,有三种尺寸:1.35 亿、3.6 亿和 17 亿个参数。
9,065 拉取请求 49 标签 更新于 7 天前