当前最强大的模型,可在一张 GPU 上运行。
89.7K 下载量 9 标签 更新于 21 小时前
QwQ 是 Qwen 系列的推理模型。
880.1K 下载量 8 标签 更新于 7 天前
DeepSeek 的第一代推理模型,性能与 OpenAI-o1 相当,包括基于 Llama 和 Qwen 的 DeepSeek-R1 提炼出的六个密集模型。
25.8M 下载量 29 标签 更新于 4 周前
新的最先进的 70B 模型。Llama 3.3 70B 提供了与 Llama 3.1 405B 模型相似的性能。
1.5M 下载量 14 标签 更新于 3 个月前
Phi-4 是微软推出的 14B 参数的最先进的开放模型。
1M 下载量 5 标签 更新于 2 个月前
Meta 的 Llama 3.2 推出了 1B 和 3B 的小型模型。
10.5M 下载量 63 标签 更新于 5 个月前
Llama 3.1 是 Meta 推出的新的最先进模型,提供 8B、70B 和 405B 参数尺寸。
26.7M 下载量 93 标签 更新于 3 个月前
一个高性能的开放嵌入模型,具有大型 token 上下文窗口。
18.8M 下载量 3 标签 更新于 12 个月前
Mistral AI 发布的 7B 模型,已更新至 0.3 版本。
10.2M 下载量 84 标签 更新于 7 个月前
Meta Llama 3:迄今为止功能最强大的开放 LLM
7.6M 下载量 68 标签 更新于 9 个月前
Qwen2.5 模型在阿里巴巴最新的大规模数据集上进行预训练,包含多达 18 万亿个 token。该模型最多支持 128K 个 token,并具有多语言支持。
5.2M 下载量 133 标签 更新于 5 个月前
最新的代码专用 Qwen 模型系列,在代码生成、代码推理和代码修复方面有显著改进。
4.6M 下载量 196 标签 更新于 4 个月前
Qwen 1.5 是阿里巴巴云推出的一系列大型语言模型,参数规模从 0.5B 到 110B
4.5M 下载量 379 标签 更新于 10 个月前
Gemma 是 Google DeepMind 构建的一系列轻量级、最先进的开放模型。已更新至 1.1 版本
4.4M 下载量 102 标签 更新于 11 个月前
Qwen2 是阿里巴巴集团推出的一系列新的大型语言模型
4.1M 下载量 97 标签 更新于 6 个月前
🌋 LLaVA 是一种新型的端到端训练的大型多模态模型,它结合了视觉编码器和 Vicuna,用于通用的视觉和语言理解。已更新至 1.6 版本。
4M 下载量 98 标签 更新于 13 个月前
Google Gemma 2 是一款高性能且高效的模型,提供三种尺寸:2B、9B 和 27B。
3.4M 下载量 94 标签 更新于 7 个月前
Llama 2 是一系列基础语言模型,参数范围从 7B 到 70B。
3.1M 下载量 102 标签 更新于 14 个月前
Phi-3 是微软推出的最先进的轻量级开源模型系列,包含 3B (Mini) 和 14B (Medium) 两种尺寸。
2.9M 下载量 72 标签 更新于 7 个月前
一个大型语言模型,可以使用文本提示来生成和讨论代码。
1.8M 下载量 199 标签 更新于 7 个月前
来自 mixedbread.ai 的最先进的大型嵌入模型
1.8M 下载量 4 标签 更新于 10 个月前
Llama 3.2 Vision 是一系列指令调整的图像推理生成模型,具有 11B 和 90B 两种尺寸。
1.5M 下载量 9 标签 更新于 4 个月前
TinyLlama 项目是一项开放的努力,旨在训练一个紧凑的 1.1B Llama 模型,使用 3 万亿 tokens。
1.3M 下载量 36 标签 更新于 14 个月前
Mistral AI 与 NVIDIA 合作构建的,具有 128k 上下文长度的先进 12B 模型。
1.3M 下载量 17 标签 更新于 7 个月前
StarCoder2 是下一代透明训练的开源代码 LLM,提供三种尺寸:3B、7B 和 15B 参数。
898K 下载量 67 标签 更新于 6 个月前
一个强大的专家混合 (MoE) 语言模型,总参数量为 671B,每个 token 激活 37B 参数。
750.1K 下载量 5 标签 更新于 8 周前
George Sung 和 Jarrad Hope 提供的未审查的 Llama 2 模型。
732.8K 下载量 34 标签 更新于 16 个月前
一个开源的专家混合代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。
723.4K 下载量 64 标签 更新于 6 个月前
Snowflake 提供的一套文本嵌入模型,针对性能进行了优化。
697.9K 下载量 16 标签 更新于 11 个月前
DeepSeek Coder 是一款强大的代码模型,使用两万亿代码和自然语言 tokens 进行训练。
602.6K 下载量 102 标签 更新于 14 个月前
Mistral AI 推出的一组具有开放权重的专家混合 (MoE) 模型,参数尺寸为 8x7b 和 8x22b。
583.5K 下载量 70 标签 更新于 2 个月前
BGE-M3 是 BAAI 推出的新模型,以其在多功能性、多语言性和多粒度方面的通用性而著称。
563.2K 下载量 3 标签 更新于 7 个月前
专为视觉语言理解而设计的一系列多模态 LLM (MLLM)。
547.2K 下载量 17 标签 更新于 3 个月前
CodeGemma 是一系列强大的轻量级模型,可以执行各种编码任务,例如中间代码补全、代码生成、自然语言理解、数学推理和指令跟随。
532.1K 下载量 85 标签 更新于 7 个月前
基于 Mixtral 专家混合模型微调的未审查的 8x7b 和 8x22b 模型,擅长编码任务。由 Eric Hartford 创建。
522.7K 下载量 70 标签 更新于 2 个月前
一个完全开源的推理模型系列,使用通过提炼 DeepSeek-R1 获得的数据集构建。
510.1K 下载量 9 标签 更新于 4 周前
Phi-2:微软研究院的 2.7B 语言模型,展示了出色的推理和语言理解能力。
497.3K 下载量 18 标签 更新于 14 个月前
一个从 Llama 3 Instruct 微调而来的 LLaVA 模型,在多个基准测试中取得了更好的分数。
453.7K 下载量 4 标签 更新于 10 个月前
Dolphin 3.0 Llama 3.1 8B 🐬 是下一代 Dolphin 系列指令调优模型,旨在成为终极通用本地模型,支持编码、数学、代理、函数调用和通用用例。
397.4K 下载量 5 标签 更新于 2 个月前
SmolLM2 是一个紧凑型语言模型系列,提供三种尺寸:135M、360M 和 1.7B 参数。
376.4K 下载量 49 标签 更新于 4 个月前
OLMo 2 是一个新的 7B 和 13B 模型系列,在高达 5T tokens 的数据上训练。这些模型与同等大小的完全开放模型相当或更好,并且在英语学术基准测试中与 Llama 3.1 等开放权重模型竞争。
362.9K 下载量 9 标签 更新于 2 个月前
微软 AI 的最先进的大型语言模型,在复杂聊天、多语言、推理和代理用例方面具有改进的性能。
357.1K 下载量 22 标签 更新于 11 个月前
基于 Mistral 的未审查 Dolphin 模型,擅长编码任务。已更新至 2.8 版本。
326.1K 下载量 120 标签 更新于 11 个月前
在非常大的句子级数据集上的嵌入模型。
312.2K 下载量 10 标签 更新于 10 个月前
Mistral Small 3 在 70B 以下的“小型”大型语言模型类别中树立了新的标杆。
303.6K 下载量 21 标签 更新于 5 周前
Dolphin 2.9 是 Eric Hartford 基于 Llama 3 的新模型,具有 8B 和 70B 尺寸,具有各种指令、对话和编码技能。
293.9K 下载量 53 标签 更新于 10 个月前
Command R 是一个大型语言模型,针对会话交互和长上下文任务进行了优化。
283.3K 下载量 32 标签 更新于 6 个月前
一个通用模型,参数范围从 30 亿到 700 亿,适用于入门级硬件。
277.4K 下载量 119 标签 更新于 16 个月前
Yi 1.5 是一个高性能的双语语言模型。
267.4K 下载量 174 标签 更新于 10 个月前
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本
265K 下载量 65 标签 更新于 2 个月前
一个轻量级 AI 模型,具有 38 亿参数,其性能超越了类似和更大尺寸的模型。
250.3K 下载量 17 标签 更新于 6 个月前
Zephyr 是一系列 Mistral 和 Mixtral 模型的微调版本,经过训练可以充当有用的助手。
238.4K 下载量 40 标签 更新时间 11 months ago
Codestral 是 Mistral AI 首个专为代码生成任务设计的代码模型。
228.4K 下载量 17 标签 更新时间 6 months ago
IBM 针对代码智能的开放基础模型系列
191.8K 下载量 162 标签 更新时间 6 months ago
🪐 基于全新高质量数据集训练的小型模型系列,参数规模包括 135M、360M 和 1.7B。
189.1K 下载量 94 标签 更新时间 6 months ago
StarCoder 是一个在 80 多种编程语言上训练的代码生成模型。
187.8K 下载量 100 标签 更新时间 16 months ago
Wizard Vicuna Uncensored 是一个基于 Eric Hartford 的 Llama 2 Uncensored 的 7B、13B 和 30B 参数模型。
186K 下载量 49 标签 更新时间 16 months ago
基于 Llama 和 Llama 2 的通用聊天模型,上下文长度为 2K 到 16K。
176.3K 下载量 111 标签 更新时间 16 months ago
Mistral OpenOrca 是一个 70 亿参数的模型,基于 Mistral 7B 模型并使用 OpenOrca 数据集进行微调。
167.1K 下载量 17 标签 更新时间 17 months ago
基于 Llama 2 的模型,经过微调以提升中文对话能力。
150K 下载量 35 标签 更新时间 16 months ago
一个开源模型系列,在各种数据上训练,并在多个基准测试中超越 ChatGPT。已更新至 3.5-0106 版本。
145.6K 下载量 50 标签 更新时间 14 months ago
一款多功能模型,适用于 AI 软件开发场景,包括代码补全。
139.3K 下载量 17 标签 更新时间 8 months ago
由 Cohere 发布的 Aya 23 是一个全新的最先进的多语言模型系列,支持 23 种语言。
136.5K 下载量 33 标签 更新时间 9 months ago
CodeQwen1.5 是一个在大量代码数据上预训练的大型语言模型。
135K 下载量 30 标签 更新时间 8 months ago
一款使用 2 万亿双语 tokens 精心打造的先进语言模型。
132.2K 下载量 64 标签 更新时间 15 months ago
一款强大、经济高效的混合专家语言模型。
128.6K 下载量 34 标签 更新时间 8 months ago
Mistral Large 2 是 Mistral 的全新旗舰模型,在代码生成、数学和推理方面能力显著提升,拥有 128k 上下文窗口并支持数十种语言。
125.3K 下载量 32 标签 更新时间 3 months ago
一款强大的多语言通用语言模型,性能可与 Llama 3 相媲美。
123.6K 下载量 32 标签 更新时间 8 months ago
Stable Code 3B 是一款编码模型,具有指令和代码补全变体,与 Code Llama 7B 等模型性能相当,但模型规模仅为后者的 2.5 分之一。
122.4K 下载量 36 标签 更新时间 11 months ago
OpenHermes 2.5 是一个 7B 模型,由 Teknium 在 Mistral 上使用完全开放的数据集进行微调。
122.1K 下载量 35 标签 更新时间 14 months ago
Nous Research 强大的模型系列,擅长科学讨论和编码任务。
121.9K 下载量 33 标签 更新时间 14 months ago
Qwen2 Math 是基于 Qwen2 LLM 构建的专业数学语言模型系列,其数学能力显著优于开源模型,甚至闭源模型(例如 GPT4o)。
120.7K 下载量 52 标签 更新时间 6 months ago
一个实验性的 1.1B 参数模型,由 Eric Hartford 基于 TinyLlama,使用新的 Dolphin 2.8 数据集训练。
120.6K 下载次数 18 标签 更新于 13 months ago
Command R+ 是一个强大的、可扩展的大型语言模型,专为在真实世界的企业用例中表现出色而构建。
119.7K 下载次数 21 标签 更新于 6 months ago
moondream2 是一个小型视觉语言模型,旨在在边缘设备上高效运行。
119.5K 下载次数 18 标签 更新于 10 months ago
最先进的代码生成模型
117.3K 下载次数 67 标签 更新于 14 months ago
BakLLaVA 是一个多模态模型,由 Mistral 7B 基础模型和 LLaVA 架构增强而成。
109.9K 下载次数 17 标签 更新于 15 months ago
Stable LM 2 是一个最先进的 1.6B 和 12B 参数语言模型,使用英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据进行训练。
108.2K 下载次数 84 标签 更新于 10 months ago
一个基于 Mistral 微调的模型,在领域和语言方面具有良好的覆盖率。
104.8K 下载次数 50 标签 更新于 14 months ago
一个高性能模型,使用一种名为 Reflection-tuning 的新技术进行训练,该技术教导大型语言模型检测其推理中的错误并纠正方向。
103.4K 下载次数 17 标签 更新于 6 months ago
专注于数学和逻辑问题的模型
101.2K 下载次数 64 标签 更新于 14 months ago
此模型将 LLama-3 8B 的上下文长度从 8k 扩展到超过 100 万个 tokens。
98.1K 下载次数 35 标签 更新于 10 months ago
NVIDIA 基于 Llama 3 的模型,擅长对话式问答 (QA) 和检索增强生成 (RAG)。
97.2K 下载次数 35 标签 更新于 10 months ago
SQLCoder 是一个代码补全模型,在 StarCoder 上进行了微调,用于 SQL 生成任务。
94.4K 下载次数 48 标签 更新于 13 months ago
一个在哲学、心理学和人际关系方面训练的伴侣助手。基于 Mistral。
90.2K 下载次数 49 标签 更新于 17 months ago
来自 BAAI 的嵌入模型,将文本映射到向量。
89.9K 下载次数 3 标签 更新于 7 months ago
基于 Llama 2 的对话模型,在各种基准测试中表现出色。
84.4K 下载次数 80 标签 更新于 16 months ago
Dolphin 模型系列的 7B 和 15B 无审查变体,擅长编码,基于 StarCoder2。
84.2K 下载次数 35 标签 更新于 11 months ago
来自 Nous Research 的基于 Llama 和 Llama 2 的通用模型。
82.4K 下载次数 63 标签 更新于 16 months ago
IBM Granite 2B 和 8B 模型是仅文本密集型大型语言模型,使用超过 12 万亿个 tokens 的数据进行训练,在 IBM 的初步测试中,在性能和速度方面都比其前代产品有了显著提升。
82.1K 下载次数 33 标签 更新于 7 周前
一个新的小型 LLaVA 模型,从 Phi 3 Mini 微调而来。
81.8K 下载次数 4 标签 更新于 10 months ago
基于 Code Llama 的代码生成模型。
81.6K 下载次数 49 标签 更新于 14 months ago
Starling 是一个大型语言模型,通过来自 AI 反馈的强化学习进行训练,专注于提高聊天机器人的实用性。
81.3K 下载量 36 标签 更新时间 11 months ago
一款紧凑而强大的 10.7B 大型语言模型,专为单轮对话而设计。
79.1K 下载量 32 标签 更新时间 15 months ago
Llama 2 的扩展,最多支持 128k tokens 的上下文。
78.9K 下载量 67 标签 更新时间 16 months ago
Yi-Coder 是一系列开源代码语言模型,以少于 100 亿参数实现了最先进的编码性能。
77.1K 下载量 67 标签 更新时间 6 months ago
Athene-V2 是一个 72B 参数模型,擅长代码补全、数学和日志提取任务。
77K 下载量 17 标签 更新时间 3 months ago
基于 Llama 2 的通用模型。
75.8K 下载量 73 标签 更新时间 16 months ago
InternLM2.5 是一款 7B 参数模型,专为具有出色推理能力的实际应用场景而定制。
74.1K 下载量 65 标签 更新时间 6 months ago
技术创新研究所 (TII) 构建的大型语言模型,用于摘要、文本生成和聊天机器人。
70.2K 下载量 38 标签 更新时间 16 months ago
NVIDIA 推出的商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。
70.1K 下载量 17 标签 更新时间 5 months ago
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的对用户查询的回复的 helpfulness。
66.9K 下载量 17 标签 更新时间 4 months ago
Deepseek-R1-Distilled-Qwen-1.5B 的微调版本,仅使用 1.5B 参数就在流行的数学评估中超越了 OpenAI 的 o1-preview 的性能。
66.5K 下载量 5 标签 更新时间 4 weeks ago
Eric Hartford 基于微软研究院的 Phi 语言模型开发的 2.7B 无审查 Dolphin 模型。
66K 下载量 15 标签 更新时间 14 months ago
Orca 2 由微软研究院构建,是 Meta Llama 2 模型的微调版本。该模型旨在特别擅长推理。
63.8K 下载量 33 标签 更新时间 15 months ago
Wizard LM 模型的无审查版本
60.9K 下载量 18 标签 更新时间 16 months ago
基于 Llama 2 模型,在 Orca 风格的数据集上进行了微调。原名 Free Willy。
59K 下载量 49 标签 更新时间 16 months ago
IBM Granite 2B 和 8B 模型旨在支持基于工具的用例和检索增强生成 (RAG),从而简化代码生成、翻译和错误修复。
58K 下载量 33 标签 更新时间 3 months ago
Groq 的一系列模型,代表了开源 AI 在工具使用/函数调用能力方面的重大进步。
56.3K 下载量 33 标签 更新时间 7 months ago
Sentence-transformers 模型,可用于聚类或语义搜索等任务。
53.1K 下载量 3 标签 更新时间 7 months ago
DeekSeek-V2 的升级版本,集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。
50K 下载量 7 标签 更新时间 6 months ago
一种新型小型推理模型,从 Qwen 2.5 3B Instruct 模型微调而来。
48.2K 下载量 5 标签 更新时间 2 months ago
微调的 Llama 2 模型,用于根据开源医疗数据集回答医疗问题。
47.7K 下载量 17 标签 更新时间 16 months ago
从 Llama 2 调整到医疗领域的开源医疗大型语言模型。
47.7K 下载量 22 标签 更新时间 15 months ago
Cohere For AI 的语言模型,经过训练在 23 种不同的语言中表现良好。
46.8K 下载量 33 标签 更新时间 4 months ago
Llama 2 的扩展,专门用于整合通用语言理解和特定领域知识,尤其是在编程和数学方面。
45.8K 下载量 33 标签 更新时间 14 个月前
Mistral 的扩展,以支持 64K 或 128K 的上下文窗口。
45.2K 下载量 33 标签 更新时间 16 个月前
IBM Granite 1B 和 3B 模型是 IBM 首个为低延迟使用而设计的专家混合 (MoE) Granite 模型。
44.4K 下载量 33 标签 更新时间 3 个月前
一系列参数小于 10B 的高效 AI 模型,通过创新的训练技术在科学、数学和编码方面表现出色。
42.4K 下载量 17 标签 更新时间 2 个月前
Nexus Raven 是一个 13B 指令调优模型,用于函数调用任务。
41.7K 下载量 32 标签 更新时间 14 个月前
基于 Llama2 的出色代码生成模型。
39.7K 下载量 19 标签 更新时间 16 个月前
基于 Llama2 的无审查模型,支持 16K 上下文窗口。
38.5K 下载量 18 标签 更新时间 14 个月前
Nous Research 的 Nous Hermes 2 模型,现在基于 Mixtral 进行了训练。
38.4K 下载量 18 标签 更新时间 2 个月前
Snowflake 的前沿嵌入模型。 Arctic Embed 2.0 增加了多语言支持,且不牺牲英语性能或可扩展性。
37.4K 下载量 3 标签 更新时间 3 个月前
ShieldGemma 是一组指令调优模型,用于评估文本提示输入和文本输出响应针对一组已定义安全策略的安全性。
36.2K 下载量 49 标签 更新时间 5 个月前
IBM Granite 1B 和 3B 模型是 IBM 的长上下文专家混合 (MoE) Granite 模型,专为低延迟使用而设计。
35.7K 下载量 33 标签 更新时间 7 周前
阿里巴巴国际数字商业集团 (AIDC-AI) 推出的用于现实世界解决方案的开放大型推理模型。
33.3K 下载量 5 标签 更新时间 3 个月前
Phi-4-mini 在多语言支持、推理和数学方面带来了显著增强,并且现在终于支持期待已久的函数调用功能。
33.2K 下载量 5 标签 更新时间 12 天前
MathΣtral:Mistral AI 设计的 7B 模型,专为数学推理和科学发现而打造。
32.8K 下载量 17 标签 更新时间 7 个月前
一系列将 HTML 内容转换为 Markdown 内容的模型,这对于内容转换任务非常有用。
32.6K 下载量 33 标签 更新时间 6 个月前
Falcon2 是 TII 构建的 11B 参数因果解码器模型,并在 5T tokens 上进行了训练。
32.4K 下载量 17 标签 更新时间 10 个月前
🎩 Magicoder 是一个 7B 参数模型系列,使用 OSS-Instruct(一种通过开源代码片段启发 LLM 的新颖方法)在 75K 合成指令数据上进行训练。
32.2K 下载量 18 标签 更新时间 15 个月前
一种轻量级聊天模型,允许在无需高端硬件的情况下实现准确且响应迅速的输出。
32.1K 下载量 17 标签 更新时间 14 个月前
Solar Pro Preview:一款先进的大型语言模型 (LLM),具有 220 亿个参数,旨在适应单个 GPU
32.1K 下载量 18 标签 更新时间 5 个月前
通过合并两个现有代码模型创建的高性能代码指令模型。
31.4K 下载量 16 标签 更新时间 16 个月前
Llama Guard 3 是一系列模型,经过微调,用于对 LLM 输入和响应的内容安全分类。
30.7K 下载量 33 标签 更新于 5 个月前
由 MotherDuck 和 Numbers Station 制作的 7B 参数文本到 SQL 模型。
30.5K 下载量 17 标签 更新于 13 个月前
MistralLite 是一个基于 Mistral 微调的模型,增强了处理长上下文的能力。
30.1K 下载量 17 标签 更新于 16 个月前
Wizard Vicuna 是一个由 MelodysDreamj 训练的,基于 Llama 2 的 13B 参数模型。
29.6K 下载量 17 标签 更新于 16 个月前
EXAONE 3.5 是由 LG AI Research 开发和发布的,一系列指令微调的双语(英语和韩语)生成模型,参数范围从 2.4B 到 32B。
29.3K 下载量 13 标签 更新于 3 个月前
一个基于 Phi-3,在私有的高质量合成数据集上针对信息提取进行微调的 3.8B 参数模型。
26.4K 下载量 17 标签 更新于 7 个月前
OpenCoder 是一个开放且可复现的代码 LLM 系列,包含 1.5B 和 8B 模型,支持英语和中文的聊天。
26.2K 下载量 9 标签 更新于 3 个月前
MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的一种转换,通过将模型自身交错创建而成。
25.3K 下载量 19 标签 更新于 14 个月前
Cohere R 系列中最小的模型,在通用 GPU 和边缘设备上构建强大的 AI 应用时,可提供顶级的速度、效率和质量。
24.7K 下载量 5 标签 更新于 7 周前
一个性能顶尖的专家混合模型,使用高质量数据进行微调。
24.4K 下载量 18 标签 更新于 14 个月前
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合并。专为聊天和代码生成而设计。
23.9K 下载量 17 标签 更新于 16 个月前
一个基于 Zephyr,使用高质量数据进行微调的 7B 聊天模型。
23.7K 下载量 18 标签 更新于 14 个月前
一个通过将两个微调的 Llama 2 70B 模型组合成一个而创建的语言模型。
23K 下载量 16 标签 更新于 16 个月前
由 Bespoke Labs 开发的最先进的事实核查模型。
22.7K 下载量 17 标签 更新于 5 个月前
IBM Granite Embedding 30M 和 278M 模型是纯文本密集双编码器嵌入模型,其中 30M 仅提供英文版本,而 278M 则服务于多语言用例。
21.6K 下载量 6 标签 更新于 2 个月前
Tülu 3 是一个领先的指令跟随模型系列,由艾伦人工智能研究所提供完全开源的数据、代码和配方。
20.3K 下载量 9 标签 更新于 2 个月前
一种紧凑高效的视觉语言模型,专门为视觉文档理解而设计,能够从表格、图表、信息图表、绘图、示意图等中自动提取内容。
20K 下载量 5 标签 更新于 13 天前
一个基于 Llama 3 的开放权重函数调用模型,与 GPT-4o 的函数调用能力相媲美。
19.1K 下载量 17 标签 更新于 7 个月前
DBRX 是 Databricks 创建的开放通用 LLM。
18.4K 下载量 7 标签 更新于 11 个月前
Granite-3.2 是 IBM Granite 的长上下文 AI 模型系列,针对思考能力进行了微调。
17.5K 下载量 9 标签 更新于 2 周前
IBM Granite Guardian 3.0 2B 和 8B 模型旨在检测提示和/或响应中的风险。
16.7K 下载量 10 标签 更新于 3 个月前
DeepSeek-R1 模型的一个版本,由 Perplexity 进行后训练,以提供公正、准确和真实的信息。
16.4K 下载量 9 标签 更新于 2 周前
一个强大的对话模型,旨在用于聊天和指令用例。
15.9K 下载量 7 标签 更新于 15 个月前
Sailor2 是为东南亚地区制作的多语言模型。提供 1B、8B 和 20B 参数尺寸。
9,822 拉取次数 13 标签 更新于 3 个月前
Command R7B 轻量级模型的全新最先进版本,在中东和北非地区企业的先进阿拉伯语能力方面表现出色。
3,433 拉取次数 5 标签 更新于 12 天前