Llama 3.2 Vision 是一个包含 11B 和 90B 大小的指令微调图像推理生成模型的集合。
28.6K Pulls 9 Tags 更新 昨天
Meta 的 Llama 3.2 推出了 1B 和 3B 的小型模型。
2.4M Pulls 63 Tags 更新 6 周前
Llama 3.1 是 Meta 推出的最新最先进的模型,有 8B、70B 和 405B 参数尺寸可供选择。
8.8M Pulls 93 Tags 更新 8 周前
Google Gemma 2 是一个高性能且高效的模型,有三种尺寸可供选择:2B、9B 和 27B。
1.8M Pulls 94 Tags 更新 3 个月前
Qwen2.5 模型是在阿里巴巴最新的超大规模数据集上预训练的,包含高达 18 万亿个 token。该模型支持高达 128K 个 token,并具有多语言支持。
1.9M Pulls 133 Tags 更新 7 周前
一个轻量级的 AI 模型,具有 38 亿个参数,性能超过了同类和更大尺寸的模型。
164.9K Pulls 17 Tags 更新 2 个月前
NVIDIA 推出的商业友好型小型语言模型,针对角色扮演、RAG 问答和函数调用进行了优化。
34.2K Pulls 17 标签 更新于 7 周前
Mistral Small 是一款轻量级模型,专为翻译和摘要等任务的经济高效使用而设计。
40.7K Pulls 17 标签 更新于 7 周前
Mistral AI 与 NVIDIA 合作构建的具有 128k 上下文长度的最先进的 12B 模型。
488.2K Pulls 17 标签 更新于 3 个月前
一个开源的专家混合代码语言模型,在特定于代码的任务中实现了与 GPT4-Turbo 相当的性能。
395.3K Pulls 64 标签 更新于 2 个月前
Mistral AI 发布的 7B 模型,已更新至 0.3 版本。
5M Pulls 84 标签 更新于 3 个月前
Mistral AI 提供的一组具有开放权重的专家混合 (MoE) 模型,参数大小分别为 8x7b 和 8x22b。
473.9K Pulls 69 标签 更新于 3 个月前
CodeGemma 是一组强大的轻量级模型,可以执行各种编码任务,例如中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。
354K Pulls 85 标签 更新于 3 个月前
Command R 是一款针对对话交互和长上下文任务进行了优化的大型语言模型。
238.6K 拉取 32 标签 更新于 2 个月前
Command R+ 是一款功能强大、可扩展的大型语言模型,专为胜任现实世界中的企业用例而设计。
103.6K 拉取 21 标签 更新于 2 个月前
🌋 LLaVA 是一种新颖的端到端训练的大型多模态模型,它结合了视觉编码器和 Vicuna,用于通用视觉和语言理解。已更新至 1.6 版本。
1.7M 拉取 98 标签 更新于 9 个月前
Meta Llama 3:迄今为止最强大的公开可用的 LLM
6.6M 拉取 68 标签 更新于 5 个月前
Gemma 是由 Google DeepMind 构建的一系列轻量级、最先进的开放模型。已更新至 1.1 版本
4.2M 拉取 102 标签 更新于 7 个月前
Qwen 1.5 是阿里云推出的一系列大型语言模型,参数量从 0.5B 到 110B 不等
4.1M 拉取 379 标签 更新于 6 个月前
Qwen2 是阿里巴巴集团推出的一系列新型大型语言模型
3.9M 拉取 97 标签 更新 8 周前
Phi-3 是微软推出的一系列轻量级 3B(小型)和 14B(中型)最先进的开源模型。
2.7M 拉取 72 标签 更新 3 个月前
一个高性能的开放式嵌入模型,具有较大的标记上下文窗口。
2.4M 拉取 3 标签 更新 8 个月前
Llama 2 是一系列基础语言模型,参数范围从 7B 到 70B 不等。
2.3M 拉取 102 标签 更新 10 个月前
一个可以使用文本提示生成和讨论代码的大型语言模型。
1.5M 拉取 199 标签 更新 3 个月前
来自 mixedbread.ai 的最先进的大型嵌入模型。
541.3K 拉取 4 标签 更新 6 个月前
基于 Mixtral 专家混合模型的未经审查的 8x7b 和 8x22b 微调模型,在编码任务方面表现出色。由 Eric Hartford 创建。
431.8K Pulls 87 Tags Updated 6 months ago
StarCoder2 是下一代透明训练的开源代码 LLM,提供三种尺寸:30 亿、70 亿和 150 亿个参数。
419.4K Pulls 67 Tags Updated 2 months ago
Phi-2:微软研究院开发的 27 亿参数语言模型,展现出卓越的推理和语言理解能力。
379.6K Pulls 18 Tags Updated 10 months ago
DeepSeek Coder 是一款功能强大的编码模型,在 2 万亿个代码和自然语言标记上进行训练。
365.1K Pulls 102 Tags Updated 10 months ago
由乔治·宋和贾拉德·霍普开发的无审查 Llama 2 模型。
352.8K Pulls 34 Tags Updated 12 months ago
TinyLlama 项目是一个开放的项目,旨在用 3 万亿个标记训练一个紧凑的 11 亿参数 Llama 模型。
275.2K Pulls 36 Tags Updated 10 months ago
最新的代码专用 Qwen 模型系列,在代码生成、代码推理和代码修复方面取得了显著进步。
269.4K Pulls 67 Tags Updated 4 weeks ago
基于 Mistral 的未经审查的 Dolphin 模型,擅长编码任务。更新到版本 2.8。
261.1K 拉取 120 标签 更新 7 个月前
Yi 1.5 是一款高性能的双语语言模型。
238.6K 拉取 174 标签 更新 5 个月前
Dolphin 2.9 是 Eric Hartford 基于 Llama 3 创建的新模型,具有 8B 和 70B 的尺寸,拥有各种指令、对话和编码技能。
235.8K 拉取 53 标签 更新 6 个月前
通用模型,参数范围从 30 亿到 700 亿,适合入门级硬件。
230.5K 拉取 119 标签 更新 12 个月前
Zephyr 是 Mistral 和 Mixtral 模型的一系列微调版本,经过训练可以充当有用的助手。
222.4K 拉取 40 标签 更新 6 个月前
从 Llama 3 Instruct 微调的 LLaVA 模型,在多个基准测试中得分更高。
210.1K 拉取 4 标签 更新 6 个月前
Snowflake 推出的文本嵌入模型套件,针对性能进行了优化。
181.9K 拉取 16 标签 更新 6 个月前
StarCoder 是一个代码生成模型,在 80 多种编程语言上进行训练。
164.8K Pulls 100 Tags 更新于 12 个月前
Codestral 是 Mistral AI 的第一个代码模型,专为代码生成任务而设计。
160.7K Pulls 17 Tags 更新于 2 个月前
Mistral OpenOrca 是一个 70 亿参数模型,使用 OpenOrca 数据集在 Mistral 7B 模型的基础上进行微调。
159.7K Pulls 17 Tags 更新于 13 个月前
基于 Llama 和 Llama 2 的通用聊天模型,上下文大小从 2K 到 16K 不等。
155.9K Pulls 111 Tags 更新于 12 个月前
来自微软 AI 的最先进的大型语言模型,在复杂的聊天、多语言、推理和代理用例方面性能有所提升。
151.1K Pulls 22 Tags 更新于 6 个月前
IBM 推出的用于代码智能的开源基础模型系列。
147.2K Pulls 162 Tags 更新于 2 个月前
Wizard Vicuna Uncensored 是一个 7B、13B 和 30B 参数模型,由 Eric Hartford 基于 Llama 2 微调而成,去除了限制。
137.8K 拉取请求 49 标签 更新 12 个月前
基于 Llama 2 的模型,经过微调以提高中文对话能力。
136.4K 拉取请求 35 标签 更新 12 个月前
一个适用于 AI 软件开发场景的多功能模型,包括代码补全。
123.4K 拉取请求 17 标签 更新 4 个月前
在非常大的句子级数据集上训练的嵌入模型。
121.6K 拉取请求 10 标签 更新 6 个月前
一个开源模型系列,在各种数据上进行训练,在各种基准测试中超越 ChatGPT。更新至 3.5-0106 版本。
115.1K 拉取请求 50 标签 更新 10 个月前
Nous Research 推出的强大模型系列,擅长科学讨论和编码任务。
114.4K 拉取请求 33 标签 更新 10 个月前
Aya 23 由 Cohere 发布,是最新一代的尖端多语言模型系列,支持 23 种语言。
113.2K 拉取请求 33 标签 更新 5 个月前
CodeQwen1.5 是一个在大量代码数据上预训练的大型语言模型。
112.3K 拉取请求 30 标签 更新 4 个月前
一个实验性的 1.1B 参数模型,由 Eric Hartford 在新的 Dolphin 2.8 数据集上进行训练,并基于 TinyLlama。
105.2K 拉取 18 标签 更新 9个月前
最先进的代码生成模型
104.9K 拉取 67 标签 更新 10个月前
Stable Code 3B 是一个代码模型,其指令和代码补全变体与 Code Llama 7B 等规模大 2.5 倍的模型相当。
103.4K 拉取 36 标签 更新 7个月前
OpenHermes 2.5 是 Teknium 在 Mistral 上使用完全开放的数据集微调的 7B 模型。
101K 拉取 35 标签 更新 10个月前
Mistral Large 2 是 Mistral 的新旗舰模型,在代码生成、数学和推理方面能力显著增强,拥有 128k 上下文窗口,支持数十种语言。
98.8K 拉取 17 标签 更新 3个月前
Qwen2 Math 是一系列基于 Qwen2 LLM 的专业数学语言模型,其数学能力显著优于开源模型,甚至优于闭源模型(例如 GPT4o)。
98.6K 拉取 52 标签 更新 2个月前
BakLLaVA 是一个多模态模型,由 Mistral 7B 基础模型增强了 LLaVA 架构。
96.5K 拉取 17 标签 更新 11个月前
一个高性能模型,使用一种称为反射调整的新技术训练,该技术教会 LLM 检测其推理中的错误并纠正方向。
95.9K 拉取请求 17 标签 更新于 2 个月前
Stable LM 2 是一个最先进的 16 亿和 120 亿参数语言模型,在英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据上进行训练。
95.8K 拉取请求 84 标签 更新于 6 个月前
一个强大的多语言通用语言模型,具有与 Llama 3 相当的竞争力。
91.6K 拉取请求 32 标签 更新于 4 个月前
一个使用 2 万亿双语标记符构建的先进语言模型。
89.7K 拉取请求 64 标签 更新于 11 个月前
该模型将 LLama-3 8B 的上下文长度从 8k 扩展到超过 100 万个标记。
89.5K 拉取请求 35 标签 更新于 6 个月前
专注于数学和逻辑问题的模型
88.9K 拉取请求 64 标签 更新于 10 个月前
一个基于 Mistral 的微调模型,在领域和语言方面覆盖率很高。
81.8K 拉取请求 50 标签 更新于 10 个月前
🪐 一个由 1.35 亿、3.6 亿和 17 亿参数组成的模型系列,在新的高质量数据集上进行训练。
80.1K 拉取请求 94 标签 更新于 2 个月前
moondream2 是一个小型视觉语言模型,旨在高效地在边缘设备上运行。
79K 拉取 18 标签 更新 6个月前
基于 Llama 2 的对话模型,在各种基准测试中表现出色。
77.5K 拉取 80 标签 更新 12个月前
来自 NVIDIA 的基于 Llama 3 的模型,在对话问答 (QA) 和检索增强生成 (RAG) 方面表现出色。
77.4K 拉取 35 标签 更新 6个月前
SQLCoder 是一个基于 StarCoder 的代码补全模型,针对 SQL 生成任务进行微调。
75.9K 拉取 48 标签 更新 9个月前
来自 Nous Research 的基于 Llama 和 Llama 2 的通用模型。
75.5K 拉取 63 标签 更新 12个月前
基于 Code Llama 的代码生成模型。
74.3K 拉取 49 标签 更新 10个月前
Llama 2 的扩展版本,支持高达 128k 个 token 的上下文。
72.4K 拉取 67 标签 更新 12个月前
基于 StarCoder2 的 Dolphin 模型系列的 7B 和 15B 未审查变体,在编码方面表现出色。
71.3K 拉取 35 标签 更新 7个月前
基于 Llama 2 的通用模型。
71K 拉取请求 73 标签 更新于 12 个月前
一个强大、经济高效的混合专家语言模型。
65.9K 拉取请求 34 标签 更新于 4 个月前
Starling 是一个大型语言模型,通过强化学习从人工智能反馈中训练,专注于提高聊天机器人帮助能力。
61.8K 拉取请求 36 标签 更新于 7 个月前
一个在哲学、心理学和人际关系方面接受过训练的伴侣助手。基于 Mistral。
60.9K 拉取请求 49 标签 更新于 13 个月前
由技术创新研究院 (TII) 构建的大型语言模型,用于摘要、文本生成和聊天机器人。
59.7K 拉取请求 38 标签 更新于 12 个月前
一个紧凑但功能强大的 10.7B 大型语言模型,专为单轮对话而设计。
58K 拉取请求 32 标签 更新于 10 个月前
Orca 2 由微软研究院构建,是 Meta 的 Llama 2 模型的微调版本。该模型旨在特别擅长推理。
56.7K 拉取请求 33 标签 更新于 11 个月前
Yi-Coder 是一系列开源代码语言模型,在不到 100 亿个参数的情况下提供最先进的编码性能。
56.1K 拉取请求 67 标签 更新于 8 周前
InternLM2.5 是一个 7B 参数模型,专为具有出色推理能力的实际场景而定制。
55.1K 拉取 65 标签 更新于 2 个月前
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本
54.6K 拉取 49 标签 更新于 2 个月前
基于 Llama 2 的模型,在 Orca 风格的数据集上进行了微调。最初称为 Free Willy。
54.3K 拉取 49 标签 更新于 12 个月前
一个新的小型 LLaVA 模型,从 Phi 3 Mini 微调而来。
49.4K 拉取 4 标签 更新于 6 个月前
由 Eric Hartford 创建的 2.7B 未经审查的海豚模型,基于微软研究院的 Phi 语言模型。
48.9K 拉取 15 标签 更新于 10 个月前
Wizard LM 模型的未经审查版本
46.1K 拉取 18 标签 更新于 12 个月前
Mistral 的扩展,支持 64K 或 128K 的上下文窗口。
41.7K 拉取 33 标签 更新于 12 个月前
Llama 2 的扩展,专门用于整合通用语言理解和领域特定知识,特别是在编程和数学方面。
41.3K Pulls 33 Tags 更新于 10 个月前
基于开源医疗数据集,对 Llama 2 模型进行微调,使其能够回答医疗问题。
38.8K Pulls 17 Tags 更新于 12 个月前
从 Llama 2 适应到医疗领域的开源医疗大型语言模型。
38.2K Pulls 22 Tags 更新于 11 个月前
Nexus Raven 是一个经过 130 亿次指令微调的模型,用于函数调用任务。
37.8K Pulls 32 Tags 更新于 9 个月前
一系列为视觉语言理解而设计的多模态 LLM(MLLM)。
37.2K Pulls 17 Tags 更新于 8 周前
Groq 推出一系列模型,代表着开源 AI 在工具使用/函数调用方面取得了重大进展。
35.9K Pulls 33 Tags 更新于 3 个月前
Nous Hermes 2 模型来自 Nous Research,现已在 Mixtral 上进行了训练。
34.8K Pulls 18 Tags 更新于 9 个月前
基于 Llama2 的优秀代码生成模型。
33.3K Pulls 19 Tags 更新于 12 个月前
支持 16K 上下文窗口的未经审查的 Llama2 基模型。
31.5K Pulls 18 Tags 更新于 10 个月前
Llama-3.1-Nemotron-70B-Instruct 是由 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的响应对用户查询的帮助性。
28.8K Pulls 17 Tags 更新于 3 周前
🎩 Magicoder 是一个由 70 亿参数模型组成的系列,使用 OSS-Instruct 在 75000 个合成指令数据上训练,OSS-Instruct 是一种通过开源代码片段来启发 LLM 的新方法。
28.7K Pulls 18 Tags 更新于 11 个月前
BGE-M3 是 BAAI 推出的一个新模型,以其在多功能性、多语言性和多粒度方面的多功能性而著称。
28K Pulls 3 Tags 更新于 3 个月前
轻量级聊天模型,无需高端硬件即可实现准确、快速的输出。
27.9K Pulls 17 Tags 更新于 10 个月前
通过合并两个现有的代码模型创建的高性能代码指令模型。
27.6K Pulls 16 Tags 更新于 12 个月前
Wizard Vicuna 是一个由 MelodysDreamj 训练的基于 Llama 2 的 130 亿参数模型。
26.7K Pulls 17 Tags 更新于 12 个月前
Falcon2 是 TII 构建的一个 110 亿参数因果解码器模型,在超过 5 万亿个 token 上训练。
26.5K Pulls 17 Tags 更新于 5 个月前
MistralLite 是基于 Mistral 的微调模型,具有增强的处理长上下文的能力。
26.1K 拉取请求 17 标签 更新于 12 个月前
由 MotherDuck 和 Numbers Station 创建的 70 亿参数文本到 SQL 模型。
24.9K 拉取请求 17 标签 更新于 9 个月前
MegaDolphin-2.2-120b 是由 Dolphin-2.2-70b 通过与自身交织创建的模型转换。
23K 拉取请求 19 标签 更新于 10 个月前
一个使用高质量数据微调的性能最优的专家混合模型。
22K 拉取请求 18 标签 更新于 10 个月前
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合并。专为聊天和代码生成而设计。
21.3K 拉取请求 17 标签 更新于 12 个月前
一个使用高质量数据微调并基于 Zephyr 的 70 亿参数聊天模型。
21.3K 拉取请求 18 标签 更新于 10 个月前
通过将两个微调的 Llama 2 70B 模型合并为一个而创建的语言模型。
21.2K 拉取请求 16 标签 更新于 11 个月前
MathΣtral:一个由 Mistral AI 设计的,用于数学推理和科学发现的 70 亿参数模型。
20.7K 拉取请求 17 标签 更新于 3 个月前
Solar Pro 预览:一个具有 220 亿参数的先进大型语言模型 (LLM),设计用于适应单个 GPU。
19.7K 拉取请求 18 标签 更新于 7 周前
一系列将 HTML 内容转换为 Markdown 内容的模型,这对于内容转换任务很有用。
17.5K Pulls 33 Tags 更新于 8 周前
IBM Granite 2B 和 8B 模型旨在支持基于工具的使用案例,并支持检索增强生成 (RAG),从而简化代码生成、翻译和错误修复。
17.2K Pulls 33 Tags 更新于 2 周前
基于 Phi-3,在私有的高质量合成数据集上微调的 3.8B 模型,用于信息提取。
16.3K Pulls 17 Tags 更新于 3 个月前
DBRX 是由 Databricks 创建的开放式通用 LLM。
16.3K Pulls 7 Tags 更新于 6 个月前
基于 Llama 3 的开放式权重函数调用模型,与 GPT-4o 函数调用功能相媲美。
13.8K Pulls 17 Tags 更新于 3 个月前
一个健壮的对话模型,旨在用于聊天和指令使用案例。
13K Pulls 7 Tags 更新于 11 个月前
IBM Granite 1B 和 3B 模型是 IBM 推出的第一个混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
11.5K Pulls 33 Tags 更新于 2 周前
来自 BAAI 的嵌入模型,将文本映射到向量。
11.1K Pulls 3 Tags 更新于 3 个月前
Cohere For AI 的语言模型经过训练,可以在 23 种不同语言中表现出色。
9,921 拉取 33 标签 更新于 2 周前
由 Bespoke Labs 开发的最新事实核查模型。
9,352 拉取 17 标签 更新于 7 周前
SmolLM2 是一个紧凑的语言模型系列,提供三种尺寸:1.35 亿、3.6 亿和 17 亿个参数。
9,063 拉取 49 标签 更新于 7 天前
DeepSeek-V2 的升级版本,它集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。
8,681 拉取 7 标签 更新于 8 周前
ShieldGemma 是一组针对指令微调的模型,用于根据一组定义的安全策略评估文本提示输入和文本输出响应的安全程度。
8,155 拉取 49 标签 更新于 4 周前
Llama Guard 3 是一系列模型,针对 LLM 输入和响应的内容安全分类进行了微调。
7,262 拉取 33 标签 更新于 4 周前
句子转换器模型,可用于聚类或语义搜索等任务。
6,323 拉取 3 标签 更新于 3 个月前
IBM Granite Guardian 3.0 2B 和 8B 模型旨在检测提示和/或响应中的风险。
1,070 拉取 10 标签 更新于 8 天前