
-
qwq
QwQ是Qwen系列的推理模型。
工具 32b868.3K 下载量 8 标签 更新于 6天前
-
deepseek-r1
DeepSeek的第一代推理模型,性能与OpenAI-o1相当,包括六个基于Llama和Qwen,从DeepSeek-R1提炼出的密集模型。
1.5b 7b 8b 14b 32b 70b 671b25.5M 下载量 29 标签 更新于 4周前
-
llama3.3
最新的 70B 模型。 Llama 3.3 70B 提供与 Llama 3.1 405B 模型类似的性能。
工具 70b1.5M 下载量 14 标签 更新于 3个月前
-
phi4
Phi-4 是来自 Microsoft 的一个 14B 参数、最先进的开放模型。
14b1M 下载量 5 标签 更新于 2个月前
-
llama3.2
Meta 的 Llama 3.2 以 1B 和 3B 模型变小。
工具 1b 3b10.4M 下载量 63 标签 更新于 5个月前
-
llama3.1
Llama 3.1 是 Meta 的一款最新的模型,具有 8B、70B 和 405B 参数大小。
工具 8b 70b 405b26.7M 下载量 93 标签 更新于 3 个月前
-
nomic-embed-text
一款高性能的开放嵌入模型,具有较大的token上下文窗口。
嵌入 (embedding)18.8M 下载量 3 标签 更新于 12 个月前
-
mistral
Mistral AI 发布的 7B 模型,已更新至 0.3 版本。
工具 7b10.2M 下载量 84 标签 更新于 7 个月前
-
llama3
Meta Llama 3:迄今为止能力最强的开放 LLM
8b 70b7.6M 下载量 68 标签 更新于 9 个月前
-
qwen2.5
Qwen2.5 模型在阿里巴巴最新的大规模数据集上进行预训练,该数据集包含多达 18 万亿个token。该模型支持多达 128K 个 token,并具有多语言支持。
工具 0.5b 1.5b 3b 7b 14b 32b 72b5.2M 下载量 133 标签 更新于 5 个月前
-
qwen2.5-coder
最新的 Code-Specific Qwen 模型系列,在代码生成、代码推理和代码修复方面有显著改进。
工具 0.5b 1.5b 3b 7b 14b 32b4.5M 下载量 196 标签 更新于 4 个月前
-
qwen
Qwen 1.5 是阿里云推出的一系列大型语言模型,参数规模从 0.5B 到 110B 不等
0.5b 1.8b 4b 7b 14b 32b 72b 110b4.5M 下载量 379 标签 更新于 10 个月前
-
gemma
Gemma 是 Google DeepMind 构建的一系列轻量级、最先进的开源模型。已更新至 1.1 版本
2b 7b4.4M 下载次数 102 标签 更新于 11 个月前
-
qwen2
Qwen2 是阿里巴巴集团推出的一系列新的大型语言模型
工具 0.5b 1.5b 7b 72b4.1M 下载次数 97 标签 更新于 6 个月前
-
llava
🌋 LLaVA 是一种新型端到端训练的大型多模态模型,它结合了视觉编码器和 Vicuna,用于通用视觉和语言理解。已更新至 1.6 版本。
视觉 7b 13b 34b4M 下载次数 98 标签 更新于 13 个月前
-
gemma2
Google Gemma 2 是一款高性能且高效的模型,有三种尺寸可供选择:2B、9B 和 27B。
2b 9b 27b3.4M 下载次数 94 标签 更新于 7 个月前
-
llama2
Llama 2 是一系列基础语言模型,参数范围从 7B 到 70B。
7b 13b 70b3M 下载次数 102 标签 更新于 14 个月前
-
phi3
Phi-3 是 Microsoft 推出的一系列轻量级、最先进的开源模型,包括 3B (Mini) 和 14B (Medium) 两个型号。
3.8b 14b2.9M 下载次数 72 标签 更新于 7 个月前
-
codellama
一种大型语言模型,可以使用文本提示来生成和讨论代码。
7b 13b 34b 70b1.8M Pulls 199 Tags Updated 7 months ago
-
mxbai-embed-large
mixedbread.ai 的最先进的大型嵌入模型
embedding (嵌入) 335m1.7M Pulls 4 Tags Updated 10 months ago
-
llama3.2-vision
Llama 3.2 Vision 是一个包含 11B 和 90B 大小的指令调整图像推理生成模型的集合。
vision (视觉) 11b 90b1.5M Pulls 9 Tags Updated 4 months ago
-
tinyllama
TinyLlama 项目是一项开放的努力,旨在在 3 万亿个 token 上训练一个紧凑的 1.1B Llama 模型。
1.1b1.3M Pulls 36 Tags Updated 14 months ago
-
mistral-nemo
Mistral AI 与 NVIDIA 合作构建的具有 128k 上下文长度的最先进的 12B 模型。
tools (工具) 12b1.3M Pulls 17 Tags Updated 7 months ago
-
starcoder2
StarCoder2 是下一代透明训练的开放代码 LLM,有三种尺寸:3B、7B 和 15B 参数。
3b 7b 15b897.6K Pulls 67 Tags Updated 6 months ago
-
deepseek-v3
一个强大的混合专家 (MoE) 语言模型,总参数为 671B,每个 token 激活 37B。
671b748.8K Pulls 5 Tags Updated 8 weeks ago
-
llama2-uncensored
George Sung 和 Jarrad Hope 发布的未审查的 Llama 2 模型。
7b 70b729K 下载次数 34 标签 更新于 16 个月前
-
deepseek-coder-v2
一个开源的混合专家模型,在代码相关任务中表现与 GPT4-Turbo 相当。
16b 236b722.2K 下载次数 64 标签 更新于 6 个月前
-
snowflake-arctic-embed
Snowflake 的一套文本嵌入模型,针对性能进行了优化。
嵌入 22m 33m 110m 137m 335m697.7K 下载次数 16 标签 更新于 10 个月前
-
deepseek-coder
DeepSeek Coder 是一个强大的编码模型,使用两万亿的代码和自然语言token进行训练。
1.3b 6.7b 33b601.5K 下载次数 102 标签 更新于 14 个月前
-
mixtral
Mistral AI 提供的一组具有开放权重的混合专家 (MoE) 模型,参数大小为 8x7b 和 8x22b。
工具 8x7b 8x22b582.7K 下载次数 70 标签 更新于 2 个月前
-
bge-m3
BGE-M3 是 BAAI 的一个新模型,其特点在于多功能性、多语言性和多粒度。
嵌入 567m556.5K 下载次数 3 标签 更新于 7 个月前
-
minicpm-v
一系列为视觉语言理解而设计的视觉-语言多模态大型语言模型(MLLM)。
视觉 8b537.1K 下载量 17 标签 已更新 3 个月前
-
codegemma
CodeGemma 是一个强大的轻量级模型集合,可以执行各种编码任务,例如中间代码补全、代码生成、自然语言理解、数学推理和指令跟随。
2b 7b530.6K 下载量 85 标签 已更新 7 个月前
-
dolphin-mixtral
基于 Mixtral 混合专家模型的无审查、8x7b 和 8x22b 微调模型,擅长编码任务。由 Eric Hartford 创建。
8x7b 8x22b522.3K 下载量 70 标签 已更新 2 个月前
-
openthinker
一个完全开源的推理模型家族,使用通过提炼 DeepSeek-R1 派生的数据集构建。
7b 32b509.8K 下载量 9 标签 已更新 3 周前
-
phi
Phi-2:微软研究院的 2.7B 语言模型,展示了出色的推理和语言理解能力。
2.7b497K 下载量 18 标签 已更新 14 个月前
-
llava-llama3
从 Llama 3 Instruct 微调的 LLaVA 模型,在多个基准测试中获得更好的分数。
视觉 8b448.8K 下载量 4 标签 已更新 10 个月前
-
dolphin3
Dolphin 3.0 Llama 3.1 8B 🐬 是下一代 Dolphin 系列指令调优模型,旨在成为终极通用本地模型,能够进行编码、数学、代理、函数调用和通用用例。
8b388.1K 下载量 5 标签 已更新 2 个月前
-
smollm2
SmolLM2 是一个紧凑的语言模型系列,有三种尺寸:135M、360M 和 1.7B 参数。
工具 135m 360m 1.7b371.5K 拉取次数 49 标签 更新于 4 个月前
-
wizardlm2
微软 AI 的先进大型语言模型,在复杂聊天、多语言、推理和代理用例方面具有改进的性能。
7b 8x22b356.8K 拉取次数 22 标签 更新于 11 个月前
-
olmo2
OLMo 2 是一个新的 7B 和 13B 模型系列,训练数据高达 5T tokens。 这些模型与同等大小的完全开放模型相当或更好,并且在英语学术基准测试中与 Llama 3.1 等开放权重模型相比具有竞争力。
7b 13b353.9K 拉取次数 9 标签 更新于 8 周前
-
dolphin-mistral
基于 Mistral 的未经审查的 Dolphin 模型,擅长编码任务。 已更新至 2.8 版本。
7b325.9K 拉取次数 120 标签 更新于 11 个月前
-
all-minilm
基于非常大的句子级别数据集的嵌入模型。
嵌入 22m 33m311.6K 拉取次数 10 标签 更新于 10 个月前
-
mistral-small
Mistral Small 3 在低于 70B 的“小型”大型语言模型类别中树立了新的基准。
工具 22b 24b298.6K 拉取次数 21 标签 更新于 5 周前
-
dolphin-llama3
Dolphin 2.9 是 Eric Hartford 基于 Llama 3 构建的,具有 8B 和 70B 尺寸的新模型,具有多种指令、对话和编码技能。
8b 70b293.5K 拉取次数 53 标签 更新于 10 个月前
-
command-r
Command R 是一种针对对话交互和长上下文任务优化的大型语言模型。
工具 35b283K 下载量 32 标签 更新于 6 个月前
-
orca-mini
一个通用模型,参数范围从 30 亿到 700 亿,适用于入门级硬件。
3b 7b 13b 70b277.3K 下载量 119 标签 更新于 16 个月前
-
yi
Yi 1.5 是一个高性能的双语语言模型。
6b 9b 34b267.3K 下载量 174 标签 更新于 10 个月前
-
hermes3
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本
工具 3b 8b 70b 405b264.7K 下载量 65 标签 更新于 2 个月前
-
phi3.5
一个轻量级 AI 模型,拥有 38 亿个参数,其性能超过了类似尺寸和更大尺寸的模型。
3.8b250K 下载量 17 标签 更新于 6 个月前
-
zephyr
Zephyr 是 Mistral 和 Mixtral 模型的一系列微调版本,经过训练可以充当有用的助手。
7b 141b238.3K 下载量 40 标签 更新于 11 个月前
-
codestral
Codestral 是 Mistral AI 的首个代码模型,专为代码生成任务而设计。
22b228K 下载量 17 标签 更新于 6 个月前
-
granite-code
IBM 提供的用于代码智能的开源基础模型系列
3b 8b 20b 34b191.6K 下载量 162 标签 更新于 6 个月前
-
smollm
🪐 一个小模型系列,参数分别为 1.35 亿、3.6 亿和 17 亿,使用新的高质量数据集进行训练。
135m 360m 1.7b188.4K 下载量 94 标签 更新于 6 个月前
-
starcoder
StarCoder 是一个在 80 多种编程语言上训练的代码生成模型。
1b 3b 7b 15b187.7K 下载量 100 标签 更新于 16 个月前
-
wizard-vicuna-uncensored
Wizard Vicuna Uncensored 是基于 Llama 2 的 7B、13B 和 30B 参数模型,由 Eric Hartford 去除审查。
7b 13b 30b185.8K 下载量 49 标签 更新于 16 个月前
-
vicuna
基于 Llama 和 Llama 2 的通用聊天模型,具有 2K 到 16K 的上下文大小。
7b 13b 33b176.2K 下载量 111 标签 更新于 16 个月前
-
mistral-openorca
Mistral OpenOrca 是一个 70 亿参数模型,使用 OpenOrca 数据集在 Mistral 7B 模型之上进行微调。
7b167.1K 下载量 17 标签 更新于 17 个月前
-
llama2-chinese
基于 Llama 2 的模型,经过微调以提高中文对话能力。
7b 13b149.9K 拉取次数 35 标签 更新于 16 个月前
-
openchat
一个开源模型系列,使用各种数据进行训练,在各种基准测试中超越 ChatGPT。已更新至 3.5-0106 版本。
7b145.4K 拉取次数 50 标签 更新于 14 个月前
-
codegeex4
一个多功能模型,适用于 AI 软件开发场景,包括代码补全。
9b139.2K 拉取次数 17 标签 更新于 8 个月前
-
aya
由 Cohere 发布的 Aya 23 是一个全新的最先进的多语言模型系列,支持 23 种语言。
8b 35b136.4K 拉取次数 33 标签 更新于 9 个月前
-
codeqwen
CodeQwen1.5 是一个在大量代码数据上预训练的大型语言模型。
7b133K 拉取次数 30 标签 更新于 8 个月前
-
deepseek-llm
一个使用 2 万亿双语 tokens 精心打造的先进语言模型。
7b 67b132.1K 拉取次数 64 标签 更新于 15 个月前
-
deepseek-v2
一个强大、经济且高效的混合专家语言模型。
16b 236b128.3K 拉取次数 34 标签 更新于 8 个月前
-
mistral-large
Mistral Large 2 是 Mistral 全新的旗舰模型,在代码生成、数学和推理方面能力显著增强,具有 128k 的上下文窗口并支持数十种语言。
工具 123b125.1K 下载量 32 标签 已更新 3 个月前
-
glm4
一个强大的多语言通用语言模型,性能与 Llama 3 具有竞争力。
9b123.5K 下载量 32 标签 已更新 8 个月前
-
stable-code
Stable Code 3B 是一个编码模型,具有指令和代码补全变体,与 Code Llama 7B 等模型相当,但体积小 2.5 倍。
3b122.4K 下载量 36 标签 已更新 11 个月前
-
openhermes
OpenHermes 2.5 是一个 7B 模型,由 Teknium 在 Mistral 上使用完全开放的数据集进行微调。
122.1K 下载量 35 标签 已更新 14 个月前
-
nous-hermes2
Nous Research 强大的模型系列,擅长科学讨论和编码任务。
10.7b 34b121.9K 下载量 33 标签 已更新 14 个月前
-
qwen2-math
Qwen2 Math 是一系列基于 Qwen2 LLM 构建的专用数学语言模型,其数学能力显著优于开源模型,甚至优于闭源模型(例如 GPT4o)。
1.5b 7b 72b120.6K 下载量 52 标签 已更新 6 个月前
-
tinydolphin
一个实验性的 1.1B 参数模型,由 Eric Hartford 在新的 Dolphin 2.8 数据集上训练,并基于 TinyLlama。
1.1b120.5K 下载量 18 标签 已更新 13 个月前
-
command-r-plus
Command R+ 是一款功能强大、可扩展的大型语言模型,专为在实际企业用例中表现出色而构建。
工具 104b119.7K 下载量 21 标签 已更新 6 个月前
-
moondream
moondream2 是一个小型视觉语言模型,旨在在边缘设备上高效运行。
视觉 1.8b117.2K Pulls 18 Tags Updated 10 months ago
-
wizardcoder
先进的代码生成模型
33b117.2K Pulls 67 Tags Updated 14 months ago
-
bakllava
BakLLaVA 是一个多模态模型,由 Mistral 7B 基础模型和 LLaVA 架构增强组成。
vision 7b109.7K Pulls 17 Tags Updated 15 months ago
-
stablelm2
Stable LM 2 是一个先进的 1.6B 和 12B 参数语言模型,使用英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据进行训练。
1.6b 12b108.1K Pulls 84 Tags Updated 10 months ago
-
neural-chat
一个基于 Mistral 微调的模型,在领域和语言方面具有良好的覆盖率。
7b104.7K Pulls 50 Tags Updated 14 months ago
-
reflection
一种高性能模型,使用一种名为 Reflection-tuning 的新技术进行训练,该技术教会 LLM 检测其推理中的错误并纠正方向。
70b103.4K Pulls 17 Tags Updated 6 months ago
-
wizard-math
专注于数学和逻辑问题的模型
7b 13b 70b101.1K Pulls 64 Tags Updated 14 months ago
-
llama3-gradient
此模型将 LLama-3 8B 的上下文长度从 8k 扩展到超过 100 万个 token。
8b 70b98.1K Pulls 35 Tags Updated 10 months ago
-
llama3-chatqa
来自 NVIDIA 的基于 Llama 3 的模型,擅长会话式问答 (QA) 和检索增强生成 (RAG)。
8b 70b97.2K 下载量 35 标签 更新于 10 个月前
-
sqlcoder
SQLCoder 是一个在 StarCoder 上微调的代码补全模型,用于 SQL 生成任务
7b 15b93.7K 下载量 48 标签 更新于 13 个月前
-
samantha-mistral
一个在哲学、心理学和人际关系方面训练的助手。基于 Mistral。
7b90.1K 下载量 49 标签 更新于 17 个月前
-
bge-large
来自 BAAI 的嵌入模型,将文本映射到向量。
embedding (嵌入) 335m89.7K 下载量 3 标签 更新于 7 个月前
-
xwinlm
基于 Llama 2 的对话模型,在各种基准测试中表现出竞争力。
7b 13b84.4K 下载量 80 标签 更新于 16 个月前
-
dolphincoder
Dolphin 模型系列的 7B 和 15B 未审查变体,擅长编码,基于 StarCoder2。
7b 15b84.2K 下载量 35 标签 更新于 11 个月前
-
nous-hermes
来自 Nous Research 的基于 Llama 和 Llama 2 的通用模型。
7b 13b82.3K 下载量 63 标签 更新于 16 个月前
-
granite3.1-dense
IBM Granite 2B 和 8B 模型是纯文本密集型 LLM,在超过 12 万亿个 token 的数据上进行训练,在 IBM 的初始测试中,性能和速度比其前代产品有了显著提高。
工具 2b 8b81.8K 下载量 33 标签 更新于 7 周前
-
llava-phi3
一个基于 Phi 3 Mini 微调的全新小型 LLaVA 模型。
视觉 3.8b81.7K 下载量 4 标签 更新于 10 个月前
-
phind-codellama
基于 Code Llama 的代码生成模型。
34b81.5K 下载量 49 标签 更新于 14 个月前
-
starling-lm
Starling 是一个大型语言模型,通过人工智能反馈的强化学习进行训练,专注于提高聊天机器人的实用性。
7b81.3K 下载量 36 标签 更新于 11 个月前
-
solar
一个紧凑而强大的 107 亿参数大型语言模型,专为单轮对话而设计。
10.7b79.1K 下载量 32 标签 更新于 15 个月前
-
yarn-llama2
Llama 2 的一个扩展,支持最多 128k tokens 的上下文。
7b 13b78.9K 下载量 67 标签 更新于 16 个月前
-
yi-coder
Yi-Coder 是一系列开源代码语言模型,以少于 100 亿的参数提供最先进的编码性能。
1.5b 9b77K 下载量 67 标签 更新于 6 个月前
-
athene-v2
Athene-V2 是一个 720 亿参数模型,擅长代码补全、数学和日志提取任务。
工具 72b76.9K 下载量 17 标签 更新于 3 个月前
-
wizardlm
基于 Llama 2 的通用模型。
75.8K 下载量 73 标签 更新于 16 个月前
-
internlm2
InternLM2.5 是一个拥有 70 亿参数的模型,专为具有出色推理能力的实际场景而定制。
100 万 18 亿 70 亿 200 亿74.1K 下载量 65 标签 更新于 6 个月前
-
falcon
一个由技术创新研究所 (TII) 构建的大型语言模型,用于摘要、文本生成和聊天机器人。
70 亿 400 亿 1800 亿70.2K 下载量 38 标签 更新于 16 个月前
-
nemotron-mini
NVIDIA 提供的商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。
工具 40 亿69.9K 下载量 17 标签 更新于 5 个月前
-
nemotron
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的对用户查询的回复的有用性。
工具 70b66.9K 下载量 17 标签 更新于 4 个月前
-
deepscaler
Deepseek-R1-Distilled-Qwen-1.5B 的微调版本,仅使用 15 亿个参数,在流行的数学评估中超越了 OpenAI 的 o1-preview 的性能。
15 亿66.3K 下载量 5 标签 更新于 4 周前
-
dolphin-phi
Eric Hartford 基于 Microsoft Research 的 Phi 语言模型的 27 亿未经审查的 Dolphin 模型。
2.7b65.9K 下载量 15 标签 更新于 14 个月前
-
orca2
Orca 2 由微软研究院构建,是 Meta 的 Llama 2 模型的微调版本。该模型的设计目标是在推理方面表现出色。
7b 13b63.8K 下载量 33 标签 更新时间 15个月前
-
wizardlm-uncensored
Wizard LM 模型的非审查版本
13b60.9K 下载量 18 标签 更新时间 16个月前
-
stable-beluga
基于 Llama 2 模型,在 Orca 风格的数据集上进行微调。 最初被称为 Free Willy。
7b 13b 70b59K 下载量 49 标签 更新时间 16个月前
-
granite3-dense
IBM Granite 2B 和 8B 模型旨在支持基于工具的用例,并支持检索增强生成 (RAG),从而简化代码生成、翻译和错误修复。
工具 2b 8b57.9K 下载量 33 标签 更新时间 3个月前
-
llama3-groq-tool-use
来自 Groq 的一系列模型,代表了开源 AI 在工具使用/函数调用能力方面的一项重大进步。
工具 8b 70b56.2K 下载量 33 标签 更新时间 7个月前
-
paraphrase-multilingual
可用于聚类或语义搜索等任务的 Sentence-transformers 模型。
嵌入 278m53K 下载量 3 标签 更新时间 7个月前
-
deepseek-v2.5
DeepSeek-V2 的升级版本,集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。
236b49.9K 下载量 7 标签 更新时间 6个月前
-
smallthinker
一个基于 Qwen 2.5 3B Instruct 模型微调的新的小型推理模型。
3b48.1K 下载量 5 标签 更新于 2个月前
-
medllama2
基于开源医疗数据集,经过微调的 Llama 2 模型,用于回答医疗问题。
7b47.7K 下载量 17 标签 更新于 16个月前
-
meditron
从 Llama 2 改编而来,用于医疗领域的开源医学大型语言模型。
7b 70b47.6K 下载量 22 标签 更新于 15个月前
-
aya-expanse
Cohere For AI 的语言模型,经过训练,可以在 23 种不同的语言中表现良好。
工具 80亿参数 320亿参数46.6K 下载量 33 标签 更新于 4个月前
-
llama-pro
Llama 2 的扩展,专门用于集成通用语言理解和特定领域知识,尤其是在编程和数学方面。
45.7K 下载量 33 标签 更新于 14个月前
-
yarn-mistral
Mistral 的一个扩展,用于支持 64K 或 128K 的上下文窗口。
7b45.2K 下载量 33 标签 更新于 16个月前
-
granite3-moe
IBM Granite 1B 和 3B 模型是 IBM 的首批混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
工具 1b 3b44.4K 下载量 33 标签 更新于 3个月前
-
falcon3
通过创新的训练技术,一个小于 10B 参数的高效 AI 模型系列,在科学、数学和编码方面表现出色。
10亿参数 30亿参数 70亿参数 100亿参数42.2K 下载量 17 标签 更新于 2个月前
-
nexusraven
Nexus Raven 是一个经过指令调整的 13B 模型,用于函数调用任务。
13b41.7K 下载量 32 标签 更新于 13 个月前
-
codeup
基于 Llama2 的优秀代码生成模型。
13b39.7K 下载量 19 标签 更新于 16 个月前
-
everythinglm
基于 Llama2 的非审查模型,支持 16K 上下文窗口。
13b38.5K 下载量 18 标签 更新于 14 个月前
-
nous-hermes2-mixtral
Nous Research 的 Nous Hermes 2 模型,现在已通过 Mixtral 训练。
8x7b38.4K 下载量 18 标签 更新于 2 个月前
-
snowflake-arctic-embed2
Snowflake 的前沿嵌入模型。 Arctic Embed 2.0 增加了多语言支持,同时不牺牲英语性能或可扩展性。
嵌入 568m37.2K 下载量 3 标签 更新于 3 个月前
-
shieldgemma
ShieldGemma 是一组指令调整模型,用于评估文本提示输入和文本输出响应针对一组已定义的安全策略的安全性。
2b 9b 27b36.1K 下载量 49 标签 更新于 5 个月前
-
granite3.1-moe
IBM Granite 1B 和 3B 模型是 IBM 专为低延迟使用而设计的长上下文专家混合 (MoE) Granite 模型。
工具 1b 3b35.5K 下载量 33 标签 更新于 7 周前
-
marco-o1
阿里巴巴国际数字商业集团 (AIDC-AI) 打造的用于现实世界解决方案的开放大型推理模型。
7b33.3K 下载量 5 标签 更新于 3 个月前
-
mathstral
MathΣtral:由 Mistral AI 设计的 7B 模型,用于数学推理和科学发现。
7b32.7K 下载量 17 标签 更新于 7 个月前
-
reader-lm
一系列将 HTML 内容转换为 Markdown 内容的模型,可用于内容转换任务。
0.5b 1.5b32.5K 下载量 33 标签 更新于 6 个月前
-
falcon2
Falcon2 是由 TII 构建的 11B 参数的仅因果解码器模型,并在 5T tokens 上进行训练。
11b32.3K 下载量 17 标签 更新于 10 个月前
-
magicoder
🎩 Magicoder 是一个 7B 参数模型系列,使用 OSS-Instruct(一种使用开源代码片段启发 LLM 的新方法)在 75K 合成指令数据上进行训练。
7b32.2K 下载量 18 标签 更新于 15 个月前
-
stablelm-zephyr
一种轻量级聊天模型,允许准确且响应迅速的输出,而无需高端硬件。
3b32.1K 下载量 17 标签 更新于 14 个月前
-
phi4-mini
Phi-4-mini 在多语言支持、推理和数学方面带来了显着增强,现在终于支持期待已久的功能调用功能。
工具 3.8b32.1K 下载量 5 标签 更新于 11 天前
-
solar-pro
Solar Pro 预览版:一种先进的大型语言模型 (LLM),具有 220 亿个参数,旨在适应单个 GPU
22b32.1K 下载量 18 标签 更新于 5 个月前
-
codebooga
通过合并两个现有的代码模型创建的高性能代码指令模型。
34b31.4K 下载量 16 标签 更新于 16 个月前
-
llama-guard3
Llama Guard 3 是一系列微调的模型,用于对 LLM 输入和响应进行内容安全分类。
10 亿 80 亿30.6K 下载量 33 标签 更新于 5 个月前
-
duckdb-nsql
MotherDuck 和 Numbers Station 制作的 70 亿参数的 text-to-SQL 模型。
7b30.5K 下载量 17 标签 更新于 13 个月前
-
mistrallite
MistralLite 是基于 Mistral 的微调模型,增强了处理长上下文的能力。
7b30.1K 下载量 17 标签 更新于 16 个月前
-
wizard-vicuna
Wizard Vicuna 是一个基于 Llama 2 的 130 亿参数模型,由 MelodysDreamj 训练。
13b29.6K 下载量 17 标签 更新于 16 个月前
-
exaone3.5
EXAONE 3.5 是 LG AI Research 开发和发布的一系列指令调整的双语(英语和韩语)生成模型,参数范围从 24 亿到 320 亿。
24 亿 78 亿 320 亿29.2K 下载量 13 标签 更新于 3 个月前
-
nuextract
一个基于 Phi-3,在私有的高质量合成数据集上微调的 38 亿参数模型,用于信息提取。
3.8b26.4K 下载量 17 标签 更新于 7 个月前
-
opencoder
OpenCoder 是一个开放且可复现的代码 LLM 系列,包括 15 亿和 80 亿参数的模型,支持英语和中文的聊天。
15 亿 80 亿26.1K 拉取次数 9 标签 更新于 3 个月前
-
megadolphin
MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的一种转换,通过将模型与其自身交织而成。
120b25.3K 拉取次数 19 标签 更新于 14 个月前
-
command-r7b
Cohere R 系列中最小的模型,提供顶级的速度、效率和质量,以便在商品 GPU 和边缘设备上构建强大的 AI 应用程序。
工具 7b24.5K 拉取次数 5 标签 更新于 7 周前
-
notux
一种性能卓越的专家混合模型,使用高质量数据进行微调。
8x7b24.4K 拉取次数 18 标签 更新于 14 个月前
-
open-orca-platypus2
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合并。 专为聊天和代码生成而设计。
13b23.9K 拉取次数 17 标签 更新于 16 个月前
-
notus
一个基于 Zephyr,使用高质量数据进行微调的 7B 聊天模型。
7b23.7K 拉取次数 18 标签 更新于 14 个月前
-
goliath
通过将两个微调的 Llama 2 70B 模型合并为一个而创建的语言模型。
23K 拉取次数 16 标签 更新于 16 个月前
-
bespoke-minicheck
由 Bespoke Labs 开发的先进的事实核查模型。
7b22.7K 拉取次数 17 标签 更新于 5 个月前
-
granite-embedding
IBM Granite Embedding 30M 和 278M 模型是纯文本密集双编码器嵌入模型,其中 30M 仅提供英文版本,278M 提供多语言用例。
嵌入 30m 278m21.3K 下载量 6 标签 更新于 2 个月前
-
tulu3
Tülu 3 是一个领先的指令遵循模型系列,由艾伦人工智能研究所提供完全开源的数据、代码和配方。
8b 70b20.2K 下载量 9 标签 更新于 2 个月前
-
granite3.2-vision
一个紧凑而高效的视觉-语言模型,专为视觉文档理解而设计,能够自动从表格、图表、信息图表、绘图、示意图等中提取内容。
视觉 工具 20 亿参数19.3K 下载量 5 标签 更新于 12 天前
-
firefunction-v2
一个基于 Llama 3 的开放权重函数调用模型,在函数调用能力上与 GPT-4o 竞争。
工具 70b19K 下载量 17 标签 更新于 7 个月前
-
dbrx
DBRX 是 Databricks 创建的一个开放的、通用的大语言模型。
1320 亿参数18.4K 下载量 7 标签 更新于 11 个月前
-
granite3.2
Granite-3.2 是 IBM Granite 的长上下文 AI 模型系列,经过微调以增强思考能力。
工具 2b 8b16.9K 下载量 9 标签 更新于 2 周前
-
granite3-guardian
IBM Granite Guardian 3.0 的 2B 和 8B 模型旨在检测提示和/或响应中的风险。
20 亿参数 80 亿参数16.6K 下载量 10 标签 更新于 3 个月前
-
gemma3
当前最强大的可运行在单个 GPU 上的模型。
1b 4b 12b 27b16.6K 拉取次数 9 标签 更新于 4 小时前
-
r1-1776
一个 DeepSeek-R1 模型的版本,经过 Perplexity 的后期训练,可提供公正、准确和真实的信息。
70b 671b16.1K 拉取次数 9 标签 更新于 2 周前
-
alfred
一个强大的对话模型,设计用于聊天和指令用例。
40b15.9K 拉取次数 7 标签 更新于 15 个月前
-
sailor2
Sailor2 是为东南亚设计的多语种语言模型。提供 1B、8B 和 20B 参数大小。
1b 8b 20b9,796 拉取次数 13 标签 更新于 3 个月前
-
command-r7b-arabic
轻量级 Command R7B 模型的全新最先进版本,在中东和北非企业的先进阿拉伯语功能方面表现出色。
工具 7b3,373 拉取次数 5 标签 更新于 11 天前