
-
deepseek-r1
DeepSeek 的第一代推理模型,性能与 OpenAI-o1 相当,包括从基于 Llama 和 Qwen 的 DeepSeek-R1 提炼出的六个密集模型。
1.5b 7b 8b 14b 32b 70b 671b7.7M 下载量 28 标签 更新时间 13 days ago
-
llama3.3
最新的 70B 模型。Llama 3.3 70B 提供了与 Llama 3.1 405B 模型相当的性能。
tools 70b1.1M 下载量 14 标签 更新时间 8 weeks ago
-
phi4
Phi-4 是微软的 14B 参数、最先进的开放模型。
14b310.5K 下载量 5 标签 更新时间 3 weeks ago
-
llama3.2
Meta 的 Llama 3.2 缩小规模,推出了 1B 和 3B 模型。
tools 1b 3b8.1M 下载量 63 标签 更新时间 4 months ago
-
llama3.1
Llama 3.1 是 Meta 推出的最新最先进的模型,提供 8B、70B 和 405B 参数尺寸。
tools 8b 70b 405b21.9M 下载量 93 标签 更新时间 2 months ago
-
nomic-embed-text
一款高性能的开放嵌入模型,具有大的 token 上下文窗口。
embedding14M 下载量 3 标签 更新时间 11 months ago
-
mistral
Mistral AI 发布的 7B 模型,已更新至 0.3 版本。
tools 7b8.5M 下载量 84 标签 更新时间 6 months ago
-
llama3
Meta Llama 3:迄今为止功能最强大的公开 LLM。
8b 70b7.4M 下载量 68 标签 更新时间 8 months ago
-
qwen
Qwen 1.5 是阿里云推出的一系列大型语言模型,参数规模从 0.5B 到 110B。
0.5b 1.8b 4b 7b 14b 32b 72b 110b4.3M 下载量 379 标签 更新时间 9 months ago
-
gemma
Gemma 是 Google DeepMind 构建的一系列轻量级、最先进的开放模型。已更新至 1.1 版本。
2b 7b4.3M 下载量 102 标签 更新时间 10 months ago
-
qwen2
Qwen2 是阿里巴巴集团推出的新系列大型语言模型。
tools 0.5b 1.5b 7b 72b4.1M 下载量 97 标签 更新时间 4 months ago
-
qwen2.5
Qwen2.5 模型在阿里巴巴最新的大规模数据集上进行了预训练,涵盖多达 18 万亿个 token。该模型支持最多 128K 个 token,并具有多语言支持。
tools 0.5b 1.5b 3b 7b 14b 32b 72b3.6M 下载量 133 标签 更新时间 4 months ago
-
llama2
Llama 2 是一系列基础语言模型,参数规模从 7B 到 70B 不等。
7b 13b 70b2.9M 下载量 102 标签 更新时间 13 months ago
-
llava
🌋 LLaVA 是一种新颖的端到端训练的大型多模态模型,它结合了视觉编码器和 Vicuna,用于通用的视觉和语言理解。已更新至 1.6 版本。
vision 7b 13b 34b2.9M 下载量 98 标签 更新时间 12 months ago
-
phi3
Phi-3 是微软推出的一系列轻量级 3B (Mini) 和 14B (Medium) 最先进的开放模型。
3.8b 14b2.9M 下载量 72 标签 更新时间 6 months ago
-
gemma2
Google Gemma 2 是一款高性能且高效的模型,提供三种尺寸:2B、9B 和 27B。
2b 9b 27b2.5M 下载量 94 标签 更新时间 6 months ago
-
qwen2.5-coder
Code-Specific Qwen 模型的最新系列,在代码生成、代码推理和代码修复方面有显著改进。
工具 0.5b 1.5b 3b 7b 14b 32b1.9M 下载量 196 标签 更新于 2 months ago
-
codellama
一个可以使用文本提示生成和讨论代码的大型语言模型。
7b 13b 34b 70b1.7M 下载量 199 标签 更新于 6 months ago
-
tinyllama
TinyLlama 项目是一项开放的努力,旨在用 3 万亿个 tokens 训练一个紧凑的 1.1B Llama 模型。
1.1b1.3M 下载量 36 标签 更新于 13 months ago
-
mxbai-embed-large
来自 mixedbread.ai 的最先进的大型嵌入模型
嵌入 335m1.2M 下载量 4 标签 更新于 9 months ago
-
mistral-nemo
由 Mistral AI 与 NVIDIA 合作构建的,具有 128k 上下文长度的最先进的 12B 模型。
工具 12b1.1M 下载量 17 标签 更新于 6 months ago
-
llama3.2-vision
Llama 3.2 Vision 是指令微调的图像推理生成模型的集合,尺寸包括 11B 和 90B。
视觉 11b 90b1M 下载量 9 标签 更新于 2 months ago
-
starcoder2
StarCoder2 是下一代透明训练的开放代码 LLM,有三种尺寸:3B、7B 和 15B 参数。
3b 7b 15b831.7K 下载量 67 标签 更新于 5 months ago
-
snowflake-arctic-embed
Snowflake 的一套文本嵌入模型,针对性能进行了优化。
嵌入 22m 33m 110m 137m 335m604.4K 下载量 16 标签 更新于 9 months ago
-
mixtral
Mistral AI 提供的,具有开放权重的专家混合 (MoE) 模型集,参数大小为 8x7b 和 8x22b。
工具 8x7b 8x22b545.1K 下载量 70 标签 更新于 6 weeks ago
-
deepseek-coder-v2
一个开源的专家混合代码语言模型,在代码特定任务中实现了与 GPT4-Turbo 相当的性能。
16b 236b536.4K 下载量 64 标签 更新于 5 months ago
-
dolphin-mixtral
基于 Mixtral 专家混合模型微调的,擅长编码任务的,未审查的 8x7b 和 8x22b 模型。由 Eric Hartford 创建。
8x7b 8x22b489.4K 下载量 70 标签 更新于 6 weeks ago
-
phi
Phi-2:微软研究院的 2.7B 语言模型,展示了出色的推理和语言理解能力。
2.7b480.3K 下载量 18 标签 更新于 13 months ago
-
codegemma
CodeGemma 是一系列功能强大、轻量级的模型,可以执行各种编码任务,如中间代码补全、代码生成、自然语言理解、数学推理和指令跟随。
2b 7b476.7K 下载量 85 标签 更新于 6 months ago
-
deepseek-coder
DeepSeek Coder 是一个功能强大的编码模型,在两万亿个代码和自然语言 tokens 上训练而成。
1.3b 6.7b 33b469.9K 下载量 102 标签 更新于 13 months ago
-
llama2-uncensored
George Sung 和 Jarrad Hope 提供的未审查的 Llama 2 模型。
7b 70b458.9K 下载量 34 标签 更新于 15 months ago
-
wizardlm2
微软 AI 提供的最先进的大型语言模型,在复杂聊天、多语言、推理和代理用例方面具有改进的性能。
7b 8x22b349.9K 下载量 22 标签 更新于 9 months ago
-
dolphin-mistral
基于 Mistral 的未审查的 Dolphin 模型,擅长编码任务。已更新至 2.8 版本。
7b312.8K 下载量 120 标签 更新于 10 months ago
-
bge-m3
BGE-M3 是 BAAI 的一个新模型,因其在多功能性、多语言性和多粒度方面的通用性而著称。
嵌入 567m288.6K 下载次数 3 标签 更新于 6 months ago
-
all-minilm
在超大型句子级数据集上训练的嵌入模型。
嵌入 22m 33m280.2K 下载次数 10 标签 更新于 9 months ago
-
dolphin-llama3
Dolphin 2.9 是 Eric Hartford 基于 Llama 3 开发的最新模型,拥有 8B 和 70B 两种尺寸,具备多种指令、对话和编码能力。
8b 70b277.1K 下载次数 53 标签 更新于 8 months ago
-
command-r
Command R 是一款大型语言模型,针对对话式交互和长上下文任务进行了优化。
工具 35b275K 下载次数 32 标签 更新于 5 months ago
-
orca-mini
一款通用模型,参数规模从 30 亿到 700 亿不等,适用于入门级硬件。
3b 7b 13b 70b268.3K 下载次数 119 标签 更新于 15 months ago
-
llava-llama3
一款基于 Llama 3 Instruct 微调的 LLaVA 模型,在多项基准测试中取得了更好的成绩。
视觉 8b265.5K 下载次数 4 标签 更新于 9 months ago
-
yi
Yi 1.5 是一款高性能的双语语言模型。
6b 9b 34b261.2K 下载次数 174 标签 更新于 8 months ago
-
hermes3
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本
工具 3b 8b 70b 405b249.8K 下载次数 65 标签 更新于 7 weeks ago
-
zephyr
Zephyr 是 Mistral 和 Mixtral 模型的一系列微调版本,旨在作为有用的助手。
7b 141b233.2K 下载次数 40 标签 更新于 9 months ago
-
phi3.5
一款轻量级 AI 模型,拥有 38 亿参数,性能超越了同等规模和更大规模的模型。
3.8b229.9K 下载次数 17 标签 更新于 5 months ago
-
codestral
Codestral 是 Mistral AI 的首个代码模型,专为代码生成任务而设计。
22b205K 下载次数 17 标签 更新于 5 months ago
-
starcoder
StarCoder 是一款在 80 多种编程语言上训练的代码生成模型。
1b 3b 7b 15b181.4K 下载次数 100 标签 更新于 15 months ago
-
granite-code
IBM 推出的一系列用于代码智能的开放基础模型
3b 8b 20b 34b181.2K 下载次数 162 标签 更新于 5 months ago
-
vicuna
基于 Llama 和 Llama 2 的通用聊天模型,上下文长度为 2K 到 16K。
7b 13b 33b172.5K 下载次数 111 标签 更新于 15 months ago
-
wizard-vicuna-uncensored
Wizard Vicuna Uncensored 是 Eric Hartford 基于 Llama 2 Uncensored 开发的 7B、13B 和 30B 参数模型。
7b 13b 30b171.6K 下载次数 49 标签 更新于 15 months ago
-
smollm
🪐 一系列小型模型,参数规模为 135M、360M 和 1.7B,在新高质量数据集上训练。
135m 360m 1.7b169K 下载次数 94 标签 更新于 5 months ago
-
mistral-openorca
Mistral OpenOrca 是一款 70 亿参数模型,基于 Mistral 7B 模型使用 OpenOrca 数据集进行微调。
7b164.8K 下载次数 17 标签 更新于 16 months ago
-
deepseek-v3
一款强大的混合专家 (MoE) 语言模型,总参数量为 671B,每个 token 激活 37B 参数。
671b159.4K 下载次数 5 标签 更新于 3 weeks ago
-
qwq
QwQ 是一款实验性研究模型,专注于提升 AI 推理能力。
工具 32b153.9K 下载次数 5 标签 更新于 2 months ago
-
smollm2
SmolLM2 是一系列紧凑型语言模型,提供三种尺寸:135M、360M 和 1.7B 参数。
工具 135m 360m 1.7b153.7K 下载次数 49 标签 更新于 3 months ago
-
llama2-chinese
基于 Llama 2 的模型,经过微调以提高中文对话能力。
7b 13b146K 下载次数 35 标签 更新于 15 months ago
-
openchat
一系列开源模型,在各种数据上训练,在多项基准测试中超越 ChatGPT。已更新至 3.5-0106 版本。
7b136.6K 下载量 50 标签 更新时间 13 months ago
-
codegeex4
一个多功能的模型,适用于人工智能软件开发场景,包括代码补全。
9b133.8K 下载量 17 标签 更新时间 7 months ago
-
aya
Aya 23 是由 Cohere 发布的,是新一代最先进的多语言模型系列,支持 23 种语言。
8b 35b130.9K 下载量 33 标签 更新时间 8 months ago
-
codeqwen
CodeQwen1.5 是一个大型语言模型,在大量的代码数据上进行了预训练。
7b126.4K 下载量 30 标签 更新时间 7 months ago
-
nous-hermes2
Nous Research 强大的模型系列,擅长科学讨论和编码任务。
10.7b 34b120.2K 下载量 33 标签 更新时间 13 months ago
-
mistral-large
Mistral Large 2 是 Mistral 全新的旗舰模型,在代码生成、数学和推理方面能力显著提升,拥有 128k 上下文窗口,并支持数十种语言。
工具 123b119K 下载量 32 标签 更新时间 2 months ago
-
stable-code
Stable Code 3B 是一个编码模型,具有指令和代码补全变体,与 Code Llama 7B 等模型相当,但模型大小仅为其 2.5 分之一。
3b117K 下载量 36 标签 更新时间 10 months ago
-
openhermes
OpenHermes 2.5 是一个 7B 模型,由 Teknium 在 Mistral 上使用完全开放的数据集进行微调。
117K 下载量 35 标签 更新时间 13 months ago
-
command-r-plus
Command R+ 是一款功能强大、可扩展的大型语言模型,专为在真实世界的企业用例中表现出色而构建。
工具 104b116.9K 下载量 21 标签 更新时间 5 months ago
-
deepseek-llm
一款先进的语言模型,使用 2 万亿双语 tokens 精心打造。
7b 67b116.6K 下载量 64 标签 更新时间 14 months ago
-
tinydolphin
一个实验性的 1.1B 参数模型,由 Eric Hartford 基于 TinyLlama,在新 Dolphin 2.8 数据集上训练而成。
1.1b115.5K 下载量 18 标签 更新时间 12 months ago
-
glm4
一个强大的多语言通用语言模型,性能可与 Llama 3 媲美。
9b115.3K 下载量 32 标签 更新时间 7 months ago
-
qwen2-math
Qwen2 Math 是基于 Qwen2 LLMs 构建的专业数学语言模型系列,其数学能力显著优于开源模型,甚至闭源模型(例如 GPT4o)。
1.5b 7b 72b114.4K 下载量 52 标签 更新时间 5 months ago
-
wizardcoder
最先进的代码生成模型
33b114.3K 下载量 67 标签 更新时间 13 months ago
-
bakllava
BakLLaVA 是一个多模态模型,由 Mistral 7B 基础模型和 LLaVA 架构增强而成。
视觉 7b105.6K 下载量 17 标签 更新时间 13 months ago
-
stablelm2
Stable LM 2 是一个最先进的 1.6B 和 12B 参数语言模型,使用英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据进行训练。
1.6b 12b105.1K 下载量 84 标签 更新时间 9 months ago
-
minicpm-v
一系列为视觉-语言理解而设计的多模态 LLMs (MLLMs)。
视觉 8b102.5K 下载量 17 标签 更新时间 2 months ago
-
reflection
一款高性能模型,使用一种名为“反思调优”的新技术进行训练,该技术教会 LLM 检测其推理中的错误并纠正方向。
70b102.1K 下载量 17 标签 更新时间 4 months ago
-
deepseek-v2
一个强大、经济高效的专家混合语言模型。
16b 236b102K 下载量 34 标签 更新时间 7 months ago
-
moondream
moondream2 是一个小型视觉语言模型,旨在在边缘设备上高效运行。
视觉 1.8b100.8K 下载量 18 标签 更新时间 9 months ago
-
neural-chat
一个基于 Mistral 微调的模型,在领域和语言覆盖方面表现良好。
7b99.6K 下载量 50 标签 更新时间 13 months ago
-
mistral-small
Mistral Small 3 在 70B 以下的“小型”大型语言模型类别中树立了新的基准。
工具 22b 24b96.5K 下载量 21 标签 更新时间 4 days ago
-
llama3-gradient
该模型将 LLama-3 8B 的上下文长度从 8k 扩展到超过 100 万 tokens。
8b 70b96.1K 下载量 35 标签 更新时间 9 months ago
-
wizard-math
专注于数学和逻辑问题的模型
7b 13b 70b96K 下载量 64 标签 更新时间 13 months ago
-
llama3-chatqa
一个来自 NVIDIA 基于 Llama 3 的模型,擅长对话式问答 (QA) 和检索增强生成 (RAG)。
8b 70b88.3K 下载量 35 标签 更新时间 8 months ago
-
sqlcoder
SQLCoder 是一个在 StarCoder 上微调的代码补全模型,用于 SQL 生成任务
7b 15b86.9K 下载量 48 标签 更新时间 12 months ago
-
xwinlm
基于 Llama 2 的对话模型,在各种基准测试中表现出竞争力。
7b 13b83.2K 下载量 80 标签 更新时间 15 months ago
-
dolphincoder
Dolphin 模型系列的一个 7B 和 15B 无审查变体,基于 StarCoder2,擅长编码。
7b 15b81K 下载量 35 标签 更新时间 10 months ago
-
nous-hermes
来自 Nous Research 的基于 Llama 和 Llama 2 的通用模型。
7b 13b80.9K 下载量 63 标签 更新时间 15 months ago
-
phind-codellama
基于 Code Llama 的代码生成模型。
34b80K 下载量 49 标签 更新时间 13 months ago
-
yarn-llama2
Llama 2 的扩展,支持高达 128k tokens 的上下文。
7b 13b77.7K 下载量 67 标签 更新时间 15 months ago
-
solar
一个紧凑而强大的 10.7B 大型语言模型,专为单轮对话而设计。
10.7b76.2K 下载量 32 标签 更新时间 13 months ago
-
starling-lm
Starling 是一个通过人工智能反馈的强化学习训练的大型语言模型,专注于提高聊天机器人助手能力。
7b75.5K 下载量 36 标签 更新时间 10 months ago
-
wizardlm
基于 Llama 2 的通用模型。
75.4K 下载量 73 标签 更新时间 15 months ago
-
llava-phi3
一个基于 Phi 3 Mini 微调的全新小型 LLaVA 模型。
视觉 3.8b72.9K 下载量 4 标签 更新时间 9 months ago
-
yi-coder
Yi-Coder 是一系列开源代码语言模型,以不到 100 亿的参数提供最先进的编码性能。
1.5b 9b72.8K 下载量 67 标签 更新时间 4 months ago
-
athene-v2
Athene-V2 是一个 72B 参数模型,擅长代码补全、数学和日志提取任务。
工具 72b70K 下载量 17 标签 更新时间 2 months ago
-
internlm2
InternLM2.5 是一个 7B 参数模型,专为实际场景量身定制,具有出色的推理能力。
1m 1.8b 7b 20b70K 下载量 65 标签 更新时间 5 months ago
-
falcon
一个由技术创新研究所 (TII) 构建的大型语言模型,用于摘要、文本生成和聊天机器人。
7b 40b 180b67.2K 下载量 38 标签 更新时间 15 months ago
-
samantha-mistral
一个在哲学、心理学和人际关系方面训练的伴侣助手。基于 Mistral。
7b67.1K 下载量 49 标签 更新时间 15 months ago
-
orca2
Orca 2 由微软研究院构建,是 Meta 的 Llama 2 模型的微调版本。该模型旨在特别擅长推理。
7b 13b61.2K 下载量 33 标签 更新时间 14 months ago
-
nemotron
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的回复对用户查询的帮助性。
tools 70b60.7K 下载量 17 标签 更新时间 3 months ago
-
nemotron-mini
NVIDIA 推出的商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。
工具 4b59.3K 下载量 17 标签 更新时间 4 months ago
-
dolphin-phi
Eric Hartford 推出的 2.7B 无审查 Dolphin 模型,基于 Microsoft Research 的 Phi 语言模型。
2.7b59.2K 下载量 15 标签 更新于 13 months ago
-
stable-beluga
基于 Llama 2 模型微调于 Orca 风格数据集。原名 Free Willy。
7b 13b 70b58.1K 下载量 49 标签 更新于 15 months ago
-
wizardlm-uncensored
Wizard LM 模型的无审查版本
13b57.5K 下载量 18 标签 更新于 15 months ago
-
dolphin3
Dolphin 3.0 Llama 3.1 8B 🐬 是 Dolphin 系列指令调优模型的下一代,旨在成为终极通用本地模型,支持编码、数学、代理、函数调用和通用用例。
8b55.5K 下载量 5 标签 更新于 4 weeks ago
-
llama3-groq-tool-use
Groq 系列模型,代表了开源 AI 在工具使用/函数调用能力方面的重大进步。
工具 8b 70b46.8K 下载量 33 标签 更新于 6 months ago
-
granite3.1-dense
IBM Granite 2B 和 8B 模型是纯文本密集型 LLM,使用超过 12 万亿个 tokens 的数据进行训练,在 IBM 的初步测试中,性能和速度均比其前代产品有了显著提升。
工具 2b 8b46.3K 下载量 33 标签 更新于 2 weeks ago
-
granite3-dense
IBM Granite 2B 和 8B 模型旨在支持基于工具的用例和检索增强生成 (RAG),从而简化代码生成、翻译和错误修复。
工具 2b 8b45.5K 下载量 33 标签 更新于 2 months ago
-
medllama2
微调的 Llama 2 模型,用于根据开源医疗数据集回答医疗问题。
7b44.9K 下载量 17 标签 更新于 15 months ago
-
llama-pro
Llama 2 的扩展,专门用于整合通用语言理解和特定领域知识,尤其是在编程和数学领域。
44.6K 下载量 33 标签 更新于 13 months ago
-
yarn-mistral
Mistral 的扩展,以支持 64K 或 128K 的上下文窗口。
7b44.5K 下载量 33 标签 更新于 15 months ago
-
meditron
从 Llama 2 改编而来的开源医学大型语言模型,应用于医学领域。
7b 70b44.2K 下载量 22 标签 更新于 14 months ago
-
nexusraven
Nexus Raven 是一个针对函数调用任务的 13B 指令调优模型。
13b40.8K 下载量 32 标签 更新于 12 months ago
-
nous-hermes2-mixtral
Nous Research 的 Nous Hermes 2 模型,现在基于 Mixtral 训练。
8x7b37.4K 下载量 18 标签 更新于 6 weeks ago
-
smallthinker
一个基于 Qwen 2.5 3B Instruct 模型微调的全新小型推理模型。
3b37.1K 下载量 5 标签 更新于 5 weeks ago
-
codeup
基于 Llama2 的出色代码生成模型。
13b36.2K 下载量 19 标签 更新于 15 months ago
-
everythinglm
基于 Llama2 的无审查模型,支持 16K 上下文窗口。
13b35.6K 下载量 18 标签 更新于 13 months ago
-
granite3-moe
IBM Granite 1B 和 3B 模型是 IBM 推出的首批混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
tools 1b 3b34.5K 下载量 33 标签 更新于 2 months ago
-
aya-expanse
Cohere For AI 的语言模型,经过训练可在 23 种不同的语言中表现良好。
工具 8b 32b33K 下载量 33 标签 更新于 3 months ago
-
magicoder
🎩 Magicoder 是一个 7B 参数模型系列,使用 OSS-Instruct 训练了 75K 合成指令数据,OSS-Instruct 是一种通过开源代码片段启发 LLM 的新颖方法。
7b31.3K 下载量 18 标签 更新于 14 months ago
-
falcon2
Falcon2 是 TII 构建的 11B 参数因果解码器专用模型,并使用超过 5 万亿个 tokens 进行训练。
11b31.1K 下载量 17 标签 更新于 8 months ago
-
stablelm-zephyr
一种轻量级聊天模型,允许准确且响应迅速的输出,而无需高端硬件。
3b30.7K 下载量 17 标签 更新于 13 months ago
-
codebooga
通过合并两个现有代码模型创建的高性能代码指令模型。
34b30.4K 下载量 16 标签 更新时间 15 months ago
-
bge-large
来自BAAI的嵌入模型,将文本映射到向量。
嵌入 335m30.3K 下载量 3 标签 更新时间 6 months ago
-
mathstral
MathΣtral:由Mistral AI设计的7B模型,用于数学推理和科学发现。
7b29.9K 下载量 17 标签 更新时间 6 months ago
-
olmo2
OLMo 2 是一个新的 7B 和 13B 模型系列,使用高达 5T 的 tokens 训练。这些模型与同等大小的完全开源模型性能相当或更好,并且在英语学术基准测试中与 Llama 3.1 等开放权重模型具有竞争力。
7b 13b29K 下载量 9 标签 更新时间 3 weeks ago
-
mistrallite
MistralLite 是一个基于 Mistral 微调的模型,增强了处理长上下文的能力。
7b28.9K 下载量 17 标签 更新时间 15 months ago
-
wizard-vicuna
Wizard Vicuna 是一个基于 Llama 2 的 13B 参数模型,由 MelodysDreamj 训练。
13b28.9K 下载量 17 标签 更新时间 15 months ago
-
reader-lm
一系列将 HTML 内容转换为 Markdown 内容的模型,这对于内容转换任务非常有用。
0.5b 1.5b28.7K 下载量 33 标签 更新时间 4 months ago
-
duckdb-nsql
由 MotherDuck 和 Numbers Station 制作的 7B 参数的 text-to-SQL 模型。
7b28.5K 下载量 17 标签 更新时间 12 months ago
-
falcon3
一个参数小于 10B 的高效 AI 模型系列,通过创新的训练技术在科学、数学和编码方面表现出色。
1b 3b 7b 10b28.4K 下载量 17 标签 更新时间 6 weeks ago
-
marco-o1
阿里巴巴国际数字商业集团 (AIDC-AI) 为现实世界解决方案开发的开放大型推理模型。
7b28K 下载量 5 标签 更新时间 2 months ago
-
solar-pro
Solar Pro 预览版:一个先进的大型语言模型 (LLM),拥有 220 亿参数,旨在适应单个 GPU。
22b27.4K 下载量 18 标签 更新时间 4 months ago
-
megadolphin
MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的一种转换,通过将模型自身交错创建。
120b24.8K 下载量 19 标签 更新时间 13 months ago
-
notux
一个性能优异的混合专家模型,使用高质量数据进行微调。
8x7b23.8K 下载量 18 标签 更新时间 13 months ago
-
shieldgemma
ShieldGemma 是一组指令调优模型,用于评估文本提示输入和文本输出响应针对一组已定义的安全策略的安全性。
2b 9b 27b23.3K 下载量 49 标签 更新时间 3 months ago
-
open-orca-platypus2
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合并。专为聊天和代码生成而设计。
13b23.2K 下载量 17 标签 更新时间 15 months ago
-
notus
一个 7B 聊天模型,使用高质量数据微调,并基于 Zephyr。
7b23.1K 下载量 18 标签 更新时间 13 months ago
-
goliath
通过将两个微调的 Llama 2 70B 模型组合成一个而创建的语言模型。
22.7K 下载量 16 标签 更新时间 14 months ago
-
llama-guard3
Llama Guard 3 是一系列为 LLM 输入和响应的内容安全分类而微调的模型。
1b 8b21.6K 下载量 33 标签 更新时间 3 months ago
-
bespoke-minicheck
由 Bespoke Labs 开发的先进的事实核查模型。
7b21K 下载量 17 标签 更新时间 4 months ago
-
granite3.1-moe
IBM Granite 1B 和 3B 模型是 IBM 的长上下文混合专家 (MoE) Granite 模型,专为低延迟使用而设计。
tools 1b 3b20.6K 下载量 33 标签 更新时间 2 weeks ago
-
nuextract
一个基于 Phi-3 的 3.8B 模型,在私有的高质量合成数据集上进行了信息提取微调。
3.8b20.1K 下载量 17 标签 更新时间 6 months ago
-
opencoder
OpenCoder 是一个开放且可复现的代码 LLM 系列,包括 1.5B 和 8B 模型,支持英语和中文的聊天。
1.5b 8b20K 下载量 9 标签 更新时间 2 months ago
-
snowflake-arctic-embed2
Snowflake 的前沿嵌入模型。Arctic Embed 2.0 增加了多语言支持,同时不牺牲英语性能或可扩展性。
embedding 568m19.2K 下载量 3 标签 更新时间 2 months ago
-
deepseek-v2.5
DeepSeek-V2 的升级版本,集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。
236b18.6K 拉取次数 7 标签 更新于 4 months ago
-
firefunction-v2
一个基于 Llama 3 的开放权重函数调用模型,与 GPT-4o 的函数调用能力相媲美。
tools 70b17.9K 拉取次数 17 标签 更新于 6 months ago
-
dbrx
DBRX 是 Databricks 创建的开放、通用的大型语言模型。
132b17.6K 拉取次数 7 标签 更新于 9 months ago
-
exaone3.5
EXAONE 3.5 是 LG AI Research 开发和发布的指令调优双语(英语和韩语)生成模型集合,参数范围从 2.4B 到 32B。
2.4b 7.8b 32b17.5K 拉取次数 13 标签 更新于 8 weeks ago
-
paraphrase-multilingual
Sentence-transformers 模型,可用于诸如聚类或语义搜索等任务。
embedding 278m17.2K 拉取次数 3 标签 更新于 6 months ago
-
alfred
一个强大的对话模型,旨在用于聊天和指令用例。
40b14.9K 拉取次数 7 标签 更新于 14 months ago
-
command-r7b
Cohere R 系列中最小的模型,提供一流的速度、效率和质量,以便在通用 GPU 和边缘设备上构建强大的 AI 应用程序。
tools 7b13.7K 拉取次数 5 标签 更新于 2 weeks ago
-
tulu3
Tülu 3 是一个领先的指令跟随模型系列,由艾伦人工智能研究所提供完全开源的数据、代码和配方。
8b 70b13.7K 拉取次数 9 标签 更新于 6 weeks ago
-
granite3-guardian
IBM Granite Guardian 3.0 2B 和 8B 模型旨在检测提示和/或响应中的风险。
2b 8b13.6K 拉取次数 10 标签 更新于 2 months ago
-
granite-embedding
IBM Granite Embedding 30M 和 278M 模型是纯文本密集双编码器嵌入模型,其中 30M 仅提供英语版本,而 278M 服务于多语言用例。
embedding 30m 278m11.3K 拉取次数 6 标签 更新于 6 weeks ago
-
sailor2
Sailor2 是为东南亚制作的多语言语言模型。提供 1B、8B 和 20B 参数尺寸。
1b 8b 20b5,526 拉取次数 13 标签 更新于 2 months ago