library

0.5b 1.8b 4b 7b 14b 32b 72b 110b

7.4M 下载量 68 标签更新时间 8 months ago

qwen

Qwen 1.5 是阿里云推出的一系列大型语言模型，参数规模从 0.5B 到 110B。

4.3M 下载量 379 标签更新时间 9 months ago

gemma

Gemma 是 Google DeepMind 构建的一系列轻量级、最先进的开放模型。已更新至 1.1 版本。

2b 7b

4.3M 下载量 102 标签更新时间 10 months ago

qwen2

Qwen2 是阿里巴巴集团推出的新系列大型语言模型。

tools 0.5b 1.5b 7b 72b

4.1M 下载量 97 标签更新时间 4 months ago

qwen2.5

Qwen2.5 模型在阿里巴巴最新的大规模数据集上进行了预训练，涵盖多达 18 万亿个 token。该模型支持最多 128K 个 token，并具有多语言支持。

tools 0.5b 1.5b 3b 7b 14b 32b 72b

3.6M 下载量 133 标签更新时间 4 months ago

llama2

Llama 2 是一系列基础语言模型，参数规模从 7B 到 70B 不等。

7b 13b 70b

2.9M 下载量 102 标签更新时间 13 months ago

llava

🌋 LLaVA 是一种新颖的端到端训练的大型多模态模型，它结合了视觉编码器和 Vicuna，用于通用的视觉和语言理解。已更新至 1.6 版本。

vision 7b 13b 34b

2.9M 下载量 98 标签更新时间 12 months ago

phi3

Phi-3 是微软推出的一系列轻量级 3B (Mini) 和 14B (Medium) 最先进的开放模型。

3.8b 14b

2.9M 下载量 72 标签更新时间 6 months ago

gemma2

Google Gemma 2 是一款高性能且高效的模型，提供三种尺寸：2B、9B 和 27B。

2b 9b 27b

2.5M 下载量 94 标签更新时间 6 months ago

qwen2.5-coder

Code-Specific Qwen 模型的最新系列，在代码生成、代码推理和代码修复方面有显著改进。

工具 0.5b 1.5b 3b 7b 14b 32b

1.9M 下载量 196 标签更新于 2 months ago

codellama

一个可以使用文本提示生成和讨论代码的大型语言模型。

7b 13b 34b 70b

1.7M 下载量 199 标签更新于 6 months ago

tinyllama

TinyLlama 项目是一项开放的努力，旨在用 3 万亿个 tokens 训练一个紧凑的 1.1B Llama 模型。

1.1b

1.3M 下载量 36 标签更新于 13 months ago

mxbai-embed-large

来自 mixedbread.ai 的最先进的大型嵌入模型

嵌入 335m

1.2M 下载量 4 标签更新于 9 months ago

mistral-nemo

由 Mistral AI 与 NVIDIA 合作构建的，具有 128k 上下文长度的最先进的 12B 模型。

工具 12b

1.1M 下载量 17 标签更新于 6 months ago

llama3.2-vision

Llama 3.2 Vision 是指令微调的图像推理生成模型的集合，尺寸包括 11B 和 90B。

视觉 11b 90b

1M 下载量 9 标签更新于 2 months ago

starcoder2

StarCoder2 是下一代透明训练的开放代码 LLM，有三种尺寸：3B、7B 和 15B 参数。

3b 7b 15b

831.7K 下载量 67 标签更新于 5 months ago

snowflake-arctic-embed

Snowflake 的一套文本嵌入模型，针对性能进行了优化。

嵌入 22m 33m 110m 137m 335m

604.4K 下载量 16 标签更新于 9 months ago

mixtral

Mistral AI 提供的，具有开放权重的专家混合 (MoE) 模型集，参数大小为 8x7b 和 8x22b。

工具 8x7b 8x22b

545.1K 下载量 70 标签更新于 6 weeks ago

deepseek-coder-v2

一个开源的专家混合代码语言模型，在代码特定任务中实现了与 GPT4-Turbo 相当的性能。

16b 236b

536.4K 下载量 64 标签更新于 5 months ago

dolphin-mixtral

基于 Mixtral 专家混合模型微调的，擅长编码任务的，未审查的 8x7b 和 8x22b 模型。由 Eric Hartford 创建。

8x7b 8x22b

489.4K 下载量 70 标签更新于 6 weeks ago

phi

Phi-2：微软研究院的 2.7B 语言模型，展示了出色的推理和语言理解能力。

2.7b

480.3K 下载量 18 标签更新于 13 months ago

codegemma

CodeGemma 是一系列功能强大、轻量级的模型，可以执行各种编码任务，如中间代码补全、代码生成、自然语言理解、数学推理和指令跟随。

2b 7b

476.7K 下载量 85 标签更新于 6 months ago

deepseek-coder

DeepSeek Coder 是一个功能强大的编码模型，在两万亿个代码和自然语言 tokens 上训练而成。

1.3b 6.7b 33b

469.9K 下载量 102 标签更新于 13 months ago

llama2-uncensored

George Sung 和 Jarrad Hope 提供的未审查的 Llama 2 模型。

7b 70b

458.9K 下载量 34 标签更新于 15 months ago

wizardlm2

微软 AI 提供的最先进的大型语言模型，在复杂聊天、多语言、推理和代理用例方面具有改进的性能。

7b 8x22b

349.9K 下载量 22 标签更新于 9 months ago

dolphin-mistral

基于 Mistral 的未审查的 Dolphin 模型，擅长编码任务。已更新至 2.8 版本。

312.8K 下载量 120 标签更新于 10 months ago

bge-m3

BGE-M3 是 BAAI 的一个新模型，因其在多功能性、多语言性和多粒度方面的通用性而著称。

嵌入 567m

288.6K 下载次数 3 标签更新于 6 months ago

all-minilm

在超大型句子级数据集上训练的嵌入模型。

嵌入 22m 33m

280.2K 下载次数 10 标签更新于 9 months ago

dolphin-llama3

Dolphin 2.9 是 Eric Hartford 基于 Llama 3 开发的最新模型，拥有 8B 和 70B 两种尺寸，具备多种指令、对话和编码能力。

277.1K 下载次数 53 标签更新于 8 months ago

command-r

Command R 是一款大型语言模型，针对对话式交互和长上下文任务进行了优化。

工具 35b

275K 下载次数 32 标签更新于 5 months ago

orca-mini

一款通用模型，参数规模从 30 亿到 700 亿不等，适用于入门级硬件。

3b 7b 13b 70b

268.3K 下载次数 119 标签更新于 15 months ago

llava-llama3

一款基于 Llama 3 Instruct 微调的 LLaVA 模型，在多项基准测试中取得了更好的成绩。

视觉 8b

265.5K 下载次数 4 标签更新于 9 months ago

yi

Yi 1.5 是一款高性能的双语语言模型。

6b 9b 34b

261.2K 下载次数 174 标签更新于 8 months ago

hermes3

Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本

工具 3b 8b 70b 405b

249.8K 下载次数 65 标签更新于 7 weeks ago

zephyr

Zephyr 是 Mistral 和 Mixtral 模型的一系列微调版本，旨在作为有用的助手。

7b 141b

233.2K 下载次数 40 标签更新于 9 months ago

phi3.5

一款轻量级 AI 模型，拥有 38 亿参数，性能超越了同等规模和更大规模的模型。

3.8b

229.9K 下载次数 17 标签更新于 5 months ago

codestral

Codestral 是 Mistral AI 的首个代码模型，专为代码生成任务而设计。

22b

205K 下载次数 17 标签更新于 5 months ago

starcoder

StarCoder 是一款在 80 多种编程语言上训练的代码生成模型。

1b 3b 7b 15b

181.4K 下载次数 100 标签更新于 15 months ago

granite-code

IBM 推出的一系列用于代码智能的开放基础模型

3b 8b 20b 34b

181.2K 下载次数 162 标签更新于 5 months ago

vicuna

基于 Llama 和 Llama 2 的通用聊天模型，上下文长度为 2K 到 16K。

7b 13b 33b

172.5K 下载次数 111 标签更新于 15 months ago

wizard-vicuna-uncensored

Wizard Vicuna Uncensored 是 Eric Hartford 基于 Llama 2 Uncensored 开发的 7B、13B 和 30B 参数模型。

7b 13b 30b

171.6K 下载次数 49 标签更新于 15 months ago

smollm

🪐 一系列小型模型，参数规模为 135M、360M 和 1.7B，在新高质量数据集上训练。

135m 360m 1.7b

169K 下载次数 94 标签更新于 5 months ago

mistral-openorca

Mistral OpenOrca 是一款 70 亿参数模型，基于 Mistral 7B 模型使用 OpenOrca 数据集进行微调。

164.8K 下载次数 17 标签更新于 16 months ago

deepseek-v3

一款强大的混合专家 (MoE) 语言模型，总参数量为 671B，每个 token 激活 37B 参数。

671b

159.4K 下载次数 5 标签更新于 3 weeks ago

qwq

QwQ 是一款实验性研究模型，专注于提升 AI 推理能力。

工具 32b

153.9K 下载次数 5 标签更新于 2 months ago

smollm2

SmolLM2 是一系列紧凑型语言模型，提供三种尺寸：135M、360M 和 1.7B 参数。

工具 135m 360m 1.7b

153.7K 下载次数 49 标签更新于 3 months ago

llama2-chinese

基于 Llama 2 的模型，经过微调以提高中文对话能力。

146K 下载次数 35 标签更新于 15 months ago

openchat

一系列开源模型，在各种数据上训练，在多项基准测试中超越 ChatGPT。已更新至 3.5-0106 版本。

136.6K 下载量 50 标签更新时间 13 months ago

codegeex4

一个多功能的模型，适用于人工智能软件开发场景，包括代码补全。

9b

133.8K 下载量 17 标签更新时间 7 months ago

aya

Aya 23 是由 Cohere 发布的，是新一代最先进的多语言模型系列，支持 23 种语言。

8b 35b

130.9K 下载量 33 标签更新时间 8 months ago

codeqwen

CodeQwen1.5 是一个大型语言模型，在大量的代码数据上进行了预训练。

126.4K 下载量 30 标签更新时间 7 months ago

nous-hermes2

Nous Research 强大的模型系列，擅长科学讨论和编码任务。

10.7b 34b

120.2K 下载量 33 标签更新时间 13 months ago

mistral-large

Mistral Large 2 是 Mistral 全新的旗舰模型，在代码生成、数学和推理方面能力显著提升，拥有 128k 上下文窗口，并支持数十种语言。

工具 123b

119K 下载量 32 标签更新时间 2 months ago

stable-code

Stable Code 3B 是一个编码模型，具有指令和代码补全变体，与 Code Llama 7B 等模型相当，但模型大小仅为其 2.5 分之一。

3b

117K 下载量 36 标签更新时间 10 months ago

openhermes

OpenHermes 2.5 是一个 7B 模型，由 Teknium 在 Mistral 上使用完全开放的数据集进行微调。

117K 下载量 35 标签更新时间 13 months ago

command-r-plus

Command R+ 是一款功能强大、可扩展的大型语言模型，专为在真实世界的企业用例中表现出色而构建。

工具 104b

116.9K 下载量 21 标签更新时间 5 months ago

deepseek-llm

一款先进的语言模型，使用 2 万亿双语 tokens 精心打造。

7b 67b

116.6K 下载量 64 标签更新时间 14 months ago

tinydolphin

一个实验性的 1.1B 参数模型，由 Eric Hartford 基于 TinyLlama，在新 Dolphin 2.8 数据集上训练而成。

1.1b

115.5K 下载量 18 标签更新时间 12 months ago

glm4

一个强大的多语言通用语言模型，性能可与 Llama 3 媲美。

9b

115.3K 下载量 32 标签更新时间 7 months ago

qwen2-math

Qwen2 Math 是基于 Qwen2 LLMs 构建的专业数学语言模型系列，其数学能力显著优于开源模型，甚至闭源模型（例如 GPT4o）。

1.5b 7b 72b

114.4K 下载量 52 标签更新时间 5 months ago

wizardcoder

最先进的代码生成模型

33b

114.3K 下载量 67 标签更新时间 13 months ago

bakllava

BakLLaVA 是一个多模态模型，由 Mistral 7B 基础模型和 LLaVA 架构增强而成。

视觉 7b

105.6K 下载量 17 标签更新时间 13 months ago

stablelm2

Stable LM 2 是一个最先进的 1.6B 和 12B 参数语言模型，使用英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据进行训练。

1.6b 12b

105.1K 下载量 84 标签更新时间 9 months ago

minicpm-v

一系列为视觉-语言理解而设计的多模态 LLMs (MLLMs)。

视觉 8b

102.5K 下载量 17 标签更新时间 2 months ago

reflection

一款高性能模型，使用一种名为“反思调优”的新技术进行训练，该技术教会 LLM 检测其推理中的错误并纠正方向。

70b

102.1K 下载量 17 标签更新时间 4 months ago

deepseek-v2

一个强大、经济高效的专家混合语言模型。

16b 236b

102K 下载量 34 标签更新时间 7 months ago

moondream

moondream2 是一个小型视觉语言模型，旨在在边缘设备上高效运行。

视觉 1.8b

100.8K 下载量 18 标签更新时间 9 months ago

neural-chat

一个基于 Mistral 微调的模型，在领域和语言覆盖方面表现良好。

99.6K 下载量 50 标签更新时间 13 months ago

mistral-small

Mistral Small 3 在 70B 以下的“小型”大型语言模型类别中树立了新的基准。

工具 22b 24b

96.5K 下载量 21 标签更新时间 4 days ago

llama3-gradient

该模型将 LLama-3 8B 的上下文长度从 8k 扩展到超过 100 万 tokens。

96.1K 下载量 35 标签更新时间 9 months ago

wizard-math

专注于数学和逻辑问题的模型

7b 13b 70b

96K 下载量 64 标签更新时间 13 months ago

llama3-chatqa

一个来自 NVIDIA 基于 Llama 3 的模型，擅长对话式问答 (QA) 和检索增强生成 (RAG)。

88.3K 下载量 35 标签更新时间 8 months ago

sqlcoder

SQLCoder 是一个在 StarCoder 上微调的代码补全模型，用于 SQL 生成任务

7b 15b

86.9K 下载量 48 标签更新时间 12 months ago

xwinlm

基于 Llama 2 的对话模型，在各种基准测试中表现出竞争力。

83.2K 下载量 80 标签更新时间 15 months ago

dolphincoder

Dolphin 模型系列的一个 7B 和 15B 无审查变体，基于 StarCoder2，擅长编码。

7b 15b

81K 下载量 35 标签更新时间 10 months ago

nous-hermes

来自 Nous Research 的基于 Llama 和 Llama 2 的通用模型。

80.9K 下载量 63 标签更新时间 15 months ago

phind-codellama

基于 Code Llama 的代码生成模型。

34b

80K 下载量 49 标签更新时间 13 months ago

yarn-llama2

Llama 2 的扩展，支持高达 128k tokens 的上下文。

77.7K 下载量 67 标签更新时间 15 months ago

solar

一个紧凑而强大的 10.7B 大型语言模型，专为单轮对话而设计。

10.7b

76.2K 下载量 32 标签更新时间 13 months ago

starling-lm

Starling 是一个通过人工智能反馈的强化学习训练的大型语言模型，专注于提高聊天机器人助手能力。

75.5K 下载量 36 标签更新时间 10 months ago

wizardlm

基于 Llama 2 的通用模型。

75.4K 下载量 73 标签更新时间 15 months ago

llava-phi3

一个基于 Phi 3 Mini 微调的全新小型 LLaVA 模型。

视觉 3.8b

72.9K 下载量 4 标签更新时间 9 months ago

yi-coder

Yi-Coder 是一系列开源代码语言模型，以不到 100 亿的参数提供最先进的编码性能。

1.5b 9b

72.8K 下载量 67 标签更新时间 4 months ago

athene-v2

Athene-V2 是一个 72B 参数模型，擅长代码补全、数学和日志提取任务。

工具 72b

70K 下载量 17 标签更新时间 2 months ago

internlm2

InternLM2.5 是一个 7B 参数模型，专为实际场景量身定制，具有出色的推理能力。

1m 1.8b 7b 20b

70K 下载量 65 标签更新时间 5 months ago

falcon

一个由技术创新研究所 (TII) 构建的大型语言模型，用于摘要、文本生成和聊天机器人。

7b 40b 180b

67.2K 下载量 38 标签更新时间 15 months ago

samantha-mistral

一个在哲学、心理学和人际关系方面训练的伴侣助手。基于 Mistral。

67.1K 下载量 49 标签更新时间 15 months ago

orca2

Orca 2 由微软研究院构建，是 Meta 的 Llama 2 模型的微调版本。该模型旨在特别擅长推理。

61.2K 下载量 33 标签更新时间 14 months ago

nemotron

Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型，旨在提高 LLM 生成的回复对用户查询的帮助性。

tools 70b

60.7K 下载量 17 标签更新时间 3 months ago

nemotron-mini

NVIDIA 推出的商业友好型小型语言模型，针对角色扮演、RAG QA 和函数调用进行了优化。

工具 4b

59.3K 下载量 17 标签更新时间 4 months ago

dolphin-phi

Eric Hartford 推出的 2.7B 无审查 Dolphin 模型，基于 Microsoft Research 的 Phi 语言模型。

2.7b

59.2K 下载量 15 标签更新于 13 months ago

stable-beluga

基于 Llama 2 模型微调于 Orca 风格数据集。原名 Free Willy。

7b 13b 70b

58.1K 下载量 49 标签更新于 15 months ago

wizardlm-uncensored

Wizard LM 模型的无审查版本

57.5K 下载量 18 标签更新于 15 months ago

dolphin3

Dolphin 3.0 Llama 3.1 8B 🐬 是 Dolphin 系列指令调优模型的下一代，旨在成为终极通用本地模型，支持编码、数学、代理、函数调用和通用用例。

8b

55.5K 下载量 5 标签更新于 4 weeks ago

llama3-groq-tool-use

Groq 系列模型，代表了开源 AI 在工具使用/函数调用能力方面的重大进步。

工具 8b 70b

46.8K 下载量 33 标签更新于 6 months ago

granite3.1-dense

IBM Granite 2B 和 8B 模型是纯文本密集型 LLM，使用超过 12 万亿个 tokens 的数据进行训练，在 IBM 的初步测试中，性能和速度均比其前代产品有了显著提升。

工具 2b 8b

46.3K 下载量 33 标签更新于 2 weeks ago

granite3-dense

IBM Granite 2B 和 8B 模型旨在支持基于工具的用例和检索增强生成 (RAG)，从而简化代码生成、翻译和错误修复。

工具 2b 8b

45.5K 下载量 33 标签更新于 2 months ago

medllama2

微调的 Llama 2 模型，用于根据开源医疗数据集回答医疗问题。

44.9K 下载量 17 标签更新于 15 months ago

llama-pro

Llama 2 的扩展，专门用于整合通用语言理解和特定领域知识，尤其是在编程和数学领域。

44.6K 下载量 33 标签更新于 13 months ago

yarn-mistral

Mistral 的扩展，以支持 64K 或 128K 的上下文窗口。

44.5K 下载量 33 标签更新于 15 months ago

meditron

从 Llama 2 改编而来的开源医学大型语言模型，应用于医学领域。

7b 70b

44.2K 下载量 22 标签更新于 14 months ago

nexusraven

Nexus Raven 是一个针对函数调用任务的 13B 指令调优模型。

40.8K 下载量 32 标签更新于 12 months ago

nous-hermes2-mixtral

Nous Research 的 Nous Hermes 2 模型，现在基于 Mixtral 训练。

8x7b

37.4K 下载量 18 标签更新于 6 weeks ago

smallthinker

一个基于 Qwen 2.5 3B Instruct 模型微调的全新小型推理模型。

3b

37.1K 下载量 5 标签更新于 5 weeks ago

codeup

基于 Llama2 的出色代码生成模型。

36.2K 下载量 19 标签更新于 15 months ago

everythinglm

基于 Llama2 的无审查模型，支持 16K 上下文窗口。

35.6K 下载量 18 标签更新于 13 months ago

granite3-moe

IBM Granite 1B 和 3B 模型是 IBM 推出的首批混合专家 (MoE) Granite 模型，专为低延迟使用而设计。

tools 1b 3b

34.5K 下载量 33 标签更新于 2 months ago

aya-expanse

Cohere For AI 的语言模型，经过训练可在 23 种不同的语言中表现良好。

工具 8b 32b

33K 下载量 33 标签更新于 3 months ago

magicoder

🎩 Magicoder 是一个 7B 参数模型系列，使用 OSS-Instruct 训练了 75K 合成指令数据，OSS-Instruct 是一种通过开源代码片段启发 LLM 的新颖方法。

31.3K 下载量 18 标签更新于 14 months ago

falcon2

Falcon2 是 TII 构建的 11B 参数因果解码器专用模型，并使用超过 5 万亿个 tokens 进行训练。

11b

31.1K 下载量 17 标签更新于 8 months ago

stablelm-zephyr

一种轻量级聊天模型，允许准确且响应迅速的输出，而无需高端硬件。

3b

30.7K 下载量 17 标签更新于 13 months ago

codebooga

通过合并两个现有代码模型创建的高性能代码指令模型。

34b

30.4K 下载量 16 标签更新时间 15 months ago

bge-large

来自BAAI的嵌入模型，将文本映射到向量。

嵌入 335m

30.3K 下载量 3 标签更新时间 6 months ago

mathstral

MathΣtral：由Mistral AI设计的7B模型，用于数学推理和科学发现。

29.9K 下载量 17 标签更新时间 6 months ago

olmo2

OLMo 2 是一个新的 7B 和 13B 模型系列，使用高达 5T 的 tokens 训练。这些模型与同等大小的完全开源模型性能相当或更好，并且在英语学术基准测试中与 Llama 3.1 等开放权重模型具有竞争力。

29K 下载量 9 标签更新时间 3 weeks ago

mistrallite

MistralLite 是一个基于 Mistral 微调的模型，增强了处理长上下文的能力。

28.9K 下载量 17 标签更新时间 15 months ago

wizard-vicuna

Wizard Vicuna 是一个基于 Llama 2 的 13B 参数模型，由 MelodysDreamj 训练。

28.9K 下载量 17 标签更新时间 15 months ago

reader-lm

一系列将 HTML 内容转换为 Markdown 内容的模型，这对于内容转换任务非常有用。

0.5b 1.5b

28.7K 下载量 33 标签更新时间 4 months ago

duckdb-nsql

由 MotherDuck 和 Numbers Station 制作的 7B 参数的 text-to-SQL 模型。

28.5K 下载量 17 标签更新时间 12 months ago

falcon3

一个参数小于 10B 的高效 AI 模型系列，通过创新的训练技术在科学、数学和编码方面表现出色。

1b 3b 7b 10b

28.4K 下载量 17 标签更新时间 6 weeks ago

marco-o1

阿里巴巴国际数字商业集团 (AIDC-AI) 为现实世界解决方案开发的开放大型推理模型。

28K 下载量 5 标签更新时间 2 months ago

solar-pro

Solar Pro 预览版：一个先进的大型语言模型 (LLM)，拥有 220 亿参数，旨在适应单个 GPU。

22b

27.4K 下载量 18 标签更新时间 4 months ago

megadolphin

MegaDolphin-2.2-120b 是 Dolphin-2.2-70b 的一种转换，通过将模型自身交错创建。

120b

24.8K 下载量 19 标签更新时间 13 months ago

notux

一个性能优异的混合专家模型，使用高质量数据进行微调。

8x7b

23.8K 下载量 18 标签更新时间 13 months ago

shieldgemma

ShieldGemma 是一组指令调优模型，用于评估文本提示输入和文本输出响应针对一组已定义的安全策略的安全性。

2b 9b 27b

23.3K 下载量 49 标签更新时间 3 months ago

open-orca-platypus2

Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合并。专为聊天和代码生成而设计。

23.2K 下载量 17 标签更新时间 15 months ago

notus

一个 7B 聊天模型，使用高质量数据微调，并基于 Zephyr。

23.1K 下载量 18 标签更新时间 13 months ago

goliath

通过将两个微调的 Llama 2 70B 模型组合成一个而创建的语言模型。

22.7K 下载量 16 标签更新时间 14 months ago

llama-guard3

Llama Guard 3 是一系列为 LLM 输入和响应的内容安全分类而微调的模型。

1b 8b

21.6K 下载量 33 标签更新时间 3 months ago

bespoke-minicheck

由 Bespoke Labs 开发的先进的事实核查模型。

21K 下载量 17 标签更新时间 4 months ago

granite3.1-moe

IBM Granite 1B 和 3B 模型是 IBM 的长上下文混合专家 (MoE) Granite 模型，专为低延迟使用而设计。

tools 1b 3b

20.6K 下载量 33 标签更新时间 2 weeks ago

nuextract

一个基于 Phi-3 的 3.8B 模型，在私有的高质量合成数据集上进行了信息提取微调。

3.8b

20.1K 下载量 17 标签更新时间 6 months ago

opencoder

OpenCoder 是一个开放且可复现的代码 LLM 系列，包括 1.5B 和 8B 模型，支持英语和中文的聊天。

1.5b 8b

20K 下载量 9 标签更新时间 2 months ago

snowflake-arctic-embed2

Snowflake 的前沿嵌入模型。Arctic Embed 2.0 增加了多语言支持，同时不牺牲英语性能或可扩展性。

embedding 568m

19.2K 下载量 3 标签更新时间 2 months ago

deepseek-v2.5

DeepSeek-V2 的升级版本，集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。

236b

18.6K 拉取次数 7 标签更新于 4 months ago

firefunction-v2

一个基于 Llama 3 的开放权重函数调用模型，与 GPT-4o 的函数调用能力相媲美。

tools 70b

17.9K 拉取次数 17 标签更新于 6 months ago

dbrx

DBRX 是 Databricks 创建的开放、通用的大型语言模型。

132b

17.6K 拉取次数 7 标签更新于 9 months ago

exaone3.5

EXAONE 3.5 是 LG AI Research 开发和发布的指令调优双语（英语和韩语）生成模型集合，参数范围从 2.4B 到 32B。

2.4b 7.8b 32b

17.5K 拉取次数 13 标签更新于 8 weeks ago

paraphrase-multilingual

Sentence-transformers 模型，可用于诸如聚类或语义搜索等任务。

embedding 278m

17.2K 拉取次数 3 标签更新于 6 months ago

alfred

一个强大的对话模型，旨在用于聊天和指令用例。

40b

14.9K 拉取次数 7 标签更新于 14 months ago

command-r7b

Cohere R 系列中最小的模型，提供一流的速度、效率和质量，以便在通用 GPU 和边缘设备上构建强大的 AI 应用程序。

tools 7b

13.7K 拉取次数 5 标签更新于 2 weeks ago

tulu3

Tülu 3 是一个领先的指令跟随模型系列，由艾伦人工智能研究所提供完全开源的数据、代码和配方。