-
llama3.2-vision
Llama 3.2 Vision 是一个包含 11B 和 90B 大小的指令微调图像推理生成模型集合。
视觉 11b 90b28.6K 拉取 9 标签 更新 昨天
-
llama3.2
Meta 的 Llama 3.2 推出了 1B 和 3B 模型。
工具 1b 3b2.4M 拉取 63 标签 更新 6 周前
-
llama3.1
Llama 3.1 是 Meta 推出的最新最先进的模型,提供 8B、70B 和 405B 参数大小。
工具 8b 70b 405b8.8M 拉取 93 标签 更新 8 周前
-
gemma2
Google Gemma 2 是一个高性能且高效的模型,提供三种大小:2B、9B 和 27B。
2b 9b 27b1.8M 拉取 94 标签 更新 3 个月前
-
qwen2.5
Qwen2.5 模型是在阿里巴巴最新的海量数据集上预训练的,涵盖多达 18 万亿个 token。该模型支持多达 128K 个 token,并具有多语言支持。
工具 0.5b 1.5b 3b 7b 14b 32b 72b1.9M 拉取 133 标签 更新 7 周前
-
phi3.5
一个拥有 38 亿参数的轻量级 AI 模型,其性能超过了同等大小甚至更大的模型。
3.8b164.9K 拉取 17 标签 更新 2 个月前
-
nemotron-mini
NVIDIA 推出的商业友好型小型语言模型,针对角色扮演、RAG QA 和函数调用进行了优化。
工具 4b34.2K 拉取请求 17 标签 更新于 7 周前
-
mistral-small
Mistral Small 是一款轻量级模型,专为翻译和摘要等任务的经济高效使用而设计。
工具 22b40.7K 拉取请求 17 标签 更新于 7 周前
-
mistral-nemo
Mistral AI 与 NVIDIA 合作构建的 12B 模型,具有 128k 上下文长度,处于业界领先水平。
工具 12b488.2K 拉取请求 17 标签 更新于 3 个月前
-
deepseek-coder-v2
一个开源的专家混合代码语言模型,在特定于代码的任务中实现了与 GPT4-Turbo 相当的性能。
16b 236b395.3K 拉取请求 64 标签 更新于 2 个月前
-
mistral
Mistral AI 发布的 7B 模型,更新至 0.3 版本。
工具 7b5M 拉取请求 84 标签 更新于 3 个月前
-
mixtral
Mistral AI 推出的专家混合 (MoE) 模型集,参数大小分别为 8x7b 和 8x22b,权重公开。
工具 8x7b 8x22b473.9K 拉取请求 69 标签 更新于 3 个月前
-
codegemma
CodeGemma 是一组强大的轻量级模型,可以执行各种编码任务,例如中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。
2b 7b354K 拉取请求 85 标签 更新于 3 个月前
-
command-r
Command R 是一款针对对话交互和长上下文任务进行了优化的大型语言模型。
工具 35b238.6K 拉取请求 32 标签 更新于 2 个月前
-
command-r-plus
Command R+ 是一款功能强大、可扩展的大型语言模型,专为在现实世界的企业用例中表现出色而设计。
工具 104b103.6K 拉取 21 标签 更新于 2 个月前
-
llava
🌋 LLaVA 是一种新颖的端到端训练的大型多模态模型,它结合了视觉编码器和 Vicuna,用于通用的视觉和语言理解。已更新至 1.6 版本。
视觉 7b 13b 34b1.7M 拉取 98 标签 更新于 9 个月前
-
llama3
Meta Llama 3:迄今为止最强大的公开可用的 LLM。
8b 70b6.6M 拉取 68 标签 更新于 5 个月前
-
gemma
Gemma 是由 Google DeepMind 开发的一系列轻量级、最先进的开放模型。已更新至 1.1 版本。
2b 7b4.2M 拉取 102 标签 更新于 7 个月前
-
qwen
Qwen 1.5 是阿里云的一系列大型语言模型,参数范围从 0.5B 到 110B。
0.5b 1.8b 4b 7b 14b 32b 72b 110b4.1M 拉取 379 标签 更新于 6 个月前
-
qwen2
Qwen2 是阿里巴巴集团推出的一系列新的大型语言模型。
工具 0.5b 1.5b 7b 72b3.9M 拉取 97 标签 更新于 8 周前
-
phi3
Phi-3 是微软开发的一系列轻量级 3B(小型)和 14B(中型)最先进的开放模型。
3.8b 14b2.7M 拉取请求 72 标签 更新于 3 个月前
-
nomic-embed-text
一个高性能的开放式嵌入模型,具有较大的 token 上下文窗口。
嵌入2.4M 拉取请求 3 标签 更新于 8 个月前
-
llama2
Llama 2 是一个基础语言模型系列,参数范围从 7B 到 70B。
7b 13b 70b2.3M 拉取请求 102 标签 更新于 10 个月前
-
codellama
一个可以利用文本提示生成和讨论代码的大型语言模型。
7b 13b 34b 70b1.5M 拉取请求 199 标签 更新于 3 个月前
-
mxbai-embed-large
来自 mixedbread.ai 的最先进大型嵌入模型。
嵌入 335m541.3K 拉取请求 4 标签 更新于 6 个月前
-
dolphin-mixtral
基于 Mixtral 专家混合模型的未经审查的 8x7b 和 8x22b 微调模型,擅长编码任务。由 Eric Hartford 创建。
8x7b 8x22b431.8K 拉取请求 87 标签 更新于 6 个月前
-
starcoder2
StarCoder2 是下一代透明训练的开源代码 LLM,有三种尺寸:3B、7B 和 15B 参数。
3b 7b 15b419.4K 拉取请求 67 标签 更新于 2 个月前
-
phi
Phi-2:一个由微软研究院开发的 27 亿参数语言模型,展示了出色的推理和语言理解能力。
2.7b379.6K 拉取请求 18 标签 更新于 10 个月前
-
deepseek-coder
DeepSeek Coder 是一个功能强大的编码模型,在 2 万亿个代码和自然语言标记上进行训练。
1.3b 6.7b 33b365.1K 拉取请求 102 标签 更新于 10 个月前
-
llama2-uncensored
由 George Sung 和 Jarrad Hope 开发的未经审查的 Llama 2 模型。
7b 70b352.8K 拉取请求 34 标签 更新于 12 个月前
-
tinyllama
TinyLlama 项目是一个开源项目,致力于在 3 万亿个标记上训练一个紧凑的 11 亿参数 Llama 模型。
1.1b275.2K 拉取请求 36 标签 更新于 10 个月前
-
qwen2.5-coder
最新系列的代码专用 Qwen 模型,在代码生成、代码推理和代码修复方面取得了显著的改进。
工具 1.5b 7b269.4K 拉取请求 67 标签 更新于 4 周前
-
dolphin-mistral
基于 Mistral 的未经审查的 Dolphin 模型,在编码任务方面表现出色。更新到 2.8 版。
7b261.1K 拉取请求 120 标签 更新于 7 个月前
-
yi
Yi 1.5 是一个高性能的双语语言模型。
6b 9b 34b238.6K 拉取请求 174 标签 更新于 5 个月前
-
dolphin-llama3
Dolphin 2.9 是 Eric Hartford 基于 Llama 3 开发的全新模型,拥有 80 亿和 700 亿参数版本,具备多种指令、对话和编码技能。
8b 70b235.8K 拉取请求 53 标签 更新于 6 个月前
-
orca-mini
一个通用模型,参数量从 30 亿到 700 亿不等,适合入门级硬件。
3b 7b 13b 70b230.5K 拉取请求 119 标签 更新于 12 个月前
-
zephyr
Zephyr 是 Mistral 和 Mixtral 模型的一系列微调版本,经过训练可以充当有用的助手。
7b 141b222.4K 拉取请求 40 标签 更新于 6 个月前
-
llava-llama3
一个从 Llama 3 Instruct 微调的 LLaVA 模型,在几个基准测试中获得了更高的分数。
视觉 8b210.1K 拉取请求 4 标签 更新于 6 个月前
-
snowflake-arctic-embed
Snowflake 推出的一套文本嵌入模型,针对性能进行了优化。
嵌入 22m 33m 110m 137m 335m181.9K 拉取请求 16 标签 更新于 6 个月前
-
starcoder
StarCoder 是一个代码生成模型,经过 80 多种编程语言的训练。
1b 3b 7b 15b164.8K 拉取请求 100 标签 更新于 12 个月前
-
codestral
Codestral 是 Mistral AI 的第一个专门为代码生成任务设计的代码模型。
22b160.7K 拉取请求 17 标签 更新于 2 个月前
-
mistral-openorca
Mistral OpenOrca 是一个 70 亿参数的模型,使用 OpenOrca 数据集在 Mistral 7B 模型之上进行了微调。
7b159.7K Pulls 17 Tags 更新于 13 个月前
-
vicuna
基于 Llama 和 Llama 2 的通用聊天模型,上下文大小为 2K 到 16K。
7b 13b 33b155.9K Pulls 111 Tags 更新于 12 个月前
-
wizardlm2
来自微软 AI 的最先进的大型语言模型,在复杂聊天、多语言、推理和代理用例方面性能提升。
7b 8x22b151.1K Pulls 22 Tags 更新于 6 个月前
-
granite-code
IBM 推出的用于代码智能的一系列开放式基础模型
3b 8b 20b 34b147.2K Pulls 162 Tags 更新于 2 个月前
-
wizard-vicuna-uncensored
Wizard Vicuna Uncensored 是一个基于 Llama 2 的 7B、13B 和 30B 参数模型,由 Eric Hartford 解锁。
7b 13b 30b137.8K Pulls 49 Tags 更新于 12 个月前
-
llama2-chinese
基于 Llama 2 的模型,经过微调以提高中文对话能力。
7b 13b136.4K Pulls 35 Tags 更新于 12 个月前
-
codegeex4
一个用于 AI 软件开发场景的多功能模型,包括代码补全。
9b123.4K Pulls 17 Tags 更新于 4 个月前
-
all-minilm
在非常大的句子级数据集上的嵌入模型。
嵌入 2200万 3300万12.16万 Pulls 10 标签 更新 6 个月前
-
openchat
一个开源模型家族,在各种数据上进行训练,在多个基准测试中超越 ChatGPT。已更新至版本 3.5-0106。
7b11.51万 Pulls 50 标签 更新 10 个月前
-
nous-hermes2
Nous Research 推出的强大模型家族,在科学讨论和编码任务方面表现出色。
107亿 340亿11.44万 Pulls 33 标签 更新 10 个月前
-
aya
由 Cohere 发布的 Aya 23 是一个新的最先进的多语言模型家族,支持 23 种语言。
80亿 350亿11.32万 Pulls 33 标签 更新 5 个月前
-
codeqwen
CodeQwen1.5 是一个在大量代码数据上预训练的大型语言模型。
7b11.23万 Pulls 30 标签 更新 4 个月前
-
tinydolphin
一个实验性的 11 亿参数模型,由 Eric Hartford 在新的 Dolphin 2.8 数据集上训练,基于 TinyLlama。
1.1b10.52万 Pulls 18 标签 更新 9 个月前
-
wizardcoder
最先进的代码生成模型
330亿10.49万 Pulls 67 标签 更新 10 个月前
-
stable-code
Stable Code 3B 是一个编码模型,具有指令和代码补全变体,与 Code Llama 7B 等规模大 2.5 倍的模型相媲美。
30亿10.34万 Pulls 36 标签 更新 7 个月前
-
openhermes
OpenHermes 2.5 是一个 70 亿模型,由 Teknium 在 Mistral 上使用完全开放的数据集进行微调。
101K Pulls 35 Tags 更新于 10 个月前
-
mistral-large
Mistral Large 2 是 Mistral 的最新旗舰模型,它在代码生成、数学和推理方面能力显著提升,具有 128k 上下文窗口,并支持数十种语言。
工具 123b98.8K Pulls 17 Tags 更新于 3 个月前
-
qwen2-math
Qwen2 Math 是一系列基于 Qwen2 LLMs 的专用数学语言模型,其数学能力显著优于开源模型,甚至超过了闭源模型(例如 GPT4o)。
1.5b 7b 72b98.6K Pulls 52 Tags 更新于 2 个月前
-
bakllava
BakLLaVA 是一个多模态模型,由 Mistral 7B 基础模型增强了 LLaVA 架构。
视觉 7b96.5K Pulls 17 Tags 更新于 11 个月前
-
reflection
使用名为 Reflection-tuning 的新技术训练的高性能模型,该技术教导 LLM 检测其推理中的错误并纠正方向。
70b95.9K Pulls 17 Tags 更新于 2 个月前
-
stablelm2
Stable LM 2 是一个最先进的 1.6B 和 12B 参数语言模型,在英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据上进行了训练。
1.6b 12b95.8K Pulls 84 Tags 更新于 6 个月前
-
glm4
一个强大的多语言通用语言模型,性能与 Llama 3 相媲美。
9b91.6K Pulls 32 Tags 更新于 4 个月前
-
deepseek-llm
使用 2 万亿双语标记训练的先进语言模型。
7b 67b89.7K 拉取请求 64 标签 更新于 11 个月前
-
llama3-gradient
该模型将 LLama-3 8B 的上下文长度从 8k 扩展到超过 100 万个令牌。
8b 70b89.5K 拉取请求 35 标签 更新于 6 个月前
-
wizard-math
专注于数学和逻辑问题的模型
7b 13b 70b88.9K 拉取请求 64 标签 更新于 10 个月前
-
neural-chat
基于 Mistral 的微调模型,在领域和语言方面具有良好的覆盖范围。
7b81.8K 拉取请求 50 标签 更新于 10 个月前
-
smollm
🪐 一系列小型模型,具有 1.35 亿、3.6 亿和 17 亿个参数,在新的高质量数据集上训练。
1.35 亿 3.6 亿 17 亿80.1K 拉取请求 94 标签 更新于 2 个月前
-
moondream
moondream2 是一款小型视觉语言模型,旨在高效运行在边缘设备上。
视觉 18 亿79K 拉取请求 18 标签 更新于 6 个月前
-
xwinlm
基于 Llama 2 的对话模型,在各种基准测试中表现出色。
7b 13b77.5K 拉取请求 80 标签 更新于 12 个月前
-
llama3-chatqa
NVIDIA 基于 Llama 3 的模型,在对话问答 (QA) 和检索增强生成 (RAG) 方面表现出色。
8b 70b77.4K 拉取请求 35 标签 更新于 6 个月前
-
sqlcoder
SQLCoder 是一个代码补全模型,在 StarCoder 上进行微调,用于 SQL 生成任务
7b 15b75.9K 拉取 48 标签 更新于 9 个月前
-
nous-hermes
基于 Nous Research 的 Llama 和 Llama 2 的通用模型。
7b 13b75.5K 拉取 63 标签 更新于 12 个月前
-
phind-codellama
基于 Code Llama 的代码生成模型。
34b74.3K 拉取 49 标签 更新于 10 个月前
-
yarn-llama2
Llama 2 的扩展版本,支持高达 128k 个 token 的上下文。
7b 13b72.4K 拉取 67 标签 更新于 12 个月前
-
dolphincoder
基于 StarCoder2 的 Dolphin 模型家族的 7B 和 15B 未经审查的变体,在编码方面表现出色。
7b 15b71.3K 拉取 35 标签 更新于 7 个月前
-
wizardlm
基于 Llama 2 的通用模型。
71K 拉取 73 标签 更新于 12 个月前
-
deepseek-v2
一个强大、经济高效的专家混合语言模型。
16b 236b65.9K 拉取 34 标签 更新于 4 个月前
-
starling-lm
Starling 是一款通过强化学习从 AI 反馈中训练的大型语言模型,专注于提高聊天机器人的帮助性。
7b61.8K 拉取 36 标签 更新于 7 个月前
-
samantha-mistral
一个在哲学、心理学和人际关系方面接受过训练的伴侣助手。基于 Mistral。
7b60.9K 拉取 49 标签 更新于 13 个月前
-
falcon
一个由技术创新研究院 (TII) 构建的大型语言模型,用于总结、文本生成和聊天机器人。
7b 40b59.7K Pulls 38 Tags 更新于 12 个月前
太阳能
一款紧凑而强大的 107 亿参数大型语言模型,专为单轮对话设计。
107 亿58K Pulls 32 Tags 更新于 10 个月前
orca2
Orca 2 由微软研究院构建,是 Meta 的 Llama 2 模型的微调版本。该模型特别擅长推理。
7b 13b56.7K Pulls 33 Tags 更新于 11 个月前
yi-coder
Yi-Coder 是一系列开源代码语言模型,在不到 100 亿参数的情况下提供最先进的编码性能。
1.5 亿 90 亿56.1K Pulls 67 Tags 更新于 8 周前
internlm2
InternLM2.5 是一款针对实际场景的 70 亿参数模型,具有出色的推理能力。
100 万 18 亿 70 亿 200 亿55.1K Pulls 65 Tags 更新于 2 个月前
hermes3
Hermes 3 是 Nous Research 旗舰 Hermes 系列 LLM 的最新版本。
工具 8b 70b 405b54.6K Pulls 49 Tags 更新于 2 个月前
stable-beluga
Llama 2 基于模型,在 Orca 风格的数据集上进行了微调。最初称为 Free Willy。
7b 13b 70b54.3K Pulls 49 Tags 更新于 12 个月前
llava-phi3
一个从 Phi 3 Mini 微调的新的小型 LLaVA 模型。
视觉 38 亿49.4K 拉取请求 4 标签 更新于 6 个月前
dolphin-phi
Eric Hartford 发布的 2.7B 未经审查的 Dolphin 模型,基于微软研究院的 Phi 语言模型。
2.7b48.9K 拉取请求 15 标签 更新于 10 个月前
wizardlm-uncensored
Wizard LM 模型的未经审查版本
13b46.1K 拉取请求 18 标签 更新于 12 个月前
yarn-mistral
Mistral 的扩展,支持 64K 或 128K 的上下文窗口。
7b41.7K 拉取请求 33 标签 更新于 12 个月前
llama-pro
Llama 2 的扩展,专门用于集成通用语言理解和领域特定知识,特别是在编程和数学方面。
41.3K 拉取请求 33 标签 更新于 10 个月前
medllama2
基于开源医学数据集,对 Llama 2 模型进行了微调,以便回答医学问题。
7b38.8K 拉取请求 17 标签 更新于 12 个月前
meditron
从 Llama 2 改编到医学领域的开源医学大型语言模型。
7b 70b38.2K 拉取请求 22 标签 更新于 11 个月前
nexusraven
Nexus Raven 是一个 13B 指令调整模型,用于函数调用任务。
13b37.8K 拉取请求 32 标签 更新于 9 个月前
minicpm-v
一系列为视觉语言理解而设计的多模态 LLM (MLLM)。
视觉 8b37.2K 拉取请求 17 标签 更新时间 8 周前
llama3-groq-tool-use
来自 Groq 的一系列模型,代表了开源 AI 在工具使用/函数调用方面的重大进步。
工具 8b 70b35.9K 拉取请求 33 标签 更新时间 3 个月前
nous-hermes2-mixtral
来自 Nous Research 的 Nous Hermes 2 模型,现在在 Mixtral 上进行了训练。
8x7b34.8K 拉取请求 18 标签 更新时间 9 个月前
codeup
基于 Llama2 的出色的代码生成模型。
13b33.3K 拉取请求 19 标签 更新时间 12 个月前
everythinglm
基于未经审查的 Llama2 的模型,支持 16K 上下文窗口。
13b31.5K 拉取请求 18 标签 更新时间 10 个月前
nemotron
Llama-3.1-Nemotron-70B-Instruct 是 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的对用户查询的响应的帮助性。
工具 70b28.8K 拉取请求 17 标签 更新时间 3 周前
magicoder
🎩 Magicoder 是一个由 7B 参数模型组成的系列,在使用 OSS-Instruct 的 75K 合成指令数据上进行了训练,OSS-Instruct 是一种通过开源代码片段来启发 LLM 的新方法。
7b28.7K 拉取请求 18 标签 更新时间 11 个月前
bge-m3
BGE-M3 是 BAAI 的一个新模型,以其在多功能性、多语言性和多粒度方面的多功能性而著称。
嵌入 567m28K 拉取请求 3 标签 更新时间 3 个月前
stablelm-zephyr
轻量级聊天模型,无需高端硬件即可实现准确、响应迅速的输出。
30亿27.9K 拉取请求 17 标签 更新 10 个月前
codebooga
一个通过合并两个现有代码模型创建的高性能代码指令模型。
34b27.6K 拉取请求 16 标签 更新 12 个月前
wizard-vicuna
Wizard Vicuna 是一个由 MelodysDreamj 训练的基于 Llama 2 的 13B 参数模型。
13b26.7K 拉取请求 17 标签 更新 12 个月前
falcon2
Falcon2 是一个由 TII 构建的、在 5T 个令牌上训练的 11B 参数因果解码器模型。
11b26.5K 拉取请求 17 标签 更新 5 个月前
mistrallite
MistralLite 是一个基于 Mistral 的微调模型,它增强了处理长上下文的能力。
7b26.1K 拉取请求 17 标签 更新 12 个月前
duckdb-nsql
由 MotherDuck 和 Numbers Station 制作的 7B 参数文本到 SQL 模型。
7b24.9K 拉取请求 17 标签 更新 9 个月前
megadolphin
MegaDolphin-2.2-120b 是由 Dolphin-2.2-70b 创建的模型,它是通过将模型与其自身交织在一起形成的。
120b23K 拉取请求 19 标签 更新 10 个月前
notux
一个使用高质量数据微调的顶级混合专家模型。
8x7b22K 拉取请求 18 标签 更新 10 个月前
open-orca-platypus2
Open Orca OpenChat 模型和 Garage-bAInd Platypus 2 模型的合并。专为聊天和代码生成而设计。
13b21.3K 拉取请求 17 标签 更新 12 个月前
notus
一个使用高质量数据微调的 7B 聊天模型,基于 Zephyr。
7b21.3K 拉取请求 18 标签 更新于 10 个月前
goliath
一个由两个微调的 Llama 2 70B 模型组合而成的一个语言模型。
21.2K 拉取请求 16 标签 更新于 11 个月前
mathstral
MathΣtral:Mistral AI 设计的一个用于数学推理和科学发现的 7B 模型。
7b20.7K 拉取请求 17 标签 更新于 3 个月前
solar-pro
Solar Pro 预览版:一个先进的大型语言模型 (LLM),具有 220 亿个参数,旨在适合单个 GPU。
22b19.7K 拉取请求 18 标签 更新于 7 周前
reader-lm
一系列将 HTML 内容转换为 Markdown 内容的模型,这对于内容转换任务很有用。
0.5b 1.5b17.5K 拉取请求 33 标签 更新于 8 周前
granite3-dense
IBM Granite 2B 和 8B 模型旨在支持基于工具的用例和检索增强生成 (RAG) 的支持,从而简化代码生成、翻译和错误修复。
工具 2b 8b17.2K 拉取请求 33 标签 更新于 2 周前
nuextract
一个基于 Phi-3 的 3.8B 模型,在用于信息提取的私有高质量合成数据集上进行了微调。
3.8b16.3K 拉取请求 17 标签 更新于 3 个月前
dbrx
DBRX 是 Databricks 创建的一个开放的通用 LLM。
132b16.3K Pulls 7 Tags 更新于 6 个月前
firefunction-v2
基于 Llama 3 的开放式权重函数调用模型,其功能调用能力与 GPT-4o 相媲美。
工具 70b13.8K Pulls 17 Tags 更新于 3 个月前
alfred
一个强大的对话模型,旨在用于聊天和指示用例。
40b13K Pulls 7 Tags 更新于 11 个月前
granite3-moe
IBM Granite 1B 和 3B 模型是 IBM 推出的首批专为低延迟使用而设计的混合专家 (MoE) Granite 模型。
工具 1b 3b11.5K Pulls 33 Tags 更新于 2 周前
bge-large
将文本映射到向量的 BAAI 嵌入模型。
嵌入 335m11.1K Pulls 3 Tags 更新于 3 个月前
aya-expanse
Cohere For AI 的语言模型经过训练,可以在 23 种不同的语言中表现出色。
工具 8b 32b9,921 Pulls 33 Tags 更新于 2 周前
bespoke-minicheck
Bespoke Labs 开发的最新事实核查模型。
7b9,352 Pulls 17 Tags 更新于 7 周前
smollm2
SmolLM2 是一个紧凑的语言模型家族,有三种尺寸:1.35 亿、3.6 亿和 17 亿个参数。
工具 135m 360m 1.7b9,063 Pulls 49 Tags 更新于 7 天前
deepseek-v2.5
DeepSeek-V2 的升级版,集成了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的通用和编码能力。
236b8,681 拉取请求 7 标签 更新 8 周前
shieldgemma
ShieldGemma 是一套针对一系列定义的安全策略,用于评估文本提示输入和文本输出响应安全性的指令微调模型。
2b 9b 27b8,155 拉取请求 49 标签 更新 4 周前
llama-guard3
Llama Guard 3 是一系列针对 LLM 输入和响应的内容安全分类进行微调的模型。
1b 8b7,262 拉取请求 33 标签 更新 4 周前
paraphrase-multilingual
可以用于聚类或语义搜索等任务的句子转换器模型。
嵌入 278m6,323 拉取请求 3 标签 更新 3 个月前
granite3-guardian
IBM Granite Guardian 3.0 2B 和 8B 模型旨在检测提示和/或响应中的风险。
2b 8b1,070 拉取请求 10 标签 更新 8 天前