Windows 预览
2024 年 2 月 15 日
Ollama 现在以预览版形式在 Windows 上提供,从而可以在全新的原生 Windows 体验中拉取、运行和创建大型语言模型。Windows 版 Ollama 包括内置 GPU 加速、访问完整的模型库以及 Ollama API,包括 OpenAI 兼容性。
硬件加速
Ollama 使用 NVIDIA GPU 以及现代 CPU 指令集(如 AVX 和 AVX2,如果可用)来加速运行模型。无需配置或虚拟化!
完全访问模型库
完整的 Ollama 模型库可在 Windows 上运行,包括 视觉模型。当运行视觉模型(如 LLaVA 1.6)时,可以将图像拖放到 ollama run
中以将其添加到消息中。
始终开启的 Ollama API
Ollama 的 API 在后台自动运行,服务于 https://127.0.0.1:11434
。工具和应用程序可以连接到它,无需任何额外设置。
例如,以下是如何使用 PowerShell 调用 Ollama 的 API
(Invoke-WebRequest -method POST -Body '{"model":"llama2", "prompt":"Why is the sky blue?", "stream": false}' -uri https://127.0.0.1:11434/api/generate ).Content | ConvertFrom-json
Windows 版 Ollama 还支持与其他平台相同的 OpenAI 兼容性,从而可以使用为 OpenAI 构建的现有工具通过 Ollama 使用本地模型。
开始使用
要开始使用 Windows 预览版 Ollama
- 下载 Windows 版 Ollama
- 双击安装程序
OllamaSetup.exe
- 安装完成后,打开您喜欢的终端并运行
ollama run llama2
来运行模型
当有新版本可用时,Ollama 将提示更新。我们欢迎您的反馈!如果您遇到任何问题,请通过打开 issue 或加入 Discord 服务器告知我们。