前面介绍了 Ollama 的安装、模型管理和运行方式,本章把核心命令、服务管理、环境变量和 API 端点整理成速查表。
1. 核心命令
| 命令 | 作用 | 示例 |
|---|---|---|
ollama run <模型> |
运行模型并进入对话 | ollama run qwen3.5:9b |
ollama pull <模型> |
拉取/更新模型 | ollama pull qwen3.5:9b |
ollama list |
列出已下载的模型 | ollama list |
ollama show <模型> |
查看模型详细信息 | ollama show qwen3.5:9b |
ollama ps |
查看正在运行的模型 | ollama ps |
ollama cp <源> <目标> |
复制模型 | ollama cp qwen3.5:9b my-qwen |
ollama rm <模型> |
删除模型 | ollama rm qwen3.5:9b |
ollama help |
查看帮助信息 | ollama help |
ollama --version |
查看版本号 | ollama --version |
2. 服务管理(Homebrew)
| 命令 | 作用 |
|---|---|
brew services start ollama |
启动服务 |
brew services stop ollama |
停止服务 |
brew services restart ollama |
重启服务 |
brew services list | grep ollama |
查看服务状态 |
3. 交互模式命令
在 ollama run 进入对话后可使用:
| 命令 | 作用 |
|---|---|
/bye |
退出对话 |
/set system <内容> |
设置系统提示词 |
/show info |
显示模型信息 |
/clear |
清除上下文历史 |
Ctrl + D |
退出对话 |
4. 常用环境变量
| 变量 | 作用 | 默认值 |
|---|---|---|
OLLAMA_HOST |
API 监听地址 | 127.0.0.1:11434 |
OLLAMA_MODELS |
模型存储路径 | ~/.ollama/models |
OLLAMA_KEEP_ALIVE |
模型在内存中保持时间 | 5m |
OLLAMA_NUM_PARALLEL |
最大并行请求数 | 1 |
OLLAMA_MAX_LOADED_MODELS |
最多同时加载模型数 | 1 |
OLLAMA_ORIGINS |
允许的 CORS 来源 | 无 |
环境变量可以写入 ~/.zshrc 使其永久生效:
bash
# 添加到 ~/.zshrc
export OLLAMA_MODELS=/path/to/your/models
export OLLAMA_KEEP_ALIVE=-1 # 模型常驻内存,不自动卸载5. API 端点速查
基础地址:http://localhost:11434
| 端点 | 方法 | 作用 |
|---|---|---|
/api/generate |
POST | 文本生成(单轮) |
/api/chat |
POST | 多轮对话 |
/api/embeddings |
POST | 生成文本向量 |
/api/tags |
GET | 列出本地模型 |
/api/show |
POST | 查看模型信息 |
/api/pull |
POST | 拉取模型 |
/api/delete |
DELETE | 删除模型 |
/v1/chat/completions |
POST | OpenAI 兼容接口 |
6. 日常场景速查
bash
# 中文对话(推荐 Qwen)
ollama run qwen3.5
# 数学 / 推理任务(推荐 DeepSeek)
ollama run deepseek-r1
# 快速问答(非交互)
echo "解释一下什么是 RESTful API" | ollama run qwen3.5
# 代码解释
cat app.py | ollama run codellama "解释这段代码"把常用命令写成 shell alias,使用更方便:
bash
# 添加到 ~/.zshrc
alias ai='ollama run qwen3.5'
alias code-ai='ollama run codellama'之后只需输入 ai 即可开始对话。
7. 常见问题排查
| 现象 | 可能原因 | 解决方法 |
|---|---|---|
could not connect to a running Ollama instance |
Ollama 服务未启动 | brew services start ollama |
| 模型下载速度极慢 | 网络问题 | 检查网络连接,必要时配置代理 |
out of memory 或模型加载失败 |
内存不足以加载模型 | 换用更小参数的模型版本(如 7b -> 3b) |
port 11434 already in use |
端口被占用 | lsof -i :11434 查看占用进程并处理 |
| API 请求返回 404 | 端点路径错误 | 确认使用正确的 API 路径(如 /api/chat,OpenAI 兼容用 /v1/) |
8. 小结
速查表覆盖 Ollama 的核心命令、服务管理、环境变量、API 端点以及常见问题排查。
| 知识点 | 说明 |
|---|---|
| 核心命令 | run、pull、list、show、ps、cp、rm 七大命令 |
| 服务管理 | brew services start/stop/restart ollama |
| 环境变量 | OLLAMA_HOST、OLLAMA_MODELS、OLLAMA_KEEP_ALIVE 等 |
| API 端点 | /api/generate、/api/chat、/v1/chat/completions 等 |
| Shell alias | alias ai='ollama run qwen3.5' 简化日常操作 |
接下来进入总结与进阶,回顾整个专栏并了解 Ollama 更多高级用法的方向。