5. 常用命令速查

3 min

前面介绍了 Ollama 的安装、模型管理和运行方式,本章把核心命令、服务管理、环境变量和 API 端点整理成速查表。

1. 核心命令

命令 作用 示例
ollama run <模型> 运行模型并进入对话 ollama run qwen3.5:9b
ollama pull <模型> 拉取/更新模型 ollama pull qwen3.5:9b
ollama list 列出已下载的模型 ollama list
ollama show <模型> 查看模型详细信息 ollama show qwen3.5:9b
ollama ps 查看正在运行的模型 ollama ps
ollama cp <源> <目标> 复制模型 ollama cp qwen3.5:9b my-qwen
ollama rm <模型> 删除模型 ollama rm qwen3.5:9b
ollama help 查看帮助信息 ollama help
ollama --version 查看版本号 ollama --version

2. 服务管理(Homebrew)

命令 作用
brew services start ollama 启动服务
brew services stop ollama 停止服务
brew services restart ollama 重启服务
brew services list | grep ollama 查看服务状态

3. 交互模式命令

ollama run 进入对话后可使用:

命令 作用
/bye 退出对话
/set system <内容> 设置系统提示词
/show info 显示模型信息
/clear 清除上下文历史
Ctrl + D 退出对话

4. 常用环境变量

变量 作用 默认值
OLLAMA_HOST API 监听地址 127.0.0.1:11434
OLLAMA_MODELS 模型存储路径 ~/.ollama/models
OLLAMA_KEEP_ALIVE 模型在内存中保持时间 5m
OLLAMA_NUM_PARALLEL 最大并行请求数 1
OLLAMA_MAX_LOADED_MODELS 最多同时加载模型数 1
OLLAMA_ORIGINS 允许的 CORS 来源

环境变量可以写入 ~/.zshrc 使其永久生效:

bash
# 添加到 ~/.zshrc
export OLLAMA_MODELS=/path/to/your/models
export OLLAMA_KEEP_ALIVE=-1 # 模型常驻内存,不自动卸载

5. API 端点速查

基础地址:http://localhost:11434

端点 方法 作用
/api/generate POST 文本生成(单轮)
/api/chat POST 多轮对话
/api/embeddings POST 生成文本向量
/api/tags GET 列出本地模型
/api/show POST 查看模型信息
/api/pull POST 拉取模型
/api/delete DELETE 删除模型
/v1/chat/completions POST OpenAI 兼容接口

6. 日常场景速查

bash
# 中文对话(推荐 Qwen)
ollama run qwen3.5

# 数学 / 推理任务(推荐 DeepSeek)
ollama run deepseek-r1

# 快速问答(非交互)
echo "解释一下什么是 RESTful API" | ollama run qwen3.5

# 代码解释
cat app.py | ollama run codellama "解释这段代码"

把常用命令写成 shell alias,使用更方便:

bash
# 添加到 ~/.zshrc
alias ai='ollama run qwen3.5'
alias code-ai='ollama run codellama'

之后只需输入 ai 即可开始对话。

7. 常见问题排查

现象 可能原因 解决方法
could not connect to a running Ollama instance Ollama 服务未启动 brew services start ollama
模型下载速度极慢 网络问题 检查网络连接,必要时配置代理
out of memory 或模型加载失败 内存不足以加载模型 换用更小参数的模型版本(如 7b -> 3b
port 11434 already in use 端口被占用 lsof -i :11434 查看占用进程并处理
API 请求返回 404 端点路径错误 确认使用正确的 API 路径(如 /api/chat,OpenAI 兼容用 /v1/

8. 小结

速查表覆盖 Ollama 的核心命令、服务管理、环境变量、API 端点以及常见问题排查。

知识点 说明
核心命令 runpulllistshowpscprm 七大命令
服务管理 brew services start/stop/restart ollama
环境变量 OLLAMA_HOSTOLLAMA_MODELSOLLAMA_KEEP_ALIVE
API 端点 /api/generate/api/chat/v1/chat/completions
Shell alias alias ai='ollama run qwen3.5' 简化日常操作

接下来进入总结与进阶,回顾整个专栏并了解 Ollama 更多高级用法的方向。