5. 常用命令速查 · Albert's Stack

前面介绍了 Ollama 的安装、模型管理和运行方式，本章把核心命令、服务管理、环境变量和 API 端点整理成速查表。

1. 核心命令

命令	作用	示例
`ollama run <模型>`	运行模型并进入对话	`ollama run qwen3.5:9b`
`ollama pull <模型>`	拉取/更新模型	`ollama pull qwen3.5:9b`
`ollama list`	列出已下载的模型	`ollama list`
`ollama show <模型>`	查看模型详细信息	`ollama show qwen3.5:9b`
`ollama ps`	查看正在运行的模型	`ollama ps`
`ollama cp <源> <目标>`	复制模型	`ollama cp qwen3.5:9b my-qwen`
`ollama rm <模型>`	删除模型	`ollama rm qwen3.5:9b`
`ollama help`	查看帮助信息	`ollama help`
`ollama --version`	查看版本号	`ollama --version`

2. 服务管理（Homebrew）

命令	作用
`brew services start ollama`	启动服务
`brew services stop ollama`	停止服务
`brew services restart ollama`	重启服务
`brew services list \| grep ollama`	查看服务状态

3. 交互模式命令

在 ollama run 进入对话后可使用：

命令	作用
`/bye`	退出对话
`/set system <内容>`	设置系统提示词
`/show info`	显示模型信息
`/clear`	清除上下文历史
`Ctrl + D`	退出对话

4. 常用环境变量

变量	作用	默认值
`OLLAMA_HOST`	API 监听地址	`127.0.0.1:11434`
`OLLAMA_MODELS`	模型存储路径	`~/.ollama/models`
`OLLAMA_KEEP_ALIVE`	模型在内存中保持时间	`5m`
`OLLAMA_NUM_PARALLEL`	最大并行请求数	`1`
`OLLAMA_MAX_LOADED_MODELS`	最多同时加载模型数	`1`
`OLLAMA_ORIGINS`	允许的 CORS 来源	无

环境变量可以写入 ~/.zshrc 使其永久生效：

bash

# 添加到 ~/.zshrc
export OLLAMA_MODELS=/path/to/your/models
export OLLAMA_KEEP_ALIVE=-1 # 模型常驻内存，不自动卸载

5. API 端点速查

基础地址：http://localhost:11434

端点	方法	作用
`/api/generate`	POST	文本生成（单轮）
`/api/chat`	POST	多轮对话
`/api/embeddings`	POST	生成文本向量
`/api/tags`	GET	列出本地模型
`/api/show`	POST	查看模型信息
`/api/pull`	POST	拉取模型
`/api/delete`	DELETE	删除模型
`/v1/chat/completions`	POST	OpenAI 兼容接口

6. 日常场景速查

bash

# 中文对话（推荐 Qwen）
ollama run qwen3.5

# 数学 / 推理任务（推荐 DeepSeek）
ollama run deepseek-r1

# 快速问答（非交互）
echo "解释一下什么是 RESTful API" | ollama run qwen3.5

# 代码解释
cat app.py | ollama run codellama "解释这段代码"

把常用命令写成 shell alias，使用更方便：

bash

# 添加到 ~/.zshrc
alias ai='ollama run qwen3.5'
alias code-ai='ollama run codellama'

之后只需输入 ai 即可开始对话。

7. 常见问题排查

现象	可能原因	解决方法
`could not connect to a running Ollama instance`	Ollama 服务未启动	`brew services start ollama`
模型下载速度极慢	网络问题	检查网络连接，必要时配置代理
`out of memory` 或模型加载失败	内存不足以加载模型	换用更小参数的模型版本（如 `7b` -> `3b`）
`port 11434 already in use`	端口被占用	`lsof -i :11434` 查看占用进程并处理
API 请求返回 404	端点路径错误	确认使用正确的 API 路径（如 `/api/chat`，OpenAI 兼容用 `/v1/`）

8. 小结

速查表覆盖 Ollama 的核心命令、服务管理、环境变量、API 端点以及常见问题排查。

知识点	说明
核心命令	`run`、`pull`、`list`、`show`、`ps`、`cp`、`rm` 七大命令
服务管理	`brew services start/stop/restart ollama`
环境变量	`OLLAMA_HOST`、`OLLAMA_MODELS`、`OLLAMA_KEEP_ALIVE` 等
API 端点	`/api/generate`、`/api/chat`、`/v1/chat/completions` 等
Shell alias	`alias ai='ollama run qwen3.5'` 简化日常操作

接下来进入总结与进阶，回顾整个专栏并了解 Ollama 更多高级用法的方向。