3. 模型管理 · Albert's Stack

1. 安装模型

使用 ollama pull 从 Ollama 模型库下载模型：

bash

ollama pull qwen3.5

首次拉取会下载完整的模型文件，根据模型大小和网络速度，可能需要几分钟到几十分钟不等。

模型名称格式为 模型名:标签，标签通常表示参数规模或量化方式：

bash

# 拉取默认版本（通常是最新的推荐版本）
ollama pull qwen3.5

# 拉取指定参数规模
ollama pull qwen3.5:9b
ollama pull qwen3.5:27b
ollama pull qwen3.5:35b

不同参数规模的模型对硬件要求不同：

本地所有已下载的模型可以通过 list 命令列出，包括模型名称、大小和修改时间：

bash

ollama list

albert@dev: ~

要了解某个模型的架构、量化方式和支持能力，可以用 show 命令查看：

bash

ollama show qwen3.5:9b

albert@dev: ~

该命令会显示模型的详细信息，包括模型架构、参数量、量化方式、上下文窗口大小等。

基于现有模型创建一个副本（比如用于自定义配置）：

bash

ollama cp qwen3.5:9b my-qwen

不再需要的模型可以删除以释放磁盘空间：

bash

ollama rm qwen3.5:9b

Ollama 的模型管理围绕 pull、list、show、cp、rm 五个命令展开，覆盖了从下载到清理的完整生命周期。

知识点	说明
拉取模型	`ollama pull 模型名:标签`，标签指定参数规模或量化方式
查看列表	`ollama list` 列出所有已下载模型
查看详情	`ollama show 模型名` 显示架构、参数量、上下文长度等
复制模型	`ollama cp 源模型目标名` 创建副本
删除模型	`ollama rm 模型名`，不可恢复
参数规模选择	1B-3B 轻量任务，7B-8B 日常使用，13B+ 复杂推理

接下来介绍运行与对话，用交互模式、管道输入和 REST API 三种方式与模型沟通。