3. 模型管理

3 min

1. 安装模型

使用 ollama pullOllama 模型库 下载模型:

bash
ollama pull qwen3.5

首次拉取会下载完整的模型文件,根据模型大小和网络速度,可能需要几分钟到几十分钟不等。

1.1 指定模型版本

模型名称格式为 模型名:标签,标签通常表示参数规模或量化方式:

bash
# 拉取默认版本(通常是最新的推荐版本)
ollama pull qwen3.5

# 拉取指定参数规模
ollama pull qwen3.5:9b
ollama pull qwen3.5:27b
ollama pull qwen3.5:35b

不同参数规模的模型对硬件要求不同:

参数规模 内存需求 适用场景
1B-3B 4GB+ 轻量任务、快速响应
7B-8B 8GB+ 日常对话、代码补全
13B-14B 16GB+ 复杂推理、长文本
70B-72B 64GB+ 专业任务、接近商用水平

2. 常用开源模型推荐

模型 拉取命令 特点
Qwen 3.5 ollama pull qwen3.5 阿里通义,中文能力出色
DeepSeek-R1 ollama pull deepseek-r1 推理模型,擅长数学和编码
Llama 3.1 ollama pull llama3.1 Meta 出品,综合能力强
Gemma 3 ollama pull gemma3 Google 出品,小巧高效
Mistral ollama pull mistral Mistral AI 出品,性能均衡
CodeLlama ollama pull codellama 专注代码生成
X/Z-Image-Turbo ollama pull x/z-image-turbo 图像理解和生成

3. 查看已下载的模型

本地所有已下载的模型可以通过 list 命令列出,包括模型名称、大小和修改时间:

bash
ollama list
albert@dev: ~

4. 查看模型详情

要了解某个模型的架构、量化方式和支持能力,可以用 show 命令查看:

bash
ollama show qwen3.5:9b
albert@dev: ~

该命令会显示模型的详细信息,包括模型架构、参数量、量化方式、上下文窗口大小等。

5. 复制模型

基于现有模型创建一个副本(比如用于自定义配置):

bash
ollama cp qwen3.5:9b my-qwen

6. 删除模型

不再需要的模型可以删除以释放磁盘空间:

bash
ollama rm qwen3.5:9b

7. 小结

Ollama 的模型管理围绕 pulllistshowcprm 五个命令展开,覆盖了从下载到清理的完整生命周期。

知识点 说明
拉取模型 ollama pull 模型名:标签,标签指定参数规模或量化方式
查看列表 ollama list 列出所有已下载模型
查看详情 ollama show 模型名 显示架构、参数量、上下文长度等
复制模型 ollama cp 源模型 目标名 创建副本
删除模型 ollama rm 模型名,不可恢复
参数规模选择 1B-3B 轻量任务,7B-8B 日常使用,13B+ 复杂推理

接下来介绍运行与对话,用交互模式、管道输入和 REST API 三种方式与模型沟通。