1. 安装模型
使用 ollama pull 从 Ollama 模型库 下载模型:
bash
ollama pull qwen3.5首次拉取会下载完整的模型文件,根据模型大小和网络速度,可能需要几分钟到几十分钟不等。
1.1 指定模型版本
模型名称格式为 模型名:标签,标签通常表示参数规模或量化方式:
bash
# 拉取默认版本(通常是最新的推荐版本)
ollama pull qwen3.5
# 拉取指定参数规模
ollama pull qwen3.5:9b
ollama pull qwen3.5:27b
ollama pull qwen3.5:35b不同参数规模的模型对硬件要求不同:
| 参数规模 | 内存需求 | 适用场景 |
|---|---|---|
| 1B-3B | 4GB+ | 轻量任务、快速响应 |
| 7B-8B | 8GB+ | 日常对话、代码补全 |
| 13B-14B | 16GB+ | 复杂推理、长文本 |
| 70B-72B | 64GB+ | 专业任务、接近商用水平 |
2. 常用开源模型推荐
| 模型 | 拉取命令 | 特点 |
|---|---|---|
| Qwen 3.5 | ollama pull qwen3.5 |
阿里通义,中文能力出色 |
| DeepSeek-R1 | ollama pull deepseek-r1 |
推理模型,擅长数学和编码 |
| Llama 3.1 | ollama pull llama3.1 |
Meta 出品,综合能力强 |
| Gemma 3 | ollama pull gemma3 |
Google 出品,小巧高效 |
| Mistral | ollama pull mistral |
Mistral AI 出品,性能均衡 |
| CodeLlama | ollama pull codellama |
专注代码生成 |
| X/Z-Image-Turbo | ollama pull x/z-image-turbo |
图像理解和生成 |
3. 查看已下载的模型
本地所有已下载的模型可以通过 list 命令列出,包括模型名称、大小和修改时间:
bash
ollama list4. 查看模型详情
要了解某个模型的架构、量化方式和支持能力,可以用 show 命令查看:
bash
ollama show qwen3.5:9b该命令会显示模型的详细信息,包括模型架构、参数量、量化方式、上下文窗口大小等。
5. 复制模型
基于现有模型创建一个副本(比如用于自定义配置):
bash
ollama cp qwen3.5:9b my-qwen6. 删除模型
不再需要的模型可以删除以释放磁盘空间:
bash
ollama rm qwen3.5:9b7. 小结
Ollama 的模型管理围绕 pull、list、show、cp、rm 五个命令展开,覆盖了从下载到清理的完整生命周期。
| 知识点 | 说明 |
|---|---|
| 拉取模型 | ollama pull 模型名:标签,标签指定参数规模或量化方式 |
| 查看列表 | ollama list 列出所有已下载模型 |
| 查看详情 | ollama show 模型名 显示架构、参数量、上下文长度等 |
| 复制模型 | ollama cp 源模型 目标名 创建副本 |
| 删除模型 | ollama rm 模型名,不可恢复 |
| 参数规模选择 | 1B-3B 轻量任务,7B-8B 日常使用,13B+ 复杂推理 |
接下来介绍运行与对话,用交互模式、管道输入和 REST API 三种方式与模型沟通。