# 基于Ollama部署ERNIE大模型教程

## 教程概述

本教程将详细介绍如何使用Ollama快速部署ERNIE-4.5-0.3B模型，让您能够在本地环境中运行和使用ERNIE大语言模型。

### 教程目标

完成本教程后，您将能够：
1. 在本地安装Ollama
2. 一键部署ERNIE-4.5-0.3B模型
3. 通过命令行与模型进行对话
4. 使用API调用模型

## 系统要求

### 硬件要求

- **内存**：至少8GB RAM（推荐16GB以上）
- **存储空间**：至少10GB可用空间
- **处理器**：支持AVX指令集的现代CPU
- **GPU**（可选）：NVIDIA GPU with CUDA support（可显著提升推理速度）

### 软件要求

- **操作系统**：Windows 10/11、macOS 10.15+、或Linux
- **Python**：3.10+（用于模型转换和API调用）
- **Git**：用于下载模型文件


## 第一步：安装Ollama

### Windows安装

1. **下载安装包**
   
   访问Ollama官网下载Windows安装包：
   ```
   https://ollama.com/download/OllamaSetup.exe
   ```

2. **运行安装程序**
   
   双击下载的`OllamaSetup.exe`文件，按照安装向导完成安装。

3. **验证安装**
   
   打开命令提示符或PowerShell，运行：
   ```bash
   ollama --version
   ```
   
   如果显示版本信息，说明安装成功。

### macOS安装

1. **下载安装包**
   
   ```bash
   # 下载dmg文件
   curl -O https://ollama.com/download/Ollama.dmg
   ```

2. **安装应用**
   
   双击dmg文件，将Ollama拖拽到Applications文件夹。

3. **验证安装**
   
   ```bash
   ollama --version
   ```

### Linux安装

1. **一键安装脚本**
   
   ```bash
   curl -fsSL https://ollama.com/install.sh | sh
   ```

2. **启动服务**
   
   ```bash
   # 启动Ollama服务
   ollama serve
   ```

## 第二步：部署ERNIE-4.5-0.3B模型

### 一键部署模型

使用以下命令直接从Ollama模型库部署ERNIE-4.5-0.3B模型：

```bash
ollama run dengcao/ERNIE-4.5-0.3B-PT
```

这个命令会自动：
1. 下载ERNIE-4.5-0.3B模型
2. 安装到本地Ollama环境
3. 启动模型并进入对话模式

> **注意**：首次运行时会下载模型文件，大约需要几分钟时间，具体取决于您的网络速度。

## 第三步：运行和测试模型

### 命令行对话

1. **启动对话模式**
   
   ```bash
   ollama run dengcao/ERNIE-4.5-0.3B-PT
   ```

2. **进行对话测试**
   
   ```
   >>> 你好，请介绍一下自己
   
   你好！我是ERNIE，一个由百度开发的大语言模型。我具备强大的中文理解和生成能力，可以帮助您：
   
   - 回答各种问题
   - 协助创作文章、诗歌等内容
   - 进行日常对话交流
   - 提供学习和工作建议
   - 翻译和语言处理任务
   
   有什么我可以帮助您的吗？
   
   >>> 请写一首关于春天的诗
   
   春风轻拂柳丝长，
   花开满树香满堂。
   燕子归来衔泥忙，
   绿意盎然满山岗。
   
   溪水潺潺向东流，
   蝴蝶翩翩花间游。
   万物复苏展新颜，
   春光无限好时候。
   ```


3. **退出对话**
   
   按`Ctrl+C`退出对话模式。

### 使用REST API

1. **启动Ollama服务**
   
   ```bash
   # 在后台启动服务
   ollama serve
   ```
   
   服务默认运行在`http://localhost:11434`

2. **API调用示例**
   
   **生成文本**：
   ```bash
   curl http://localhost:11434/api/generate -d '{
     "model": "dengcao/ERNIE-4.5-0.3B-PT",
     "prompt": "请解释一下人工智能的发展历程",
     "stream": false
   }'
   ```
   
   **对话模式**：
   ```bash
   curl http://localhost:11434/api/chat -d '{
     "model": "dengcao/ERNIE-4.5-0.3B-PT",
     "messages": [
       {
         "role": "user",
         "content": "什么是机器学习？"
       }
     ]
   }'
   ```


### Python SDK使用

1. **安装Python客户端**
   
   ```bash
   pip install ollama
   ```

2. **Python代码示例**
   
   ```python
   import ollama
   
   # 简单对话
   response = ollama.chat(model='dengcao/ERNIE-4.5-0.3B-PT', messages=[
     {
       'role': 'user',
       'content': '请介绍一下深度学习的基本概念',
     },
   ])
   print(response['message']['content'])
   
   # 流式对话
   stream = ollama.chat(
       model='dengcao/ERNIE-4.5-0.3B-PT',
       messages=[{'role': 'user', 'content': '写一个Python函数来计算斐波那契数列'}],
       stream=True,
   )
   
   for chunk in stream:
     print(chunk['message']['content'], end='', flush=True)
   ```


## 第四步：集成和应用

### 应用开发示例

1. **简单聊天机器人**
   
   ```python
   import ollama
   import streamlit as st
   
   st.title("ERNIE聊天机器人")
   
   # 初始化聊天历史
   if "messages" not in st.session_state:
       st.session_state.messages = []
   
   # 显示聊天历史
   for message in st.session_state.messages:
       with st.chat_message(message["role"]):
           st.markdown(message["content"])
   
   # 用户输入
   if prompt := st.chat_input("请输入您的问题"):
       # 添加用户消息
       st.session_state.messages.append({"role": "user", "content": prompt})
       with st.chat_message("user"):
           st.markdown(prompt)
   
       # 生成回复
       with st.chat_message("assistant"):
           response = ollama.chat(
               model='dengcao/ERNIE-4.5-0.3B-PT',
               messages=st.session_state.messages
           )
           reply = response['message']['content']
           st.markdown(reply)
           st.session_state.messages.append({"role": "assistant", "content": reply})
   ```
2. **运行聊天机器人**
   
   ```bash
   # 安装依赖
   pip install streamlit
   
   # 运行应用
   streamlit run chatbot.py
   ```

## 故障排除

### 常见问题及解决方案

1. **模型加载失败**
   
   **问题**：`Error: model not found`
   
   **解决方案**：
   ```bash
   # 检查模型是否存在
   ollama list
   
   # 重新下载模型
   ollama run dengcao/ERNIE-4.5-0.3B-PT
   ```

2. **API连接失败**
   
   **问题**：`Connection refused`
   
   **解决方案**：
   ```bash
   # 确保服务正在运行
   ollama serve
   
   # 检查端口是否被占用
   netstat -an | grep 11434
   ```

## 总结

通过本教程，您已经学会了：

1. ✅ **安装配置Ollama**：在不同操作系统上安装和配置Ollama
2. ✅ **模型准备**：下载ERNIE-4.5-0.3B模型
3. ✅ **应用集成**：将模型集成到实际应用中
4. ✅ **故障排除**：解决常见问题和调试技巧


### 联系我们

如果您在使用过程中遇到问题或有任何建议，欢迎通过以下方式联系：

- **GitHub Issues**：在项目仓库中提交问题
- **微信**：G_Fuji
- **社区论坛**：参与相关技术讨论

---