## 下载ollama

source /etc/network_turbo


curl -fsSL https://ollama.com/install.sh | sh

## 配置ollama环境

### cpu 加载/ gpu 加载 （自动识别）
vim /etc/profile 

export OLLAMA_HOST="0.0.0.0:6006" 

export OLLAMA_MODELS=/root/autodl-tmp/models 

source /etc/profile 

echo $OLLAMA_HOST


### GPU加载 单卡/多卡

vim /etc/profile 

export OLLAMA_HOST="0.0.0.0:6006" 

export OLLAMA_GPU_LAYER=cuda

export OLLAMA_NUM_GPU=2

export CUDA_VISIBLE_DEVICES=0,1

export OLLAMA_SCHED_SPREAD=1

export OLLAMA_KEEP_ALIVE=-1

export OLLAMA_MODELS=/root/autodl-tmp/models 

source /etc/profile 

echo $OLLAMA_HOST

## 开启ollama服务

ollama serve

## 从官方拉取模型

ollama run qwen3:8b

## 本地openai调用

In [5]:
import os
from openai import OpenAI

# client = OpenAI(
#     # 若没有配置环境变量，请用百炼API Key将下行替换为：api_key="sk-xxx",
#     api_key=os.getenv("DASHSCOPE_API_KEY"), # 如何获取API Key：https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
#     base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
# )

client = OpenAI(
   
    api_key="na", 
    base_url="http://localhost:8000/v1",
)


completion = client.chat.completions.create(
    model="midori", 
    messages=[
        {'role': 'system', 'content': 'You are a helpful assistant.'},
        {'role': 'user', 'content': '说一下什么是大模型'}
        ]
)
print(completion.choices[0].message.content)

<think>
嗯，用户问的是“说一下什么是大模型”，首先我需要明确用户的需求。他们可能对这个术语不太了解，想得到一个通俗易懂的解释。作为助理，我要确保回答既全面又不复杂。

首先，我要定义大模型是什么，可能用户知道一些AI的概念，但大模型是其中比较新的东西。需要说明大模型的基本概念，比如参数量、训练数据和应用场景。然后，应该提到一些常见的例子，比如GPT、BERT、通义千问，这样用户能更具体地理解。

接下来，用户可能想知道为什么大模型重要，所以需要解释它们的优势，比如强大的语言理解和生成能力，多任务处理，还有持续学习的能力。但也要提到挑战，比如计算资源需求高、存在偏见和伦理问题，这样回答会更全面。

另外，可能用户对实际应用感兴趣，所以举几个例子会更好，比如聊天机器人、文本生成、代码编写、数据分析等。这样他们能了解大模型在现实中的作用。

还要注意避免使用专业术语过多，保持口语化。同时检查是否有遗漏的部分，比如是否提到训练过程或应用场景的多样性。最后，确保结构清晰，分点解释，让用户容易理解。
</think>

**大模型**（Large Language Models，简称LLM）是指基于人工智能技术，通过海量数据训练出的具有强大语言理解和生成能力的深度学习模型。它们能够处理复杂的自然语言任务，如文本生成、翻译、问答、代码编写等，并且在多个领域展现出强大的泛化能力。

---

### **核心特点**
1. **超大规模参数**  
   大模型通常拥有数十亿甚至数千亿个参数（参数是模型内部用于学习数据特征的变量）。参数量越大，模型对语言的理解和生成能力越强。

2. **海量数据训练**  
   通过训练大量文本数据（如书籍、网页、对话记录等），大模型能学习到语言的结构、语义和上下文关联，从而具备类人水平的语言理解和推理能力。

3. **多任务处理能力**  
   大模型可以同时完成多种任务，例如：
   - 回答开放性问题（如“解释量子力学”）
   - 文本生成（如写故事、写邮件）
   - 代码编写（如根据需求生成代码）
   - 数据分析（如从文本中提取关键信息）

4. **持续学习与迭代**  
   初期训练完成后，大模型可以通过微调（Fine-tuning）或增量训练进一步优化，适应特定领域或场景（例如医疗、金融、教育等）。

---

## 通过open-webui 部署ollama

vim /etc/profile 

export OLLAMA_HOST="0.0.0.0:11434" 

source /etc/profile 

echo $OLLAMA_HOST

## 注意，不需要以下环节
export HF_ENDPOINT=https://hf-mirror.com \
export ENABLE_OLLAMA_API=False \
export OPENAI_API_BASE_URL=http://127.0.0.1:5000/v1 \
export DEFAULT_MODELS="Qwen3-8B" \

## 直接启动open-webui即可

ollama serve

open-webui serve --port 6006