# 在 Python 中使用 Ollama API



## 导入Ollama模块



In [1]:
pip install ollama

Note: you may need to restart the kernel to use updated packages.


## 使用方法


In [5]:
import ollama
response = ollama.chat(model='llama3.1', messages=[
  {
    'role': 'user',
    'content': '为什么天空是蓝色的？',
  },
])
print(response['message']['content'])

天空看起来是蓝色的，因为太阳光线散射的现象。白日时，大气层中所有能吸收和散射光照的气体和微粒，均有作用于白天太阳光。光在经过地球大气层时，由于与各种介质相互作用（反弹、折射、散射等），因此，光线会随着角度的改变而发生偏移。这也是为什么我们天空中能看到美丽的彩虹。

蓝光具有较小的波长，使它能够更深地穿透大气层，并且与大气层中的水蒸气、CO2等气体和微粒相互作用时，会被散射出来。由于我们的视觉系统对紫外线的灵敏度最低，同时蓝色在全能感受范围内位于视觉光谱中较高的一端，因此我们观察到的天空颜色主要是蓝色的（虽然在实际上，我们还可以观察到一些黄色、白色等其他颜色）。


## 流式响应

可以通过设置 `stream=True` 启用响应流，使函数调用返回一个 Python 生成器，其中每个部分都是流中的一个对象。


In [3]:
import ollama

stream = ollama.chat(
    model='llama3.1',
    messages=[{'role': 'user', 'content': '为什么天空是蓝色的？'}],
    stream=True,
)

for chunk in stream:
  print(chunk['message']['content'], end='', flush=True)

天空看起来是蓝色的，因为我们看到地球大气中散射的光照。这是一个复杂的问题，但可以用简单的语言解释。

大气中的分子和气体会吸收或折射白色光，反射出蓝紫色的光。这个过程称为“Rayleigh 散射”。它是由于大气中的微小颗粒在不同波长下的光照表现出的差异而产生的。结果是，我们看到一个天空呈现蓝色的颜色。

## API


### 聊天



In [4]:
ollama.chat(model='llama3.1', messages=[{'role': 'user', 'content': '为什么天空是蓝色的？'}])

{'model': 'llama3.1',
 'created_at': '2024-08-09T09:39:13.853693892Z',
 'message': {'role': 'assistant', 'content': '答案：因为大气散射。'},
 'done_reason': 'stop',
 'done': True,
 'total_duration': 567149901,
 'load_duration': 10989019,
 'prompt_eval_count': 18,
 'prompt_eval_duration': 314188000,
 'eval_count': 9,
 'eval_duration': 185421000}

### 生成



In [5]:
ollama.generate(model='llama3.1', prompt='为什么天空是蓝色的？')

{'model': 'llama3.1',
 'created_at': '2024-08-09T09:39:44.737161632Z',
 'response': '蓝天白云是我们心目中的理想世界。蓝色是那么靓丽、那样的舒适，所以人们常说：蓝天白云好生活。这不是什么哲学道理，它只是自然的真实写照。有研究指出，看到蓝色的效果，是由于蓝色能起到放松人的作用，而这种情感状态，直接关系到我们的心理健康。\n\n\u3000\u3000那么为什么是蓝色呢？我们都知道地球上水的大部分是青色的，这就是为什么天空看起来是蓝色的原因了。太阳光通过大气时，与地面上的水分子相遇，并被吸收、散射和折射。这就是为什么蓝天白云这样的美景在我们的视觉中出现的缘故。\n\n\u3000\u3000地球上有70%以上的表面积都是海洋，所以蓝色霸占了自然界，给我们带来无限舒适感。所以蓝色的风景，是一种心灵的救赎。',
 'done': True,
 'done_reason': 'stop',
 'context': [128009,
  128006,
  882,
  128007,
  271,
  113221,
  36827,
  35894,
  21043,
  115427,
  118458,
  11571,
  128009,
  128006,
  78191,
  128007,
  271,
  115427,
  36827,
  101828,
  103458,
  21043,
  98739,
  64209,
  30832,
  105363,
  22649,
  101067,
  102616,
  1811,
  115427,
  39135,
  21043,
  111498,
  21688,
  241,
  107921,
  5486,
  100823,
  119938,
  120178,
  108562,
  108905,
  127198,
  40053,
  37687,
  5232,
  115427,
  36827,
  101828,
  103458,
  53901,
  104654,
  110477,
  103668,
  101879,
  115981,
  48864,
  45893,

### 本地模型列表



In [6]:
ollama.list()

{'models': [{'name': 'llava:latest',
   'model': 'llava:latest',
   'modified_at': '2024-08-08T14:20:09.31045753+08:00',
   'size': 4733363377,
   'digest': '8dd30f6b0cb19f555f2c7a7ebda861449ea2cc76bf1f44e262931f45fc81d081',
   'details': {'parent_model': '',
    'format': 'gguf',
    'family': 'llama',
    'families': ['llama', 'clip'],
    'parameter_size': '7B',
    'quantization_level': 'Q4_0'}},
  {'name': 'llama3.1:latest',
   'model': 'llama3.1:latest',
   'modified_at': '2024-08-08T14:13:55.590492785+08:00',
   'size': 4661230977,
   'digest': '75382d0899dfaaa6ce331cf680b72bd6812c7f05e5158c5f2f43c6383e21d734',
   'details': {'parent_model': '',
    'format': 'gguf',
    'family': 'llama',
    'families': ['llama'],
    'parameter_size': '8.0B',
    'quantization_level': 'Q4_0'}},
  {'name': 'glm4xiuxian:latest',
   'model': 'glm4xiuxian:latest',
   'modified_at': '2024-08-07T16:16:37.744493536+08:00',
   'size': 4661231198,
   'digest': '348c4463f081b362ef39ef448ff73a1674f9cf55

### 显示模型信息



In [7]:
ollama.show('llama3.1')

{'license': 'LLAMA 3.1 COMMUNITY LICENSE AGREEMENT\nLlama 3.1 Version Release Date: July 23, 2024\n\n“Agreement” means the terms and conditions for use, reproduction, distribution and modification of the\nLlama Materials set forth herein.\n\n“Documentation” means the specifications, manuals and documentation accompanying Llama 3.1\ndistributed by Meta at https://llama.meta.com/doc/overview.\n\n“Licensee” or “you” means you, or your employer or any other person or entity (if you are entering into\nthis Agreement on such person or entity’s behalf), of the age required under applicable laws, rules or\nregulations to provide legal consent and that has legal authority to bind your employer or such other\nperson or entity if you are entering in this Agreement on their behalf.\n\n“Llama 3.1” means the foundational large language models and software and algorithms, including\nmachine-learning model code, trained model weights, inference-enabling code, training-enabling code,\nfine-tuning enabl

### 创建模型



In [8]:
modelfile='''
FROM llama3.1
SYSTEM 你是超级马里奥兄弟中的马里奥。
'''

ollama.create(model='example', modelfile=modelfile)

{'status': 'success'}

### 复制模型



In [None]:
ollama.copy('llama3.1', 'user/llama3.1')

### 删除模型


In [9]:
ollama.delete('example')

{'status': 'success'}

### 拉取模型



In [None]:
ollama.pull('llama3.1')

### 推送模型



In [None]:
ollama.push('user/llama3.1')

### 生成嵌入



In [3]:
ollama.embeddings(model='llama3.1', prompt='天空是蓝色的因为瑞利散射')

{'embedding': [-2.141606569290161,
  0.8904281854629517,
  -0.8698991537094116,
  1.1863431930541992,
  1.266108512878418,
  1.3763099908828735,
  0.13048076629638672,
  0.8475880026817322,
  5.382612228393555,
  -0.8182613849639893,
  2.451780319213867,
  -2.0489768981933594,
  2.439929246902466,
  1.1848701238632202,
  -1.5042893886566162,
  1.523100733757019,
  3.5554730892181396,
  2.3698158264160156,
  1.5025027990341187,
  0.3790349066257477,
  -0.9003847241401672,
  0.3219177722930908,
  -1.655588150024414,
  1.245728850364685,
  -0.5998708605766296,
  -0.21839220821857452,
  0.31109553575515747,
  -0.3510762155056,
  -2.165977716445923,
  -0.48920106887817383,
  -1.583941102027893,
  -1.799527645111084,
  -0.9458537101745605,
  1.1263484954833984,
  0.12802058458328247,
  -0.32982853055000305,
  0.596611499786377,
  -1.6250736713409424,
  -0.36680158972740173,
  -3.769871473312378,
  0.6333229541778564,
  -1.073930263519287,
  -1.5813485383987427,
  1.8329622745513916,
  2.2371

### 进程



In [4]:
ollama.ps()

{'models': [{'name': 'llama3.1:latest',
   'model': 'llama3.1:latest',
   'size': 6654289920,
   'digest': '75382d0899dfaaa6ce331cf680b72bd6812c7f05e5158c5f2f43c6383e21d734',
   'details': {'parent_model': '',
    'format': 'gguf',
    'family': 'llama',
    'families': ['llama'],
    'parameter_size': '8.0B',
    'quantization_level': 'Q4_0'},
   'expires_at': '2024-08-09T17:51:17.3304647+08:00',
   'size_vram': 6654289920}]}

## 自定义客户端

可以使用以下字段创建自定义客户端：

- `host`: 要连接的 Ollama 主机
- `timeout`: 请求超时时间



In [9]:
from ollama import Client
client = Client(host='http://localhost:11434')
response = client.chat(model='llama3.1', messages=[
  {
    'role': 'user',
    'content': '为什么天空是蓝色的？',
  },
])
response

{'model': 'llama3.1',
 'created_at': '2024-08-09T09:50:33.090211856Z',
 'message': {'role': 'assistant', 'content': '因为大气中有很多氦和氮，散射了光。'},
 'done_reason': 'stop',
 'done': True,
 'total_duration': 8818670948,
 'load_duration': 8350474275,
 'prompt_eval_count': 18,
 'prompt_eval_duration': 30688000,
 'eval_count': 18,
 'eval_duration': 395311000}

## 异步客户端



In [2]:
import asyncio
from ollama import AsyncClient
import nest_asyncio

nest_asyncio.apply()

async def chat():
    message = {'role': 'user', 'content': '为什么天空是蓝色的？'}
    response = await AsyncClient().chat(model='llama3.1', messages=[message])
    print(response)

asyncio.run(chat())


{'model': 'llama3.1', 'created_at': '2024-08-09T09:55:42.591365652Z', 'message': {'role': 'assistant', 'content': '答案：因为大气中的分子和气体散射光。\n\n天空为什么是蓝色的，这个问题可能已经有很多年了，但是你知道吗？天空的颜色不是因为天空本身，而是因为我们看到的大气在散射光。所以，实际上，没有天空，它们只是我们的眼睛看到大气和太阳一起产生的景象。\n\n当阳光穿过地球的大气时，它会遇到大量的气体分子，这些气体分子会散射光。这就像你在深海中看到了闪亮的水滴一样。当光从天空中照进你的眼睛时，所有来自大气和太阳的各个色调都会混合在一起，最后变成了蓝色。\n\n因此，我们可以说是，大气中的分子和气体散射光造成了我们看到的蓝色的天空。'}, 'done_reason': 'stop', 'done': True, 'total_duration': 7331322929, 'load_duration': 2913727677, 'prompt_eval_count': 18, 'prompt_eval_duration': 29622000, 'eval_count': 190, 'eval_duration': 4327579000}


设置 `stream=True` 修改函数以返回 Python 异步生成器：



In [3]:
import asyncio
from ollama import AsyncClient
import nest_asyncio

nest_asyncio.apply()
async def chat():
  message = {'role': 'user', 'content': '为什么天空是蓝色的？'}
  async for part in await AsyncClient().chat(model='llama3.1', messages=[message], stream=True):
    print(part['message']['content'], end='', flush=True)

asyncio.run(chat())

答案：这是由于地球大气层中散射光的性质所致。我们知道，阳光中的各种色彩都有其对应的波长，蓝色光线的波长最短。因为蓝色光线能穿过大气层的空气分子，而不被吸收，所以它能够到达我们的眼睛里，因此天空看起来是蓝色的。

## 错误

如果请求返回错误状态或在流式传输时检测到错误，则会引发错误。


In [None]:
model = 'does-not-yet-exist'

try:
  ollama.chat(model)
except ollama.ResponseError as e:
  print('错误:', e.error)
  if e.status_code == 404:
    ollama.pull(model)