In [1]:
import secrets
import string
import json
import requests
from pprint import pprint
import os
from dotenv import load_dotenv

load_dotenv()

# set api url
# api_url = 'https://example.com/generate' # for dev server
api_url = 'http://localhost:8000' # for local testing

LLM_API_SERVER_URL = 'http://localhost:11434'  # Ollama server URL

API_TOKEN = os.getenv('API_TOKEN')

health = requests.get(f'{api_url}/health')

print("API Health Check:", health.status_code, health.text)

API Health Check: 200 {"status":"ok"}


In [13]:
# pull_ollama_model("qwen3:4b")

## Test LLM

In [4]:
# def for test llm
def test_llm(prompt: str, user_id: str, thread_id: str) -> None:
    api_url = "http://localhost:8000"
    endpoint = "/generate"

       
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {API_TOKEN}"  # add token
    }

    payload = {
        "prompt": prompt,
        "user_id": user_id,
        "thread_id": thread_id
    }

    response = requests.post(f'{api_url}{endpoint}', json=payload, headers=headers)
    print("Status code:", response.status_code)
    try:
        data = response.json()
        print("Response:", data.get("generated_text", data))
    except Exception:
        print("Response Text:", response.text)

In [7]:
user_id = "user_123"
thread_id = "thread_123"

test_llm("Какая погода сегодня в Бангладеше", user_id, thread_id)

Status code: 200
Response: </think>

Сегодня в Бангладеше в городе Дхака погода: **смешано-ясно**, температура **27,5°C (81,5°F)**, ветер с запада со скоростью **7,8 м/с**, относительная влажность **84%**, давление **1005,0 мб**, без осадков, UV-индекс **0**. 

Прогноз на сегодня: **patchy rain possible** (возможен дождь). 

Если нужна точная информация о завтрашней погоде, подождите, пока данные станут доступными.


In [8]:
test_llm("А завтра какая погода?", user_id, thread_id)

Status code: 200
Response: С预报 на завтра не доступно для Пекина, но по предварительным данным в ноябре 2025 года Пекин может быть холодным и мокрым с низкими температурами и возможным дождем. Для Москвы также нет конкретных данных о завтрашней погоде. Подождите, пока данные станут доступными.


In [8]:
test_llm("БОльше деталей о погоде завтра и на русском языке", user_id, thread_id)

Status code: 200
('Погода в Пекине сегодня: ясно, температура 27,2°C (81°F), ветер с запада со '
 'скоростью 6,7 м/с, относительная влажность 70%, давление 1003,0 мб, без '
 'осадков, UV-индекс 0.  \n'
 'С预报 на завтра не disponible, но по предварительным данным, в ноябре 2025 '
 'года Пекин может быть холодным и мокрым с низкими температурами и возможным '
 'дождем. Если нужна более точная информация, подождите, пока данные станут '
 'доступными.')
Response: None


In [9]:
test_llm("А в Москве какая погода завтра?", user_id, thread_id)

Status code: 200
('The current weather in Moscow is partly cloudy with a temperature of 20.3°C '
 '(68.5°F). Wind speed is 5.1 mph from the west, and the pressure is 1015.0 mb '
 'with no precipitation. The UV index is 0.1. \n'
 '\n'
 "For tomorrow's forecast, specific details are not available yet. However, "
 'the monthly weather forecast suggests generally mild conditions with '
 "potential for slight changes. Let me know if you'd like updates once more "
 'data becomes available!')
Response: None


## Function to pull models from ollama server

In [None]:
def pull_ollama_model(model_name: str) -> None:
    """
    Pulls a model to the Ollama server.
    
    Args:
        model_name (str): The name of the model to pull.
        
    Returns:
        dict: The response from the Ollama server if model is successfully pulled.
    """
    url = f"{LLM_API_SERVER_URL}/api/pull"
    payload = {
    "name": model_name
    }
    headers = {
        "Content-Type": "application/json"
    }

    response = requests.post(url, json=payload, headers=headers)

    print("Status code:", response.status_code)
    print("Response:", response.text)