1. Ollama python SDK

In [3]:
import subprocess
import json

def ollama_query(model_name, prompt, timeout=60):
    """
    Wysyła zapytanie do modelu Ollama przez CLI
    
    Args:
        model_name (str): Nazwa modelu (np. "llama3.1:8b")
        prompt (str): Tekst zapytania
        timeout (int): Timeout w sekundach
    
    Returns:
        str: Odpowiedź modelu lub komunikat błędu
    """
    try:
        cmd = ["ollama", "run", model_name]
        res = subprocess.run(
            cmd, 
            input=prompt.encode('utf-8'), 
            stdout=subprocess.PIPE, 
            stderr=subprocess.PIPE,
            timeout=timeout
        )
        
        if res.returncode == 0:
            return res.stdout.decode('utf-8').strip()
        else:
            return f"Błąd: {res.stderr.decode('utf-8')}"
            
    except subprocess.TimeoutExpired:
        return f"Timeout: Model nie odpowiedział w ciągu {timeout}s"
    except Exception as e:
        return f"Błąd wykonania: {str(e)}"

# Przykłady użycia
models = [
    "qwen2.5:1.5b",
    "SpeakLeash/bielik-1.5b-v3.0-instruct:Q8_0",
    "llama3.1:8b",
    "SpeakLeash/bielik-11b-v2.3-instruct:Q8_0"
]

prompt = "Wypisz 3 zalety uczenia przez wzmacnianie, każdą zaletę umieść w jednym zdaniu."

# Test na różnych modelach
for model in models:
    print(f"\n{'='*50}")
    print(f"Model: {model}")
    print(f"{'='*50}")
    response = ollama_query(model, prompt)
    print(response)
    print()


Model: qwen2.5:1.5b
1. Zwiększenie efektivności: Uczenie przez wzmacnianie umożliwia automatycznego uczenia się rzeczywistych procesów i prawidłowości, niezaawansej lub często zmieniającej siebie umiejętności.

2. Przede wszystkim szybkość: Wystarczy podać do szkoly informacje (teoretyczne instrukcje) i system uczy się z powrotem, bez potrzeby nadawania kolejnych instrukcji lub kontroli.

3. Zrozumienie sytuacji: System uczy się nie tylko na poziomie instrukcyjnym, ale również na poziomie interpretowania i prawidłowego działania w rzeczywistości, co jest szczególnie przydatne w wielu dziedzinach nauki.


Model: SpeakLeash/bielik-1.5b-v3.0-instruct:Q8_0
A:
1. Uczenie przez wzmacnianie pozwala na szybkie i efektywne uczenie się poprzez nagradzanie pozytywnych zachowań, co prowadzi do szybszego rozwoju umiejętności.
2. Algorytmy uczenia przez wzmacnianie są łatwe w implementacji i mogą być dostosowane do różnych zadań, co czyni je wszechstronnymi narzędziami.
3. Uczenie przez wzmacnianie