# Language models

Tento notebook dokumentuje použití balíčku, který obsahuje více jazykových modelů.

### 1. Úvod

Použitý repozitář **jncraton/languagemodels**: [odkaz](https://github.com/jncraton/languagemodels).

Autor: Jonathan L. Craton, orcid: 0009-0007-6543-8571

Tento repozitář ukazuje použití velkých jazykových modelů na vlastním zařízení s minimálně 512MB.

Tento balíček umožňuje používat velké jazykové modely v softwaru co nejjednodušeji. Všechny inference jsou prováděny lokálně, aby vaše data byla soukromá.

### 1.1. Modely

- Tento balíček umožňuje konrétní výběr modelu, ale jsou preferovány výchozí hodnoty, aby se balíček mohl v průběhu času zlepšovat, jakmile jsou k dispozici lepší modely. 
- Použité modely jsou o 1000x menší než největší modely používané dnes. 
- Tento balíček je užitečný jako ukázka, ale výkon je daleko pod současným stavem umělé inteligence.

- Tento balíček v současné době používá **LaMini-Flan-T5-base** jako výchozí model. Jedná se o doladění základního modelu T5 na vrcholu doladění FLAN. Model je doladěn tak, aby reagoval na instrukce lidským způsobem. Následující lidská hodnocení byla uvedena v dokumentaci k této rodině modelů:

![Srovnani modelů](obrazky\model-comparison.png)

Pro dokončení kódu se používají modely řady **CodeT5+.**


### 2. Příprava

In [None]:
# naistalování požadované knihovny
%pip install languagemodels

# importování požadované knihovny
import languagemodels as lm

## 3. Použití

Tato knihovna má mnoho využití díky použití většího množství různých modelů.

#### 3.1. Doplnění textu - **complete** function

Generování (doplnění) textu pomocí funkce **complete**. Následující kód ukazuje, jak použít funkci `complete` pro generování textu:

In [None]:
# Doplnění českého textu - nefunguje
text = lm.complete("Schovala se ve skříni dokud")
print(text)

In [None]:
# Doplnění anglického textu - funguje
text = lm.complete("She hid in her room until")
print(text)

#### 3.2. Následování příkazů (instrukcí) - **do** function

Následování příkazů (instrukcí) pomocí funkce **do**. Následující kód ukazuje, jak použít funkci `do` pro následování instrukcí:

In [None]:
# Následování instrukcí 1
response = lm.do("Přelož mi: Hola, mundo!")
print(response)

In [None]:
# Následování instrukcí 2
response = lm.do("Přelož mi to do češtiny: Hola, mundo!")
print(response)

#### 3.3. Chatování s modelem - **chat** function

Chat-style inference pomocí funkce **chat**. Následující kód ukazuje, jak použít funkci `chat` pro chatování s modelem:

In [None]:
# Chatování s modelem
response = lm.chat('''
System: Respond as a helpful assistant.
                   
User: What time is it?

Assistant:
''')
print(response)

#### 3.4. Zero-shot klasifikace - **classify** function

Zero-shot classification pomocí funkce **classify**. Následující kód ukazuje, jak použít funkci `classify` pro zero-shot klasifikaci:

In [None]:
# Zero-shot klasifikace
label1 = "positive"
label2 = "negative"
text = "Language models are useful"
predictions = lm.classify(text, label1, label2)
print(predictions)

#### 3.5. Uložení dokumentu a vyhledání kontextu dokumentu - **store_doc** & **get_doc_context** functions

Semantic search pomocí funkcí **store_doc** a **get_doc_context**. Následující kód ukazuje, jak použít funkce `store_doc` a `get_doc_context` pro sémantické vyhledávání:

In [None]:
# Uložení dokumentu
lm.store_doc(lm.get_wiki("Python"), "Python")
lm.store_doc(lm.get_wiki("C language"), "C")
lm.store_doc(lm.get_wiki("Javascript"), "Javascript")

# Vyhledání kontextu dokumentu
context = lm.get_doc_context("When was this language developed?")
print(context)

#### 3.6. Extrahování odpovědi na otázku - **extract_answer** function

Extractive question answering pomocí funkce **extract_answer**. Následující kód ukazuje, jak použít funkci `extract_answer` pro extrakci odpovědi na otázku:

In [None]:
# Extrahování odpovědi na otázku
question = "What color is the ball?"
text = "There is a green ball and a red box"
answer = lm.extract_answer(question, text)
print(answer)

#### 3.7. Doplnění kódu - **code** function

Model doladěný na Python kódu pomocí funkce **code**. Následující kód ukazuje, jak použit funkci `code` pro dokončení kódu:

In [None]:
# Práce s kódem
code = """
a = 2
b = 5

# Swap a and b
"""
answer = lm.code(code)
print(answer)

#### 3.8. External Retrieval

Jsou k dispozici pomocné funkce pro získávání textu z externích zdrojů, které lze použít k rozšíření kontextu.

###### 3.8.1 Získání informací z Wikipedie - **get_wiki** function

Základní webové vyhledávání pomocí funkce **get_wiki** Následující kód ukazuje, jak použít funkci `get_wiki` pro získání informací z Wikipedie:

In [None]:
# Získání informací z Wikipedie
query = "Albert Einstein"
text = lm.get_wiki(query)
print(text)

###### 3.8.2 Získání předpovědi počasí - **get_weather** function

Základní získání předpovědi počasí pomocí funkce **get_weather** Následující kód ukazuje, jak použít funkci `get_weather` pro získání předpovědi počasí (funguje pouze na území USA, zdroj dat je https://api.weather.gov):

In [None]:
# Získání předpovědi počasí
latitude = 41.8
longitude = -87.6
text = lm.get_weather(latitude, longitude)
print(text)

###### 3.8.3 Získání aktuální datumu - **get_date** function

Získaní data pomocí funkce **get_date**. Následující kód ukazuje, jak použít funkci `get_date` pro získání aktuálního datumu (GTM time +-0):

In [None]:
# Získání aktuálního data
date = lm.get_date()
print(date)

## 4. Příklady

Použití funkce **chat** a **get_date** pro vytvoření funkčnějšího řádkového asistenta.

In [None]:
# Nastavení vstupního řetězce
prompt = f"System: Reply as a helpful assistant. Currently {lm.get_date()}."

while True:
    # Uživatel zadá svou zprávu
    user_message = input("\nUser: ")

    # Přidání uživatelovy zprávy k řetězci prompt
    prompt += f"\n\nUser: {user_message}"

    print(prompt)

    # Přidání textu pro odpověď asistenta k řetězci prompt
    prompt += "\n\nAssistant:"

    # Získání odpovědi od modelu
    response = lm.chat(prompt)

    print(f"\nAssistant: {response}")

    prompt += f" {response}"

Další asistent, který využívá uložené informace pro svoje znalosti.

In [None]:
# Definice funkce assist, která přijímá otázku jako vstup a vrací odpověď na základě kontextu dokumentu a otázky.
def assist(question):
    context = lm.get_doc_context(question)  # Získání kontextu dokumentu na základě otázky.
    return lm.do(f"Answer using context: {context} Question: {question}")  # Vrácení odpovědi na základě kontextu a otázky.

# Definice proměnných lat a lon, které jsou použity v rámci funkce assist.
lat, lon = (41.8, -87.6)

# Uložení dokumentů do paměti pro pozdější použití.
lm.store_doc(lm.get_wiki("Python language"), "Python")
lm.store_doc(lm.get_wiki("Planet Saturn"), "Saturn")
lm.store_doc(lm.get_weather(lat, lon), "Weather")
lm.store_doc(lm.get_date(), "Time")

# Definice seznamu otázek, které jsou použity v rámci cyklu for.
questions = [
    "What day of the week is it?",
    "Is it going to rain today?",
    "What time is it?",
    "Who created Python?",
    "How many moon does Saturn have?",
]

# Cyklus for, který volá funkci assist s jednou z otázek jako vstupem a výstup je vypsán na obrazovku.
for question in questions:
    print(f"{question} {assist(question)}")

## 5. Nastavení výkonu modelu

Základní model by měl běžet rychle na jakémkoli systému s 512 MB paměti, ale tato paměťová hranice může být zvýšena pro výběr výkonnějších modelů, které budou spotřebovávat více zdrojů. Zde je příklad:

In [None]:
# Jednoduchá instrukce pro model s defaultním nastavením (512 MB RAM) - rychlé ale špatně
lm.do("Translate to english: Le chat noir dort sur le tapis rouge dans la cuisine.")

In [None]:
# Navýšení paměti na 4 GB RAM - správně
lm.set_max_ram('4gb')

# Provedení instrukce s navýšenou pamětí
lm.do("Translate to english: Le chat noir dort sur le tapis rouge dans la cuisine.")

In [None]:
# Navýšení paměti na 3 GB RAM - rychlé ale furt špatně
lm.set_max_ram('3gb')

# Provedení instrukce se změněnou pamětí
lm.do("Translate to english: Le chat noir dort sur le tapis rouge dans la cuisine.")