<a href="https://colab.research.google.com/github/gantrior/AI4TalentsWorkshop/blob/main/ChatGPT_API.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ChatGPT API pro vývojáře
## Úvod do OpenAI GPT-3.5
Vítejte ve workshopu "ChatGPT API pro vývojáře"! Dnes se společně podíváme na fascinující svět umělé inteligence (UI) prostřednictvím API OpenAI GPT-3.5. Nejprve si vysvětlíme, co jsou OpenAI a GPT-3.5, a pak se ponoříme do základního pochopení zpracování přirozeného jazyka (NLP).

### Co je OpenAI?
OpenAI je organizace zaměřená na výzkum a vývoj umělé inteligence. Jejich cílem je zajistit, aby byla umělá obecná inteligence (AGI) - vysoce autonomní systémy, které překonávají lidi ve většině ekonomicky cenných prací - bezpečná a přínosná pro celou lidskou společnost. OpenAI vytváří špičkové modely AI, jako je GPT-3.5, které jsou dostupné vývojářům prostřednictvím jejich API.

### Co je GPT-3.5?
GPT-3.5, nebo Generative Pre-trained Transformer 3.5, je vylepšenou verzí předchozího modelu GPT-3 od OpenAI. Stejně jako jeho předchůdce je schopen generovat text, který je často nerozeznatelný od toho, který by napsal člověk, ale s vylepšenou přesností a schopností zpracování. GPT-3.5 může být využit k řadě úloh, jako je překlad jazyků, odpovídání na otázky, generování kreativního psaní a mnoho dalších.

### Co je zpracování přirozeného jazyka (NLP)?
Zpracování přirozeného jazyka je odvětvím informatiky a umělé inteligence, které se zaměřuje na interakci mezi počítači a lidským (přirozeným) jazykem. NLP umožňuje počítačům číst, rozumět a generovat lidský jazyk ve formě, která je hodnotná. Technologie NLP je základem všech systémů, které pracují s lidským jazykem, jako jsou osobní asistenti (např. Siri a Alexa), chatboti a automatické překladové služby.

V následující části workshopu si nastavíme prostředí, abychom mohli začít pracovat s API OpenAI GPT-3.5.

## Nastavení prostředí
V této části workshopu si připravíme prostředí, abychom mohli začít pracovat s API OpenAI GPT-3.5. Nejdříve si nainstalujeme potřebné knihovny, poté nastavíme přístupové údaje pro API OpenAI a nakonec se seznámíme s Jupyter Notebookem.

### Instalace potřebných knihoven
Pro interakci s API OpenAI budeme potřebovat knihovnu openai. Můžete ji nainstalovat pomocí následujícího příkazu v Jupyter Notebooku:

In [None]:
!pip install openai

### Vytvoření API klíče
Pro autentizaci vašich požadavků na API OpenAI budete potřebovat API klíč. Postupujte takto:

* Přejděte na stránku https://platform.openai.com/account/api-keys.
* Pokud nemáte účet OpenAI, vytvořte si jej.
* Po přihlášení klikněte na tlačítko pro vytvoření nového API klíče.
* Zadejte název pro svůj klíč a klikněte na "Create new secret key".

Nikdy nesdílejte svůj API klíč s nikým jiným, jak je uvedeno na platformě OpenAI​.

### Nastavení přístupových údajů pro API OpenAI
Otevřete novou buňku v Jupyter Notebooku a zadejte následující kód, abyste nastavili svůj API klíč:

In [None]:
import openai

# Nahraďte 'sk-abcdefgh1234567890' vaším API klíčem
# openai.api_key = 'sk-abcdefgh1234567890'

Nyní, když máte připravené prostředí, můžete začít s odesíláním vašich prvních požadavků na ChatGPT prostřednictvím API OpenAI GPT-3.5!

# Co je to Token?

Token je jednotka textu, kterou model zpracovává. V kontextu OpenAI modelů, token může být znakem, slovem nebo složeným slovem, v závislosti na jazyce a specifickém textu.

Kodování tokenů je proces, kdy je text rozdělen do jednotlivých tokenů, které model může zpracovat. OpenAI používá Byte-Pair-Encoding (BPE) algoritmus pro tokenizaci textu.

Pro práci s tokeny OpenAI budete potřebovat knihovnu `tiktoken`.



In [None]:
!pip install tiktoken

Použijte knihovnu `tiktoken` k zakódování textu do tokenů.

In [None]:
import tiktoken

# Použijte knihovnu tiktoken k zakódování textu do tokenů.

#Co stojí dotazy na OpenAI API
Dotazy na OpenAI API nejsou zadarmo, ale nový uživatelé mají počáteční budget, který je dostatečný na prvotní experimentování. Opecně je cena za vstupní/výstupní tokeny.

Model `gpt-3.5-turbo` který budeme dále používat je velmi cenově příznivý. Jeho cena je pro vstupní data `$0.0015/1000` Tokenů a výstupní data `$0.002/1000` Tokenů.

Kompletní ceník je dostupný zde: https://openai.com/pricing

## Váš první požadavek na ChatGPT
V této části uvidíme, jak odeslat základní požadavek na ChatGPT pomocí Pythonu a knihovny openai.

### Odeslání základního požadavku
Nejdříve importujeme knihovnu `openai`, kterou jsme nainstalovali dříve a výsledek zobrazíme.

In [None]:
# Odesláni jednoduchého požadavku s použitím "gpt-3.5-turbo" modelu


Nyní byste měli vidět přeložený text ve francouzštině: 'Bonjour, comment ça va?'

### Porozumění odpovědi
* Požadavek na API vrací odpověď ve formátu JSON, který obsahuje několik užitečných informací.
* Klíč `choices` obsahuje pole s odpověďmi. Každá odpověď obsahuje textový řetězec, který je výstupem modelu.
* Používáme metodu strip() k odstranění přebytečných bílých znaků z výstupu.

### Vysvětlení "role"
Role sděluje modelu, jak by měl obsah zpracovat. Zde je popis rolí:
* **user** - informuje model, že následující obsah pochází od uživatele – tj. od osoby, která položila otázku.
* **asistent** - informuje model, že obsah byl vygenerován jako reakce na uživatele.
* **systém** - zpráva specifikovaná vývojářem k "nasměrování" odpovědi modelu. V závislosti na použitém modelu může mít systémová zpráva větší či menší dopad na skutečné odpovědi modelu.

### Práce s kontextem konverzace
Při práci s ChatGPT je důležité rozumět, jak API zachází s kontextem konverzace. Pokud chcete, aby API mělo v kontextu předchozí odpovědi, musíte poslat celou historii konverzace. Tímto způsobem může model vidět celou konverzaci a odpovědět konzistentně s předchozími zprávami.


In [None]:
# Pošlete požadavek s historií konverzace

V tomto příkladu jsme odeslali čtyři zprávy jako součást požadavku na API: jednu zprávu systému, dvě zprávy uživatele a jednu zprávu asistenta. Poslední zpráva uživatele je nová otázka, na kterou chceme, aby asistent odpověděl. Protože jsme poslali celou historii konverzace, asistent může vidět předchozí otázky a odpovědi, a tak lépe odpovědět na novou otázku.

To je vše, co potřebujete k odeslání svého prvního požadavku na ChatGPT a získání odpovědi. Můžete experimentovat s různými texty a pozorovat, jak ChatGPT reaguje.

## Prozkoumejte API hlouběji
V této části se ponoříme hlouběji do možností, které nabízí API OpenAI GPT-3.5. Prozkoumáme některé pokročilejší funkce a ukážeme, jak je lze použít ve vašich projektech.

Pokročilé nastavení požadavku
### Maximální délka odpovědi
Omezte délku odpovědi nastavením parametru max_tokens. To je užitečné pro kontrolu délky výstupního textu.

In [None]:
# nastavte v požadavku maximální délku odpovědi

## "Teplota"
Parametr `temperature` ovlivňuje kreativitu odpovědi. Nižší hodnota (např. 0.2) generuje konzistentnější, méně kreativní text, zatímco vyšší hodnota (např. 0.8) generuje více kreativní, ale méně předvídatelný text.

In [None]:
# nastavte `temperature` parameter v požadavku

### Další parametry
Další parametry můžete prozkoumat v dokumentaci: https://platform.openai.com/docs/api-reference/chat/create

In [None]:
# můžete vyzkoušet další jiné parametry

## Limitování tokenů v dotazech

Vzhledem k tomu, že při volání OpenAI API se platí za tokeny a modely mívají předem definovaný počet tokenů se kterými dokáží naráz pracovat, tak je vhodné vědět jak je v dotazech na API limitovat.

In [None]:
# Vyzkoušejte si limitování tokenů

# Ukázkový projekt: Automatická Čtečka RSS
V tomto projektu si vytvoříte automatizovanou čtečku RSS, která vám umožní sledovat témata, která vás zajímají, pomocí personalizovaných filtrů. Tato čtečka bude načítat články z RSS feedu, analyzovat je a doporučovat vám články na základě vašich zájmů.

## Příprava
Nejdříve budete potřebovat knihovnu feedparser pro načítání RSS feedů a tiktoken pro práci s tokeny.


In [None]:
!pip install feedparser tiktoken

## Načtení RSS Feedu
Použijte knihovnu feedparser k načtení RSS feedu z vybraného zdroje.

In [None]:
import feedparser

# Nahraďte 'rss_url' URL vašeho RSS feedu
rss_url = 'https://servis.idnes.cz/rss.aspx?c=technet'
feed = feedparser.parse(rss_url)

print(feed)

## Vytvoření vlastního profilu

Vlastní profil je možné vytvořit v libovolné srozumitelné formě.

In [None]:
# Vytvořte vlastní profil
profile = """
Obsah: Zajímá mě jedno z následujících témat:
* umělá inteligence
* programování v jednom z jazyků Python, Golang, C# nebo frontendový vývoj v Typescript - React a Angular
* hardwarové technologické novinky
* softwaré novinky, případně novinky v nových verzích existujícího softwaru
""".strip()


# Analýza Článků

In [None]:
import tiktoken
import json

def send(
    system_prompt=None,
    user_prompt=None,
    chat_model="gpt-3.5-turbo",
    model_token_limit=4097,
):
    tokenizer = tiktoken.encoding_for_model(chat_model)
    token_integers_system = tokenizer.encode(system_prompt)
    token_integers_user = tokenizer.encode(user_prompt)

    completions_token_limit = 500
    wrapped_content_token_count = 11 # magická hodnota která vyjádří konstatní navýšení za request. Je to odvozeno od množství zpráv a parametrů, které se v každém requestu posílají
    user_token_limit = model_token_limit - len(token_integers_system) - wrapped_content_token_count - completions_token_limit

    user_prompt_trimmed = tokenizer.decode(token_integers_user[0:user_token_limit])

    response = openai.ChatCompletion.create(
        model=chat_model,
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt_trimmed},
        ],
        temperature=1,
        max_tokens=completions_token_limit
    )

    return response

def is_article_relevant(article_title, article_description, profile):
    # TODO Vyplňte

# Projděte 10 článků z feedu
for entry in feed.entries[0:10]:
    article_title = entry.title
    article_description = entry.description
    if is_article_relevant(article_title, article_description, profile):
        print(f"DOPORUČENÝ ČLÁNEK: {entry.link}")
    else:
        print(f"nedoporučený článek: {article_title}")