# ChatGPT API pro vývojáře
## Úvod do OpenAI GPT-3.5
Vítejte ve workshopu "ChatGPT API pro vývojáře"! Dnes se společně podíváme na fascinující svět umělé inteligence (UI) prostřednictvím API OpenAI GPT-3.5. Nejprve si vysvětlíme, co jsou OpenAI a GPT-3.5, a pak se ponoříme do základního pochopení zpracování přirozeného jazyka (NLP).

### Co je OpenAI?
OpenAI je organizace zaměřená na výzkum a vývoj umělé inteligence. Jejich cílem je zajistit, aby byla umělá obecná inteligence (AGI) - vysoce autonomní systémy, které překonávají lidi ve většině ekonomicky cenných prací - bezpečná a přínosná pro celou lidskou společnost. OpenAI vytváří špičkové modely AI, jako je GPT-3.5, které jsou dostupné vývojářům prostřednictvím jejich API.

### Co je GPT-3.5?
GPT-3.5, nebo Generative Pre-trained Transformer 3.5, je vylepšenou verzí předchozího modelu GPT-3 od OpenAI. Stejně jako jeho předchůdce je schopen generovat text, který je často nerozeznatelný od toho, který by napsal člověk, ale s vylepšenou přesností a schopností zpracování. GPT-3.5 může být využit k řadě úloh, jako je překlad jazyků, odpovídání na otázky, generování kreativního psaní a mnoho dalších.

### Co je zpracování přirozeného jazyka (NLP)?
Zpracování přirozeného jazyka je odvětvím informatiky a umělé inteligence, které se zaměřuje na interakci mezi počítači a lidským (přirozeným) jazykem. NLP umožňuje počítačům číst, rozumět a generovat lidský jazyk ve formě, která je hodnotná. Technologie NLP je základem všech systémů, které pracují s lidským jazykem, jako jsou osobní asistenti (např. Siri a Alexa), chatboti a automatické překladové služby.

V následující části workshopu si nastavíme prostředí, abychom mohli začít pracovat s API OpenAI GPT-3.5.

## Nastavení prostředí
V této části workshopu si připravíme prostředí, abychom mohli začít pracovat s API OpenAI GPT-3.5. Nejdříve si nainstalujeme potřebné knihovny, poté nastavíme přístupové údaje pro API OpenAI a nakonec se seznámíme s Jupyter Notebookem.

### Instalace potřebných knihoven
Pro interakci s API OpenAI budeme potřebovat knihovnu openai. Můžete ji nainstalovat pomocí následujícího příkazu v Jupyter Notebooku:

In [10]:
!pip install openai



### Vytvoření API klíče
Pro autentizaci vašich požadavků na API OpenAI budete potřebovat API klíč. Postupujte takto:

* Přejděte na stránku https://platform.openai.com/account/api-keys.
* Pokud nemáte účet OpenAI, vytvořte si jej.
* Po přihlášení klikněte na tlačítko pro vytvoření nového API klíče.
* Zadejte název pro svůj klíč a klikněte na "Create new secret key".

Nikdy nesdílejte svůj API klíč s nikým jiným, jak je uvedeno na platformě OpenAI​.

### Nastavení přístupových údajů pro API OpenAI
Otevřete novou buňku v Jupyter Notebooku a zadejte následující kód, abyste nastavili svůj API klíč:

In [11]:
import openai

# Nahraďte 'sk-abcdefgh1234567890' vaším API klíčem
# openai.api_key = 'sk-abcdefgh1234567890'

Nyní, když máte připravené prostředí, můžete začít s odesíláním vašich prvních požadavků na ChatGPT prostřednictvím API OpenAI GPT-3.5!

# Co je to Token?

Token je jednotka textu, kterou model zpracovává. V kontextu OpenAI modelů, token může být znakem, slovem nebo složeným slovem, v závislosti na jazyce a specifickém textu.

Kodování tokenů je proces, kdy je text rozdělen do jednotlivých tokenů, které model může zpracovat. OpenAI používá Byte-Pair-Encoding (BPE) algoritmus pro tokenizaci textu.

Pro práci s tokeny OpenAI budete potřebovat knihovnu `tiktoken`.



In [12]:
!pip install tiktoken



Použijte knihovnu `tiktoken` k zakódování textu do tokenů.

In [13]:
import tiktoken

tokenizer = tiktoken.encoding_for_model("gpt-3.5-turbo")
tokens = tokenizer.encode("Text který je třeba tokenizovat: !@#$%^&*()")

print(tokens)

for token in tokens:
  print(tokenizer.decode_single_token_bytes(token))


[1199, 100228, 20195, 4864, 259, 29432, 71853, 4037, 450, 869, 266, 25, 758, 31, 49177, 46999, 5, 9, 368]
b'Text'
b' kter'
b'\xc3\xbd'
b' je'
b' t'
b'\xc5\x99'
b'eba'
b' token'
b'iz'
b'ov'
b'at'
b':'
b' !'
b'@'
b'#$'
b'%^'
b'&'
b'*'
b'()'


#Co stojí dotazy na OpenAI API
Dotazy na OpenAI API nejsou zadarmo, ale nový uživatelé mají počáteční budget, který je dostatečný na prvotní experimentování. Opecně je cena za vstupní/výstupní tokeny.

Model `gpt-3.5-turbo` který budeme dále používat je velmi cenově příznivý. Jeho cena je pro vstupní data `$0.0015/1000` Tokenů a výstupní data `$0.002/1000` Tokenů.

Kompletní ceník je dostupný zde: https://openai.com/pricing

## Váš první požadavek na ChatGPT
V této části uvidíme, jak odeslat základní požadavek na ChatGPT pomocí Pythonu a knihovny openai.

### Odeslání základního požadavku
Nejdříve importujeme knihovnu `openai`, kterou jsme nainstalovali dříve a výsledek zobrazíme.

In [14]:
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Jsi můj asistent."},
        {"role": "user", "content": "Přelož následující text z čestiny do Francouzštiny: 'Ahoj, jak se máš?'"},
    ]
)

In [15]:
# print(response)
print(response['choices'][0]['message']['content'].strip())

Bonjour, comment ça va ?


Nyní byste měli vidět přeložený text ve francouzštině: 'Bonjour, comment ça va?'

### Porozumění odpovědi
* Požadavek na API vrací odpověď ve formátu JSON, který obsahuje několik užitečných informací.
* Klíč `choices` obsahuje pole s odpověďmi. Každá odpověď obsahuje textový řetězec, který je výstupem modelu.
* Používáme metodu strip() k odstranění přebytečných bílých znaků z výstupu.

### Vysvětlení "role"
Role sděluje modelu, jak by měl obsah zpracovat. Zde je popis rolí:
* **user** - informuje model, že následující obsah pochází od uživatele – tj. od osoby, která položila otázku.
* **asistent** - informuje model, že obsah byl vygenerován jako reakce na uživatele.
* **systém** - zpráva specifikovaná vývojářem k "nasměrování" odpovědi modelu. V závislosti na použitém modelu může mít systémová zpráva větší či menší dopad na skutečné odpovědi modelu.

### Práce s kontextem konverzace
Při práci s ChatGPT je důležité rozumět, jak API zachází s kontextem konverzace. Pokud chcete, aby API mělo v kontextu předchozí odpovědi, musíte poslat celou historii konverzace. Tímto způsobem může model vidět celou konverzaci a odpovědět konzistentně s předchozími zprávami.


In [16]:
# Příklad pokračování v konverzaci
conversation_history = [
    {"role": "system", "content": "Jsi můj asistent."},
    {"role": "user", "content": "Přelož následující text z čestiny do Francouzštiny: 'Ahoj, jak se máš?'"},
    {"role": "assistant", "content": "Bonjour, comment ça va ?"},
    {"role": "user", "content": "Přelož to samé do španělštiny"}
]

response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=conversation_history
)

print(response['choices'][0]['message']['content'].strip())

¡Hola, cómo estás?


V tomto příkladu jsme odeslali čtyři zprávy jako součást požadavku na API: jednu zprávu systému, dvě zprávy uživatele a jednu zprávu asistenta. Poslední zpráva uživatele je nová otázka, na kterou chceme, aby asistent odpověděl. Protože jsme poslali celou historii konverzace, asistent může vidět předchozí otázky a odpovědi, a tak lépe odpovědět na novou otázku.

To je vše, co potřebujete k odeslání svého prvního požadavku na ChatGPT a získání odpovědi. Můžete experimentovat s různými texty a pozorovat, jak ChatGPT reaguje.

## Prozkoumejte API hlouběji
V této části se ponoříme hlouběji do možností, které nabízí API OpenAI GPT-3.5. Prozkoumáme některé pokročilejší funkce a ukážeme, jak je lze použít ve vašich projektech.

Pokročilé nastavení požadavku
### Maximální délka odpovědi
Omezte délku odpovědi nastavením parametru max_tokens. To je užitečné pro kontrolu délky výstupního textu.

In [17]:
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Jsi můj asistent."},
        {"role": "user", "content": "Napiš krátkou pohádku na spaní pro mého syna (maximálně 50 slov)."},
    ],
    max_tokens=50
)
print(response['choices'][0]['message']['content'].strip())

Byl jednou malý kluk, který nemohl usnout. Tak přišlo na pomoc kouzelné pavoučí pletivo. Když ho pověsil nad postel, obj


## "Teplota"
Parametr `temperature` ovlivňuje kreativitu odpovědi. Nižší hodnota (např. 0.2) generuje konzistentnější, méně kreativní text, zatímco vyšší hodnota (např. 0.8) generuje více kreativní, ale méně předvídatelný text.

In [18]:
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Jsi můj asistent."},
        {"role": "user", "content": "Napiš krátkou pohádku na spaní pro mého syna (maximálně 50 slov)."},
    ],
    temperature=1
)
print(response['choices'][0]['message']['content'].strip())

Byl jednou malý kluk, který se nemohl v noci dobře uklidnit. Jednoho večera mu maminka přišla s kouzelným příběhem. "Když zavřeš oči, zazní jemné šepotání vlnkami a hvězdy tě zahladí do snů. Usni, ať tě noční můry nepobíhají, zavři oči a dej šanci sladkým snům." Kluk se usmál, zavřel oči a rychle se ponořil do krásného spánku.


### Další parametry
Další parametry můžete prozkoumat v dokumentaci: https://platform.openai.com/docs/api-reference/chat/create

In [19]:
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Jsi můj asistent."},
        {"role": "user", "content": "Napiš krátkou pohádku na spaní pro mého syna (maximálně 50 slov)."},
    ],
    n=2
)
print(response['choices'])

[<OpenAIObject at 0x78c4d14deb10> JSON: {
  "index": 0,
  "message": {
    "role": "assistant",
    "content": "Bylo jednou jeden mal\u00fd zaj\u00ed\u010dek, kter\u00fd m\u011bl probl\u00e9m s us\u00edn\u00e1n\u00edm. Ka\u017edou noc sk\u00e1kal po sv\u00e9m pokoji a nemohl se dostat k sp\u00e1nku. Jednoho ve\u010dera mu maminka \u0159ekla: \"Zkuste si p\u0159edstavit barevn\u00e9 obl\u00e1\u010dky a po\u010d\u00edtat ovce.\" Zaj\u00ed\u010dek to vyzkou\u0161el, n\u011b\u017en\u011b polo\u017eil hlavu na pol\u0161t\u00e1\u0159 a zav\u0159el o\u010di. A najednou usnul. Od t\u00e9 doby ka\u017ed\u00fd ve\u010der us\u00ednal s \u00fasm\u011bvem."
  },
  "finish_reason": "stop"
}, <OpenAIObject at 0x78c4d14de890> JSON: {
  "index": 1,
  "message": {
    "role": "assistant",
    "content": "Byl jednou mal\u00fd chlapec, kter\u00fd se nemohl v noci usm\u00ed\u0159it se svoj\u00ed postel\u00ed. Jednoho ve\u010dera se vydal na dobrodru\u017estv\u00ed a na\u0161el magickou podu\u0161ku. Kdy\u0

## Limitování tokenů v dotazech

Vzhledem k tomu, že při volání OpenAI API se platí za tokeny a modely mívají předem definovaný počet tokenů se kterými dokáží naráz pracovat, tak je vhodné vědět jak je v dotazech na API limitovat.

In [20]:
import tiktoken

def send_chatcompletion(
    system_prompt="Jsi můj asistent",
    user_prompt=None,
    chat_model="gpt-3.5-turbo",
    completions_token_limit=500,
):
    response = openai.ChatCompletion.create(
        model=chat_model,
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt},
        ],
        temperature=1,
        max_tokens=completions_token_limit
    )

    return response

def send(
    system_prompt="Jsi můj asistent",
    user_prompt=None,
    chat_model="gpt-3.5-turbo",
    model_token_limit=4097,
    completions_token_limit=500,
):
    tokenizer = tiktoken.encoding_for_model(chat_model)
    token_integers_system = tokenizer.encode(system_prompt)
    token_integers_user = tokenizer.encode(user_prompt)

    wrapped_content_token_count = 11 # magická hodnota která vyjádří konstatní navýšení za request. Je to odvozeno od množství zpráv a parametrů, které se v každém requestu posílají
    user_token_limit = model_token_limit - len(token_integers_system) - wrapped_content_token_count - completions_token_limit

    user_prompt_trimmed = tokenizer.decode(token_integers_user[0:user_token_limit])

    return send_chatcompletion(
        system_prompt=system_prompt,
        user_prompt=user_prompt_trimmed,
        chat_model=chat_model,
        completions_token_limit=completions_token_limit,
    )

velmi_dlouhy_dotaz = "Velmi dlouhy dotaz" * 800

tokenizer = tiktoken.encoding_for_model("gpt-3.5-turbo")
tokens = tokenizer.encode(velmi_dlouhy_dotaz)
print(len(tokens))

# send_chatcompletion(user_prompt=velmi_dlouhy_dotaz)
send(user_prompt=velmi_dlouhy_dotaz)

5600


<OpenAIObject chat.completion id=chatcmpl-88qc17YAJIdTkruVZKhj9MoQkQh7K at 0x78c4f281c950> JSON: {
  "id": "chatcmpl-88qc17YAJIdTkruVZKhj9MoQkQh7K",
  "object": "chat.completion",
  "created": 1697119557,
  "model": "gpt-3.5-turbo-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Omlouv\u00e1m se, ale v\u00e1\u0161 dotaz je p\u0159\u00edli\u0161 dlouh\u00fd a nejsem schopen na n\u011bj odpov\u011bd\u011bt. Mohli byste ho, pros\u00edm, zkr\u00e1tit nebo sd\u011blit konkr\u00e9tn\u011bj\u0161\u00ed informace?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 3597,
    "completion_tokens": 65,
    "total_tokens": 3662
  }
}

# Ukázkový projekt: Automatická Čtečka RSS
V tomto projektu si vytvoříte automatizovanou čtečku RSS, která vám umožní sledovat témata, která vás zajímají, pomocí personalizovaných filtrů. Tato čtečka bude načítat články z RSS feedu, analyzovat je a doporučovat vám články na základě vašich zájmů.

## Příprava
Nejdříve budete potřebovat knihovnu feedparser pro načítání RSS feedů a tiktoken pro práci s tokeny.


In [21]:
!pip install feedparser tiktoken

Collecting feedparser
  Downloading feedparser-6.0.10-py3-none-any.whl (81 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/81.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m81.1/81.1 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
Collecting sgmllib3k (from feedparser)
  Downloading sgmllib3k-1.0.0.tar.gz (5.8 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: sgmllib3k
  Building wheel for sgmllib3k (setup.py) ... [?25l[?25hdone
  Created wheel for sgmllib3k: filename=sgmllib3k-1.0.0-py3-none-any.whl size=6047 sha256=224196467fd03214292da16a8311283cadc7d02509f48ba0d924e6b245d98882
  Stored in directory: /root/.cache/pip/wheels/f0/69/93/a47e9d621be168e9e33c7ce60524393c0b92ae83cf6c6e89c5
Successfully built sgmllib3k
Installing collected packages: sgmllib3k, feedparser
Successfully installed feedparser-6.0.10 sgmllib3k-1.0.0


## Načtení RSS Feedu
Použijte knihovnu feedparser k načtení RSS feedu z vybraného zdroje.

In [22]:
import feedparser

# Nahraďte 'rss_url' URL vašeho RSS feedu
rss_url = 'https://servis.idnes.cz/rss.aspx?c=technet'
feed = feedparser.parse(rss_url)

print(feed)

{'bozo': False, 'entries': [{'title': 'KVÍZ: Umíte využít počítačové rozhraní na maximum?', 'title_detail': {'type': 'text/plain', 'language': None, 'base': 'https://servis.idnes.cz/rss.aspx?c=technet', 'value': 'KVÍZ: Umíte využít počítačové rozhraní na maximum?'}, 'links': [{'rel': 'alternate', 'type': 'text/html', 'href': 'https://www.idnes.cz/technet/pc-mac/kviz-usb-firewire-thunderbolt-lightning.A231011_130802_hardware_vse#utm_source=rss&utm_medium=feed&utm_campaign=technet&utm_content=main'}], 'link': 'https://www.idnes.cz/technet/pc-mac/kviz-usb-firewire-thunderbolt-lightning.A231011_130802_hardware_vse#utm_source=rss&utm_medium=feed&utm_campaign=technet&utm_content=main', 'summary': 'Není to tak dávno, co skupina zajišťující vývoj USB představila nové značení, a navíc se objevila i oficiálně zveřejněná specifika nové verze konkurenčního rozhraní od Intelu. V našem kvízu se můžete dozvědět, jak dobře se v různých digitálních rozhraních vyznáte.', 'summary_detail': {'type': 'text

## Vytvoření vlastního profilu

Vlastní profil je možné vytvořit v libovolné srozumitelné formě.

In [25]:
profile = """
Obsah: Zajímá mě jedno z následujících témat:
* umělá inteligence
* programování v jednom z jazyků Python, Golang, C# nebo frontendový vývoj v Typescript - React a Angular
* hardwarové technologické novinky
* softwaré novinky, případně novinky v nových verzích existujícího softwaru
""".strip()


# Analýza Článků

In [33]:
import tiktoken
import json

def send(
    system_prompt=None,
    user_prompt=None,
    chat_model="gpt-3.5-turbo",
    model_token_limit=4097,
):
    tokenizer = tiktoken.encoding_for_model(chat_model)
    token_integers_system = tokenizer.encode(system_prompt)
    token_integers_user = tokenizer.encode(user_prompt)

    completions_token_limit = 500
    wrapped_content_token_count = 11 # magická hodnota která vyjádří konstatní navýšení za request. Je to odvozeno od množství zpráv a parametrů, které se v každém requestu posílají
    user_token_limit = model_token_limit - len(token_integers_system) - wrapped_content_token_count - completions_token_limit

    user_prompt_trimmed = tokenizer.decode(token_integers_user[0:user_token_limit])

    response = openai.ChatCompletion.create(
        model=chat_model,
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt_trimmed},
        ],
        temperature=1,
        max_tokens=completions_token_limit
    )

    return response

def is_article_relevant(article_title, article_description, profile):
    prompt = """
Dám ti můj profil a článek a ty vyhodnotíš, zda mě ten článek bude zajímat. Odpovíš v JSON formátu s následující strukturou: `{{ "odpoved": "<ano nebo ne>", "duvod": "<krátké vysvětlení, proč mě to má nebo nemá zajímat>"}}`.
Můj profil:
```
{profile}
```

Titulek článku: `{title}`
""".format(profile=profile, title=article_title, description=article_description)

    response = send(
        system_prompt="Jsi moje automatická čtečka RSS článků, který vyhodnotí zda je pro mě článek zajímavý.",
        user_prompt=prompt,
    )

    result = json.loads(response['choices'][0]['message']['content'].strip().lower())
    print(result)

    if result["odpoved"] == 'ano':
      return True

    return False

# Projděte každý článek ve feedu
for entry in feed.entries[0:10]:
    article_title = entry.title
    article_description = entry.description
    if is_article_relevant(article_title, article_description, profile):
        print(f"DOPORUČENÝ ČLÁNEK: {entry.link}")
    else:
        print(f"nedoporučený článek: {article_title}")

{'odpoved': 'ne', 'duvod': 'tento článek se neodkazuje na žádné z tvých zájmů. hovoří o využití počítačového rozhraní, což je hlavně ovládnutí uživatelského rozhraní a nezabývá se žádným konkrétním tématem, které tě zajímá.'}
nedoporučený článke: KVÍZ: Umíte využít počítačové rozhraní na maximum?
{'odpoved': 'ne', 'duvod': 'článek se týká historické události a nemá souvislost s umělou inteligencí, programováním, hardwarovými nebo softwarovými novinkami, které tě zajímají.'}
nedoporučený článke: První vzdušná vítězství izraelského letectva vybojovala československá stíhačka
{'odpoved': 'ne', 'duvod': 'článek se zabývá tématem leteckého závodu, které není v souladu s tvými zájmy v programování a technologickém pokroku.'}
nedoporučený článke: Nejstarší letecký závod světa má vítěze. Vyhráli francouzští vzduchoplavci
{'odpoved': 'ne', 'duvod': 'článek se zabývá výzkumem kosmických vzorků z planetky bennu, což se nijak nesouvisej s tvými zájmy o umělou inteligenci, programování nebo technol