<a href="https://colab.research.google.com/github/NbtKmy/gc_workshops/blob/main/ChatGPT_API.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ChatGPT API

Seit März 2023 bietet OpenAI die API für ChatGPT (siehe [den Link](https://openai.com/blog/introducing-chatgpt-and-whisper-apis)) an. Hier probieren wir die API-Schnittstelle von ChatGPT aus.
(Es gab Update im Juni 2023. Seitdem sind unterschiedliche Modelle angeboten. Siehe ["Models overview"-Seite](https://platform.openai.com/docs/models/overview))


Für die Nutzung der API muss man einen Account bei OpenAI erstellen und den **kostenpflichtigen** Plan nehmen. Preise der Nutzung ist [hier](https://openai.com/pricing) dokumentiert.

Demnach:

| Model	| Usage input | Usage output |
|---------------|---------------------|---------------------|
| gpt-3.5-turbo	|  \$0.0015/1K tokens  |  \$0.002 / 1K tokens |
| gpt-3.5-turbo-16k | \$0.003 / 1K tokens | \$0.004 / 1K tokens |
| gpt-4 (8k tokens) | \$0.03 / 1K tokens | \$0.06 / 1K tokens |
| gpt-4-32k | \$0.06 / 1K tokens | \$0.12 / 1K tokens |

__Stand: 26.09.2023. Aktuelle Preise bitte immer auf der [offiziellen Seite](https://openai.com/pricing) überprüfen__

Der Preis für gpt-3.5-turbo ist nicht so hoch, aber man muss Kreditkarteninformation hinterlegen.
Wenn man einen Account bei OpenAI ganz neu gemacht hat, erhält man ausserdem Guthaben für 18 US-Doller, die 3 Monaten nach der Erstellung des Accounts abläuft.

## Token?
Zur Zählung der Tokens wird in der Dokumentation folgendermassen erklärt:
> Language models read text in chunks called tokens. In English, a token can be as short as one character or as long as one word (e.g., a or apple), and in some languages tokens can be even shorter than one character or even longer than one word.
> [...]
> Both input and output tokens count toward these quantities. For example, if your API call used 10 tokens in the message input and you received 20 tokens in the message output, you would be billed for 30 tokens.

(Stand: 6. März 2023. Aus: https://platform.openai.com/docs/guides/chat/managing-tokens)

## Nutzung der eingegebenen Daten?

Laut der Dokumentation werden die durch API eingegebenen Daten/Texte nicht automatisch für die Verbesserung/Training des KI-Modells verwendet.

(Stand: 6. März 2023. Siehe: https://platform.openai.com/docs/data-usage-policies)


## Unterschiedliche LLMs testen
AI Playground
https://play.vercel.ai/

## Wie siehen die Tokens aus?

Bevor man mit der API beginnt, betrachten wir zuerst, wie die Tokens bei ChatGPT aussiehen.
Im folgenden Abschnitt kann man beliebige Texte eingeben, um die Zahlung der Tokens zu erfahren.
Dadurch können wir vielleicht Gefühl bekommen, wie viel Texte/Sätze wie viel Tokens entsprechen...

OpenAI bietet dafür Python-Library, tiktoken, an. Mit Hilfe von tiktoken kann man die Tokenzahlen bei ChatGPT erörtern.

In [None]:
!pip install -U -q tiktoken

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.7 MB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.2/1.7 MB[0m [31m6.8 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m1.7/1.7 MB[0m [31m22.9 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m14.4 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
import tiktoken

encoding = tiktoken.encoding_for_model('gpt-3.5-turbo')
text_to_tokens = ''#@param{type:'string'}

tokens = encoding.encode(text_to_tokens)
print('Zahl der Tokens: ' + str(len(tokens)))
print(tokens)


for token in tokens:
    bytes_token = encoding.decode_single_token_bytes(token)
    string_token = bytes_token.decode('utf-8', 'ignore')
    print(str(bytes_token) + ' = ' + string_token)





## ChatGPT API verwenden

In [None]:
!pip install -q openai

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m73.6/73.6 kB[0m [31m6.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m12.0 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m114.5/114.5 kB[0m [31m15.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m268.8/268.8 kB[0m [31m34.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m149.6/149.6 kB[0m [31m18.5 MB/s[0m eta [36m0:00:00[0m
[?25h

Hier braucht man den eigenen API-Key. **Der API-Key muss vor fremden Leuten geschützt sein!!**

In [None]:
import openai


my_api_key = ''#@param{type:'string'}
openai.api_key = my_api_key




Einstellung des ChatBot: https://platform.openai.com/docs/guides/chat/introduction

Die Beschreibung für das Parameter "temperature" ist hier zu finden: https://platform.openai.com/docs/api-reference/chat/create#chat/create-temperature

temperature kann einen Wert zwischen 0 und 2 nehmen. Der tiefe Wert bedeutet, dass die Antwort der KI akurrat wird. Der hohe Wert von temperature führt zur freien/kreativen Antwort.

Um das Gespräch zu beenden, tippe "Gespräch beenden" in Prompt

In [None]:
messages = []
system_msg = 'Du bist ein freundlicher KI-ChatBot.\
    Dein Name ist Robita.'
messages.append({'role': 'system', 'content': system_msg})
print('Sag etwas zu Robita')
while True:
    message = input ('🙋 Human: ')

    messages.append ({'role': 'user', 'content': message})
    response = openai.ChatCompletion.create(
        model='gpt-3.5-turbo',
        messages=messages,
        temperature=0.8,
    )
    reply = response['choices'][0]['message']['content']
    messages.append({'role': 'assistant', 'content': reply})
    print('---\n🤖 Robita: ' + reply + '\n---')

    if message == 'Gespräch beenden':
        break




In [None]:
!pip install -q gTTS

In [None]:
from gtts import gTTS
from IPython.display import Audio
from IPython.display import display
from io import BytesIO
from tempfile import TemporaryFile



tts = gTTS('hallo, mein name ist totoro. Heute ist sonnig. Was kann ich für dich tun?', lang='de')
f = TemporaryFile()
tts.write_to_fp(f)
f.seek(0)
aud = Audio(f.read(), autoplay=True)
display(aud)
f.close()

In [None]:
from gtts import gTTS
from IPython.display import Audio
from IPython.display import display
from io import BytesIO
from tempfile import TemporaryFile

import openai


def speech(txt):

    tts = gTTS(txt, lang='de')
    f = TemporaryFile()
    tts.write_to_fp(f)
    f.seek(0)
    aud = Audio(f.read(), autoplay=True)
    display(aud)
    f.close()


my_api_key = ''#@param{type:'string'}
openai.api_key = my_api_key

messages = []
system_msg = 'Du bist ein freundlicher KI-ChatBot.\
    Dein Name ist Robita.'
messages.append({'role': 'system', 'content': system_msg})
first_message = 'Sag etwas zu Robita'
print(first_message)
speech(first_message)

while True:
    message = input ('🙋 Human: ')

    messages.append ({'role': 'user', 'content': message})
    response = openai.ChatCompletion.create(
        model='gpt-3.5-turbo',
        messages=messages,
        temperature=0.8,
    )
    reply = response['choices'][0]['message']['content']
    messages.append({'role': 'assistant', 'content': reply})
    print('---\n🤖 Robita: ' + reply + '\n---')
    speech(reply)
    if message == 'Gespräch beenden':
        break



## Gespräch mit ChatGPT

OpenAI bietet "Whisper API", API für Speech-to-Text, an. Mit dieser API probieren wir ein "Gespräch" mit ChatGPT.

In [None]:
!pip install -q gTTS openai gradio numpy scipy

In [None]:
import openai

my_api_key = ''#@param{type:'string'}
openai.api_key = my_api_key

In [None]:
from gtts import gTTS
from IPython.display import Audio
from IPython.display import display
from io import BytesIO
from tempfile import TemporaryFile
import time

import openai
import gradio as gr

import numpy as np
from scipy.io.wavfile import write



def speech(txt):

    tts = gTTS(txt, lang='de')
    f = TemporaryFile()
    tts.write_to_fp(f)
    f.seek(0)
    aud = Audio(f.read(), autoplay=True)
    display(aud)
    f.close()

def speech_to_text(audio):

    # Gradio.Audio gibt die Aufnahme durch Microphon als numpy.Array
    # Für whisper muss diese numpy.Array-Daten in ein passendes Format umgewandelt werden
    rate, audio_data = audio
    scaled = np.int16(audio_data / np.max(np.abs(audio_data)) * 32767)
    write('test.wav', rate, scaled)
    audio_file = open('test.wav', 'rb')
    transcript = openai.Audio.transcribe('whisper-1', audio_file)

    return transcript.text


def audio_chat(audio, messages_stats):


    speech_text = speech_to_text(audio)
    message = '🙋 Human: ' + speech_text

    messages_stats.append ({'role': 'user', 'content': speech_text})
    response = openai.ChatCompletion.create(
        model='gpt-3.5-turbo',
        messages=messages_stats,
        temperature=0.8,
    )
    reply = response['choices'][0]['message']['content']

    speech(reply)
    messages_stats.append({'role': 'assistant', 'content': reply})
    message += '\n🤖 Robita: ' + reply + '\n---'


    return message, messages_stats

if __name__ == "__main__":

    messages = []
    system_msg = 'Du bist ein freundlicher KI-ChatBot. Dein Name ist Robita.'
    messages.append({'role': 'system', 'content': system_msg})
    messages_stats = gr.State(value=messages)
    first_message = 'Sag etwas zu Robita'
    speech(first_message)


    gr.Interface(
        title = 'Chatten mit ChatGPT',
        fn=audio_chat,

        inputs=[
            gr.Audio(source='microphone'),
            messages_stats
        ],
        outputs=[
            'textbox',
            messages_stats
        ],
        live=True
    ).launch()

## Referenz

Dokumentation für Chat Completions (ChatGPT)
https://platform.openai.com/docs/guides/chat/chat-completions-beta

