# Zadanie 3 – Rozpoznawanie intencji użytkownika
Celem jest zbudowanie prostego modelu NLP, który będzie klasyfikował wypowiedzi użytkowników według ich intencji.

In [None]:
import pandas as pd
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from sklearn.model_selection import train_test_split
import numpy as np

## Dane wejściowe

In [None]:
data = {
    'text': [
        'Chciałbym zamówić pizzę',
        'Pokaż mi pogodę w Warszawie',
        'Potrzebuję pomocy z logowaniem',
        'Czy mogę zmienić termin wizyty?',
        'Jakie są godziny otwarcia?',
        'Zamów mi kawę na wynos',
        'Nie mogę się zalogować do systemu',
        'Jaka jest temperatura w Krakowie?',
        'Proszę o nową fakturę',
        'Chcę zamówić sushi'
    ],
    'intent': [
        'zamówienie_jedzenia',
        'sprawdzenie_pogody',
        'wsparcie_logowanie',
        'zmiana_terminu',
        'informacja_godziny',
        'zamówienie_jedzenia',
        'wsparcie_logowanie',
        'sprawdzenie_pogody',
        'fakturowanie',
        'zamówienie_jedzenia'
    ]
}
df = pd.DataFrame(data)

## Tokenizacja i kodowanie etykiet

In [None]:
tokenizer = Tokenizer(num_words=1000, oov_token='<OOV>')
tokenizer.fit_on_texts(df['text'])
sequences = tokenizer.texts_to_sequences(df['text'])
padded = pad_sequences(sequences, maxlen=10, padding='post')

label2id = {label: idx for idx, label in enumerate(df['intent'].unique())}
id2label = {idx: label for label, idx in label2id.items()}
labels = df['intent'].map(label2id).values

## Budowa i trening modelu

In [None]:
X_train, X_test, y_train, y_test = train_test_split(padded, labels, test_size=0.2, random_state=42)

model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=1000, output_dim=16, input_length=10),
    tf.keras.layers.GlobalAveragePooling1D(),
    tf.keras.layers.Dense(16, activation='relu'),
    tf.keras.layers.Dense(len(label2id), activation='softmax')
])

model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=30, validation_data=(X_test, y_test))

## Predykcja nowych wypowiedzi

In [None]:
test_sentences = [
    'Zamów makaron na wieczór',
    'Proszę o zmianę godziny wizyty',
    'Jaka pogoda będzie jutro?',
    'Nie mogę odzyskać hasła',
    'Chciałbym zamówić lody'
]
seq = tokenizer.texts_to_sequences(test_sentences)
pad = pad_sequences(seq, maxlen=10, padding='post')
preds = model.predict(pad)

for i, p in enumerate(preds):
    print(f'{test_sentences[i]} -> {id2label[np.argmax(p)]}')