# Test CNN dla NLP - analiza sekwencji s≈Ç√≥w

Ten notebook testuje CNN 1D na analizie prostych sekwencji "s≈Ç√≥w" (token√≥w), podobnie jak w Flux do zada≈Ñ NLP. U≈ºywamy bardzo ma≈Çych danych, kt√≥re mo≈ºna policzyƒá rƒôcznie.

## Importowanie modu≈Ç√≥w i bibliotek

In [1]:
include("../MyReverseDiff.jl")
include("../MyEmbedding.jl")
include("../MyMlp.jl")

using .MyReverseDiff
using .MyEmbedding
using .MyMlp
using Printf
using LinearAlgebra
using Random

# Ustaw seed dla reprodukowalno≈õci
Random.seed!(42)

println("Modu≈Çy za≈Çadowane pomy≈õlnie!")

Modu≈Çy za≈Çadowane pomy≈õlnie!


## 1. Przygotowanie danych tekstowych

Utworzymy mini-s≈Çownik i 2 proste "zdania" z r√≥≈ºnymi wzorami sekwencyjnymi.

In [2]:
# Mini s≈Çownik (bardzo ma≈Çy dla prostoty)
vocab = ["good", "bad", "movie", "very", "<PAD>"]
vocab_size = length(vocab)
embedding_dim = 3  # Ma≈Çe embedding dla ≈Çatwych oblicze≈Ñ
sequence_length = 4  # D≈Çugo≈õƒá sekwencji

println("S≈Çownik:")
for (i, word) in enumerate(vocab)
    println("$i: $word")
end

println("\nParametry:")
println("- Rozmiar s≈Çownika: $vocab_size")
println("- Wymiar embedding: $embedding_dim")
println("- D≈Çugo≈õƒá sekwencji: $sequence_length")

S≈Çownik:
1: good
2: bad
3: movie
4: very
5: <PAD>

Parametry:
- Rozmiar s≈Çownika: 5
- Wymiar embedding: 3
- D≈Çugo≈õƒá sekwencji: 4


In [3]:
# Sekwencje tekstowe jako indeksy
# Sekwencja 1: "very good movie <PAD>" ‚Üí [5, 2, 4, 1] ‚Üí pozytywna (klasa 1)
# Sekwencja 2: "very bad movie <PAD>" ‚Üí [5, 3, 4, 1] ‚Üí negatywna (klasa 0)

sequence_1 = Float32[4, 1, 3, 5]  # very good movie <PAD>
sequence_2 = Float32[4, 2, 3, 5]  # very bad movie <PAD>

# Konwertuj na format batch (sequence_length, batch_size)
X_batch = zeros(Float32, sequence_length, 2)
X_batch[:, 1] = sequence_1
X_batch[:, 2] = sequence_2

# Etykiety: sekwencja 1 ‚Üí pozytywna (1), sekwencja 2 ‚Üí negatywna (0)
y_batch = Float32[1.0 0.0]  # (1, 2) 

println("Sekwencja 1 (pozytywna): ", [vocab[Int(i)] for i in sequence_1])
println("Indeksy: ", sequence_1)
println("\nSekwencja 2 (negatywna): ", [vocab[Int(i)] for i in sequence_2])
println("Indeksy: ", sequence_2)
println("\nShape danych X: ", size(X_batch))
println("Etykiety y: ", y_batch)
println("Shape etykiet: ", size(y_batch))

Sekwencja 1 (pozytywna): ["very", "good", "movie", "<PAD>"]
Indeksy: Float32[4.0, 1.0, 3.0, 5.0]

Sekwencja 2 (negatywna): ["very", "bad", "movie", "<PAD>"]
Indeksy: Float32[4.0, 2.0, 3.0, 5.0]

Shape danych X: (4, 2)
Etykiety y: Float32[1.0 0.0]
Shape etykiet: (1, 2)


## 2. Definicja modelu CNN dla NLP

Architektura podobna do Flux:
- **Embedding**: s≈Çowa ‚Üí wektory
- **Conv1D**: wykrywa n-gramy (wzory w sekwencjach)
- **MaxPool**: wybiera najwa≈ºniejsze cechy
- **Flatten**: sp≈Çaszczenie
- **Dense**: klasyfikacja

In [4]:
# Parametry modelu
vocab_size = 5
embedding_dim = 3
conv_filters = 2        # Liczba filtr√≥w CNN
kernel_size = 2         # Rozmiar kernela (analizuje 2 kolejne s≈Çowa)
hidden_size = 4         # Rozmiar warstwy ukrytej
output_size = 1         # Klasyfikacja binarna
batch_size = 2

println("Parametry modelu NLP:")
println("- Embedding: $vocab_size s≈Ç√≥w ‚Üí $embedding_dim wymiar√≥w")
println("- CNN: $conv_filters filtr√≥w, kernel size $kernel_size (analizuje $kernel_size s≈Çowa naraz)")
println("- Warstwa ukryta: $hidden_size neuron√≥w")
println("- Wyj≈õcie: $output_size neuron (sentiment pozytywny/negatywny)")
println("- Batch size: $batch_size")

Parametry modelu NLP:
- Embedding: 5 s≈Ç√≥w ‚Üí 3 wymiar√≥w
- CNN: 2 filtr√≥w, kernel size 2 (analizuje 2 s≈Çowa naraz)
- Warstwa ukryta: 4 neuron√≥w
- Wyj≈õcie: 1 neuron (sentiment pozytywny/negatywny)
- Batch size: 2


In [5]:
# Model: Embedding ‚Üí Conv1D ‚Üí Pool ‚Üí Flatten ‚Üí Dense ‚Üí Dense
model = Chain(
    Embedding(vocab_size, embedding_dim; name="embedding"),
    ConvolutionBlock(conv_filters, kernel_size; name="conv1d"),
    PoolingBlock(3; name="maxpool"),  # Max pooling
    FlattenBlock(name="flatten"),
    Dense(8, hidden_size, relu; name="hidden"),
    Dense(hidden_size, output_size, œÉ; name="output")
)

println("Model CNN dla NLP utworzony pomy≈õlnie!")
println("Liczba warstw: ", length(model.layers))

println("\nArchitektura:")
println("1. Embedding: s≈Çowa ‚Üí wektory $embedding_dim-wymiarowe")
println("2. Conv1D: wykrywa wzory w $kernel_size kolejnych s≈Çowach")
println("3. MaxPool: wybiera najwa≈ºniejsze cechy")
println("4. Flatten: sp≈Çaszczenie do wektora")
println("5. Dense: ukryta warstwa z ReLU")
println("6. Dense: klasyfikacja z sigmoid")

Model CNN dla NLP utworzony pomy≈õlnie!
Liczba warstw: 6

Architektura:
1. Embedding: s≈Çowa ‚Üí wektory 3-wymiarowe
2. Conv1D: wykrywa wzory w 2 kolejnych s≈Çowach
3. MaxPool: wybiera najwa≈ºniejsze cechy
4. Flatten: sp≈Çaszczenie do wektora
5. Dense: ukryta warstwa z ReLU
6. Dense: klasyfikacja z sigmoid


## 3. Rƒôczne ustawienie wag dla prostoty oblicze≈Ñ

Ustawimy proste warto≈õci, kt√≥re pozwolƒÖ na ≈Çatwe obliczenia rƒôczne.

In [6]:
# Embedding weights - ka≈ºde s≈Çowo ma sw√≥j unikalny wektor
embedding_weights = Float32[
    1.0  -1.0   0.5  0.0 0.0;   # wymiar 1: <PAD>, good, bad, movie, very
    0.5   0.5   0.0  1.0 0.0;   # wymiar 2
    1.0  -1.0   1.0  0.0 0.0    # wymiar 3
]
model.layers[1].W.output = embedding_weights

println("Embedding weights (3√ó5 - wymiary √ó s≈Çowa):")
display(embedding_weights)
println("\nInterpretacja embedding√≥w:")
for (i, word) in enumerate(vocab)
    vec = embedding_weights[:, i]
    println("$word: $vec")
end

3√ó5 Matrix{Float32}:
 1.0  -1.0  0.5  0.0  0.0
 0.5   0.5  0.0  1.0  0.0
 1.0  -1.0  1.0  0.0  0.0

Embedding weights (3√ó5 - wymiary √ó s≈Çowa):

Interpretacja embedding√≥w:
good: Float32[1.0, 0.5, 1.0]
bad: Float32[-1.0, 0.5, -1.0]
movie: Float32[0.5, 0.0, 1.0]
very: Float32[0.0, 1.0, 0.0]
<PAD>: Float32[0.0, 0.0, 0.0]


In [7]:
# Filtry konwolucyjne - wykrywajƒÖ r√≥≈ºne wzory 2-gram√≥w
conv_weights = Float32[
    1.0   0.0;    # Filtr 1: wykrywa pozytywne przej≈õcia
    -1.0  1.0     # Filtr 2: wykrywa negatywne wzory
]
model.layers[2].masks.output = conv_weights

println("Filtry konwolucyjne (kernel_size√ónum_filters = 2√ó2):")
display(conv_weights)
println("\nFiltr 1: [1.0, -1.0] - wykrywa pozytywne trendy")
println("Filtr 2: [0.0, 1.0] - wykrywa drugie s≈Çowo w parze")

2√ó2 Matrix{Float32}:
  1.0  0.0
 -1.0  1.0

Filtry konwolucyjne (kernel_size√ónum_filters = 2√ó2):

Filtr 1: [1.0, -1.0] - wykrywa pozytywne trendy
Filtr 2: [0.0, 1.0] - wykrywa drugie s≈Çowo w parze


In [8]:
# Wagi Dense layers
model.layers[5].W.output = Float32[  # hidden layer weights (4√ó8)
    1.0   0.5  -0.5  1.0   0.5  -0.5  -0.5  1.0 ;
    0.5   1.0   1.0  0.5   1.0   1.0  1.0  0.5;
    -0.5  0.0   1.0  -0.5  0.0   1.0  1.0  -0.5;
    1.0  -1.0   0.5  1.0  -1.0   0.5  0.5  1.0
]

bias_vector = Float32[0.0; 0.0; 0.0; 0.0]
bias_matrix = reshape(bias_vector, 4, 1)
model.layers[5].b.output = bias_matrix

bias_vector = Float32[0.5 -0.5 1.0 -1.0]
bias_matrix = reshape(bias_vector, 1, 4)
model.layers[6].W.output = bias_matrix

bias_vector = Float32[0.0]
bias_matrix = reshape(bias_vector, 1, 1)
model.layers[6].b.output = bias_matrix

println("Wagi warstwy ukrytej (4√ó3):")
display(model.layers[5].W.output)
println("\nWagi warstwy wyj≈õciowej (1√ó4):")
display(model.layers[6].W.output)

4√ó8 Matrix{Float32}:
  1.0   0.5  -0.5   1.0   0.5  -0.5  -0.5   1.0
  0.5   1.0   1.0   0.5   1.0   1.0   1.0   0.5
 -0.5   0.0   1.0  -0.5   0.0   1.0   1.0  -0.5
  1.0  -1.0   0.5   1.0  -1.0   0.5   0.5   1.0

1√ó4 Matrix{Float32}:
 0.5  -0.5  1.0  -1.0

Wagi warstwy ukrytej (4√ó3):

Wagi warstwy wyj≈õciowej (1√ó4):


## 4. Budowanie grafu obliczeniowego

In [9]:
# Utworzenie wƒôz≈Ç√≥w wej≈õciowych
x_input_node = Constant(zeros(Float32, sequence_length, batch_size))
y_label_node = Constant(zeros(Float32, output_size, batch_size))

# Ustaw dane wej≈õciowe
x_input_node.output = X_batch
y_label_node.output = y_batch

println("Dane wej≈õciowe ustawione:")
println("Shape sekwencji X: ", size(x_input_node.output))
println("Shape etykiet y: ", size(y_label_node.output))
println("\nSekwencje jako indeksy:")
display(x_input_node.output)
println("\nEtykiety:")
display(y_label_node.output)

4√ó2 Matrix{Float32}:
 4.0  4.0
 1.0  2.0
 3.0  3.0
 5.0  5.0

1√ó2 Matrix{Float32}:
 1.0  0.0

Dane wej≈õciowe ustawione:
Shape sekwencji X: (4, 2)
Shape etykiet y: (1, 2)

Sekwencje jako indeksy:

Etykiety:


In [10]:
# Zbuduj graf obliczeniowy
loss_node, model_output_node, order = build_graph!(model, binarycrossentropy, x_input_node, y_label_node; loss_name="loss")

println("Graf obliczeniowy zbudowany pomy≈õlnie!")
println("Liczba wƒôz≈Ç√≥w w grafie: ", length(order))
println("Typ wƒôz≈Ça loss: ", typeof(loss_node))
println("Typ wƒôz≈Ça output: ", typeof(model_output_node))

Graf obliczeniowy zbudowany pomy≈õlnie!
Liczba wƒôz≈Ç√≥w w grafie: 20
Typ wƒôz≈Ça loss: ScalarOperator{typeof(Main.MyReverseDiff.binary_cross_entropy_loss_impl)}
Typ wƒôz≈Ça output: BroadcastedOperator{typeof(œÉ)}


## 5. Forward Pass - analiza krok po kroku

Przeanalizujemy jak model przetwarza sekwencje s≈Ç√≥w.

In [11]:
println("=== DANE WEJ≈öCIOWE - SEKWENCJE S≈Å√ìW ===")
println("\nSekwencja 1 (pozytywna):")
seq1_words = [vocab[Int(i)] for i in X_batch[:, 1]]
seq1_indices = X_batch[:, 1]
println("S≈Çowa: ", seq1_words)
println("Indeksy: ", seq1_indices)

println("\nSekwencja 2 (negatywna):")
seq2_words = [vocab[Int(i)] for i in X_batch[:, 2]]
seq2_indices = X_batch[:, 2]
println("S≈Çowa: ", seq2_words)
println("Indeksy: ", seq2_indices)

println("\nZadanie: Klasyfikuj sentiment (pozytywny=1, negatywny=0)")

=== DANE WEJ≈öCIOWE - SEKWENCJE S≈Å√ìW ===

Sekwencja 1 (pozytywna):
S≈Çowa: ["very", "good", "movie", "<PAD>"]
Indeksy: Float32[4.0, 1.0, 3.0, 5.0]

Sekwencja 2 (negatywna):
S≈Çowa: ["very", "bad", "movie", "<PAD>"]
Indeksy: Float32[4.0, 2.0, 3.0, 5.0]

Zadanie: Klasyfikuj sentiment (pozytywny=1, negatywny=0)


In [12]:
# Wykonaj forward pass
println("=== FORWARD PASS ===")
println("Wykonujƒô forward pass...")
forward_result = forward!(order)
println("Forward pass zako≈Ñczony pomy≈õlnie!")
println("\nWarto≈õƒá loss: ", loss_node.output)

=== FORWARD PASS ===
Wykonujƒô forward pass...
Forward pass zako≈Ñczony pomy≈õlnie!

Warto≈õƒá loss: 0.7750082


In [13]:
println("=== WYNIKI KLASYFIKACJI SENTIMENTU ===")
println("\nPredykcje modelu: ", model_output_node.output)
println("Prawdziwe etykiety: ", y_label_node.output)
println("Binary Cross Entropy Loss: ", loss_node.output)

# Interpretacja wynik√≥w
predictions = model_output_node.output
labels = y_label_node.output

println("\n=== INTERPRETACJA WYNIK√ìW ===")
for i in 1:batch_size
    words = [vocab[Int(j)] for j in X_batch[:, i]]
    pred_prob = round(predictions[1, i], digits=4)
    pred_class = pred_prob > 0.5 ? "POZYTYWNY" : "NEGATYWNY"
    true_class = Int(labels[1, i]) == 1 ? "POZYTYWNY" : "NEGATYWNY"
    correct = (pred_prob > 0.5) == (labels[1, i] == 1.0) ? "‚úì" : "‚úó"
    
    println("\nSekwencja $i: $(join(words, " "))")
    println("  Predykcja: $pred_prob ‚Üí $pred_class")
    println("  Prawda: $true_class $correct")
end

=== WYNIKI KLASYFIKACJI SENTIMENTU ===

Predykcje modelu: Float32[0.37754068 0.4378235]
Prawdziwe etykiety: Float32[1.0 0.0]
Binary Cross Entropy Loss: 0.7750082

=== INTERPRETACJA WYNIK√ìW ===

Sekwencja 1: very good movie <PAD>
  Predykcja: 0.3775 ‚Üí NEGATYWNY
  Prawda: POZYTYWNY ‚úó

Sekwencja 2: very bad movie <PAD>
  Predykcja: 0.4378 ‚Üí NEGATYWNY
  Prawda: NEGATYWNY ‚úì


## 6. Weryfikacja rƒôczna - obliczenia embedding i konwolucji

Policzymy rƒôcznie pierwsze kroki, ≈ºeby zrozumieƒá jak CNN analizuje tekst.

In [14]:
println("=== WERYFIKACJA RƒòCZNA - EMBEDDING ===")
println("\nEmbedding weights:")
display(embedding_weights)

println("\n1. EMBEDDING SEKWENCJI 1: 'very good movie <PAD>'")
println("Indeksy: [5, 2, 4, 1]")

println("\nSlowo 'very' (indeks 5):")
very_embedding = embedding_weights[:, 5]
println("Embedding: ", very_embedding)

println("\nSlowo 'good' (indeks 2):")
good_embedding = embedding_weights[:, 2]
println("Embedding: ", good_embedding)

println("\nSlowo 'movie' (indeks 4):")
movie_embedding = embedding_weights[:, 4]
println("Embedding: ", movie_embedding)

println("\nSlowo '<PAD>' (indeks 1):")
pad_embedding = embedding_weights[:, 1]
println("Embedding: ", pad_embedding)

println("\nEmbedded sekwencja 1 (3√ó4 - embedding_dim √ó sequence_length):")
embedded_seq1 = hcat(very_embedding, good_embedding, movie_embedding, pad_embedding)
display(embedded_seq1)

3√ó5 Matrix{Float32}:
 1.0  -1.0  0.5  0.0  0.0
 0.5   0.5  0.0  1.0  0.0
 1.0  -1.0  1.0  0.0  0.0

3√ó4 Matrix{Float32}:
 0.0  -1.0  0.0  1.0
 0.0   0.5  1.0  0.5
 0.0  -1.0  0.0  1.0

=== WERYFIKACJA RƒòCZNA - EMBEDDING ===

Embedding weights:

1. EMBEDDING SEKWENCJI 1: 'very good movie <PAD>'
Indeksy: [5, 2, 4, 1]

Slowo 'very' (indeks 5):
Embedding: Float32[0.0, 0.0, 0.0]

Slowo 'good' (indeks 2):
Embedding: Float32[-1.0, 0.5, -1.0]

Slowo 'movie' (indeks 4):
Embedding: Float32[0.0, 1.0, 0.0]

Slowo '<PAD>' (indeks 1):
Embedding: Float32[1.0, 0.5, 1.0]

Embedded sekwencja 1 (3√ó4 - embedding_dim √ó sequence_length):


In [15]:
println("\n2. KONWOLUCJA 1D - WYKRYWANIE N-GRAM√ìW")
println("\nFiltry konwolucyjne (kernel size 2):")
display(conv_weights)
println("Filtr 1: [1.0, -1.0] - wykrywa wzory pozytywne")
println("Filtr 2: [0.0, 1.0] - skupia siƒô na drugim s≈Çowie w parze")

println("\nKonwolucja analizuje pary s≈Ç√≥w:")
println("- Para 1: 'very' + 'good'")
println("- Para 2: 'good' + 'movie'")
println("- Para 3: 'movie' + '<PAD>'")

println("\nPrzyk≈Çad obliczenia dla pary 'very' + 'good':")
println("Very embedding: ", very_embedding)
println("Good embedding: ", good_embedding)
println("\nFiltr 1 [1.0, -1.0] na wymiarze 1:")
println("1.0 √ó 0.0 + (-1.0) √ó 1.0 = -1.0")
println("\nFiltr 2 [0.0, 1.0] na wymiarze 1:")
println("0.0 √ó 0.0 + 1.0 √ó 1.0 = 1.0")

println("\nTo pokazuje jak CNN wykrywa r√≥≈ºnice miƒôdzy 'very good' a 'very bad'!")

2√ó2 Matrix{Float32}:
  1.0  0.0
 -1.0  1.0


2. KONWOLUCJA 1D - WYKRYWANIE N-GRAM√ìW

Filtry konwolucyjne (kernel size 2):
Filtr 1: [1.0, -1.0] - wykrywa wzory pozytywne
Filtr 2: [0.0, 1.0] - skupia siƒô na drugim s≈Çowie w parze

Konwolucja analizuje pary s≈Ç√≥w:
- Para 1: 'very' + 'good'
- Para 2: 'good' + 'movie'
- Para 3: 'movie' + '<PAD>'

Przyk≈Çad obliczenia dla pary 'very' + 'good':
Very embedding: Float32[0.0, 0.0, 0.0]
Good embedding: Float32[-1.0, 0.5, -1.0]

Filtr 1 [1.0, -1.0] na wymiarze 1:
1.0 √ó 0.0 + (-1.0) √ó 1.0 = -1.0

Filtr 2 [0.0, 1.0] na wymiarze 1:
0.0 √ó 0.0 + 1.0 √ó 1.0 = 1.0

To pokazuje jak CNN wykrywa r√≥≈ºnice miƒôdzy 'very good' a 'very bad'!


## 7. Test Backward Pass - uczenie siƒô wzor√≥w

In [16]:
println("=== BACKWARD PASS - UCZENIE SIƒò ===")
println("Wykonujƒô backward pass...")

# Wykonaj backward pass
backward!(order)
println("Backward pass zako≈Ñczony!")

println("\n=== OBLICZONE GRADIENTY ===")

println("\n1. Gradienty embedding√≥w (kt√≥re s≈Çowa potrzebujƒÖ poprawy):")
embedding_grads = model.layers[1].W.gradient
display(embedding_grads)

println("\n2. Gradienty filtr√≥w konwolucyjnych (kt√≥re wzory poprawiƒá):")
conv_grads = model.layers[2].masks.gradient
display(conv_grads)

println("\n3. Gradienty warstwy klasyfikacyjnej:")
output_grads = model.layers[6].W.gradient
display(output_grads)

=== BACKWARD PASS - UCZENIE SIƒò ===
Wykonujƒô backward pass...
Backward pass zako≈Ñczony!

=== OBLICZONE GRADIENTY ===

1. Gradienty embedding√≥w (kt√≥re s≈Çowa potrzebujƒÖ poprawy):

2. Gradienty filtr√≥w konwolucyjnych (kt√≥re wzory poprawiƒá):

3. Gradienty warstwy klasyfikacyjnej:


3√ó5 Matrix{Float32}:
 0.0         0.0        -0.28815     0.0       0.0
 0.389037   -0.0547279   0.342878    0.334309  0.0
 0.0778074   0.0547279   0.0778074  -0.389037  0.0

2√ó2 Matrix{Float32}:
 0.711806   0.15133
 0.0547279  0.548936

1√ó4 Matrix{Float32}:
 0.0632969  -0.507748  -0.340251  -0.155615

In [17]:
a = [0.38903707 -0.054727938; -0.23342223 -0.054727938; 0.07780741 0.05472794; 0.38903707 -0.054727938; -0.23342223 -0.054727938; 0.07780741 0.05472794; 0.07780741 0.05472794; 0.38903707 -0.054727938]
reshape(a,(1,8,2)...)

1√ó8√ó2 Array{Float64, 3}:
[:, :, 1] =
 0.389037  -0.233422  0.0778074  0.389037  ‚Ä¶  0.0778074  0.0778074  0.389037

[:, :, 2] =
 -0.0547279  -0.0547279  0.0547279  ‚Ä¶  0.0547279  0.0547279  -0.0547279

## 8. Podsumowanie i por√≥wnanie z Flux

Analiza jak nasza implementacja por√≥wnuje siƒô z profesjonalnymi bibliotekami NLP.

In [18]:
println("=== PODSUMOWANIE TESTU CNN DLA NLP ===")

println("\n‚úì Zadanie: Klasyfikacja sentimentu tekstu")
println("‚úì Dane: 2 sekwencje po 4 s≈Çowa")
println("‚úì Model: Embedding ‚Üí Conv1D ‚Üí Pool ‚Üí Dense")
println("‚úì Forward pass: wykonany")
println("‚úì Backward pass: wykonany")
println("‚úì Loss: ", round(loss_node.output, digits=6))

println("\nüìä Wyniki klasyfikacji sentimentu:")
for i in 1:batch_size
    words = [vocab[Int(j)] for j in X_batch[:, i]]
    pred = round(model_output_node.output[1, i], digits=4)
    sentiment = pred > 0.5 ? "POZYTYWNY" : "NEGATYWNY"
    true_label = Int(y_label_node.output[1, i]) == 1 ? "POZYTYWNY" : "NEGATYWNY"
    println("  '$(join(words, " "))': $pred ‚Üí $sentiment (cel: $true_label)")
end

println("\nüîç Podobie≈Ñstwa z Flux CNN:")
println("  ‚úì Embedding layer - s≈Çowa na wektory")
println("  ‚úì Conv1D - wykrywanie n-gram√≥w")
println("  ‚úì MaxPooling - selekcja najwa≈ºniejszych cech")
println("  ‚úì Dense - klasyfikacja finalna")

println("\nüéØ Zastosowania:")
println("  - Analiza sentimentu (pozytywny/negatywny)")
println("  - Klasyfikacja tematyczna tekst√≥w")
println("  - Wykrywanie spamu")
println("  - Analiza emocji w social media")

println("\nüí° Kluczowe koncepty:")
println("  - N-gramy: CNN wykrywa wzory w parach/tr√≥jkach s≈Ç√≥w")
println("  - Embeddingi: przekszta≈ÇcajƒÖ s≈Çowa w wektory liczb")
println("  - Pooling: wybiera najwa≈ºniejsze cechy z ca≈Çego tekstu")
println("  - End-to-end learning: ca≈Çy model uczy siƒô razem")

=== PODSUMOWANIE TESTU CNN DLA NLP ===

‚úì Zadanie: Klasyfikacja sentimentu tekstu
‚úì Dane: 2 sekwencje po 4 s≈Çowa
‚úì Model: Embedding ‚Üí Conv1D ‚Üí Pool ‚Üí Dense
‚úì Forward pass: wykonany
‚úì Backward pass: wykonany
‚úì Loss: 0.775008

üìä Wyniki klasyfikacji sentimentu:
  'very good movie <PAD>': 0.3775 ‚Üí NEGATYWNY (cel: POZYTYWNY)
  'very bad movie <PAD>': 0.4378 ‚Üí NEGATYWNY (cel: NEGATYWNY)

üîç Podobie≈Ñstwa z Flux CNN:
  ‚úì Embedding layer - s≈Çowa na wektory
  ‚úì Conv1D - wykrywanie n-gram√≥w
  ‚úì MaxPooling - selekcja najwa≈ºniejszych cech
  ‚úì Dense - klasyfikacja finalna

üéØ Zastosowania:
  - Analiza sentimentu (pozytywny/negatywny)
  - Klasyfikacja tematyczna tekst√≥w
  - Wykrywanie spamu
  - Analiza emocji w social media

üí° Kluczowe koncepty:
  - N-gramy: CNN wykrywa wzory w parach/tr√≥jkach s≈Ç√≥w
  - Embeddingi: przekszta≈ÇcajƒÖ s≈Çowa w wektory liczb
  - Pooling: wybiera najwa≈ºniejsze cechy z ca≈Çego tekstu
  - End-to-end learning: ca≈Çy model uczy