In [None]:
'''
✅ LSTM (Long Short-Term Memory) - O que é?
Evolução das RNNs clássicas;
Criada para resolver o problema de vanishing gradients (quando a rede esquece informações antigas);
Consegue lembrar de contextos longos, ideal para textos longos ou dependências de palavras distantes.

📌 Como funciona internamente?
Dentro de cada célula LSTM, temos:
Forget Gate: Decide o que esquecer da memória;
Input Gate: Decide o que guardar da entrada atual;
Cell State: Transporta informações ao longo da sequência;
Output Gate: Decide o que emitir para a próxima célula.
Essa estrutura permite controlar o fluxo da informação, melhorando o aprendizado de dependências longas.

✅ GRU (Gated Recurrent Unit) - O que é?
Uma versão mais simples e rápida da LSTM;
Possui menos portas (apenas duas: Reset Gate e Update Gate);
Tem desempenho semelhante à LSTM em muitos casos, mas treina mais rápido por ter menos parâmetros.
'''

In [2]:
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.utils import pad_sequences

# Seu dataset
texts = ["Eu amo esse filme", "Esse filme é péssimo", "Que filme maravilhoso", "Horrível, não gostei"]
labels = [1, 0, 1, 0]

# Tokeniza o texto
tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
word_index = tokenizer.word_index
vocab_size = len(word_index) + 1

In [3]:
#  Exemplo prático - Classificador de Sentimento usando LSTM e GRU (Keras)

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, GRU, Dense

# Exemplo básico da estrutura LSTM
lstm_model = Sequential()
lstm_model.add(Embedding(input_dim=vocab_size, output_dim=300, input_length=10))
lstm_model.add(LSTM(units=128))  # Camada LSTM
lstm_model.add(Dense(1, activation='sigmoid'))

lstm_model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
lstm_model.summary()




In [4]:
# Exemplo básico da estrutura GRU
gru_model = Sequential()
gru_model.add(Embedding(input_dim=vocab_size, output_dim=300, input_length=10))
gru_model.add(GRU(units=128))  # Camada GRU
gru_model.add(Dense(1, activation='sigmoid'))

gru_model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
gru_model.summary()


In [5]:
# ✅ Como plugar FastText em uma rede neural (Keras)

import requests

x = requests.get('https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.pt.300.vec.gz')
open('cc.pt.300.vec.gz', 'wb').write(x.content)

1271093660

In [7]:
!pip install gensim tensorflow keras numpy numba

Collecting gensim
  Downloading gensim-4.3.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (8.1 kB)
Collecting numpy
  Downloading numpy-1.26.4-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (61 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.0/61.0 kB[0m [31m2.8 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting scipy<1.14.0,>=1.7.0 (from gensim)
  Downloading scipy-1.13.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (60 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m60.6/60.6 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
Downloading gensim-4.3.3-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (26.7 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m26.7/26.7 MB[0m [31m59.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading numpy-1.26.4-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (18.3 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In [1]:
!pip install --upgrade numpy gensim numba tensorflow

Collecting numpy
  Using cached numpy-2.2.4-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (62 kB)


In [2]:
from gensim.models import KeyedVectors

# Carrega o modelo FastText pré-treinado (em .vec ou .bin)
fasttext_model = KeyedVectors.load_word2vec_format('cc.pt.300.vec.gz', binary=False)


In [5]:
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.utils import pad_sequences

# Seu dataset
texts = ["Eu amo esse filme", "Esse filme é péssimo", "Que filme maravilhoso", "Horrível, não gostei"]
labels = [1, 0, 1, 0]

tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
word_index = tokenizer.word_index
vocab_size = len(word_index) + 1

embedding_dim = 300
embedding_matrix = np.zeros((vocab_size, embedding_dim))

for word, i in word_index.items():
  if word in fasttext_model:
    embedding_matrix[i] = fasttext_model[word]
  else:
    embedding_matrix = np.random.normal(scale=0.6, size=(embedding_dim,))   # Caso não encontre

In [14]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, GRU, Dense

# Padroniza o input
sequences = tokenizer.texts_to_sequences(texts)
X = pad_sequences(sequences, maxlen=10)

# Monta a rede neural com a Embedding pré-treinada
model = Sequential()
model.add(Embedding(input_dim=vocab_size,
                    output_dim=embedding_dim,
                    weights=[embedding_matrix],  # Pluga o FastText aqui
                    input_length=10,
                    trainable=False))  # Pode deixar False para não "estragar" o FastText
model.add(LSTM(128, return_sequences=True))
model.add(LSTM(64))  # Camada LSTM
# model.add(GRU(units=128))  # Camada GRU
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Treina o modelo
model.fit(X, np.array(labels), epochs=10, verbose=1)


Epoch 1/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 5s/step - accuracy: 0.2500 - loss: 0.6936
Epoch 2/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 65ms/step - accuracy: 0.7500 - loss: 0.6818
Epoch 3/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 63ms/step - accuracy: 0.7500 - loss: 0.6697
Epoch 4/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 65ms/step - accuracy: 0.7500 - loss: 0.6564
Epoch 5/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 65ms/step - accuracy: 1.0000 - loss: 0.6411
Epoch 6/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 67ms/step - accuracy: 1.0000 - loss: 0.6233
Epoch 7/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 66ms/step - accuracy: 0.7500 - loss: 0.6028
Epoch 8/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 65ms/step - accuracy: 0.7500 - loss: 0.5795
Epoch 9/10
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m

<keras.src.callbacks.history.History at 0x7bb33f43b6d0>

In [8]:
# Teste com frase nova
new_text = ["O filme é maravilhoso"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# GRU

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 268ms/step
[[0.3352439]]


In [9]:
# Teste com frase nova
new_text = ["O filme é ruim"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# GRU

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 50ms/step
[[0.3129459]]


In [10]:
# Teste com frase nova
new_text = ["O filme é legal"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# GRU

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step
[[0.3129459]]


In [12]:
# Teste com frase nova
new_text = ["O filme é legal"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# LSTM

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 226ms/step
[[0.34470332]]


In [13]:
# Teste com frase nova
new_text = ["O filme é ruim"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# LSTM

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 48ms/step
[[0.34470332]]


In [15]:
# Teste com frase nova
new_text = ["O filme é ruim"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# LSTM return_sequences

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 380ms/step
[[0.40288222]]


In [16]:
# Teste com frase nova
new_text = ["O filme é legal"]
new_seq = tokenizer.texts_to_sequences(new_text)
new_seq = pad_sequences(new_seq, maxlen=10)

# Predição de sentimento
pred = model.predict(new_seq)
print(pred)  # Resultado: valor próximo de 1 (positivo)
# LSTM return_sequences

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 43ms/step
[[0.40288222]]
