# WineMood ‚Äì Classificador de Sentimentos para Avalia√ß√µes de Vinhos

Este notebook implementa um sistema de classifica√ß√£o de sentimentos para avalia√ß√µes de vinhos usando t√©cnicas de Processamento de Linguagem Natural (NLP) e Deep Learning.

## Objetivos
- Analisar avalia√ß√µes textuais de vinhos
- Classificar o sentimento como positivo, neutro ou negativo
- Criar um modelo de Deep Learning para entender o contexto das avalia√ß√µes
- Desenvolver uma interface web para teste em tempo real

## 1. Configura√ß√£o do Ambiente

Primeiro, vamos instalar e importar as bibliotecas necess√°rias.

In [None]:
# Instalar bibliotecas necess√°rias
!pip install kaggle nltk tensorflow pandas numpy matplotlib streamlit

In [None]:
# Importar bibliotecas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import re
import os
import pickle

# Bibliotecas para NLP
import nltk
from nltk.corpus import stopwords

# Bibliotecas para Deep Learning
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense, Dropout
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint

# Configurar visualiza√ß√£o
plt.style.use('ggplot')
sns.set(style='whitegrid')

# Verificar se GPU est√° dispon√≠vel
print("GPU dispon√≠vel:", tf.config.list_physical_devices('GPU'))

## 2. Download e Carregamento do Dataset

Vamos baixar o dataset de avalia√ß√µes de vinhos do Kaggle.

In [None]:
# Configurar a API do Kaggle
# Nota: Voc√™ precisa fazer upload do arquivo kaggle.json para o Colab
from google.colab import files
uploaded = files.upload()

# Criar diret√≥rio para as credenciais do Kaggle
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json

In [None]:
# Baixar o dataset
!kaggle datasets download -d zynicide/wine-reviews
!unzip wine-reviews.zip

In [None]:
# Carregar o dataset
df = pd.read_csv('winemag-data-130k-v2.csv')

# Exibir as primeiras linhas
df.head()

## 3. Explora√ß√£o e Pr√©-processamento de Dados

Vamos explorar o dataset e preparar os dados para o treinamento.

In [None]:
# Verificar informa√ß√µes do dataset
print("Formato do dataset:", df.shape)
print("\nInforma√ß√µes do dataset:")
df.info()

# Verificar valores nulos
print("\nValores nulos por coluna:")
print(df.isnull().sum())

In [None]:
# Verificar estat√≠sticas descritivas
print("Estat√≠sticas descritivas da pontua√ß√£o:")
df['points'].describe()

In [None]:
# Visualizar a distribui√ß√£o de pontua√ß√µes
plt.figure(figsize=(12, 6))
sns.histplot(df['points'], bins=20, kde=True)
plt.title('Distribui√ß√£o de Pontua√ß√µes de Vinhos')
plt.xlabel('Pontua√ß√£o')
plt.ylabel('Frequ√™ncia')
plt.grid(True)
plt.show()

In [None]:
# Filtrar apenas as colunas necess√°rias e remover valores nulos
df_filtered = df[['description', 'points']].dropna()
print(f"Formato ap√≥s filtragem: {df_filtered.shape}")

In [None]:
# Criar r√≥tulos de sentimento baseados na pontua√ß√£o
def create_sentiment_label(points):
    if points >= 90:
        return 2  # Positivo
    elif points >= 80:
        return 1  # Neutro
    else:
        return 0  # Negativo

df_filtered['sentiment'] = df_filtered['points'].apply(create_sentiment_label)

# Verificar a distribui√ß√£o de sentimentos
sentiment_counts = df_filtered['sentiment'].value_counts()
print("Distribui√ß√£o de sentimentos:")
print(sentiment_counts)

# Visualizar a distribui√ß√£o
plt.figure(figsize=(10, 6))
sns.countplot(x='sentiment', data=df_filtered, palette=['red', 'gray', 'green'])
plt.title('Distribui√ß√£o de Sentimentos')
plt.xlabel('Sentimento (0: Negativo, 1: Neutro, 2: Positivo)')
plt.ylabel('Contagem')
plt.grid(True)
plt.show()

### Pr√©-processamento de Texto

Vamos limpar e preparar o texto para o modelo.

In [None]:
# Baixar stopwords
nltk.download('stopwords')
stop_words = set(stopwords.words('english'))

In [None]:
# Fun√ß√£o para pr√©-processar o texto
def preprocess_text(text):
    # Converter para min√∫sculas
    text = text.lower()
    
    # Remover pontua√ß√£o e caracteres especiais
    text = re.sub(r'[^\w\s]', '', text)
    
    # Remover stopwords
    words = text.split()
    filtered_words = [word for word in words if word not in stop_words]
    
    return ' '.join(filtered_words)

# Aplicar pr√©-processamento
df_filtered['processed_text'] = df_filtered['description'].apply(preprocess_text)

# Exibir exemplos de texto original e processado
examples = df_filtered[['description', 'processed_text', 'sentiment']].sample(5)
examples

## 4. Prepara√ß√£o dos Dados para o Modelo

Vamos tokenizar e padronizar os textos para alimentar o modelo de Deep Learning.

In [None]:
# Definir par√¢metros
MAX_NUM_WORDS = 10000  # Tamanho do vocabul√°rio
MAX_SEQUENCE_LENGTH = 100  # Comprimento m√°ximo da sequ√™ncia
EMBEDDING_DIM = 100  # Dimens√£o do embedding

# Criar tokenizer
tokenizer = Tokenizer(num_words=MAX_NUM_WORDS)
tokenizer.fit_on_texts(df_filtered['processed_text'])

# Converter textos para sequ√™ncias
sequences = tokenizer.texts_to_sequences(df_filtered['processed_text'])

# Padronizar sequ√™ncias
padded_sequences = pad_sequences(sequences, maxlen=MAX_SEQUENCE_LENGTH, padding='post')

# Verificar formato dos dados
print(f"Formato das sequ√™ncias padronizadas: {padded_sequences.shape}")

In [None]:
# Preparar r√≥tulos para classifica√ß√£o multiclasse
labels = tf.keras.utils.to_categorical(df_filtered['sentiment'], num_classes=3)
print(f"Formato dos r√≥tulos: {labels.shape}")

In [None]:
# Dividir em conjuntos de treino e teste (80/20)
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(
    padded_sequences, labels, test_size=0.2, random_state=42, stratify=labels
)

print(f"Conjunto de treino: {X_train.shape}, {y_train.shape}")
print(f"Conjunto de teste: {X_test.shape}, {y_test.shape}")

## 5. Constru√ß√£o e Treinamento do Modelo

Vamos criar um modelo de Deep Learning com camadas de Embedding e LSTM.

In [None]:
# Definir o modelo
model = Sequential()
model.add(Embedding(input_dim=MAX_NUM_WORDS, output_dim=EMBEDDING_DIM, input_length=MAX_SEQUENCE_LENGTH))
model.add(LSTM(128, dropout=0.2, recurrent_dropout=0.2))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(3, activation='softmax'))  # 3 classes: negativo, neutro, positivo

# Compilar o modelo
model.compile(
    loss='categorical_crossentropy',
    optimizer='adam',
    metrics=['accuracy']
)

# Resumo do modelo
model.summary()

In [None]:
# Definir callbacks
early_stopping = EarlyStopping(
    monitor='val_loss',
    patience=3,
    restore_best_weights=True
)

model_checkpoint = ModelCheckpoint(
    'best_model.h5',
    monitor='val_accuracy',
    save_best_only=True,
    verbose=1
)

In [None]:
# Treinar o modelo
history = model.fit(
    X_train, y_train,
    epochs=10,
    batch_size=64,
    validation_split=0.1,
    callbacks=[early_stopping, model_checkpoint],
    verbose=1
)

## 6. Avalia√ß√£o do Modelo

Vamos avaliar o desempenho do modelo no conjunto de teste.

In [None]:
# Carregar o melhor modelo
best_model = tf.keras.models.load_model('best_model.h5')

# Avaliar no conjunto de teste
test_loss, test_accuracy = best_model.evaluate(X_test, y_test, verbose=1)
print(f"Acur√°cia no conjunto de teste: {test_accuracy:.4f}")

In [None]:
# Visualizar o hist√≥rico de treinamento
plt.figure(figsize=(12, 5))

# Gr√°fico de acur√°cia
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Treino')
plt.plot(history.history['val_accuracy'], label='Valida√ß√£o')
plt.title('Acur√°cia do Modelo')
plt.xlabel('√âpoca')
plt.ylabel('Acur√°cia')
plt.legend()
plt.grid(True)

# Gr√°fico de perda
plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Treino')
plt.plot(history.history['val_loss'], label='Valida√ß√£o')
plt.title('Perda do Modelo')
plt.xlabel('√âpoca')
plt.ylabel('Perda')
plt.legend()
plt.grid(True)

plt.tight_layout()
plt.show()

In [None]:
# Fazer predi√ß√µes no conjunto de teste
y_pred_proba = best_model.predict(X_test)
y_pred = np.argmax(y_pred_proba, axis=1)
y_true = np.argmax(y_test, axis=1)

# Matriz de confus√£o
from sklearn.metrics import confusion_matrix, classification_report

cm = confusion_matrix(y_true, y_pred)
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=['Negativo', 'Neutro', 'Positivo'],
            yticklabels=['Negativo', 'Neutro', 'Positivo'])
plt.title('Matriz de Confus√£o')
plt.xlabel('Predito')
plt.ylabel('Real')
plt.show()

# Relat√≥rio de classifica√ß√£o
print("Relat√≥rio de Classifica√ß√£o:")
print(classification_report(y_true, y_pred, target_names=['Negativo', 'Neutro', 'Positivo']))

## 7. An√°lise de Exemplos Incorretos

Vamos analisar alguns exemplos que o modelo classificou incorretamente.

In [None]:
# Identificar exemplos classificados incorretamente
incorrect_indices = np.where(y_pred != y_true)[0]
print(f"N√∫mero de exemplos classificados incorretamente: {len(incorrect_indices)}")

# Selecionar alguns exemplos incorretos aleatoriamente
if len(incorrect_indices) > 0:
    sample_size = min(5, len(incorrect_indices))
    sample_indices = np.random.choice(incorrect_indices, size=sample_size, replace=False)
    
    # Recuperar os textos originais
    original_texts = df_filtered['description'].values[np.where(df_filtered.index.isin(X_test[sample_indices]))[0]]
    
    # Exibir exemplos incorretos
    for i, idx in enumerate(sample_indices):
        true_label = ['Negativo', 'Neutro', 'Positivo'][y_true[idx]]
        pred_label = ['Negativo', 'Neutro', 'Positivo'][y_pred[idx]]
        print(f"Exemplo {i+1}:")
        print(f"Texto: {original_texts[i]}")
        print(f"R√≥tulo real: {true_label}")
        print(f"R√≥tulo predito: {pred_label}")
        print("---")

## 8. Salvar o Modelo e o Tokenizer

Vamos salvar o modelo treinado e o tokenizer para uso na aplica√ß√£o web.

In [None]:
# Salvar o modelo final
best_model.save('model.h5')
print("Modelo salvo como 'model.h5'")

# Salvar o tokenizer
with open('tokenizer.pickle', 'wb') as handle:
    pickle.dump(tokenizer, handle, protocol=pickle.HIGHEST_PROTOCOL)
print("Tokenizer salvo como 'tokenizer.pickle'")

## 9. Teste do Modelo com Exemplos

Vamos testar o modelo com alguns exemplos de avalia√ß√µes de vinhos.

In [None]:
# Fun√ß√£o para classificar o sentimento de um texto
def classify_sentiment(text, model, tokenizer):
    # Pr√©-processar o texto
    processed_text = preprocess_text(text)
    
    # Tokenizar e padronizar
    sequence = tokenizer.texts_to_sequences([processed_text])
    padded_sequence = pad_sequences(sequence, maxlen=MAX_SEQUENCE_LENGTH, padding='post')
    
    # Fazer a predi√ß√£o
    prediction = model.predict(padded_sequence)
    sentiment_class = np.argmax(prediction, axis=1)[0]
    
    # Mapear para r√≥tulos de sentimento
    sentiment_map = {0: "Negativo", 1: "Neutro", 2: "Positivo"}
    sentiment = sentiment_map[sentiment_class]
    
    # Obter as probabilidades
    probabilities = prediction[0]
    
    return sentiment, probabilities

In [None]:
# Exemplos de avalia√ß√µes de vinhos
examples = [
    "Great complexity with floral aromas and a long finish.",
    "This wine is average at best, with a short finish and little character.",
    "Terrible wine, tastes like vinegar and has no depth.",
    "Balanced acidity with notes of apple and pear, decent for the price.",
    "Exceptional depth and complexity, with layers of dark fruit and spice."
]

# Testar o modelo com os exemplos
for example in examples:
    sentiment, probabilities = classify_sentiment(example, best_model, tokenizer)
    print(f"Texto: {example}")
    print(f"Sentimento: {sentiment}")
    print(f"Probabilidades: Negativo: {probabilities[0]:.4f}, Neutro: {probabilities[1]:.4f}, Positivo: {probabilities[2]:.4f}")
    print("---")

## 10. Prepara√ß√£o para a Interface Web

Vamos preparar os arquivos necess√°rios para a aplica√ß√£o Streamlit.

In [None]:
# Criar arquivo requirements.txt
requirements = """
streamlit==1.22.0
tensorflow==2.12.0
nltk==3.8.1
numpy==1.23.5
pandas==1.5.3
matplotlib==3.7.1
"""

with open('requirements.txt', 'w') as f:
    f.write(requirements.strip())
    
print("Arquivo requirements.txt criado")

In [None]:
# Baixar arquivos para uso local
from google.colab import files

files.download('model.h5')
files.download('tokenizer.pickle')
files.download('requirements.txt')

## 11. C√≥digo da Aplica√ß√£o Streamlit

Abaixo est√° o c√≥digo para a aplica√ß√£o Streamlit que pode ser salvo como `app.py`.

In [None]:
%%writefile app.py
import streamlit as st
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
import re
import nltk
from nltk.corpus import stopwords
import pickle

# Configura√ß√£o da p√°gina
st.set_page_config(
    page_title="WineMood - Sentiment Analyzer",
    page_icon="üç∑",
    layout="wide",
    initial_sidebar_state="expanded",
    menu_items={
        'About': "# WineMood - Analisador de Sentimentos para Avalia√ß√µes de Vinhos"
    }
)

# Aplicar tema escuro personalizado
st.markdown("""
<style>
    .main {
        background-color: #1E1E1E;
        color: #FFFFFF;
    }
    .stTextInput > div > div > input {
        background-color: #2D2D2D;
        color: #FFFFFF;
    }
    .stButton>button {
        background-color: #8A2BE2;
        color: white;
        font-weight: bold;
        border-radius: 5px;
        padding: 0.5rem 1rem;
        border: none;
    }
    .stButton>button:hover {
        background-color: #9370DB;
    }
    .positive {
        color: #4CAF50;
        font-weight: bold;
        font-size: 24px;
    }
    .neutral {
        color: #9E9E9E;
        font-weight: bold;
        font-size: 24px;
    }
    .negative {
        color: #F44336;
        font-weight: bold;
        font-size: 24px;
    }
    .title {
        font-size: 42px;
        font-weight: bold;
        text-align: center;
        margin-bottom: 30px;
        color: #FFFFFF;
    }
    .subtitle {
        font-size: 24px;
        font-weight: bold;
        margin-bottom: 20px;
        color: #FFFFFF;
    }
</style>
""", unsafe_allow_html=True)

# Fun√ß√£o para carregar o modelo e o tokenizer
@st.cache_resource
def load_model_and_tokenizer():
    try:
        # Carregar o modelo
        model = tf.keras.models.load_model('model.h5')
        
        # Carregar o tokenizer
        with open('tokenizer.pickle', 'rb') as handle:
            tokenizer = pickle.load(handle)
            
        return model, tokenizer
    except Exception as e:
        st.error(f"Erro ao carregar o modelo: {e}")
        return None, None

# Fun√ß√£o para pr√©-processar o texto
def preprocess_text(text, tokenizer, max_length=100):
    # Converter para min√∫sculas
    text = text.lower()
    
    # Remover pontua√ß√£o e caracteres especiais
    text = re.sub(r'[^\w\s]', '', text)
    
    # Remover stopwords
    try:
        nltk.data.find('corpora/stopwords')
    except LookupError:
        nltk.download('stopwords', quiet=True)
    
    stop_words = set(stopwords.words('english'))
    text = ' '.join([word for word in text.split() if word not in stop_words])
    
    # Tokenizar e padronizar
    sequences = tokenizer.texts_to_sequences([text])
    padded_sequences = pad_sequences(sequences, maxlen=max_length, padding='post')
    
    return padded_sequences

# Fun√ß√£o para classificar o sentimento
def classify_sentiment(text, model, tokenizer):
    # Pr√©-processar o texto
    processed_text = preprocess_text(text, tokenizer)
    
    # Fazer a predi√ß√£o
    prediction = model.predict(processed_text)
    
    # Obter a classe com maior probabilidade
    sentiment_class = np.argmax(prediction, axis=1)[0]
    
    # Mapear para r√≥tulos de sentimento
    sentiment_map = {0: "Negativo", 1: "Neutro", 2: "Positivo"}
    sentiment = sentiment_map[sentiment_class]
    
    # Obter as probabilidades
    probabilities = prediction[0]
    
    return sentiment, probabilities

# Fun√ß√£o para exibir o resultado com a cor apropriada
def display_sentiment(sentiment):
    if sentiment == "Positivo":
        return st.markdown(f'<p class="positive">Sentimento: {sentiment}</p>', unsafe_allow_html=True)
    elif sentiment == "Neutro":
        return st.markdown(f'<p class="neutral">Sentimento: {sentiment}</p>', unsafe_allow_html=True)
    else:
        return st.markdown(f'<p class="negative">Sentimento: {sentiment}</p>', unsafe_allow_html=True)

# Fun√ß√£o para plotar o gr√°fico de barras
def plot_sentiment_probabilities(probabilities):
    labels = ['Negativo', 'Neutro', 'Positivo']
    
    fig, ax = plt.subplots(figsize=(10, 5))
    fig.patch.set_facecolor('#1E1E1E')
    ax.set_facecolor('#1E1E1E')
    
    bars = ax.bar(labels, probabilities * 100, color=['#F44336', '#9E9E9E', '#4CAF50'])
    
    # Adicionar r√≥tulos e t√≠tulo
    ax.set_ylabel('Probabilidade (%)', color='white')
    ax.set_title('Distribui√ß√£o de Probabilidades de Sentimento', color='white')
    
    # Personalizar eixos
    ax.spines['bottom'].set_color('white')
    ax.spines['top'].set_color('white')
    ax.spines['right'].set_color('white')
    ax.spines['left'].set_color('white')
    ax.tick_params(axis='x', colors='white')
    ax.tick_params(axis='y', colors='white')
    
    # Adicionar valores nas barras
    for bar in bars:
        height = bar.get_height()
        ax.annotate(f'{height:.1f}%',
                    xy=(bar.get_x() + bar.get_width() / 2, height),
                    xytext=(0, 3),
                    textcoords="offset points",
                    ha='center', va='bottom',
                    color='white')
    
    return fig

# Interface principal
def main():
    # Carregar o modelo e o tokenizer
    model, tokenizer = load_model_and_tokenizer()
    
    # T√≠tulo
    st.markdown('<p class="title">WineMood ‚Äì Sentiment Analyzer</p>', unsafe_allow_html=True)
    
    # Criar abas
    tab1, tab2 = st.tabs(["Analisador de Sentimentos", "Sobre o Projeto"])
    
    with tab1:
        st.markdown('<p class="subtitle">An√°lise de Sentimentos em Avalia√ß√µes de Vinhos</p>', unsafe_allow_html=True)
        
        # √Årea de texto para entrada do usu√°rio
        user_input = st.text_area("Digite a descri√ß√£o do vinho (ou v√°rias descri√ß√µes, uma por linha):", 
                                height=150,
                                placeholder="Ex: Great complexity with floral aromas and a long finish.")
        
        # Bot√£o para classificar
        if st.button("Classify"):
            if user_input:
                # Dividir o texto em linhas para processar m√∫ltiplas avalia√ß√µes
                reviews = user_input.strip().split('\n')
                
                # Processar cada avalia√ß√£o
                results = []
                all_probabilities = []
                
                for review in reviews:
                    if review.strip():  # Verificar se a linha n√£o est√° vazia
                        sentiment, probabilities = classify_sentiment(review, model, tokenizer)
                        results.append((review, sentiment))
                        all_probabilities.append(probabilities)
                
                # Exibir resultados
                if len(results) == 1:
                    # Caso de uma √∫nica avalia√ß√£o
                    display_sentiment(results[0][1])
                    
                    # Plotar gr√°fico de probabilidades
                    st.pyplot(plot_sentiment_probabilities(all_probabilities[0]))
                else:
                    # Caso de m√∫ltiplas avalia√ß√µes
                    st.markdown('<p class="subtitle">Resultados:</p>', unsafe_allow_html=True)
                    
                    # Criar DataFrame para exibir resultados
                    df_results = pd.DataFrame(results, columns=['Avalia√ß√£o', 'Sentimento'])
                    
                    # Contar ocorr√™ncias de cada sentimento
                    sentiment_counts = df_results['Sentimento'].value_counts()
                    
                    # Garantir que todos os sentimentos estejam representados
                    for sentiment in ['Positivo', 'Neutro', 'Negativo']:
                        if sentiment not in sentiment_counts:
                            sentiment_counts[sentiment] = 0
                    
                    # Calcular percentuais
                    total = len(results)
                    sentiment_percentages = (sentiment_counts / total * 100).reindex(['Positivo', 'Neutro', 'Negativo'])
                    
                    # Exibir tabela de resultados
                    st.dataframe(df_results, use_container_width=True)
                    
                    # Plotar gr√°fico de barras com percentuais
                    fig, ax = plt.subplots(figsize=(10, 5))
                    fig.patch.set_facecolor('#1E1E1E')
                    ax.set_facecolor('#1E1E1E')
                    
                    bars = ax.bar(['Positivo', 'Neutro', 'Negativo'], 
                                sentiment_percentages, 
                                color=['#4CAF50', '#9E9E9E', '#F44336'])
                    
                    # Adicionar r√≥tulos e t√≠tulo
                    ax.set_ylabel('Percentual (%)', color='white')
                    ax.set_title('Distribui√ß√£o de Sentimentos', color='white')
                    
                    # Personalizar eixos
                    ax.spines['bottom'].set_color('white')
                    ax.spines['top'].set_color('white')
                    ax.spines['right'].set_color('white')
                    ax.spines['left'].set_color('white')
                    ax.tick_params(axis='x', colors='white')
                    ax.tick_params(axis='y', colors='white')
                    
                    # Adicionar valores nas barras
                    for bar in bars:
                        height = bar.get_height()
                        ax.annotate(f'{height:.1f}%',
                                    xy=(bar.get_x() + bar.get_width() / 2, height),
                                    xytext=(0, 3),
                                    textcoords="offset points",
                                    ha='center', va='bottom',
                                    color='white')
                    
                    st.pyplot(fig)
            else:
                st.warning("Por favor, digite uma avalia√ß√£o de vinho para classificar.")
    
    with tab2:
        st.markdown('<p class="subtitle">Sobre o WineMood</p>', unsafe_allow_html=True)
        
        st.markdown("""
        ## O que √© o WineMood?
        
        WineMood √© um sistema inteligente que analisa avalia√ß√µes textuais de vinhos e classifica automaticamente o sentimento expresso como positivo, neutro ou negativo. Utilizando t√©cnicas de Processamento de Linguagem Natural (NLP) combinadas com Deep Learning, o projeto transforma a linguagem humana em insights √∫teis para consumidores e empresas.
        
        ## Como funciona?
        
        O sistema utiliza um modelo de Deep Learning baseado em redes neurais recorrentes (LSTM) para entender o contexto e o sentimento das avalia√ß√µes de vinhos. O processo inclui:
        
        1. **Pr√©-processamento de texto**: limpeza, remo√ß√£o de stopwords e tokeniza√ß√£o
        2. **Vetoriza√ß√£o**: convers√£o de palavras em representa√ß√µes num√©ricas
        3. **An√°lise de sequ√™ncia**: compreens√£o do contexto atrav√©s de LSTM
        4. **Classifica√ß√£o**: determina√ß√£o do sentimento predominante
        
        ## Aplica√ß√µes pr√°ticas
        
        - Recomenda√ß√£o autom√°tica de vinhos com base no sentimento do cliente
        - Aux√≠lio a vendedores e produtores de vinho para entender a percep√ß√£o do p√∫blico
        - Destaque de vinhos bem avaliados em plataformas de e-commerce
        
        ## Tecnologias utilizadas
        
        - **Python**: linguagem de programa√ß√£o principal
        - **TensorFlow + Keras**: framework de Deep Learning
        - **NLTK**: biblioteca para processamento de linguagem natural
        - **Streamlit**: interface web interativa
        - **Pandas & NumPy**: manipula√ß√£o de dados
        - **Matplotlib**: visualiza√ß√£o de dados
        
        ## Dataset
        
        O modelo foi treinado com aproximadamente 130.000 avalia√ß√µes de vinhos do Kaggle, com pontua√ß√µes convertidas em categorias de sentimento:
        
        - **Positivo**: pontua√ß√£o ‚â• 90
        - **Neutro**: pontua√ß√£o entre 80-89
        - **Negativo**: pontua√ß√£o < 80
        """)

if __name__ == "__main__":
    main()

## 12. Instru√ß√µes para Deploy

### Deploy Local

Para executar a aplica√ß√£o localmente:

1. Instale as depend√™ncias: `pip install -r requirements.txt`
2. Execute o Streamlit: `streamlit run app.py`

### Deploy no Streamlit Cloud

Para fazer o deploy no Streamlit Cloud:

1. Crie uma conta no [Streamlit Cloud](https://streamlit.io/cloud)
2. Crie um reposit√≥rio no GitHub com os seguintes arquivos:
   - app.py
   - requirements.txt
   - model.h5
   - tokenizer.pickle
3. Conecte o reposit√≥rio ao Streamlit Cloud
4. Configure o deploy com o arquivo principal como app.py

## 13. Conclus√£o

Neste notebook, desenvolvemos um classificador de sentimentos para avalia√ß√µes de vinhos usando Deep Learning. O modelo alcan√ßou uma boa acur√°cia e foi implementado em uma interface web interativa usando Streamlit.

O projeto WineMood demonstra como t√©cnicas de NLP e Deep Learning podem ser aplicadas a dados do mundo real para extrair insights valiosos e criar aplica√ß√µes pr√°ticas para consumidores e empresas.