# üìä Visualiza√ß√£o com PyWaffle e WordCloud
Este notebook inclui teoria, exemplos com dados simples e grandes datasets, e uma sec√ß√£o final com exerc√≠cios pr√°ticos.

## üß© PyWaffle - Teoria
**PyWaffle** √© uma biblioteca baseada em matplotlib para criar gr√°ficos de waffle. Estes gr√°ficos representam valores em grelhas de quadrados ou √≠cones e s√£o ideais para visualizar propor√ß√µes de categorias de forma clara e visual.

**Principais par√¢metros:**
- `values`: dicion√°rio com categorias e valores
- `rows`: n√∫mero de linhas da grelha
- `labels`: r√≥tulos informativos
- `icons`: √≠cones Font Awesome (opcional)
- `legend`, `title`: configura√ß√µes visuais adicionais

**Vantagens:**
- Muito visual e apelativo
- √ìtimo para dashboards e relat√≥rios executivos

**Limita√ß√µes:**
- N√£o recomendado para categorias com valores muito pequenos
- Pode distorcer perce√ß√£o se n√£o houver contexto adequado

In [None]:
# Exemplo simples com PyWaffle
from pywaffle import Waffle
import matplotlib.pyplot as plt

data = {'C√£es': 40, 'Gatos': 30, 'P√°ssaros': 20, 'Outros': 10}

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=data,
    title={'label': 'Distribui√ß√£o de Animais de Estima√ß√£o', 'loc': 'left'},
    labels=[f"{k} ({v}%)" for k, v in data.items()],
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1)}
)
plt.show()

In [None]:
# Exemplo com pandas
import pandas as pd

df = pd.DataFrame({'Animal': ['C√£o', 'Gato'], 'Qtd': [50, 30]})
data_dict = dict(zip(df['Animal'], df['Qtd']))

fig = plt.figure(
    FigureClass=Waffle,
    rows=5,
    values=data_dict,
    title={'label': 'Animais com pandas', 'loc': 'left'},
    labels=[f"{k} ({v})" for k, v in data_dict.items()],
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1)}
)
plt.show()

In [None]:
# Exemplo com grande dataset (dataset fict√≠cio de vendas)
import numpy as np
np.random.seed(0)

categorias = ['Eletr√≥nica', 'Roupa', 'Livros', 'Casa', 'Brinquedos']
vendas = np.random.randint(500, 2000, size=len(categorias))
df_vendas = pd.DataFrame({'Categoria': categorias, 'Vendas': vendas})
data_vendas = dict(zip(df_vendas['Categoria'], df_vendas['Vendas']))

fig = plt.figure(
    FigureClass=Waffle,
    rows=10,
    values=data_vendas,
    title={'label': 'Distribui√ß√£o de Vendas por Categoria', 'loc': 'left'},
    labels=[f"{k} ({v})" for k, v in data_vendas.items()],
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1)}
)
plt.show()

## ‚òÅÔ∏è WordCloud - Teoria
**WordCloud** permite gerar representa√ß√µes gr√°ficas da frequ√™ncia de palavras num texto. Palavras mais frequentes s√£o apresentadas com maior destaque.

**Par√¢metros importantes:**
- `generate(texto)`: gera a nuvem a partir de uma string
- `background_color`: cor de fundo (ex: 'white')
- `colormap`: paleta de cores (ex: 'viridis')
- `max_words`: n√∫mero m√°ximo de palavras
- `stopwords`: palavras irrelevantes a ignorar
- `width`, `height`: dimens√µes da imagem

**Vantagens:**
- Intuitivo e f√°cil de interpretar
- Excelente para resumos visuais

**Limita√ß√µes:**
- Perde o contexto
- Pode necessitar de limpeza textual

In [None]:
# Exemplo b√°sico de WordCloud
from wordcloud import WordCloud
texto = 'gato c√£o papagaio gato c√£o peixe gato cavalo gato papagaio c√£o'

wordcloud = WordCloud(
    width=800,
    height=400,
    background_color='white'
).generate(texto)

plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.title('Nuvem de Palavras')
plt.show()

In [None]:
# Exemplo com pandas e WordCloud
from wordcloud import STOPWORDS

df = pd.DataFrame({
    'comentarios': [
        'Muito intuitivo e r√°pido',
        'Excelente suporte t√©cnico',
        'Experi√™ncia positiva',
        'Gostei da apresenta√ß√£o',
        'Sistema leve e eficiente'
    ]
})

texto = ' '.join(df['comentarios'])
stopwords = set(STOPWORDS)
stopwords.update(['de', 'e', 'da', 'ao'])

wordcloud = WordCloud(
    width=800,
    height=400,
    background_color='white',
    colormap='viridis',
    stopwords=stopwords,
    max_words=50
).generate(texto)

plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.title('Nuvem de Palavras - Coment√°rios')
plt.show()

In [None]:
# Exemplo com dataset grande (simulado)
comentarios = [
    'Produto excelente e entrega r√°pida',
    'Gostei da qualidade e do pre√ßo',
    'Servi√ßo ao cliente eficiente',
    'Muito f√°cil de usar e intuitivo',
    'Comprarei novamente com certeza'
] * 100  # duplicar para simular grande volume

texto_grande = ' '.join(comentarios)
wordcloud = WordCloud(
    width=800,
    height=400,
    background_color='white',
    colormap='cool',
    max_words=100
).generate(texto_grande)

plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.title('Nuvem de Palavras - Dataset Grande')
plt.show()

### üìà PyWaffle com Dataset Real (CSV)

In [None]:
# Leitura de dados reais de vendas a partir de CSV
import pandas as pd
from pywaffle import Waffle
import matplotlib.pyplot as plt

# Carregar dataset
df_vendas = pd.read_csv('dataset_vendas.csv')
data_vendas = dict(zip(df_vendas['Categoria'], df_vendas['Vendas']))

# Criar gr√°fico
fig = plt.figure(
    FigureClass=Waffle,
    rows=10,
    values=data_vendas,
    title={'label': 'Distribui√ß√£o Real de Vendas por Categoria', 'loc': 'left'},
    labels=[f"{k} ({v})" for k, v in data_vendas.items()],
    legend={'loc': 'upper left', 'bbox_to_anchor': (1, 1)}
)
plt.show()

### ‚òÅÔ∏è WordCloud com Dataset Real (CSV)

In [None]:
# Leitura de coment√°rios reais de clientes a partir de CSV
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt

# Carregar dataset
df_comentarios = pd.read_csv('dataset_comentarios.csv')
texto = ' '.join(df_comentarios['comentarios'])

# Palavras a ignorar
stopwords = set(STOPWORDS)
stopwords.update(['de', 'e', 'da', 'ao'])

# Gerar WordCloud
wordcloud = WordCloud(
    width=800,
    height=400,
    background_color='white',
    colormap='plasma',
    stopwords=stopwords,
    max_words=100
).generate(texto)

# Visualizar
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.title('Nuvem de Palavras - Coment√°rios Reais')
plt.show()

## üìù Lista de Exerc√≠cios
1. Cria um gr√°fico Waffle com 6 categorias de um dataset real ou fict√≠cio.
2. Usa `pandas` para importar um ficheiro CSV e gera o gr√°fico com `PyWaffle`.
3. Gera uma `WordCloud` com base numa coluna de coment√°rios de clientes.
4. Testa diferentes valores de `max_words`, `colormap` e `background_color`.
5. Identifica as palavras mais frequentes e remove palavras irrelevantes usando `stopwords`.
6. Compara a WordCloud gerada antes e depois da limpeza do texto.