# Exercício Prático: Análise Exploratória de Dados - Vinhos (UCI)
Neste notebook, realizaremos uma análise exploratória do dataset de vinhos da UCI.
As etapas incluem:
- Leitura do dataset
- Análise descritiva
- Criação de gráficos


In [None]:
# Importando as bibliotecas necessárias
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# URL do dataset Wine
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR
column_names_pt_br = [
    'classe', 'alcool', 'acido_malico', 'cinzas', 'alcalinidade_de_cinzas',
    'magnesio', 'fenois_totais', 'flavanoides', 'fenois_nao_flavanoides',
    'proantocianinas', 'intensidade_de_cor', 'matiz',
    'od280_od315_de_vinhos_diluidos', 'prolina'
]

# Lendo o dataset
vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

# Visualizando as primeiras linhas
vinhos.head()

## 1. Análise Exploratória

In [None]:
# Contagem das classes
vinhos['classe'].value_counts()

In [None]:
# Estatísticas descritivas das variáveis
vinhos[['alcool', 'acido_malico', 'magnesio', 'matiz']].describe()

## 2. Criação de Boxplots

In [None]:
# Criando boxplots para as colunas especificadas
fig, axs = plt.subplots(2, 2, figsize=(14, 10))
sns.boxplot(data=vinhos, y='magnesio', ax=axs[0, 0])
sns.boxplot(data=vinhos, y='prolina', ax=axs[0, 1])
sns.boxplot(data=vinhos, y='cinzas', ax=axs[1, 0])
sns.boxplot(data=vinhos, y='alcool', ax=axs[1, 1])

# Ajustando os títulos dos gráficos
axs[0, 0].set_title('Boxplot - Magnésio')
axs[0, 1].set_title('Boxplot - Prolina')
axs[1, 0].set_title('Boxplot - Cinzas')
axs[1, 1].set_title('Boxplot - Álcool')

plt.tight_layout()
plt.show()

## 3. Boxplots Segregados por Classe

In [None]:
# Boxplot segregado por classe
vinhos.boxplot(column='magnesio', by='classe', figsize=(6, 6))
plt.title('Boxplot - Magnésio por Classe')
plt.suptitle('')
plt.show()

vinhos.boxplot(column='fenois_totais', by='classe', figsize=(6, 6))
plt.title('Boxplot - Fenois Totais por Classe')
plt.suptitle('')
plt.show()

vinhos.boxplot(column='acido_malico', by='classe', figsize=(6, 6))
plt.title('Boxplot - Ácido Málico por Classe')
plt.suptitle('')
plt.show()

vinhos.boxplot(column='alcool', by='classe', figsize=(6, 6))
plt.title('Boxplot - Álcool por Classe')
plt.suptitle('')
plt.show()

## 4. Criação de Histograma

In [None]:
# Histograma para a coluna fenois_totais
plt.figure(figsize=(8, 6))
plt.hist(vinhos['fenois_totais'], bins=10, color='skyblue', edgecolor='black')
plt.title('Histograma - Fenois Totais')
plt.xlabel('Fenois Totais')
plt.ylabel('Frequência')
plt.show()

In [None]:
# Histograma filtrando apenas a classe 3
classe_3 = vinhos[vinhos['classe'] == '3']
plt.figure(figsize=(8, 6))
plt.hist(classe_3['fenois_totais'], bins=10, color='skyblue', edgecolor='black')
plt.title('Histograma - Fenois Totais (Classe 3)')
plt.xlabel('Fenois Totais')
plt.ylabel('Frequência')
plt.show()