In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR

column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

# Ler o arquivo CSV

vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

# Tarefa 1: Análise Exploratória de Variáveis

print("Contagem de classes:")
print(vinhos['classe'].value_counts())

print("\nEstatísticas descritivas:")
print(vinhos[['alcool', 'acido_malico', 'magnesio', 'matiz']].describe())

# Tarefa 2: Criação de Boxplots

plt.figure(figsize=(12, 6))
sns.boxplot(data=vinhos[['magnesio', 'prolina', 'cinzas', 'alcool']])
plt.title("Boxplots de Variáveis")
plt.show()

# Tarefa 3: Boxplots Segregados por Classe

for col in ['magnesio', 'fenois_totais', 'acido_malico', 'alcool']:
    plt.figure(figsize=(8, 6))
    vinhos.boxplot(column=col, by='classe')
    plt.title(f'Boxplot de {col} segregado por Classe')
    plt.suptitle('')
    plt.show()

# Tarefa 4: Criação de Histograma

plt.figure(figsize=(8, 6))
sns.histplot(vinhos['fenois_totais'], bins=10, kde=True)
plt.title("Histograma de Fenóis Totais")
plt.xlabel("Fenóis Totais")
plt.ylabel("Frequência")
plt.show()

# Histograma da coluna fenois_totais filtrando a classe 3

plt.figure(figsize=(8, 6))
sns.histplot(vinhos[vinhos['classe'] == '3']['fenois_totais'], bins=10, kde=True)
plt.title("Histograma de Fenóis Totais (Classe 3)")
plt.xlabel("Fenóis Totais")
plt.ylabel("Frequência")
plt.show()