In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Carregar os dados
df = pd.read_excel('processadores_limpo.xlsx')

# Verificar estrutura
print(df.head())
print(df.info())

# Limpeza básica (se necessário)
df['preço'] = pd.to_numeric(df['preço'], errors='coerce')
df.dropna(subset=['preço'], inplace=True)

# Extrair informações dos nomes dos processadores (se necessário)
# Podemos extrair geração, núcleos, threads, etc. dos nomes

In [None]:
# Contagem por fabricante
plt.figure(figsize=(10,6))
sns.countplot(data=df, x='fabricante', order=df['fabricante'].value_counts().index)
plt.title('Distribuição de Processadores por Fabricante')
plt.xlabel('Fabricante')
plt.ylabel('Contagem')
plt.show()

# Preço médio por fabricante
plt.figure(figsize=(10,6))
sns.barplot(data=df, x='fabricante', y='preço', estimator='mean')
plt.title('Preço Médio por Fabricante')
plt.xlabel('Fabricante')
plt.ylabel('Preço Médio (R$)')
plt.show()

In [None]:
# Extrair série/modelo (exemplo para AMD)
df['série'] = df['marca'].apply(lambda x: x.split()[2] if 'AMD' in x else x.split()[2] + ' ' + x.split()[3])

# Top 10 séries mais comuns
top_series = df['série'].value_counts().head(10)

plt.figure(figsize=(12,6))
sns.barplot(x=top_series.index, y=top_series.values)
plt.title('Top 10 Séries de Processadores Mais Comuns')
plt.xlabel('Série')
plt.ylabel('Contagem')
plt.xticks(rotation=45)
plt.show()

In [None]:
# Top 10 processadores mais caros
top_expensive = df.sort_values('preço', ascending=False).head(10)

plt.figure(figsize=(12,6))
sns.barplot(data=top_expensive, x='preço', y='marca', hue='fabricante', dodge=False)
plt.title('Top 10 Processadores Mais Caros')
plt.xlabel('Preço (R$)')
plt.ylabel('Modelo')
plt.tight_layout()
plt.show()