
# üéÆ An√°lise de Dados de Jogos de Videogame

Este projeto faz parte do meu portf√≥lio de An√°lise de Dados (Google Data Analytics Certificate).  
O objetivo √© explorar dados de vendas de videogames para descobrir:

- Quais g√™neros e plataformas vendem mais.  
- Como as vendas evolu√≠ram ao longo dos anos.  
- Se existe rela√ß√£o entre notas cr√≠ticas e vendas.  

O conjunto de dados utilizado √© o **Video Game Sales Dataset** dispon√≠vel no Kaggle.
    

In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.style.use("seaborn-v0_8-whitegrid")
sns.set_palette("pastel")

# Importar o dataset
df = pd.read_csv("/kaggle/input/videogamesales/vgsales.csv")
df.head()
    

In [None]:

df.info()
df.describe()
df.isnull().sum()
    


### Observa√ß√µes
- Verifique quais colunas t√™m valores ausentes (ex: Year, Publisher).  
- Decida se vai preencher, remover ou ignorar esses dados.  
- Entenda o formato dos dados antes de limp√°-los.
    

In [None]:

df = df.dropna()
df["Year"] = df["Year"].astype(int)

df = df.rename(columns={
    "Name": "Game",
    "Platform": "Console",
    "Year": "Ano",
    "Genre": "Genero",
    "Global_Sales": "VendasGlobais"
})

df.head()
    


### Explica√ß√£o
- Removemos valores nulos para evitar erros em an√°lises.  
- Converti o tipo da coluna "Year" para inteiro.  
- Renomeei colunas para facilitar leitura em portugu√™s.
    

In [None]:

plt.figure(figsize=(10,5))
top_genres = df.groupby("Genero")["VendasGlobais"].sum().sort_values(ascending=False).head(10)
sns.barplot(x=top_genres.values, y=top_genres.index)
plt.title("Top 10 G√™neros Mais Vendidos Globalmente")
plt.xlabel("Vendas (em milh√µes)")
plt.ylabel("G√™nero")
plt.show()
    

In [None]:

sales_per_year = df.groupby("Ano")["VendasGlobais"].sum()
sales_per_year.plot(kind="line", figsize=(10,5), marker='o')
plt.title("Evolu√ß√£o das Vendas Globais de Jogos (por Ano)")
plt.xlabel("Ano de Lan√ßamento")
plt.ylabel("Vendas (milh√µes)")
plt.show()
    

In [None]:

top_platforms = df.groupby("Console")["VendasGlobais"].sum().sort_values(ascending=False).head(10)
sns.barplot(x=top_platforms.values, y=top_platforms.index)
plt.title("Top 10 Plataformas Mais Vendidas")
plt.xlabel("Vendas Globais (milh√µes)")
plt.ylabel("Plataforma")
plt.show()
    


### Interpreta√ß√£o
- G√™neros de **A√ß√£o** e **Esporte** aparecem no topo.  
- O pico de vendas ocorreu entre 2008 e 2010.  
- **PS2**, **Wii** e **Xbox 360** foram as plataformas mais lucrativas.
    

In [None]:

if "Critic_Score" in df.columns:
    plt.figure(figsize=(8,5))
    sns.scatterplot(x="Critic_Score", y="VendasGlobais", data=df, alpha=0.6)
    plt.title("Correla√ß√£o entre Nota Cr√≠tica e Vendas Globais")
    plt.xlabel("Nota Cr√≠tica")
    plt.ylabel("Vendas Globais (milh√µes)")
    plt.show()
    


Observa-se uma tend√™ncia de que jogos com notas mais altas t√™m maiores vendas,  
mas o sucesso comercial nem sempre depende apenas da cr√≠tica.
    


## üß© Conclus√µes

- Os g√™neros **A√ß√£o** e **Esporte** lideram as vendas globais.  
- O per√≠odo entre **2008 e 2010** foi o auge da ind√∫stria.  
- **PlayStation 2** foi a plataforma mais lucrativa de todos os tempos.

## üîÆ Pr√≥ximos Passos

- Atualizar o dataset com jogos mais recentes (p√≥s-2020).  
- Analisar vendas regionais e influ√™ncia de marketing.  
- Aplicar machine learning para prever sucesso de novos lan√ßamentos.
    


## üåê Publica√ß√£o

1. Publique o notebook no **Kaggle** como p√∫blico.  
2. Baixe o arquivo `.ipynb` e envie para o **GitHub**.  
3. No `README.md` do reposit√≥rio, adicione:

```markdown
# üéÆ An√°lise de Dados de Jogos de Videogame
Este reposit√≥rio cont√©m uma an√°lise explorat√≥ria feita com Python e pandas no Kaggle.
```

Pronto! Seu portf√≥lio de An√°lise de Dados est√° completo e profissional üöÄ
    