
# 🎮 Análise de Dados de Jogos de Videogame

Este projeto faz parte do meu portfólio de Análise de Dados (Google Data Analytics Certificate).  
O objetivo é explorar dados de vendas de videogames para descobrir:

- Quais gêneros e plataformas vendem mais.  
- Como as vendas evoluíram ao longo dos anos.  
- Se existe relação entre notas críticas e vendas.  

O conjunto de dados utilizado é o **Video Game Sales Dataset** disponível no Kaggle.
    

In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.style.use("seaborn-v0_8-whitegrid")
sns.set_palette("pastel")

# Importar o dataset
df = pd.read_csv("/kaggle/input/videogamesales/vgsales.csv")
df.head()
    

In [None]:

df.info()
df.describe()
df.isnull().sum()
    


### Observações
- Verifique quais colunas têm valores ausentes (ex: Year, Publisher).  
- Decida se vai preencher, remover ou ignorar esses dados.  
- Entenda o formato dos dados antes de limpá-los.
    

In [None]:

df = df.dropna()
df["Year"] = df["Year"].astype(int)

df = df.rename(columns={
    "Name": "Game",
    "Platform": "Console",
    "Year": "Ano",
    "Genre": "Genero",
    "Global_Sales": "VendasGlobais"
})

df.head()
    


### Explicação
- Removemos valores nulos para evitar erros em análises.  
- Converti o tipo da coluna "Year" para inteiro.  
- Renomeei colunas para facilitar leitura em português.
    

In [None]:

plt.figure(figsize=(10,5))
top_genres = df.groupby("Genero")["VendasGlobais"].sum().sort_values(ascending=False).head(10)
sns.barplot(x=top_genres.values, y=top_genres.index)
plt.title("Top 10 Gêneros Mais Vendidos Globalmente")
plt.xlabel("Vendas (em milhões)")
plt.ylabel("Gênero")
plt.show()
    

In [None]:

sales_per_year = df.groupby("Ano")["VendasGlobais"].sum()
sales_per_year.plot(kind="line", figsize=(10,5), marker='o')
plt.title("Evolução das Vendas Globais de Jogos (por Ano)")
plt.xlabel("Ano de Lançamento")
plt.ylabel("Vendas (milhões)")
plt.show()
    

In [None]:

top_platforms = df.groupby("Console")["VendasGlobais"].sum().sort_values(ascending=False).head(10)
sns.barplot(x=top_platforms.values, y=top_platforms.index)
plt.title("Top 10 Plataformas Mais Vendidas")
plt.xlabel("Vendas Globais (milhões)")
plt.ylabel("Plataforma")
plt.show()
    


### Interpretação
- Gêneros de **Ação** e **Esporte** aparecem no topo.  
- O pico de vendas ocorreu entre 2008 e 2010.  
- **PS2**, **Wii** e **Xbox 360** foram as plataformas mais lucrativas.
    

In [None]:

if "Critic_Score" in df.columns:
    plt.figure(figsize=(8,5))
    sns.scatterplot(x="Critic_Score", y="VendasGlobais", data=df, alpha=0.6)
    plt.title("Correlação entre Nota Crítica e Vendas Globais")
    plt.xlabel("Nota Crítica")
    plt.ylabel("Vendas Globais (milhões)")
    plt.show()
    


Observa-se uma tendência de que jogos com notas mais altas têm maiores vendas,  
mas o sucesso comercial nem sempre depende apenas da crítica.
    


## 🧩 Conclusões

- Os gêneros **Ação** e **Esporte** lideram as vendas globais.  
- O período entre **2008 e 2010** foi o auge da indústria.  
- **PlayStation 2** foi a plataforma mais lucrativa de todos os tempos.

## 🔮 Próximos Passos

- Atualizar o dataset com jogos mais recentes (pós-2020).  
- Analisar vendas regionais e influência de marketing.  
- Aplicar machine learning para prever sucesso de novos lançamentos.
    


## 🌐 Publicação

1. Publique o notebook no **Kaggle** como público.  
2. Baixe o arquivo `.ipynb` e envie para o **GitHub**.  
3. No `README.md` do repositório, adicione:

```markdown
# 🎮 Análise de Dados de Jogos de Videogame
Este repositório contém uma análise exploratória feita com Python e pandas no Kaggle.
```

Pronto! Seu portfólio de Análise de Dados está completo e profissional 🚀
    