# Bibliotecas e base de dados

In [132]:
import pandas as pd
import plotly.graph_objects as go

In [133]:
# carregar o dataset
df = pd.read_csv('vendas_de_jogos.csv', encoding='1252', sep=';', header=0,
                 names=('rank', 'name', 'platform', 'year', 'genre', 'publisher', 'na_sales', 'eu_sales', 'jp_sales', 'other_sales', 'global_sales'))

# Pré-processamento

In [134]:
# remover qualquer linha que contenha qualquer valor nulo
df.dropna(inplace=True)

In [135]:
# categorizar as vendas dos jogos por gêneros
action_game_sales = df[df['genre'] == 'Action']
sports_game_sales = df[df['genre'] == 'Sports']
shooter_game_sales = df[df['genre'] == 'Shooter']
adventure_game_sales = df[df['genre'] == 'Adventure']
role_game_sales = df[df['genre'] == 'Role-Playing']
simulation_game_sales = df[df['genre'] == 'Simulation']
strategy_game_sales = df[df['genre'] == 'Strategy']
platform_game_sales = df[df['genre'] == 'Platform']
race_game_sales = df[df['genre'] == 'Racing']
fight_game_sales = df[df['genre'] == 'Fighting']
puzzle_game_sales = df[df['genre'] == 'Puzzle']
misc_game_sales = df[df['genre'] == 'Misc']

# Descobertas

### Gênero

In [136]:
fig = go.Figure(
    data=[
          go.Histogram(x=df['genre'], marker_color='#48186a'),
    ],
    layout=go.Layout(title='Contagem de jogos por gênero', xaxis=dict(categoryorder='max descending'), paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que a maior quantidade de jogos são do gênero Ação, seguido pelo gênero Esportes.

In [137]:
fig = go.Figure(
    data=[
          go.Bar(x=df.groupby('genre')['global_sales'].sum().index,
                 y=df.groupby('genre')['global_sales'].sum().values,
                 name='Vendas globais', marker_color='#48186a'),
          go.Bar(x=df.groupby('genre')['na_sales'].sum().index,
                 y=df.groupby('genre')['na_sales'].sum().values,
                 name='Vendas na América do Norte', marker_color='#33638d'),
          go.Bar(x=df.groupby('genre')['eu_sales'].sum().index,
                 y=df.groupby('genre')['eu_sales'].sum().values,
                 name='Vendas da Europa', marker_color='#28ae80'),
          go.Bar(x=df.groupby('genre')['jp_sales'].sum().index,
                 y=df.groupby('genre')['jp_sales'].sum().values,
                 name='Vendas do Japão', marker_color='#5ec962'),
          go.Bar(x=df.groupby('genre')['other_sales'].sum().index,
                 y=df.groupby('genre')['other_sales'].sum().values,
                 name='Vendas de outros países', marker_color='#fde725'),
    ],
    layout=go.Layout(title='Vendas de jogos por gênero (em milhões de dólares)', xaxis=dict(categoryorder='max descending'), paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que o gênero mais vendido globalmente é de Ação, seguido de Esportes. Se diferenciando do padrão em outros países, no Japão há uma preferência maior para jogos do gênero RPG, vendo até mais do que jogos do gênero Ação e Esportes.

### Plataforma

In [138]:
fig = go.Figure(
    data=[
          go.Histogram(x=action_game_sales['platform'], name='Ação', marker_color='#440154'),
          go.Histogram(x=sports_game_sales['platform'], name='Esportes', marker_color='#48186a'),
          go.Histogram(x=shooter_game_sales['platform'], name='FPS', marker_color='#424086'),
          go.Histogram(x=adventure_game_sales['platform'], name='Aventura', marker_color='#33638d'),
          go.Histogram(x=role_game_sales['platform'], name='RPG', marker_color='#2c728e'),
          go.Histogram(x=simulation_game_sales['platform'], name='Simulação', marker_color='#26828e'),
          go.Histogram(x=strategy_game_sales['platform'], name='Estratégia', marker_color='#1fa088'),
          go.Histogram(x=platform_game_sales['platform'], name='Plataforma', marker_color='#28ae80'),
          go.Histogram(x=race_game_sales['platform'], name='Corrida', marker_color='#3fbc73'),
          go.Histogram(x=fight_game_sales['platform'], name='Luta', marker_color='#5ec962'),
          go.Histogram(x=puzzle_game_sales['platform'], name='Quebra-cabeça', marker_color='#addc30'),
          go.Histogram(x=misc_game_sales['platform'], name='Diverso', marker_color='#fde725'),
    ],
    layout=go.Layout(title='Contagem de jogos por plataforma, subdividido por gênero', barmode='stack', xaxis=dict(categoryorder='sum descending'), paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que as plataformas Nintendo DS e PS2 possuem a maior quantidade de jogos. Enquanto a plataforma PS2 possui mais jogos do gênero Esportes, com 391 jogos, a Nintendo DS possui mais do gênero Diverso, com 389 jogos.

In [139]:
fig = go.Figure(
    data=[
          go.Bar(x=df.groupby('platform')['global_sales'].sum().index,
                 y=df.groupby('platform')['global_sales'].sum().values,
                 name='Vendas globais', marker_color='#48186a'),
          go.Bar(x=df.groupby('platform')['na_sales'].sum().index,
                 y=df.groupby('platform')['na_sales'].sum().values,
                 name='Vendas na América do Norte', marker_color='#33638d'),
          go.Bar(x=df.groupby('platform')['eu_sales'].sum().index,
                 y=df.groupby('platform')['eu_sales'].sum().values,
                 name='Vendas da Europa', marker_color='#28ae80'),
          go.Bar(x=df.groupby('platform')['jp_sales'].sum().index,
                 y=df.groupby('platform')['jp_sales'].sum().values,
                 name='Vendas do Japão', marker_color='#5ec962'),
          go.Bar(x=df.groupby('platform')['other_sales'].sum().index,
                 y=df.groupby('platform')['other_sales'].sum().values,
                 name='Vendas de outros países', marker_color='#fde725'),
    ],
    layout=go.Layout(title='Vendas de jogos por plataforma (em milhões de dólares)', xaxis=dict(categoryorder='max descending'), paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que a plataforma com mais jogos vendidos é o PS2, seguido de X360, PS3, Wii e Nintendo DS.

### Passagem de tempo

In [140]:
fig = go.Figure(
    data=[
          go.Histogram(x=action_game_sales['year'], name='Ação', marker_color='#440154'),
          go.Histogram(x=sports_game_sales['year'], name='Esportes', marker_color='#48186a'),
          go.Histogram(x=shooter_game_sales['year'], name='FPS', marker_color='#424086'),
          go.Histogram(x=adventure_game_sales['year'], name='Aventura', marker_color='#33638d'),
          go.Histogram(x=role_game_sales['year'], name='RPG', marker_color='#2c728e'),
          go.Histogram(x=simulation_game_sales['year'], name='Simulação', marker_color='#26828e'),
          go.Histogram(x=strategy_game_sales['year'], name='Estratégia', marker_color='#1fa088'),
          go.Histogram(x=platform_game_sales['year'], name='Plataforma', marker_color='#28ae80'),
          go.Histogram(x=race_game_sales['year'], name='Corrida', marker_color='#3fbc73'),
          go.Histogram(x=fight_game_sales['year'], name='Luta', marker_color='#5ec962'),
          go.Histogram(x=puzzle_game_sales['year'], name='Quebra-cabeça', marker_color='#addc30'),
          go.Histogram(x=misc_game_sales['year'], name='Diverso', marker_color='#fde725'),
    ],
    layout=go.Layout(title='Contagem de jogos por ano', barmode='stack', paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que houve um aumento gigantesco de vendas nos últimos anos, principalmente em jogos dos gêneros Ação, Esportes e Diverso.

In [141]:
fig = go.Figure(
    data=[
          go.Bar(x=df.groupby('year')['na_sales'].sum().index,
                 y=df.groupby('year')['na_sales'].sum().values,
                 name='Vendas na América do Norte', marker_color='#33638d'),
          go.Bar(x=df.groupby('year')['eu_sales'].sum().index,
                 y=df.groupby('year')['eu_sales'].sum().values,
                 name='Vendas da Europa', marker_color='#28ae80'),
          go.Bar(x=df.groupby('year')['jp_sales'].sum().index,
                 y=df.groupby('year')['jp_sales'].sum().values,
                 name='Vendas do Japão', marker_color='#5ec962'),
          go.Bar(x=df.groupby('year')['other_sales'].sum().index,
                 y=df.groupby('year')['other_sales'].sum().values,
                 name='Vendas de outros países', marker_color='#fde725'),
          # go.Bar(x=df.groupby('year')['global_sales'].sum().index,
          #        y=df.groupby('year')['global_sales'].sum().values,
          #        name='Vendas globais', marker_color='#48186a'),
    ],
    layout=go.Layout(title='Vendas de jogos por ano (em milhões de dólares)', barmode='stack', paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que as vendas, apesar de aumentarem bastante no mundo todo, tiveram um aumento desproporcional na América do Norte nos últimos anos.

### Gênero x Plataforma

In [142]:
fig = go.Figure(
    data=[
          go.Bar(x=puzzle_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=puzzle_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Quebra-cabeça', marker_color='#440154'),
          go.Bar(x=strategy_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=strategy_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Estratégia', marker_color='#48186a'),
          go.Bar(x=fight_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=fight_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Luta', marker_color='#424086'),
          go.Bar(x=simulation_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=simulation_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Simulação', marker_color='#33638d'),
          go.Bar(x=platform_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=platform_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Plataforma', marker_color='#2c728e'),
          go.Bar(x=race_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=race_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Corrida', marker_color='#26828e'),
          go.Bar(x=adventure_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=adventure_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Aventura', marker_color='#1fa088'),
          go.Bar(x=shooter_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=shooter_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='FPS', marker_color='#28ae80'),
          go.Bar(x=role_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=role_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='RPG', marker_color='#3fbc73'),
          go.Bar(x=misc_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=misc_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Diverso', marker_color='#5ec962'),
          go.Bar(x=sports_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=sports_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Esportes', marker_color='#addc30'),
          go.Bar(x=action_game_sales.groupby("platform")["global_sales"].sum().index,
                 y=action_game_sales.groupby("platform")["global_sales"].sum().values,
                 name='Ação', marker_color='#fde725'),
    ],
    layout=go.Layout(title='Total de vendas globais por plataforma, divididos por gênero (em milhões de dólares)', barmode='stack', xaxis=dict(categoryorder='sum descending'), paper_bgcolor='beige', plot_bgcolor='beige')
)
fig

Com o gráfico, conclui-se que a plataforma X360 possui o maior número de vendas de jogos do gênero FPS, enquanto a plataforma PS3 possui o maior número de vendas de jogos do gênero Ação.