<a href="https://colab.research.google.com/github/Dominichelli/Video-Game-Sales/blob/main/Vendas_Video_Game.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Análise de Dados: Vendas de Jogos de Videogame**

Este notebook apresenta alguns estudos a respeito de dados encontrados no dataset Video Game Sales postado no Kaggle, que contém informações relevantes a respeito de vendas de jogos de videogames durante determinado período.

In [None]:
import pandas as pd
import seaborn as sns
import plotly.express as px
import matplotlib.pyplot as plt

##**1. Tratando dados**

In [1]:
# Install dependencies as needed:
# pip install kagglehub[pandas-datasets]
import kagglehub
from kagglehub import KaggleDatasetAdapter

file_path = "vgsales.csv"

# Load the latest version
df = kagglehub.load_dataset(
  KaggleDatasetAdapter.PANDAS,
  "gregorut/videogamesales",
  file_path,

)

df.head()

  df = kagglehub.load_dataset(


Using Colab cache for faster access to the 'videogamesales' dataset.


Unnamed: 0,Rank,Name,Platform,Year,Genre,Publisher,NA_Sales,EU_Sales,JP_Sales,Other_Sales,Global_Sales
0,1,Wii Sports,Wii,2006.0,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74
1,2,Super Mario Bros.,NES,1985.0,Platform,Nintendo,29.08,3.58,6.81,0.77,40.24
2,3,Mario Kart Wii,Wii,2008.0,Racing,Nintendo,15.85,12.88,3.79,3.31,35.82
3,4,Wii Sports Resort,Wii,2009.0,Sports,Nintendo,15.75,11.01,3.28,2.96,33.0
4,5,Pokemon Red/Pokemon Blue,GB,1996.0,Role-Playing,Nintendo,11.27,8.89,10.22,1.0,31.37


**Explicando as Colunas**

* Rank: Posição do jogo no ranking de vendas;
* Name: Título do jogo;
* Platform: Console em que o jogo foi lançado;
* Year: Ano de lançamento daquele título;
* Genre: Gênero do jogo;
* Publisher: Empresa responsável pela publicação do jogo;
* NA_Sales: Vendas na América do Norte, em milhões de dólares;
* EU_Sales: Vendas na Europa, em milhões de dólares;
* JP_Sales: Vendas no Japão, em milhões de dólares;
* Other_Sales: Vendas no em outras regiões além de Japão, Europa e América do Norte;
* Global_Sales: Total de vendas mundiais.

In [None]:
#Renomeando as colunas para PT-BR
renomeando_colunas = {
    'Name': 'nome',
    'Platform': 'console',
    'Year': 'ano',
    'Genre': 'genero',
    'Publisher': 'publicadora',
    'NA_Sales': 'vendas_america_latina',
    'EU_Sales': 'vendas_europa',
    'JP_Sales': 'vendas_japao',
    'Other_Sales': 'vendas_outras_regioes',
    'Global_Sales': 'vendas_globais'
}

df = df.rename(columns=renomeando_colunas)
display(df.columns)

Index(['Rank', 'nome', 'console', 'ano', 'genero', 'publicadora',
       'vendas_america_latina', 'vendas_europa', 'vendas_japao',
       'vendas_outras_regioes', 'vendas_globais'],
      dtype='object')

In [None]:
#Verificando se existe valores nulos

df.isnull().sum()

Unnamed: 0,0
Rank,0
nome,0
console,0
ano,271
genero,0
publicadora,58
vendas_america_latina,0
vendas_europa,0
vendas_japao,0
vendas_outras_regioes,0


In [None]:
#Tratando dados nulos

df.fillna({'ano':'Desconhecido'}, inplace=True)
df.fillna({'publicadora':'Desconhecido'}, inplace=True)

df.isnull().sum()

Unnamed: 0,0
Rank,0
nome,0
console,0
ano,0
genero,0
publicadora,0
vendas_america_latina,0
vendas_europa,0
vendas_japao,0
vendas_outras_regioes,0


In [None]:
df = df.drop_duplicates()

In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 16598 entries, 0 to 16597
Data columns (total 11 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   Rank                   16598 non-null  int64  
 1   nome                   16598 non-null  object 
 2   console                16598 non-null  object 
 3   ano                    16598 non-null  object 
 4   genero                 16598 non-null  object 
 5   publicadora            16598 non-null  object 
 6   vendas_america_latina  16598 non-null  float64
 7   vendas_europa          16598 non-null  float64
 8   vendas_japao           16598 non-null  float64
 9   vendas_outras_regioes  16598 non-null  float64
 10  vendas_globais         16598 non-null  float64
dtypes: float64(5), int64(1), object(5)
memory usage: 1.4+ MB


In [None]:
df["ano"] = pd.to_numeric(df["ano"], errors="coerce")
df["ano"] = df["ano"].astype("Int64")
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 16598 entries, 0 to 16597
Data columns (total 11 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   Rank                   16598 non-null  int64  
 1   nome                   16598 non-null  object 
 2   console                16598 non-null  object 
 3   ano                    16327 non-null  Int64  
 4   genero                 16598 non-null  object 
 5   publicadora            16598 non-null  object 
 6   vendas_america_latina  16598 non-null  float64
 7   vendas_europa          16598 non-null  float64
 8   vendas_japao           16598 non-null  float64
 9   vendas_outras_regioes  16598 non-null  float64
 10  vendas_globais         16598 non-null  float64
dtypes: Int64(1), float64(5), int64(1), object(4)
memory usage: 1.4+ MB


In [None]:
df.head(10)

Unnamed: 0,Rank,nome,console,ano,genero,publicadora,vendas_america_latina,vendas_europa,vendas_japao,vendas_outras_regioes,vendas_globais
0,1,Wii Sports,Wii,2006,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74
1,2,Super Mario Bros.,NES,1985,Platform,Nintendo,29.08,3.58,6.81,0.77,40.24
2,3,Mario Kart Wii,Wii,2008,Racing,Nintendo,15.85,12.88,3.79,3.31,35.82
3,4,Wii Sports Resort,Wii,2009,Sports,Nintendo,15.75,11.01,3.28,2.96,33.0
4,5,Pokemon Red/Pokemon Blue,GB,1996,Role-Playing,Nintendo,11.27,8.89,10.22,1.0,31.37
5,6,Tetris,GB,1989,Puzzle,Nintendo,23.2,2.26,4.22,0.58,30.26
6,7,New Super Mario Bros.,DS,2006,Platform,Nintendo,11.38,9.23,6.5,2.9,30.01
7,8,Wii Play,Wii,2006,Misc,Nintendo,14.03,9.2,2.93,2.85,29.02
8,9,New Super Mario Bros. Wii,Wii,2009,Platform,Nintendo,14.59,7.06,4.7,2.26,28.62
9,10,Duck Hunt,NES,1984,Shooter,Nintendo,26.93,0.63,0.28,0.47,28.31


##**2.Analises**

###**2.1 Qual o padrão de vendas mundial ao decorrer dos anos?**


In [None]:
df.groupby('ano')['ano'].count()

Unnamed: 0_level_0,ano
ano,Unnamed: 1_level_1
1980,9
1981,46
1982,36
1983,17
1984,14
1985,14
1986,21
1987,16
1988,15
1989,17


Todos os lançamentos após 2016 apresentam dados faltantes.

Nesse caso iremos excluir esses lançamentos do nosso dataset

In [None]:
df_anos_drop = df[df['ano'] >= 2017].index
df = df.drop(df_anos_drop)

df['ano'].unique()

<IntegerArray>
[2006, 1985, 2008, 2009, 1996, 1989, 1984, 2005, 1999, 2007, 2010, 2013, 2004,
 1990, 1988, 2002, 2001, 2011, 1998, 2015, 2012, 2014, 1992, 1997, 1993, 1994,
 1982, 2003, 1986, 2000, <NA>, 1995, 2016, 1991, 1981, 1987, 1980, 1983]
Length: 38, dtype: Int64

In [None]:
top_generos=(df.groupby(['ano','genero'])['vendas_globais'].sum().reset_index())
top_generos

Unnamed: 0,ano,genero,vendas_globais
0,1980,Action,0.34
1,1980,Fighting,0.77
2,1980,Misc,2.71
3,1980,Shooter,7.07
4,1980,Sports,0.49
...,...,...,...
381,2016,Role-Playing,6.76
382,2016,Shooter,18.22
383,2016,Simulation,0.39
384,2016,Sports,14.60


In [None]:
idx = top_generos.groupby('ano')['vendas_globais'].idxmax()
top_generos = top_generos.loc[idx].sort_values('ano')

# Gráfico de barras
fig = px.bar(top_generos,
             x='ano',
             y='vendas_globais',
             color='genero',
             text='genero',
             title='Gênero de jogos mais vendido por ano',
             labels={'ano': 'Ano', 'vendas_globais': 'Vendas Globais (Milhões)', 'genero': 'Gênero'},
             width=1100,
             height=600)

fig.update_traces(textposition='outside')
fig.update_layout(xaxis=dict(dtick=1))

fig.show()

**Observação:** Entre 2001 e 2013 ocorreram os maiores picos de vendas, com domínio do gênero Action. Mas 2006 se destaca pela diversidade de gêneros, tendo ficado em alto o gênero Sports. Por isso a análise seguirá com esses anos




In [None]:
df_2000 = df[(df['ano']>=2000) & (df['ano']<2014)]
top_jogos = (df_2000.groupby(['ano', 'nome', 'genero'])['vendas_globais'].sum().reset_index())
top_jogos

Unnamed: 0,ano,nome,genero,vendas_globais
0,2000,007 Racing,Racing,0.53
1,2000,007: The World is not Enough,Action,2.47
2,2000,A-Train 6,Strategy,0.06
3,2000,ATV: Quad Power Racing,Racing,1.04
4,2000,Action Bass,Action,1.14
...,...,...,...,...
9309,2013,Yumi's Odd Odyssey,Platform,0.03
9310,2013,Zillions of Enemy X: Zetsukai no Crusade,Role-Playing,0.02
9311,2013,Zoo Tycoon (2013),Simulation,0.44
9312,2013,Zumba Fitness: World Party,Misc,0.50


In [None]:
idx_2000 = top_jogos.groupby('ano')['vendas_globais'].idxmax()
top_jogos = top_jogos.loc[idx_2000].sort_values('ano')

# Gráfico de barras
fig = px.bar(top_jogos,
             x='ano',
             y='vendas_globais',
             color='nome',
             text='nome',
             title='Nome do jogo mais vendido por ano',
             labels={'ano': 'Ano', 'vendas_globais': 'Vendas Globais (Milhões)', 'nome': 'Nome', 'genero':'Gênero'},
             hover_data=['genero'],
             width=1200,
             height=700)

fig.update_traces(textposition='outside')
fig.update_layout(xaxis=dict(dtick=1))

fig.show()

**Observação:** Nota-se que, em 2006 o jogo Wii Sports foi campeão de vendas, e o título mais vendido entre os anos 2000 a 2016         
**Surge a questão:** Será que o sucesso de Wii Sports foi o único responsável pela pico das vendas de jogos do gênero Sports em 2006?

Alem disso, observa-se que, na maioria dos anos explorados, o jogo campeão de vendas, não pertence gênero campeão de vendas do ano que se refere.

Com base nisso, a análise seguirá explorando a relação entre o jogo campeão de vendas e o gênero predominante em cada ano, buscando entender melhor esse comportamento.

In [None]:
#Iremos separar 2 grupos, para conseguirmos vizualizar melhor

#De 2000 a 2006
df_2006 = df_2000[(df_2000['ano']>=2000) & (df_2000['ano']<2007)]
top_2006 = df_2006.groupby('ano').apply(lambda x: x).reset_index(drop=True)

#De 2007 a 2013
df_2013 = df_2000[(df_2000['ano']>=2007) & (df_2000['ano']<=2013)]
top_2013 = df_2013.groupby('ano').apply(lambda x: x).reset_index(drop=True)







In [None]:
fig = px.bar(top_2006,
             x='genero',
             y='vendas_globais',
             color='genero',
             facet_col='ano',
             facet_col_wrap=4,
             title='Top 100 jogos mais vendidos por ano (2000 a 2006)',
             labels={'ano': 'Ano', 'vendas_globais': 'Vendas Globais (Milhões)', 'nome': 'Nome', 'genero':'Gênero'},
             hover_data=['nome'],
             width=1200,
             height=1000)
fig.show()





In [None]:
fig = px.bar(top_2013,
             x='genero',
             y='vendas_globais',
             color='genero',
             facet_col='ano',
             facet_col_wrap=4,
             title='Top 100 jogos mais vendidos por ano (2007 a 2013)',
             labels={'ano': 'Ano', 'vendas_globais': 'Vendas Globais (Milhões)', 'nome': 'Nome', 'genero':'Gênero'},
             hover_data=['nome'],
             width=1200,
             height=1000)
fig.show()

**Observação**: No ano de 2006, o jogo Wii Sports não foi o único responsável pelo pico de vendas de jogos do genero Sports, mas foi o jogo que teve maior peso.

Durante todo o período analisado, esse foi o único caso em que um único jogo superou as vendas somadas de todos os demais títulos de outros gêneros.

###**2.2 Quais são as 5 Publicadora com mais vendas?**

In [None]:
df.head()

Unnamed: 0,Rank,nome,console,ano,genero,publicadora,vendas_america_latina,vendas_europa,vendas_japao,vendas_outras_regioes,vendas_globais
0,1,Wii Sports,Wii,2006,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74
1,2,Super Mario Bros.,NES,1985,Platform,Nintendo,29.08,3.58,6.81,0.77,40.24
2,3,Mario Kart Wii,Wii,2008,Racing,Nintendo,15.85,12.88,3.79,3.31,35.82
3,4,Wii Sports Resort,Wii,2009,Sports,Nintendo,15.75,11.01,3.28,2.96,33.0
4,5,Pokemon Red/Pokemon Blue,GB,1996,Role-Playing,Nintendo,11.27,8.89,10.22,1.0,31.37


Primeiramente, vamos filtrar os 5 Consoles com mais vendas:

In [None]:
df_publicadora_total = df.groupby(['publicadora'])['vendas_globais'].sum().reset_index()
df_top5_publicadoras = df_publicadora_total.nlargest(5, 'vendas_globais')
display(df_top5_publicadoras)

Unnamed: 0,publicadora,vendas_globais
360,Nintendo,1786.56
139,Electronic Arts,1110.32
21,Activision,727.46
457,Sony Computer Entertainment,607.5
526,Ubisoft,474.43


In [None]:
df_publicadora= df[df['publicadora'].isin(['Nintendo', 'Electronic Arts', 'Activision', 'Sony Computer Entertainment', 'Ubisoft'])]

fig = px.line(
    df_publicadora.groupby(['ano','publicadora'])['vendas_globais'].sum().reset_index(),
    x='ano',
    y='vendas_globais',
    color='publicadora',
    markers=True
)

fig.show()

**Observação:** Nota-se que, a Nintendo lidera as vendas globais em diversos anos.  


Qual foi o motivo disso?

A Nintendo publicou mais jogos que as outras publicadoras, resultando no aumento de vendas? Ou os seus lançamentos atingiram popularidade maior que o lançamento de outras empresas?

In [None]:
#Quantidade de jogos publicados por ano, por cada publicadora

df_qtd_jogos = (df_publicadora.groupby(['ano', 'publicadora']).agg(qtd_jogos=('vendas_globais','size'), vendas_globais=('vendas_globais', 'sum')).reset_index())

fig = px.line(
    df_qtd_jogos,
    x='ano',
    y='qtd_jogos',
    color='publicadora',
    markers=True
)

fig.show()
df_qtd_jogos

Unnamed: 0,ano,publicadora,qtd_jogos,vendas_globais
0,1980,Activision,5,3.02
1,1981,Activision,6,8.50
2,1982,Activision,4,1.86
3,1983,Activision,3,1.94
4,1983,Nintendo,6,10.96
...,...,...,...,...
130,2016,Activision,14,3.67
131,2016,Electronic Arts,20,12.25
132,2016,Nintendo,10,3.47
133,2016,Sony Computer Entertainment,5,6.56


**Observação**: É possível notar que, no período analisado, a Nintendo não foi a maior publicadora de jogos desde 1995, ou seja, o volume de jogos não explica na liderança, o que explica é o alto desempenho por jogo, indicando maior popularidade dos títulos publicados.

Mas, não vamos parar por aqui. Entre 2002 a 2004, e EA liderou as vendas globais e a quantidade de jogos publicados.

Para entender se esse resultado da EA ocorreu por volume ou popularidade dos jogos, vamos aprofundar a análise e verificar o desempenho médio dos títulos publicados nesse período.

In [None]:
df_qtd_jogos['media'] = df_qtd_jogos['vendas_globais'] / df_qtd_jogos['qtd_jogos']

fig = px.line(
    df_qtd_jogos,
    x='ano',
    y='media',
    color='publicadora',
    markers=True
)

fig.show()
df_qtd_jogos

Unnamed: 0,ano,publicadora,qtd_jogos,vendas_globais,media
0,1980,Activision,5,3.02,0.604000
1,1981,Activision,6,8.50,1.416667
2,1982,Activision,4,1.86,0.465000
3,1983,Activision,3,1.94,0.646667
4,1983,Nintendo,6,10.96,1.826667
...,...,...,...,...,...
130,2016,Activision,14,3.67,0.262143
131,2016,Electronic Arts,20,12.25,0.612500
132,2016,Nintendo,10,3.47,0.347000
133,2016,Sony Computer Entertainment,5,6.56,1.312000


**Observação:** Observando os resultados, fica evidente que a Electronic Arts liderou as vendas globais no período analisado principalmente pelo alto volume de jogos publicados, e não pelo desempenho individual de cada título.
Quando analisamos apenas a soma total das vendas, a EA realmente aparece à frente — porém, ao introduzir a métrica de média de vendas por jogo, o cenário muda: sua performance por título é significativamente inferior à das demais publicadoras.

Isso indica que o forte resultado da EA não está associado à popularidade excepcional de seus lançamentos, mas sim à estratégia de publicar um número maior de jogos.
Ou seja, a liderança da EA foi impulsionada por quantidade, não por qualidade média de vendas.

In [None]:
#df_publicadora_genero = df_publicadora.groupby(['publicadora', 'genero'])['vendas_globais'].sum().reset_index()
#df_publicadora

# 2.3 Vendas em Diferentes Regiões

In [None]:
df.head()

Unnamed: 0,Rank,nome,console,ano,genero,publicadora,vendas_america_latina,vendas_europa,vendas_japao,vendas_outras_regioes,vendas_globais
0,1,Wii Sports,Wii,2006,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74
1,2,Super Mario Bros.,NES,1985,Platform,Nintendo,29.08,3.58,6.81,0.77,40.24
2,3,Mario Kart Wii,Wii,2008,Racing,Nintendo,15.85,12.88,3.79,3.31,35.82
3,4,Wii Sports Resort,Wii,2009,Sports,Nintendo,15.75,11.01,3.28,2.96,33.0
4,5,Pokemon Red/Pokemon Blue,GB,1996,Role-Playing,Nintendo,11.27,8.89,10.22,1.0,31.37


Será que as vendas foram diferentes em cada região apontada no gráfico?

In [None]:
df_gen_regiao = (df.groupby(['genero', 'ano']).agg(vendas_america_latina=('vendas_america_latina', 'sum'), vendas_europa=('vendas_europa', 'sum'), vendas_japao=('vendas_japao', 'sum'), vendas_outras_regioes=('vendas_outras_regioes', 'sum'), vendas_globais=('vendas_globais', 'sum')).reset_index())

df_gen_regiao

Unnamed: 0,genero,ano,vendas_america_latina,vendas_europa,vendas_japao,vendas_outras_regioes,vendas_globais
0,Action,1980,0.32,0.02,0.00,0.00,0.34
1,Action,1981,13.86,0.81,0.00,0.12,14.84
2,Action,1982,6.07,0.38,0.00,0.05,6.52
3,Action,1983,2.67,0.17,0.00,0.02,2.86
4,Action,1984,0.80,0.19,0.83,0.03,1.85
...,...,...,...,...,...,...,...
381,Strategy,2012,0.94,0.99,1.11,0.29,3.33
382,Strategy,2013,2.39,2.47,0.82,0.64,6.33
383,Strategy,2014,0.16,0.22,0.55,0.04,0.99
384,Strategy,2015,0.57,0.98,0.15,0.12,1.82


In [None]:
fig = px.imshow(
    df_gen_regiao.pivot_table(
        index='genero',
        columns='ano',
        values='vendas_america_latina'
    ),
    aspect='auto',
    color_continuous_scale='Viridis',
    title='Gêneros por ano - América do Latina'
)
fig.show()


In [None]:
df_genero_misc = df[df['genero'] == 'Misc']
df_genero_misc

Unnamed: 0,Rank,nome,console,ano,genero,publicadora,vendas_america_latina,vendas_europa,vendas_japao,vendas_outras_regioes,vendas_globais
7,8,Wii Play,Wii,2006,Misc,Nintendo,14.03,9.20,2.93,2.85,29.02
15,16,Kinect Adventures!,X360,2010,Misc,Microsoft Game Studios,14.97,4.94,0.24,1.67,21.82
19,20,Brain Age: Train Your Brain in Minutes a Day,DS,2005,Misc,Nintendo,4.75,9.26,4.16,2.05,20.22
60,61,Just Dance 3,Wii,2011,Misc,Ubisoft,6.05,3.15,0.00,1.07,10.26
68,69,Just Dance 2,Wii,2010,Misc,Ubisoft,5.84,2.89,0.01,0.78,9.52
...,...,...,...,...,...,...,...,...,...,...,...
16516,16519,DJ Max Technika Tune,PSV,2012,Misc,CyberFront,0.00,0.00,0.01,0.00,0.01
16519,16522,Bakumatsu Rock: Ultra Soul,PSP,2014,Misc,Marvelous Interactive,0.00,0.00,0.01,0.00,0.01
16523,16526,Style Book: Cinnamoroll,DS,2006,Misc,Namco Bandai Games,0.00,0.00,0.01,0.00,0.01
16536,16539,Patrician IV: Gold Edition,PC,2011,Misc,Kalypso Media,0.00,0.01,0.00,0.00,0.01


In [None]:
fig = px.imshow(
    df_gen_regiao.pivot_table(
        index='genero',
        columns='ano',
        values='vendas_europa'
    ),
    aspect='auto',
    color_continuous_scale='Viridis',
    title='Gêneros por ano - Europa'
)
fig.show()


In [None]:
fig = px.imshow(
    df_gen_regiao.pivot_table(
        index='genero',
        columns='ano',
        values='vendas_japao'
    ),
    aspect='auto',
    color_continuous_scale='Viridis',
    title='Gêneros por ano - Japão'
)
fig.show()

In [None]:
df_genero_rp = df[df['genero'] == 'Role-Playing']
df_genero_rp

Unnamed: 0,Rank,nome,console,ano,genero,publicadora,vendas_america_latina,vendas_europa,vendas_japao,vendas_outras_regioes,vendas_globais
4,5,Pokemon Red/Pokemon Blue,GB,1996,Role-Playing,Nintendo,11.27,8.89,10.22,1.00,31.37
12,13,Pokemon Gold/Pokemon Silver,GB,1999,Role-Playing,Nintendo,9.00,6.18,7.20,0.71,23.10
20,21,Pokemon Diamond/Pokemon Pearl,DS,2006,Role-Playing,Nintendo,6.42,4.52,6.04,1.37,18.36
25,26,Pokemon Ruby/Pokemon Sapphire,GBA,2002,Role-Playing,Nintendo,6.06,3.90,5.38,0.50,15.85
26,27,Pokemon Black/Pokemon White,DS,2010,Role-Playing,Nintendo,5.57,3.28,5.65,0.82,15.32
...,...,...,...,...,...,...,...,...,...,...,...
16520,16523,Tengai Makyo: Dai Yon no Mokushiroku,PSP,2006,Role-Playing,Hudson Soft,0.00,0.00,0.01,0.00,0.01
16525,16528,Blazer Drive,DS,2008,Role-Playing,Sega,0.00,0.00,0.01,0.00,0.01
16553,16556,Bound By Flame,X360,2014,Role-Playing,Desconhecido,0.00,0.01,0.00,0.00,0.01
16556,16559,Super Robot Taisen: Original Generation,GBA,2002,Role-Playing,Banpresto,0.01,0.00,0.00,0.00,0.01


**Observação :** O gênero mais vendido da America Latina foi: **Action**

O gênero mais vendido na Europa foi: **Action**

O gênero mais vendido no Japão foi: **Role-Playing**

Vamos análisar como esses foi a venda desses 2 gêneros, nas 3 localidades

**Gênero Action**

In [None]:
df_action = df_gen_regiao[df_gen_regiao['genero'] == 'Action']

fig = px.line (
    df_action,
    x='ano',
    y=['vendas_america_latina', 'vendas_europa', 'vendas_japao', 'vendas_outras_regioes'],
    title='Vendas de Jogos do Gênero Action por Região',
    markers=True,
)

fig.show()

**Gênero Role-Playing**

In [None]:
df_role_playing = df_gen_regiao[df_gen_regiao['genero'] == 'Role-Playing']

fig = px.line (
    df_role_playing,
    x='ano',
    y=['vendas_america_latina', 'vendas_europa', 'vendas_japao', 'vendas_outras_regioes'],
    title='Vendas de Jogos do Gênero Role-Playing por Região',
    markers=True,
)

fig.show()

**Observação** No período de 2002 a 2012, a America Latina comprou mais jogos do gênero Role-Playing que o Japão.

Porque isso ocorreu, sendo que o este gênero não foi um destaque de vendas na America Latina, mas foi no Japão?

In [None]:
participacao = (
    df.groupby('genero')[['vendas_america_latina', 'vendas_japao']]
    .sum()
    .assign(
        pct_na=lambda x: (x['vendas_america_latina'] / x['vendas_america_latina'].sum()) * 100,
        pct_jp=lambda x: (x['vendas_japao'] / x['vendas_japao'].sum()) * 100
    )
    .loc[['Role-Playing']]
)

participacao


Unnamed: 0_level_0,vendas_america_latina,vendas_japao,pct_na,pct_jp
genero,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Role-Playing,327.28,352.27,7.450577,27.287234


**Observação** O gênero Role-playing representa 7,45% das vendas de jogos na America Latina e 27,28% das vendas no Japão

Ao analisar o período entre 2002 e 2012, é possível notar que, em números absolutos, o gênero Role-Playing vendeu mais na América do que no Japão. No entanto, isso não significa que o gênero é mais popular no mercado americano.

A diferença ocorre principalmente porque a América possui um mercado consumidor muito maior, o que naturalmente eleva o volume total de vendas. Quando observamos a participação proporcional do gênero em cada região, o Japão continua apresentando uma afinidade muito maior com jogos de RPG.