<h1>Vendas de Jogos de Videogames na História</h1>

Prática de Data Science utilizando, como base, o tutorial de <b> <a href='https://paulovasconcellos.com.br/como-criar-seu-primeiro-projeto-de-data-science-parte-2-de-2-cb9a2fe05eff'>Paulo Vasconcellos</a></b> para analisar os dados do dataset de Vendas de Jogos de Videogames

In [None]:
#Importando as bibliotecas necessárias para a análise
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
plt.style.use('ggplot')

In [None]:
#Importando o dataset
dataset = pd.read_csv("../input/vgsales/vgsales.csv")

In [None]:
#Renomeando as Colunas
dataset.columns = ['Ranking', 'Nome', 'Plataforma', 'Ano', 'Gênero', 'Editora', 'Vendas América do Norte', 'Vendas EUA', 'Vendas Japão', 'Outras Vendas', 'Vendas Globais']

In [None]:
#Carregando as 10 primeiras linhas do Dataframe
dataset.head(10)

In [None]:
#Procurando dados nulos na coluna 'Ano'
dataset[dataset['Ano'].isnull()].head()

In [None]:
#Quantificando os jogos por gênero
dataset['Gênero'].value_counts()

In [None]:
#Cruzando os dados de Plataforma e Gênero em uma nova tabela
tabelacruzada = pd.crosstab(dataset['Plataforma'],dataset['Gênero'])

In [None]:
#Conferindo a nova tabela
tabelacruzada.head()

In [None]:
#Acrecentando a Coluna total no final da nova tabela e somando os valores em linha
tabelacruzada['Total'] = tabelacruzada.sum(axis=1)

In [None]:
#Organizando os dados da última coluna de forma decrescente
tabelacruzada = tabelacruzada.sort_values('Total', ascending=False)

In [None]:
#Criando uma nova tabela com valores da coluna 'Total' superiores a 1000
top10=tabelacruzada[tabelacruzada['Total']>1000]

In [None]:
top10.head()

In [None]:
#Gerando um gráfico 'heatmap' dos dados da tabela 'Top10'
sns.set(font_scale=1)
plt.figure(figsize=(18,9))
sns.heatmap(top10,annot=True, vmax=top10.loc[:'PS', :'Strategy'].values.max(), vmin=top10.loc[:, :'Strategy'].values.min(), fmt='d')
plt.xlabel('Gênero')
plt.ylabel('Plataforma')
plt.show()

In [None]:
#definindo o objeto de estudo PS2
PS2 = dataset[dataset[u'Plataforma']=='PS2']

In [None]:
#Gerando um gráfico com a quantidade de jogos de cada gênero feito para o PS2
PS2[u'Gênero'].value_counts().plot.bar(color='green')

In [None]:
#Top5 dos jogos de esportes vendidos nos EUA (PS2)
PS2.loc[(PS2['Gênero']=='Sports') & (PS2['Vendas EUA']>2)].head(5)