In [None]:
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
import numpy as np
print("Setup Complete")

# Wczytanie i wyczyszczenie danych

In [None]:
# vgs - video game sales

vgs_filepath = "../input/videogamesales/vgsales.csv"
vgs_data = pd.read_csv(vgs_filepath)

## Opis zmiennych

* Rank - miejsce w rankingu ogólnym
* Name - nazwa gry
* Platform - platforma, na której gra została wydana (np. PC,PS4, itd.)
* Year - rok wydania
* Genre - gatunek
* Publisher - wydawca
* NA_Sales - sprzedaż w Ameryce Północnej (w mln)
* EU_Sales - sprzedaż w Europie (w mln)
* JP_Sales - sprzedaż w Japonii (w mln)
* Other_Sales - sprzedaż w pozostałej części świata (w mln)
* Global_Sales - całkowita sprzedaż (w mln)

In [None]:
vgs_data.head()

In [None]:
vgs_data.shape

In [None]:
vgs_data.info()

In [None]:
vgs_data.isnull().sum()

In [None]:
vgs_data = vgs_data.dropna()
vgs_data.info()

In [None]:
vgs_data = vgs_data.drop('Rank', axis=1)

In [None]:
vgs_data.Platform.value_counts()

In [None]:
vgs_data.Year.value_counts()

In [None]:
vgs_data.Genre.value_counts()

In [None]:
vgs_data.Publisher.value_counts().head(30)

# Szeregi czasowe

## Jak kształtowała się w czasie ogólna sprzedaż na 5 platformach, na których wydano największą liczbę gier?

In [None]:
# wyznaczam 5 platform z największą liczbą gier

vgs_data.Platform.value_counts().head(5)

In [None]:
x1 = vgs_data.groupby(['Platform', 'Year']).Global_Sales.sum()

plt.figure(figsize=(15,5))
plt.xlabel('Rok')
plt.ylabel('Sprzedaż (w mln)')
plt.title('Sprzedaż ogólna wg platform')

sns.lineplot(data=x1['DS'] , label='DS')
sns.lineplot(data=x1['PS2'] , label='PS2')
sns.lineplot(data=x1['PS3'] , label='PS3')
sns.lineplot(data=x1['Wii'] , label='Wii')
sns.lineplot(data=x1['X360'] , label='X360')

DS, czyli najstarsza platforma, największą popularność osiągnęła w latach 2005-2008. Jednak pierwszą platformą, na którą wydano i sprzedano ponad 200 gier było PS2. Wii osiągnęło duży, lecz nietrwający długo, sukces w latach 2006-2010. PS3 i Xbox 360 cieszyły się podobną popularnością w latach 2006-2015.

## Jak kształtowała się w czasie ogólna sprzedaż dla 5 największych wydawców?

In [None]:
# wyznaczam 5 wydawców z największa globalną sprzedażą

vgs_data.groupby('Publisher').Global_Sales.sum().sort_values(ascending=False).head(5)

In [None]:
x2 = vgs_data.groupby(['Publisher', 'Year']).Global_Sales.sum()

plt.figure(figsize=(15,5))
plt.xlabel('Rok')
plt.ylabel('Sprzedaż (w mln)')
plt.title('Sprzedaż ogólna wg wydawców')

sns.lineplot(data=x2['Nintendo'] , label='Nintendo')
sns.lineplot(data=x2['Electronic Arts'] , label='Electronic Arts')
sns.lineplot(data=x2['Activision'] , label='Activision')
sns.lineplot(data=x2['Sony Computer Entertainment'] , label='Sony Computer Entertainment')
sns.lineplot(data=x2['Ubisoft'] , label='Ubisoft')

Na powyższym wykresie łatwo zauważyć bardzo wysoką sprzedaż gier Nintendo - prawie co roku największą wśród wszystkich wydawców. Warto także zauważyć, że Electronic Arts od 2000 aż do 2012 roku utrzymywało się na 1. lub 2. miejscu pod względem sprzedanych gier.

## Jak kształtowała się w czasie ogólna sprzedaż poszczególnych gatunków gier?

In [None]:
genres = vgs_data.Genre.unique().tolist()
genres

In [None]:
x3 = vgs_data.groupby(['Genre', 'Year']).Global_Sales.sum()

plt.figure(figsize=(20,10))
plt.xlabel('Rok')
plt.ylabel('Sprzedaż (w mln)')
plt.title('Sprzedaż ogólna wg gatunków')

for i in range(0,12):
    sns.lineplot(data=x3[genres[i]] , label=genres[i])

In [None]:
x4 = vgs_data[vgs_data.Year >= 1995].groupby(['Genre', 'Year']).Global_Sales.sum()

plt.figure(figsize=(20,10))
plt.xlabel('Rok')
plt.ylabel('Sprzedaż (w mln)')
plt.title('Sprzedaż ogólna wg gatunków (od 1995 roku)')

for i in range(0,12):
    sns.lineplot(data=x4[genres[i]] , label=genres[i])

Na pierwszym wykresie możemy zauwazyć, że do roku około 1995 popularnymi gatunkami były strzelanki, gry platformowe i logiczne. 

Drugi wykres jest 'przybliżeniem' pierwszego - zaczyna się właśnie od 1995 roku, w którym coraz popularniejsze stawały się gry typu RPG. Później, od około 2001 najwięcej sprzedawało się gier akcji, a od 2005 także gier sportowych.

# Wykresy słupkowe

## Porównanie sprzedaży ogólnej wg platform

In [None]:
x5 = vgs_data.groupby('Platform').Global_Sales.sum()
x5

In [None]:
plt.figure(figsize=(15,10))

sns.barplot(x=x5.index, y=x5, ci=None)

plt.xlabel('Platforma')
plt.ylabel('Sprzedaż (w mln)')
plt.title('Sprzedaż ogólna wg platform')

Najwięcej gier sprzedano na PS2, Xbox 260, PS3, Wii oraz DS. Pozostałe platformy nie osiągnęły znaczącej popularności.

## Porównanie sprzedaży ogólnej wg gatunku

In [None]:
x6 = vgs_data.groupby('Genre').Global_Sales.sum()
x6

In [None]:
plt.figure(figsize=(15,10))

sns.barplot(x=x6.index, y=x6, ci=None)

plt.xlabel('Gatunek')
plt.ylabel('Sprzedaż (w mln)')
plt.title('Sprzedaż ogólna wg gatunków')

Największą popularnością cieszą się gry akcji, sportowe i strzelanki. Najmniej sprzedano gier strategicznych.

## Najpopularniejsze gry, platformy i wydawcy w poszczególnych regionach świata

### Ameryka Północna

In [None]:
# gry
x7 = vgs_data.sort_values(by='NA_Sales', ascending=False).head(3)
x7

In [None]:
# platformy
x8 = vgs_data.groupby('Platform')['NA_Sales'].sum().sort_values(ascending=False).head(3)
x8

In [None]:
# wydawcy
x9 = vgs_data.groupby('Publisher')['NA_Sales'].sum().sort_values(ascending=False).head(3)
x9

In [None]:
fig, ax = plt.subplots(1,3, gridspec_kw={'wspace': 0.4}, figsize=(17,5))

ax[0].set_title('Najpopularniejsze gry')
sns.barplot(x=x7.Name, y=x7.NA_Sales, ax=ax[0])
ax[0].set_xlabel('Gra')
ax[0].set_ylabel('Sprzedaż (mln)')

ax[1].set_title('Najpopularniejsze platformy')
sns.barplot(x=x8.index, y=x8, ax=ax[1])
ax[1].set_xlabel('Platforma')
ax[1].set_ylabel('Sprzedaż (mln)')

ax[2].set_title('Najpopularniejsi wydawcy')
sns.barplot(x=x9.index, y=x9, ax=ax[2])
ax[2].set_xlabel('Wydawca')
ax[2].set_ylabel('Sprzedaż (mln)')

fig.suptitle('Ameryka Północna', fontsize=30)
plt.subplots_adjust(top=0.75)
fig.show()


W Ameryce Północnej 
* najpopularniejszymi grami w historii są Wii Sports, Super Mario Bros. i Duck Hunt,
* najpopularniejszymi platformami - Xbox 360, PS2 i Wii,
* a najpopularniejszymi wydawcami - Nintendo, Electronic Arts i Activision.



### Europa

In [None]:
# gry
x10 = vgs_data.sort_values(by='EU_Sales', ascending=False).head(3)
x10

In [None]:
# platformy
x11 = vgs_data.groupby('Platform')['EU_Sales'].sum().sort_values(ascending=False).head(3)
x11

In [None]:
# wydawcy
x12 = vgs_data.groupby('Publisher')['EU_Sales'].sum().sort_values(ascending=False).head(3)
x12

In [None]:
fig, ax = plt.subplots(1,3, gridspec_kw={'wspace': 0.4}, figsize=(17,5))

ax[0].set_title('Najpopularniejsze gry')
sns.barplot(x=x10.Name, y=x10.EU_Sales, ax=ax[0])
ax[0].set_xlabel('Gra')
ax[0].set_ylabel('Sprzedaż (mln)')

ax[1].set_title('Najpopularniejsze platformy')
sns.barplot(x=x11.index, y=x11, ax=ax[1])
ax[1].set_xlabel('Platforma')
ax[1].set_ylabel('Sprzedaż (mln)')

ax[2].set_title('Najpopularniejsi wydawcy')
sns.barplot(x=x12.index, y=x12, ax=ax[2])
ax[2].set_xlabel('Wydawca')
ax[2].set_ylabel('Sprzedaż (mln)')

fig.suptitle('Europa', fontsize=30)
plt.subplots_adjust(top=0.75)
fig.show()

W Europie
* najpopularniejszymi grami w historii są Wii Sports, Mario Kart Wii i Wii Sports Resort,
* najpopularniejszymi platformami - PS3, PS2 i Xbox 360,
* a najpopularniejszymi wydawcami - Nintendo, Electronic Arts i Activision.

### Japonia

In [None]:
# gry
x13 = vgs_data.sort_values(by='JP_Sales', ascending=False).head(3)
x13

In [None]:
# platformy
x14 = vgs_data.groupby('Platform')['JP_Sales'].sum().sort_values(ascending=False).head(3)
x14

In [None]:
# wydawcy
x15 = vgs_data.groupby('Publisher')['JP_Sales'].sum().sort_values(ascending=False).head(3)
x15

In [None]:
fig, ax = plt.subplots(1,3, gridspec_kw={'wspace': 0.4}, figsize=(17,5))

ax[0].set_title('Najpopularniejsze gry')
sns.barplot(x=x13.Name, y=x13.JP_Sales, ax=ax[0])
ax[0].set_xlabel('Gra')
ax[0].set_ylabel('Sprzedaż (mln)')
ax[0].tick_params(rotation=90)

ax[1].set_title('Najpopularniejsze platformy')
sns.barplot(x=x14.index, y=x14, ax=ax[1])
ax[1].set_xlabel('Platforma')
ax[1].set_ylabel('Sprzedaż (mln)')


ax[2].set_title('Najpopularniejsi wydawcy')
sns.barplot(x=x15.index, y=x15, ax=ax[2])
ax[2].set_xlabel('Wydawca')
ax[2].set_ylabel('Sprzedaż (mln)')
ax[2].tick_params(rotation=90)

fig.suptitle('Japonia', fontsize=30)
plt.subplots_adjust(top=0.75)

fig.show()

W Japonii
* najpopularniejszymi grami w historii są Pokemon Red/Pokemon Blue, Pokemon Glod/Pokemon Silver i Super Mario Bros.,
* najpopularniejszymi platformami - DS, PS i PS2,
* a najpopularniejszymi wydawcami - Nintendo, Nanco Bandai Games i Konami Digital Entertainment.

# Heatmapa

### 10 największych wydawców i gatunki gier, czyli który wydawca w czym się specjalizuje?

In [None]:
# wyznaczam 10 wydawców z największa globalną sprzedażą

publishers = vgs_data.groupby('Publisher').Global_Sales.sum().sort_values(ascending=False).head(10).index.tolist()
publishers

In [None]:
x16 = pd.pivot_table(vgs_data[vgs_data.Publisher.isin(publishers)], index='Genre',
                    columns='Publisher', values='Name', aggfunc='count')
x16

In [None]:
plt.figure(figsize=(20,10))
sns.heatmap(data=x16, annot=True, fmt="d")

W grach sportowych specjalizuje się szczególnie Electronic Arts oraz Konami Digital Entertainment. Activision wydaje głównie gry akcji, podobnie jak Namco Bandai Games.