# Descripción del ejercicio:

#### Analisis de un DATASET CSV con al menos 20 preguntas y 20 gráficos (uno para cada pregunta). Realizar el Informe dentro de jupyter explicando con markdown el código

###### Se usa el dataset: https://www.kaggle.com/gregorut/videogamesales

Este conjunto de datos contiene una lista de videojuegos con ventas superiores a 100.000 copias. Fue generado por Scrapping de vgchartz.com.

Descripción de los campos:

* Rank - Ranking en ventas
* Name - Nombre
* Platform - Plataforma de lanzamiento
* Year - Año de lanzamiento
* Genre - Genero del juego
* Publisher - Publicador del juego
* NA_Sales - Ventas en Norte America (en millones)
* EU_Sales - Ventas en Europa (en millones)
* JP_Sales - Ventas en Japón (en millones)
* Other_Sales - Ventas en millones en el resto del mundo
* Global_Sales - Total de ventas global

Las preguntas a responderse son las siguientes:

1. ¿Cuáles son los 3 géneros que más venden a nivel mundial?
2. ¿Cuáles son los 3 juegos más vendidos por el publicador "Microsoft Game Studios"?
3. ¿Cuáles son las ventas por año y plataforma a nivel global?
4. ¿Cuáles son los 5 juegos más vendidos a nivel mundial entre el 2000 y 2005?
5. ¿Cuáles son los 5 juegos más vendidos a nivel mundial entre 1980 y 2000?
6. ¿Cuál es el publicador que más vende en promedio a nivel global?
7. ¿Cuál es el publicador que menos vende en promedio a nivel global?
8. ¿Cuántos juegos tiene la plataforma "Wii" con género "Role-Playing"?
9. ¿Cuántos juegos tiene la plataforma "NES" cuyo género sea "Platform"?
10. ¿Cuáles son los 3 juegos más actuales de la lista?
11. ¿Cuáles son los 3 juegos más antiguos de la lista?
12. ¿Cuáles son los 2 géneros que más publica "Activision"?
13. ¿Cuáles son lo 5 juegos más vendidos en Japón?
14. ¿Cuáles son lo 5 juegos menos vendidos en Japón (con venta mayor a 0)? 
15. ¿Cuáles son lo 5 juegos más vendidos en Norteamérica?
16. ¿Cuáles son lo 5 juegos menos vendidos en Norteamérica (con venta mayor a 0)? 
17. ¿Cuáles son lo 5 juegos más vendidos en Europa?
18. ¿Cuáles son lo 5 juegos menos vendidos en Europa (con venta mayor a 0)? 
19. ¿Cuáles son lo 5 juegos más vendidos en otros lugares?
20. ¿Cuáles son lo 5 juegos menos vendidos en otros lugares (con venta mayor a 0)? 

In [4]:
import pandas as pd
import plotly.express as px

In [138]:
df = pd.read_csv("./vgsales.csv")
df.head()

Unnamed: 0,Rank,Name,Platform,Year,Genre,Publisher,NA_Sales,EU_Sales,JP_Sales,Other_Sales,Global_Sales
0,1,Wii Sports,Wii,2006.0,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74
1,2,Super Mario Bros.,NES,1985.0,Platform,Nintendo,29.08,3.58,6.81,0.77,40.24
2,3,Mario Kart Wii,Wii,2008.0,Racing,Nintendo,15.85,12.88,3.79,3.31,35.82
3,4,Wii Sports Resort,Wii,2009.0,Sports,Nintendo,15.75,11.01,3.28,2.96,33.0
4,5,Pokemon Red/Pokemon Blue,GB,1996.0,Role-Playing,Nintendo,11.27,8.89,10.22,1.0,31.37


### 1. ¿Cuáles son los 3 géneros que más venden a nivel mundial?

In [35]:
df_generos_ventas = df[['Genre', 'Global_Sales']]
print(df_generos_ventas.head())

df_generos_promedio_ventas = df_generos_ventas.groupby(['Genre']).mean()
df_top_3_generos_ventas_globales = df_generos_promedio_ventas.sort_values(by='Global_Sales', ascending=False).head(3)
print("RESPUESTA", df_top_3_generos_ventas_globales)

fig = px.bar(df_top_3_generos_ventas_globales, x=df_top_3_generos_ventas_globales.index, y='Global_Sales', color='Global_Sales', title='Top 3 géneros que más venden a nivel mundial')
fig.show()

          Genre  Global_Sales
0        Sports         82.74
1      Platform         40.24
2        Racing         35.82
3        Sports         33.00
4  Role-Playing         31.37
RESPUESTA               Global_Sales
Genre                     
Platform          0.938341
Shooter           0.791885
Role-Playing      0.623233


#### Los tres géneros que más dinero han generado desde 1980 son: Plataformas, de disparos y juegos de rol, llegando el de plataformas a generar casi 1 millón por juego en promedio en estos 40 años

### 2. ¿Cuáles son los 3 juegos más vendidos por el publicador "Microsoft Game Studios"?

In [34]:
df_ventas_microsoft = df.loc[df['Publisher'] == "Microsoft Game Studios", ['Name', 'Global_Sales']]
df_top_3_juegos_microsoft = df_ventas_microsoft.sort_values(by='Global_Sales', ascending=False).head(3)
print("RESPUESTA\n", df_top_3_juegos_microsoft.head())


fig = px.bar(df_top_3_juegos_microsoft, x='Global_Sales', y='Name', color='Global_Sales', orientation='h', title='Top 3 juegos más vendidos por el publicador "Microsoft Game Studios"')
fig.show()

RESPUESTA
                   Name  Global_Sales
15  Kinect Adventures!         21.82
43              Halo 3         12.14
62         Halo: Reach          9.88


#### Microsoft también tiene un punto en el mercado de videojuegos, aunque no los haya desarrollado. Los juegos más populares que tiene as su nombre son: Kinect Adventures, Halo:Reach y Halo 3

### 3. ¿Cuáles son las ventas por año y plataforma a nivel global?

In [50]:
df_promedios = df[['Year','Platform', 'Global_Sales']]
print(df_promedios.head())


fig = px.scatter(df_promedios, x="Year", y="Global_Sales", size="Global_Sales", color="Platform",
                 hover_name="Platform", log_x=True, size_max=60)
fig.show()


     Year Platform  Global_Sales
0  2006.0      Wii         82.74
1  1985.0      NES         40.24
2  2008.0      Wii         35.82
3  2009.0      Wii         33.00
4  1996.0       GB         31.37


#### Se rescata que en el 2006 el nintendo Wii alcanzó una gran popularidad obteniendo ganancias que se desmarcan de la competencia

### 4. ¿Cuáles son los 5 juegos más vendidos a nivel mundial entre el 2000 y 2005?

In [53]:
condicion_1 = df["Year"] >= 2000
condicion_2 = df["Year"] <= 2005
df_ventas_en_anios_2000_2005 = df.loc[condicion_1][condicion_2][['Name', 'Year', 'Global_Sales']].sort_values(by='Global_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_ventas_en_anios_2000_2005.head())


fig = px.pie(df_ventas_en_anios_2000_2005, values='Global_Sales', names='Name', title='Top 5 juegos más vendidos a nivel mundial entre el 2000 y 2005')
fig.show()


RESPUESTA
                                             Name    Year  Global_Sales
10                                    Nintendogs  2005.0         24.76
11                                 Mario Kart DS  2005.0         23.42
17                 Grand Theft Auto: San Andreas  2004.0         20.81
19  Brain Age: Train Your Brain in Minutes a Day  2005.0         20.22
24                   Grand Theft Auto: Vice City  2002.0         16.15



Boolean Series key will be reindexed to match DataFrame index.



### 5. ¿Cuáles son los juegos más vendidos a nivel mundial entre 1980 y 2000?

In [55]:
condicion_1 = df["Year"] >= 1980
condicion_2 = df["Year"] <= 2000
df_ventas_en_anios_1980_2000 = df.loc[condicion_1][condicion_2][['Name', 'Year', 'Global_Sales']].sort_values(by='Global_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_ventas_en_anios_1980_2000.head())


fig = px.pie(df_ventas_en_anios_1980_2000, values='Global_Sales', names='Name', title='Top 5 juegos más vendidos a nivel mundial entre el 1980 y 2000')
fig.show()

RESPUESTA
                            Name    Year  Global_Sales
1             Super Mario Bros.  1985.0         40.24
4      Pokemon Red/Pokemon Blue  1996.0         31.37
5                        Tetris  1989.0         30.26
9                     Duck Hunt  1984.0         28.31
12  Pokemon Gold/Pokemon Silver  1999.0         23.10



Boolean Series key will be reindexed to match DataFrame index.



### 6. ¿Cuál es el publicador que más vende en promedio a nivel global?

In [60]:

df_best_publishers = df.loc[:, ['Publisher', 'Global_Sales']].groupby(['Publisher']).mean().sort_values(by='Global_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_best_publishers.head(1))

fig = px.bar(df_best_publishers, x=df_best_publishers.index, y='Global_Sales', color='Global_Sales', title='Publicador que más vende en promedio a nivel global')
fig.show()

RESPUESTA
            Global_Sales
Publisher              
Palcom             4.17


### 7. ¿Cuál es el publicador que menos vende en promedio a nivel global?

In [61]:

df_worst_publishers = df.loc[:, ['Publisher', 'Global_Sales']].groupby(['Publisher']).mean().sort_values(by='Global_Sales', ascending=True).head(5)
print("RESPUESTA\n", df_worst_publishers.head(1))


fig = px.bar(df_worst_publishers, x=df_worst_publishers.index, y='Global_Sales', color='Global_Sales', title='Publicador que menos vende en promedio a nivel global')
fig.show()

RESPUESTA
                    Global_Sales
Publisher                      
UIG Entertainment          0.01


### 8. ¿Cuántos juegos tiene la plataforma "Wii" con género "Role-Playing"?

In [108]:
condicion = df['Platform'] == "Wii"

df_wii_role = df.loc[condicion].loc[:, ['Genre']].groupby(['Genre']).agg({'Genre': ['count']})

mydict = {
    "Generos": list(df_wii_role.index.values),
    "Cantidad": df_wii_role.loc[ :, [('Genre','count')]].values.reshape(1, len(df_wii_role.index.values)).tolist()[0]
}

df_dict = pd.DataFrame.from_dict(mydict)

print("RESPUESTA\n", df_dict.loc[df_dict["Generos"] == "Role-Playing"])


fig = px.bar(df_dict, x="Cantidad", y='Generos', orientation='h', title='Cantidad de juegos del Wii por género')
fig.show()

RESPUESTA
         Generos  Cantidad
7  Role-Playing        35


### 9. ¿Cuántos juegos tiene la plataforma "NES" cuyo género sea "Platform"?

In [115]:
condicion = df['Platform'] == "NES"

df_nes_role = df.loc[condicion].loc[:, ['Genre']].groupby(['Genre']).agg({'Genre': ['count']})


mydict = {
    "Generos": list(df_nes_role.index.values),
    "Cantidad": df_nes_role.loc[ :, [('Genre','count')]].values.reshape(1, len(df_nes_role.index.values)).tolist()[0]
}
print(mydict)

df_dict = pd.DataFrame.from_dict(mydict)

print("RESPUESTA\n", df_dict.loc[df_dict["Generos"] == "Platform"])


fig = px.bar(df_dict, x="Cantidad", y='Generos', orientation='h', title='Cantidad de juegos del NES por género')
fig.show()

{'Generos': ['Action', 'Adventure', 'Fighting', 'Misc', 'Platform', 'Puzzle', 'Racing', 'Role-Playing', 'Shooter', 'Sports'], 'Cantidad': [13, 1, 4, 2, 28, 14, 4, 11, 7, 14]}
RESPUESTA
     Generos  Cantidad
4  Platform        28


### 10. ¿Cuáles son los 3 juegos más actuales de la lista?

In [118]:
df_actuales = df.sort_values(by='Year', ascending=False).head(4)
print("RESPUESTA\n", df_actuales)


fig = px.pie(df_actuales, values='Global_Sales', names='Name', title='Los 3 juegos más actuales de la lista')
fig.show()

RESPUESTA
         Rank                                              Name Platform  \
5957    5959                            Imagine: Makeup Artist       DS   
14390  14393  Phantasy Star Online 2 Episode 4: Deluxe Package      PS4   
16241  16244  Phantasy Star Online 2 Episode 4: Deluxe Package      PSV   
16438  16441                  Brothers Conflict: Precious Baby      PSV   

         Year         Genre     Publisher  NA_Sales  EU_Sales  JP_Sales  \
5957   2020.0    Simulation       Ubisoft      0.27       0.0      0.00   
14390  2017.0  Role-Playing          Sega      0.00       0.0      0.03   
16241  2017.0  Role-Playing          Sega      0.00       0.0      0.01   
16438  2017.0        Action  Idea Factory      0.00       0.0      0.01   

       Other_Sales  Global_Sales  
5957          0.02          0.29  
14390         0.00          0.03  
16241         0.00          0.01  
16438         0.00          0.01  


### 11. ¿Cuáles son los 3 juegos más antiguos de la lista?

In [119]:
df_actuales = df.sort_values(by='Year', ascending=True).head(3)
print("RESPUESTA\n", df_actuales)


fig = px.pie(df_actuales, values='Global_Sales', names='Name', title='Los 3 juegos más actuales de la lista')
fig.show()

RESPUESTA
       Rank      Name Platform    Year     Genre   Publisher  NA_Sales  \
6896  6898  Checkers     2600  1980.0      Misc       Atari      0.22   
2669  2671    Boxing     2600  1980.0  Fighting  Activision      0.72   
5366  5368   Freeway     2600  1980.0    Action  Activision      0.32   

      EU_Sales  JP_Sales  Other_Sales  Global_Sales  
6896      0.01       0.0         0.00          0.24  
2669      0.04       0.0         0.01          0.77  
5366      0.02       0.0         0.00          0.34  


### 12. ¿Cuáles son los 2 géneros que más publica "Activision"?

In [122]:
condicion = df['Publisher'] == "Activision"
df_generos_activision = df.loc[condicion].loc[:, ['Genre', 'Global_Sales']].groupby('Genre').agg({'Genre': ['count']}).sort_values(by=('Genre', 'count'), ascending=False).head(2)


mydict = {
    "Generos": list(df_generos_activision.index.values),
    "Cantidad": df_generos_activision.loc[ :, [('Genre','count')]].values.reshape(1, len(df_generos_activision.index.values)).tolist()[0]
}
print(mydict)

df_dict = pd.DataFrame.from_dict(mydict)

print("RESPUESTA\n", df_generos_activision)


fig = px.bar(df_dict, x="Cantidad", y='Generos', orientation='h', title='Los 2 géneros que más publica "Activision"')
fig.show()


{'Generos': ['Action', 'Shooter'], 'Cantidad': [310, 159]}
RESPUESTA
         Genre
        count
Genre        
Action    310
Shooter   159


### 13. ¿Cuáles son lo 5 juegos más vendidos en Japón?

In [123]:
df_mas_vendidos = df.loc[:, ['Name', 'JP_Sales']].sort_values(by='JP_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_mas_vendidos)


fig = px.pie(df_mas_vendidos, values='JP_Sales', names='Name', title='Los 5 juegos más vendidos en Japón')
fig.show()

RESPUESTA
                              Name  JP_Sales
4        Pokemon Red/Pokemon Blue     10.22
12    Pokemon Gold/Pokemon Silver      7.20
1               Super Mario Bros.      6.81
6           New Super Mario Bros.      6.50
20  Pokemon Diamond/Pokemon Pearl      6.04


### 14. ¿Cuáles son lo 5 juegos menos vendidos en Japón (con venta mayor a 0)? 

In [126]:
df_menos_vendidos = df.loc[df['JP_Sales'] > 0].loc[:, ['Name', 'JP_Sales']].sort_values(by='JP_Sales', ascending=True).head(5)
print("RESPUESTA\n", df_menos_vendidos)


fig = px.bar(df_menos_vendidos, x='Name', y='JP_Sales', color='JP_Sales', title='Los menos vendidos en Japón')
fig.show()

RESPUESTA
                                                     Name  JP_Sales
16590  Eiyuu Densetsu: Sora no Kiseki Material Collec...      0.01
8017                        The Walking Dead: Season One      0.01
7978                             Tekken Tag Tournament 2      0.01
929                                    LittleBigPlanet 3      0.01
7878                               Shadows of the Damned      0.01


### 15. ¿Cuáles son lo 5 juegos más vendidos en Norteamérica?

In [127]:
df_mas_vendidos = df.loc[:, ['Name', 'NA_Sales']].sort_values(by='NA_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_mas_vendidos)


fig = px.pie(df_mas_vendidos, values='NA_Sales', names='Name', title='Los 5 juegos más vendidos en Norteamérica')
fig.show()

RESPUESTA
                 Name  NA_Sales
0         Wii Sports     41.49
1  Super Mario Bros.     29.08
9          Duck Hunt     26.93
5             Tetris     23.20
2     Mario Kart Wii     15.85


### 16. ¿Cuáles son lo 5 juegos menos vendidos en Norteamérica (con venta mayor a 0)? 

In [128]:
df_menos_vendidos = df.loc[df['NA_Sales'] > 0].loc[:, ['Name', 'NA_Sales']].sort_values(by='NA_Sales', ascending=True).head(5)
print("RESPUESTA\n", df_menos_vendidos)


fig = px.bar(df_menos_vendidos, x='Name', y='NA_Sales', color='NA_Sales', title='Los menos vendidos en Norteamérica')
fig.show()

RESPUESTA
                                 Name  NA_Sales
16597               Spirits & Spells      0.01
14786                        Poy Poy      0.01
14804                Nanotek Warrior      0.01
14806  Cake Mania: Baker's Challenge      0.01
14808    Super Monkey Ball Adventure      0.01


### 17. ¿Cuáles son lo 5 juegos más vendidos en Europa?

In [129]:
df_mas_vendidos = df.loc[:, ['Name', 'EU_Sales']].sort_values(by='EU_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_mas_vendidos)


fig = px.pie(df_mas_vendidos, values='EU_Sales', names='Name', title='Los 5 juegos más vendidos en Europa')
fig.show()

RESPUESTA
                   Name  EU_Sales
0           Wii Sports     29.02
2       Mario Kart Wii     12.88
3    Wii Sports Resort     11.01
10          Nintendogs     11.00
16  Grand Theft Auto V      9.27


### 18. ¿Cuáles son lo 5 juegos menos vendidos en Europa (con venta mayor a 0)? 

In [130]:
df_menos_vendidos = df.loc[df['EU_Sales'] > 0].loc[:, ['Name', 'EU_Sales']].sort_values(by='EU_Sales', ascending=True).head(5)
print("RESPUESTA\n", df_menos_vendidos)


fig = px.bar(df_menos_vendidos, x='Name', y='EU_Sales', color='EU_Sales', title='Los menos vendidos en Europa')
fig.show()

RESPUESTA
                                              Name  EU_Sales
6234                               FIFA Soccer 07      0.01
11251             Guilty Gear XX Accent Core Plus      0.01
11262                    Diva Girls: Divas on Ice      0.01
11272                             Don King Boxing      0.01
11287  SafeCracker: The Ultimate Puzzle Adventure      0.01


### 19. ¿Cuáles son lo 5 juegos más vendidos en otros lugares?

In [131]:
df_mas_vendidos = df.loc[:, ['Name', 'Other_Sales']].sort_values(by='Other_Sales', ascending=False).head(5)
print("RESPUESTA\n", df_mas_vendidos)


fig = px.pie(df_mas_vendidos, values='Other_Sales', names='Name', title='Los 5 juegos más vendidos en el resto del mundo')
fig.show()



RESPUESTA
                              Name  Other_Sales
17  Grand Theft Auto: San Andreas        10.57
0                      Wii Sports         8.46
47                 Gran Turismo 4         7.53
16             Grand Theft Auto V         4.14
2                  Mario Kart Wii         3.31


### 20. ¿Cuáles son lo 5 juegos menos vendidos en otros lugares (con venta mayor a 0)? 

In [132]:
df_menos_vendidos = df.loc[df['Other_Sales'] > 0].loc[:, ['Name', 'Other_Sales']].sort_values(by='Other_Sales', ascending=True).head(5)
print("RESPUESTA\n", df_menos_vendidos)


fig = px.bar(df_menos_vendidos, x='Name', y='Other_Sales', color='Other_Sales', title='Los menos vendidos en el resto del mundo')
fig.show()

RESPUESTA
                                               Name  Other_Sales
15288  Military History: Commander - Europe at War         0.01
2631     Secret Agent Barbie: Royal Jewels Mission         0.01
8738                          All-Pro Football 2K8         0.01
8735                        Space Invaders Extreme         0.01
8734                      Chaotic: Shadow Warriors         0.01
