In [2]:
import pandas as pd
import plotly.graph_objs as go
from plotly.offline import iplot

df = pd.read_csv("all_games.csv")
df

Unnamed: 0,name,platform,release_date,summary,meta_score,user_review
0,The Legend of Zelda: Ocarina of Time,Nintendo 64,"November 23, 1998","As a young boy, Link is tricked by Ganondorf, ...",99,9.1
1,Tony Hawk's Pro Skater 2,PlayStation,"September 20, 2000",As most major publishers' development efforts ...,98,7.4
2,Grand Theft Auto IV,PlayStation 3,"April 29, 2008",[Metacritic's 2008 PS3 Game of the Year; Also ...,98,7.7
3,SoulCalibur,Dreamcast,"September 8, 1999","This is a tale of souls and swords, transcendi...",98,8.4
4,Grand Theft Auto IV,Xbox 360,"April 29, 2008",[Metacritic's 2008 Xbox 360 Game of the Year; ...,98,7.9
...,...,...,...,...,...,...
18795,Fast & Furious: Showdown,Xbox 360,"May 21, 2013",Fast & Furious: Showdown takes some of the fra...,22,1.3
18796,Drake of the 99 Dragons,Xbox,"November 3, 2003",Drake is out for revenge in a supernatural Hon...,22,1.7
18797,Afro Samurai 2: Revenge of Kuma Volume One,PlayStation 4,"September 22, 2015","Head out on a journey of redemption, driven by...",21,2.9
18798,Infestation: Survivor Stories (The War Z),PC,"October 15, 2012","(Formerly known as ""The War Z"") It has been 5 ...",20,1.7


In [8]:
comp_counts = df["platform"].value_counts()

data = [go.Bar(
    x=comp_counts.index, 
    y=comp_counts.values,
    marker=dict(
        color=comp_counts.values,
        colorscale='Viridis',
        colorbar=dict(title='Número de juegos')
    )
)]

layout = go.Layout(title="Número de juegos por consola", xaxis=dict(title="Consola"), yaxis=dict(title="Número de juegos"))

fig = go.Figure(data=data, layout=layout)
iplot(fig)

In [17]:
# Se convierte la columna "user_review" del DataFrame "df" a valores numéricos. Los valores no numéricos se convierten en NaN.
df["user_review"] = pd.to_numeric(df["user_review"], errors='coerce')

# Se ordena el DataFrame "df" por la columna "user_review" en orden descendente (de mayor a menor) y se seleccionan los primeros 30 juegos.
df_top30 = df.sort_values("user_review", ascending=False).head(30)

# Se crea una lista con un objeto "Bar" de Plotly, que contendrá los datos y las opciones de visualización
data = [go.Bar(
    # El eje x muestra los nombres de los juegos del DataFrame "df_top30"
    x=df_top30["name"],
    # El eje y muestra las calificaciones de los juegos del DataFrame "df_top30"
    y=df_top30["user_review"],
    # Se configura la barra para que su color corresponda a la calificación de los juegos, utilizando la escala de color "YlOrRd"
    marker=dict(
        color=df_top30["user_review"],
        colorscale='YlOrRd',  # Escala de colores
        # Se agrega un colorbar para que la escala de colores esté etiquetada
        colorbar=dict(title='Calificación')
    )
)]

# Se crea un objeto "Layout" de Plotly, que contiene las opciones de diseño y de ejes del gráfico
layout = go.Layout(
    title="Los 30 mejores juegos",
    xaxis=dict(title="Juego"),
    yaxis=dict(title="Nota")
)

# Se crea un objeto "Figure" de Plotly, que contiene tanto los datos como las opciones de diseño
fig = go.Figure(data=data, layout=layout)

# Se muestra el gráfico utilizando la función "show" del objeto "Figure"
fig.show()

In [18]:
df_top500 = df.head(500)

# Contar el número de juegos por plataforma
platform_counts = df_top500["platform"].value_counts()

# Crear el gráfico de tarta
data = [go.Pie(
    labels=platform_counts.index,
    values=platform_counts.values,
    textinfo='percent',
)]

layout = go.Layout(title="Porcentaje de juegos por plataforma")

fig = go.Figure(data=data, layout=layout)
iplot(fig)

In [19]:
# Seleccionar los primeros 100 juegos
df_top100 = df.head(100)

# Crear el gráfico de dispersión con colores graduados
data = [go.Scatter(
    x=df_top100["release_date"],
    y=df_top100["name"],
    mode='markers',
    marker=dict(
        color=df_top100.index,
        colorscale='Blues',  # Escala de colores
        colorbar=dict(title='Fecha de lanzamiento')  # Título de la barra de colores
    ),
    text=df_top100["name"] + '<br>' + df_top100["release_date"]  # Texto con el nombre y la fecha de lanzamiento
)]

layout = go.Layout(
    title="Fechas de lanzamiento de los 100 primeros juegos",
    xaxis=dict(title="Fecha de lanzamiento"),
    yaxis=dict(title="Juego")
)

fig = go.Figure(data=data, layout=layout)
iplot(fig)

In [20]:

# Convertir los valores "tbd" en NaN
df["user_review"] = pd.to_numeric(df["user_review"], errors='coerce')

# Ordenar el DataFrame por "user_review" de mayor a menor y seleccionar los primeros 100 juegos
df_top100 = df.sort_values("user_review", ascending=False).head(100)

# Crear el gráfico 3D
trace = go.Scatter3d(
    x=df_top100["meta_score"],
    y=df_top100["user_review"],
    z=df_top100.index,
    mode="markers",
    marker=dict(
        size=8,
        color=df_top100["user_review"],
        colorscale="Viridis",
        opacity=0.8
    ),
    text=df_top100["name"],
    hoverinfo="text"
)

data = [trace]

layout = go.Layout(
    title="Los 100 mejores juegos",
    scene=dict(
        xaxis=dict(title="Puntuación Metacrítica"),
        yaxis=dict(title="Puntuación de Usuarios"),
        zaxis=dict(title="Juegos")
    )
)

fig = go.Figure(data=data, layout=layout)
iplot(fig)