# Análisis de datos y estadísticas

#### Importación de módulos a utilziar

In [1]:
import os
import pandas as pd
from matplotlib import pyplot as plt
import time
from collections import Counter

#### Apertura del archivo a procesar

In [17]:
csv = "informacion_partidas.csv"
path = os.path.join(os.getcwd(),'..','csv',csv)

try:
    df=pd.read_csv(path)

except FileNotFoundError:
    print(f"No se encuentra el dataset a procesar {csv}")

#### Top 10 de palabras que se encuentran primero de todas las partidas

### Módulo para gráficos de torta

In [10]:
def make_pie_chart(data: pd.Series, labels: list, title:str) -> plt.pie:
    """
    funcion 'make_pie_chart'

    Def:
        Dados ciertos parámetros, devuelve un gráfico de tortas con sus respectivas proporciones, leyendas, porcentajes y título.
    Args:
        data (pd.Series): contiene una Serie a la que se le aplicó el criterio .groupby.size()
        labels (list): es una lista que contiene las claves del parámetro 'data'
        title (str): es una cadena que será el título del gráfico
    """
    plt.pie(data, autopct='%1.1f%%', shadow=True)
    plt.legend(labels)
    plt.title(title)
    plt.axis('equal')
    plt.tight_layout()
    plt.show()
    return plt.show()

#### Gráfico que muestre el porcentaje de partidas por estado.

In [None]:
# uso de matplotlib e informacion_partidas.csv//columna[2] "Estado"

#ok, finalizada, error, -, timeout, cancelada, partidas sin evento fin

estado = df[(df["Estado"] != "ok")]
estado = estado[(estado["Estado"] != "-")]
estado = estado.groupby(["Estado"]).size()
etiquetas = [x for x in estado.keys()]
make_pie_chart(estado, etiquetas, "Partias por estado")


#### Gráfico que muestre el porcentaje de partidas finalizadas según género

In [None]:
# uso de matplotlib e informacion_partidas.csv//columna[8] "Genero"
#mismo procesamiento que gráfico anterior, cambia columna

genero = df[df["Evento"] == "fin"]
genero = genero.groupby(["Genero"]).size()
etiquetas = [x for x in genero.keys()]
make_pie_chart(genero, etiquetas, "Partidas finalizadas por género")

#### Gráfico que muestre el procentaje de partidas finalizadas según nivel

In [None]:
# uso de matplotlib e informacion_partidas.csv//columna[7] "Nivel"
#mismo procesamiento que gráfico anterior, cambia columna

dificultad = df[df["Estado"] == "finalizada"]
dificultad = dificultad.groupby(["Nivel"]).size()
etiquetas = [x for x in dificultad.keys()]
make_pie_chart (dificultad, etiquetas, "Partidas finalizadas por nivel")

#### Duración total de la partida

In [None]:
# no estaría entendiendo si acá deberíamos implementar un gráfico, una suma total de todas las duraciones o cómo hacer este procesamiento.

#### Tiempo de la respuesta exitosa más rápida

In [None]:
# debería el informar máximo de (timestamp de estado "OK" - timestamp de registro anterior) 

#### Promedio de tiempo de respuesta para respuestas exitosas

In [14]:
# sum(columna estado "OK") / len (columna estado)
cant_total = df["Estado"]
c = Counter(cant_total)
cant_ok = c["ok"]
total = sum(c.values())

print ("El promedio de tiempo de respuesta para respuestas exitosas es:", "{:.2f}".format((cant_ok/total)*100), "%")

El promedio de tiempo de respuesta para respuestas exitosas es: 20.00 %


#### Promedio de tiempo de partida general

In [None]:
# variable que suma (timestamp(estado inicio_partida) - timestamp(estado fin)) y divide por cant de partidas [sobre esto último deberíamos consultar si se considerará también las canceladas]

#### Porcentaje de aciertos por usuarie

In [None]:
aciertos = df[df["Estado"] == "ok"]
aciertos = aciertos.groupby(["Usuarie"]).size()
etiquetas = [x for x in aciertos.keys()]
make_pie_chart(aciertos, etiquetas, "Porcentaje de aciertos por usuarie")

#### Cantidad de tarjetas para las que el usuarie no dio respuesta

In [19]:
#revisar -> entiendo que acá no se debería procesar el timeout sino cuando event == "-PASAR-"

sin_respuesta = df[df["Estado"] == "timeout"]
sin_respuesta = sin_respuesta["Estado"]
sin_respuesta = Counter(sin_respuesta)
print ("La cantidad de tarjetas para las que el usuarie no dio respuesta fue:", sin_respuesta["timeout"])

La cantidad de tarjetas para las que el usuarie no dio respuesta fue: 3


#### Cantidad de tarjetas en las que el usuarie dio una respuesta errónea

## Opcional

#### Gráfico que muestre el porcentaje de partidas que se juegan para cada dia de la semana

#### Promedio de tiempo de partidas finalizadas por nivel

#### Porcentaje de palabras encontradas en las partidas "timeout"