# Obtener información de un CSV - Análisis de MOTO GP

Para obtener información de un CSV, primero hay que poder manejar archivos

Para esto se utiliza la función `open` la cual permite abrir archivos y gracias al uso de contextos con `with` de python podemos hacer uso del contexto de la función y abrir lo en diferentes modos:
* `r`: para modo lectura
* `w`: para modo escritura
* `a`: para modo añadir
* `b`: para modo escritura de bytes
* `+`: para actualizar (lectura y escritura)

La apertura de fichero nos proporciona un descriptor al cual se le puede pedir datos usando el método `read`, o `write`. [Dcoumentación de open](https://docs.python.org/3/library/functions.html#open)

In [None]:
with open("Clasificacion-actual.csv", "r") as archivo:
    # Lee el contenido del archivo
    contenido = archivo.read()
    # Realiza operaciones con el contenido, por ejemplo, imprimirlo
    print(contenido)


Como se puede ver, la lecutra la hace directamente sobre el fichero en tipo texto por defecto

Para poder analizar el contenido deberíamos de ir partiendo cada línea separando por el separador utilizado (en nuestro caso `,`) e ir analizando según la cabecera y según cada línea

In [None]:
from pprint import pprint

idx = 0
contenido = []
cabecera = []
with open("Clasificacion-actual.csv", "r") as archivo:
    for linea in archivo.readlines():
        linea_analizada = linea.split(',')
        contenido.append(linea_analizada)

pprint(contenido)

## Uso de csv

En el build-in podemos encontrar la librería CSV la cual es de gran ayuda para fichero separados por cualquier delimitador [documentación de CSV](https://docs.python.org/3/library/csv.html)

La librería `csv` permite trabajar con ficheros de datos en formato CSV, o valores separados por delimitadores (no solo comas).

Principalmente tiene 4 funciones:
* **csv.reader(descriptor, delimiter=',')**: permite crear un lector de ficheros CSV (se lee haciendo `row in lector`).

```python
import csv
with open('eggs.csv', newline='') as csvfile:
     spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
     for row in spamreader:
         print(', '.join(row))
Spam, Spam, Spam, Spam, Spam, Baked Beans
Spam, Lovely Spam, Wonderful Spam
```

* **csv.write(descriptor, delimiter=',')**: permite crear un escritor de ficheros CSV
* **csv.writerow(iter)**: permite guardar una línea como el iterador.

```python
import csv
with open('eggs.csv', 'w', newline='') as csvfile:
    spamwriter = csv.writer(csvfile, delimiter=' ',
                            quotechar='|', quoting=csv.QUOTE_MINIMAL)
    spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
    spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])
```

* **csv.DictReader(descriptor, fieldnames=None)**: permite leer información como diccionario definiendo las claves en fieldnames, sin fieldnames se usa la primera línea como claves del diccionario.

```python
import csv
with open('names.csv', newline='') as csvfile:
    reader = csv.DictReader(csvfile)
    for row in reader:
        print(row['first_name'], row['last_name'])

Eric Idle
John Cleese

print(row)
{'first_name': 'John', 'last_name': 'Cleese'}
```

* **csv.DictWriter(descriptor, fieldnames)**: permite escribir información como diccionarios definiendo las claves en fieldnames, sin fieldnames se usa la primera línea como claves del diccionario.

```python
with open('names.csv', 'w', newline='') as csvfile:
    fieldnames = ['first_name', 'last_name']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

    writer.writeheader()
    writer.writerow({'first_name': 'Baked', 'last_name': 'Beans'})
    writer.writerow({'first_name': 'Lovely', 'last_name': 'Spam'})
    writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})
```

Más info en: [csv](https://docs.python.org/es/3/library/csv.html)

In [None]:
import csv

with open("Clasificacion-actual.csv", "r", newline="") as archivo:
    lector_csv = csv.reader(archivo)
    for fila in lector_csv:
        # Cada fila es una lista de valores en el archivo CSV
        print(fila)

In [None]:
import csv

pilotos = []

with open("Clasificacion-actual.csv", "r", newline="") as archivo:
    lector_csv = csv.DictReader(archivo)
    for fila in lector_csv:
        fila['nombre'] = fila['nombre'].strip()
        pilotos.append(fila)
pilotos

## Ejercicio 1 

Definir una función que obtenga los nombres y las posiciones de los pilotos analizando el CSV (Clasificacion-actual.csv)

## Ejercicio 2

Analizar y obtener los datos de los pilotos en el archivo de "Clasificaciones por cada gran premio.csv"

## Ejercicio 3

Crear una función que con el nombre de un piloto devuelva un diccionario con los resultados del piloto en todos los grandes premios

## Ejercicio 4

Pintar los resultados de varios pilotos según los resultados usando las funciones de Gráficos en jupyter

In [None]:
import matplotlib.pyplot as plt

def pintar_grafico(datos_x, datos_y, colores, tooltips=None, title_x='Datos en el Eje X', title_y='Datos en el Eje Y', title='Gráfico Personalizado'):
    """
    Crea un gráfico personalizado con datos en el eje X y en el eje Y, colores personalizados y tooltips.

    :param datos_x: Un diccionario donde las claves son las etiquetas y los valores son listas de datos en el eje X.
    :param datos_y: Un diccionario donde las claves son las etiquetas y los valores son listas de datos en el eje Y.
    :param colores: Un diccionario que asigna colores a cada serie.
    :param tooltips: Un diccionario que asigna tooltips a cada punto de datos.
    """
    fig, ax = plt.subplots()

    for etiqueta in datos_x.keys():
        if etiqueta in colores:
            color = colores[etiqueta]
        else:
            color = 'blue'  # Color predeterminado si no se especifica

        if etiqueta in tooltips:
            texto_tooltip = tooltips[etiqueta]
        else:
            texto_tooltip = None

        ax.plot(datos_x[etiqueta], datos_y[etiqueta], label=etiqueta, color=color, marker='o', linestyle='-')

        if texto_tooltip:
            for x, y, tooltip in zip(datos_x[etiqueta], datos_y[etiqueta], texto_tooltip):
                ax.annotate(f'{tooltip}', (x, y), textcoords="offset points", xytext=(0, 10), ha='center')

    # Personalización del gráfico
    ax.set_xlabel(title_x)
    ax.set_ylabel(title_y)
    ax.set_title(title)
    #ax.set_xticklabels(ax.get_xticks(), rotation=45)
    ax.legend()
    plt.grid(True)
    plt.xticks(rotation=45)

    plt.show()

## Ejercicio 5

Obtener la media de puntos obtenidas por cada contructor (Honda, Ducati, KTM, etc)

## Ejercicio 6

Obtener la mediana de los puntos obtenidos según cada país (nacionalidad)

## Ejercicio 7

Crear una función que actualice los datos de la Clasificaciones por cada gran premio pasandole como parámetro los resultados de cada piloto (debe de dejar como '-' los pilotos que no hayan terminado o no tengan puntos de clasificación)

## Otros ejercicios

Desde el archivo guardado en CSV analizar la información
* Obtener medias
* Obtener percentiles
* Unir la información de la nacionalidad de cada piloto en un mismo CSV
* Agrupar por constructores
* Filtrar por países
* Actualizar el contenido de nuevos campeonatos e ir añadiendo en el CSV
* Que circuitos tienen más accidentes
* En qué circuitos destacan los españoles
* Que circuitos son mejores para Honda, o para KTM
* Influye la longitud del nombre en ser más ganador?
* Influye el número de vocales en que tengas mas o menos puntos?
* Obtener la lista de los pilotos de Italia
* Y ordenarlos por sus puntos
* Filtrar la lista por pilotos que corran con un constructor que tenga la letra a (mayuscula o minuscula), mostrando los nombres
* Actualizar CSV de clasificación actual y de cada campeonato
* Ejercicio pintar los top 5 pilotos de moto GP desde un archivo CSV
Sacar los top pilotos por páis
Sacar los top pilotos por constructores
Obtener los 3 pilotos con más podios
Sacar la suma de puntos por constructores
Sacar la media de triunfos por constructores
Actualizar las posiciones según la última carrera o una carrera futura
* Podríamos dar una distribución de cómo tiene que quedar cada jugador para poder ganar?
Podríamos saber qué jugadores ya es imposible que ganen?
Podríamos calcular el efecto "patria" comprobando si la media de los puntos aumenta al correr en su propio país? (por cada piloto)
Calcular las posiciones añadiendo la clasificación de un nuevo campeonato
