<a href="https://colab.research.google.com/github/PamelaMorsentti/PamelaMorsentti/blob/main/CaC_Practica_Pandas_y_PyPlot.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CaC - Practica Pandas y PyPlot
Mediante el formulario [Programando por un Sueño](https://forms.gle/CqKQScgSoUi6EkKm8) estuvimos encuestando votos y calificaciones para las actuaciones de los personajes de la pelicula "Sing".

Este formulario almacena los datos de la encuesta en la hoja ***Votacion*** de la planilla de calculo de Google [Programando por un Sueño (respuestas)](https://docs.google.com/spreadsheets/d/1ny8dP2nK_i5cmXn5Xr-l16PYntD9AaElml1R9zGnmEU)


## Importacion de datos desde la planilla de la encuesta
- Usamos el modulo Pandas y sus Dataframes
- Para leer la planilla gsheet de la encuesta la vamos a considerar un archivo CSV (valores separados por comas).
- Para formar la URL de lectura usamos el ***id de la planilla*** y el ***nombre de la hoja***

In [None]:
import pandas as pd

id_planilla = '1ny8dP2nK_i5cmXn5Xr-l16PYntD9AaElml1R9zGnmEU'
nombre_hoja = 'Votacion'
url = f'https://docs.google.com/spreadsheets/d/{id_planilla}/gviz/tq?tqx=out:csv&sheet={nombre_hoja}'

encuesta = pd.read_csv(url) # Leemos los datos de la planilla en un Dataframe

encuesta.tail() # Mostramos las ultimas 5 entradas del Dataframe

## 1º estadistica: ***Ranking de personajes por cantidad de votos***
Para eso vamos a contar los votos de cada personaje.
- Primero agrupamos los votos por Personaje y los contamos
- Luego ordenamos los totales de la Serie `votos` en forma descendente (para hacer un ranking)
- Finalmente mostramos el resultado

In [None]:
votos = encuesta.groupby('Personaje').Personaje.count().copy()
votos.sort_values(ascending=False, inplace=True)
print(votos.to_markdown())

### Grafico del ***Ranking de personajes por cantidad de votos***
- Usamos la libreria ***pyplot*** del modulo ***matplotlib*** para hacer graficos de barras.
- Definimos el tamaño del grafico
- Le ponemos un titulo al grafico
- Graficamos las barras
- Escribimos los datos sobre las barras
- Le ponemos una etiqueta al eje vertical
- Mostramos el grafico

In [None]:
import matplotlib.pyplot as plt
fig, gra = plt.subplots(figsize=(4,3)) # Devuelve una tupla (figura, (grafico0, grafico1, ...))
gra.set_title('Ranking de personajes por cantidad de votos')
gra.bar(votos.index, votos.values, width=0.8, color='green')
gra.bar_label(gra.containers[0], label_type='center')
gra.set_ylabel('Votos')

# plt.savefig('/content/figs/ranking_votos.png')
plt.show()


## 2º estadistica: ***Ranking de personajes por promedio de puntos***
Para eso vamos a promediar los puntajes de cada personaje.
- Primero agrupamos los puntajes por Personaje y los promediamos para cada categoria (este Dataframe nos va a servir para varias estadisticas)
- Mostramos el Dataframe `puntos`
- Luego hacemos el promedio por Personaje (filas) y obtenemos el promedio total de cada uno.
- Luego ordenamos los totales en forma descendente (para hacer un ranking)
- Mostramos la Serie de promedios de los Personajes `puntos_personajes`

In [None]:
puntos = encuesta.groupby('Personaje').mean(numeric_only=True).copy()
print(puntos.to_markdown())
print()

puntos_personajes = puntos.mean(axis=1).copy()
puntos_personajes.sort_values(ascending=False, inplace=True)
print(puntos_personajes.to_markdown())


### Grafico del ***Ranking de personajes por promedio de puntos***
- Usamos la libreria ***pyplot*** del modulo ***matplotlib*** para hacer graficos de barras.
- Definimos el tamaño del grafico
- Le ponemos un titulo al grafico
- Graficamos las barras
- Escribimos los datos sobre las barras
- Le ponemos una etiqueta al eje vertical
- Mostramos el grafico

In [None]:
fig, gra = plt.subplots(figsize=(4,3)) # Devuelve una tupla (figura, (grafico0, grafico1, ...))
gra.set_title('Ranking de personajes por promedio de puntos')
gra.bar(puntos_personajes.index, puntos_personajes.values, width=0.8, color='darkorange')
gra.set_ylabel('Puntos')
gra.bar_label(gra.containers[0], label_type='center', fmt='%0.2f')

plt.show()


## 3º estadistica: ***Ranking de categorias por promedio de puntos***
Para eso vamos a promediar los puntajes de cada categoria.
- Mostramos el Dataframe `puntos` (obtenido en el punto anterior)
- Luego hacemos el promedio por Categoria (columnas) y obtenemos el promedio total de cada una
- Luego ordenamos los totales en forma descendente (para hacer un ranking)
- Mostramos la Serie de promedios de las Categoriass `puntos_categorias`

In [None]:
print(puntos.to_markdown())
print()

puntos_categorias = puntos.mean(axis=0).copy()
puntos_categorias.sort_values(ascending=False, inplace=True)
print(puntos_categorias.to_markdown())

### Grafico del ***Ranking de categorias por promedio de puntos***
- Usamos la libreria ***pyplot*** del modulo ***matplotlib*** para hacer graficos de barras.
- Definimos el tamaño del grafico
- Le ponemos un titulo al grafico
- Graficamos las barras
- Escribimos los datos sobre las barras
- Modificamos el angulo de las categorias horizontales a 45º
- Le ponemos una etiqueta al eje vertical
- Mostramos el grafico

In [None]:
fig, gra = plt.subplots(figsize=(4,3)) # Devuelve una tupla (figura, (grafico0, grafico1, ...))
gra.set_title('Ranking de categorias por promedio de puntos')
gra.bar(puntos_categorias.index, puntos_categorias.values, width=0.8, color='blue')
gra.set_ylabel('Puntos')
gra.bar_label(gra.containers[0], label_type='center', fmt='%0.2f',c='white')

plt.show()


## 4º estadistica: ***Ranking de personajes por categoria***
Vamos a hacer un ranking por cada Categoria (en total 5) usando los datos del Dataframe `puntos`.

Como se trata de 5 graficos practicamente identicos (solo cambia la categoria), vamos a usar un bucle `for` para ahorrar codigo.


### Grafico del ***Ranking de personajes por categoria***
- Mostramos el Dataframe `puntos` (obtenido en el punto anterior)
- Usamos la libreria ***pyplot*** del modulo ***matplotlib*** para hacer graficos de barras.
- Definimos el tamaño del grafico (esta vez se trata de un arreglo de 5 graficos)
- Usando un bucle `for` para iterar el Dataframe `puntos` (usamos enumerate para obtener indice y categoria):
  - Le ponemos un titulo a cada grafico
  - Extraemos los promedios de cada Categoria en una Serie, los ordenamos descendentes y los guardamos en `serie`
  - Configuramos limite del eje `y` en 5.2 para cada grafico
  - Graficamos las barras de cada grafico
  - Escribimos los datos sobre las barras
  - Modificamos el angulo de las categorias horizontales a 90º
- Le ponemos una etiqueta al eje vertical (el mismo para todos los graficos)
- Mostramos el grafico

In [None]:
print(puntos.to_markdown())
print()

fig, (gra) = plt.subplots(1,5,figsize=(15,3))

for i,cat in enumerate(puntos.columns):
  gra[i].set_title(cat)
  gra[i].set_ylim(0,5.2)
  serie = puntos[cat].sort_values(ascending=False).copy()
  gra[i].bar(serie.index, serie.values, color='darkred')
  gra[i].set_xticklabels(serie.index,rotation=90)
  gra[i].bar_label(gra[i].containers[0], label_type='center', fmt='%0.2f',c='white')

gra[0].set_ylabel('Puntos')
fig.suptitle('Ranking de personajes por categoria', y=1.1, size=16, weight='bold')

plt.show()

## ¿Te animas a obtener los ***rankings de categorias por personaje***?
Deberias lograr 5 graficos, uno por cada personaje mostrando sus 5 promedios.

In [None]:
# Tu codigo aca