# Distribución de docentes por Jornada y Regimen
Mediante graficos tipo *pie* se intenta representar una comparativa del numero de docentes de diferentes sexos en los Regimenes Costa y Sierra

## Importacion de librerias
Un ejemplo de las librerias que podemos importar para trabajar con **Bokeh** y **Pandas**.

In [1]:
#!/usr/bin/python
# -*- coding: utf-8 -*-
# Victoria

import pandas as pd
import numpy as np

from bokeh.layouts import layout
from bokeh.plotting import figure, show, output_notebook
from bokeh.models import ColumnDataSource, ColorBar, FactorRange
from bokeh.models.tools import HoverTool
from bokeh.transform import linear_cmap, factor_cmap, cumsum
from bokeh.palettes import plasma, Spectral9, cividis

from lib.colores import *

## Asignar la salida de los graficos al propio notebook

In [2]:
output_notebook()

## Lectura del Arvhivo CSV

In [3]:
df = pd.read_csv('data/fuente2.csv', sep=';', encoding='windows-1252')

## Agrupación mediante el metodo groupby
Se realiza una agrupacion por la columna `RegimenEscolar`, a partir de este grupo se extraen dos subgrupos `grupoCosta` y `grupoSierra`.

A cada uno se lo reagrupa por `JornadaLaboral` y se obtien una suma total de cada columna.

In [4]:
grupo = df.groupby(['RegimenEscolar'])
# grupo = df.groupby(['RegimenEscolar']).sum()
grupoCosta = grupo.get_group('Costa')
grupoCosta = grupoCosta.groupby(['JornadaLaboral']).sum()

grupoSierra = grupo.get_group('Sierra')
grupoSierra = grupoSierra.groupby(['JornadaLaboral']).sum()

# Resultados del groupby
grupoCosta

Unnamed: 0_level_0,DocentesFemenino,DocentesMasculino,TotalDocentes,TotalAdministrativos,EstudiantesFemenino,EstudiantesMasculino,Total_Alumnos
JornadaLaboral,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
Matutina,762,611,1373,261,10099.0,10341,19486
"Matutina,Nocturno",209,158,367,60,2409.0,2871,5280
"Matutina,Vespertina",16,6,22,9,117.0,139,256
"Matutino,Nocturno",32,17,49,8,377.0,413,790


## Obtenos listas con los factores de RegimenEscolar
Convertimos las columnas de `JornadaLaboral` que contienen los indices a listas de factores unicos.

In [5]:
jornadaLabC = grupoCosta.index.tolist()
jornadaLabS = grupoSierra.index.tolist()
jornadaLabS

['Matutina',
 'Matutina,Nocturno',
 'Matutina,Vespertina',
 'Matutina,Vespertina,Nocturno',
 'Matutino,Nocturno',
 'Nocturno',
 'Vespertina',
 'Vespertina,Nocturno']

## Calculo de las porciones del Pie

Se crean las columnas `angleM`, `porcentajeM`, `angleH`, `porcentajeH` y `color` para cada grupo.

- En las columnas `angleM` y `angleH` se calculan las porcines del *Pie* mediante una formula que **Bokeh** sugiere en su documentacion.

- En las columnas `porcentajeM` y `porcentajeM` se calculan los porcentajes equivalentes a cada suma.

- En la columna `color` se asigna un numero de colores que depende del largo de los factores obtenido anteriormente.

In [6]:
grupoCosta['angleM'] = grupoCosta['DocentesFemenino']/grupoCosta['DocentesFemenino'].sum()*2*np.pi
grupoCosta['porcentajeM'] = (grupoCosta['DocentesFemenino']*100)/grupoCosta['DocentesFemenino'].sum()
grupoCosta['angleH'] = grupoCosta['DocentesMasculino']/grupoCosta['DocentesMasculino'].sum()*2*np.pi
grupoCosta['porcentajeH'] = (grupoCosta['DocentesMasculino']*100)/grupoCosta['DocentesMasculino'].sum()
grupoCosta['color'] = legend16(len(jornadaLabC))

grupoSierra['angleM'] = grupoSierra['DocentesFemenino']/grupoSierra['DocentesFemenino'].sum()*2*np.pi
grupoSierra['porcentajeM'] = (grupoSierra['DocentesFemenino']*100)/grupoSierra['DocentesFemenino'].sum()
grupoSierra['angleH'] = grupoSierra['DocentesMasculino']/grupoSierra['DocentesMasculino'].sum()*2*np.pi
grupoSierra['porcentajeH'] = (grupoSierra['DocentesMasculino']*100)/grupoSierra['DocentesMasculino'].sum()
grupoSierra['color'] = androidPalette30(len(jornadaLabS))

## Se convierten los DataFrames a datos de Bokeh
Mediante el objeto `ColumnDataSource` se convierte los datos de un `DataFrame` a datos de columnas, que es el formato en que trabaja **Bokeh**

In [7]:
sourceCosta = ColumnDataSource(grupoCosta)
# sourceCosta.column_names
sourceSierra = ColumnDataSource(grupoSierra)

# Se muestran los nombres de los datos
sourceCosta.column_names

['JornadaLaboral',
 'DocentesFemenino',
 'DocentesMasculino',
 'TotalDocentes',
 'TotalAdministrativos',
 'EstudiantesFemenino',
 'EstudiantesMasculino',
 'Total_Alumnos',
 'angleM',
 'porcentajeM',
 'angleH',
 'porcentajeH',
 'color']

## Definimos una función que genere Pie's
Esta funcion recibe 7 parametros.
- **titulo** -> `str` Define el titulo del *Pie*.
- **datos** -> `ColumnDataSource` Conjunto de datos a graficar.
- **ancho** -> `int` Ancho de la grafica.
- **alto** -> `int` Alto de la grafica.
- **herramientas** -> `str` Una cadena de texto con las herramientas requeridas para la grafica.
- **color_linea** -> `str` Color de la linea externa de las porciones, un color en texto *white* o un color hexadecimal *#FFFFFF*.
- **genero** -> `str` *M* o *H* que define de que columnas seran obtenidos los datos.

In [8]:
def graficoPie(titulo='', datos=None, ancho=400, alto=400, herramientas='', color_linea='white', genero=''):
    # Creamos un objeto figure con una configuracion inicial
    p = figure(title=titulo, width=ancho, height=alto, tools=herramientas)
    
    # Se comprueba de que columna de angulos se obtienen los mismos
    if genero == 'M':
        angulo = 'angleM'
    elif genero == 'H':
        angulo = 'angleH'
    else:
        angulo=''
    
    # Se crean las porciones del Pie
    p.wedge(x=0, y=0, radius=0.9, start_angle=cumsum(angulo, include_zero=True), end_angle=cumsum(angulo), legend='JornadaLaboral', line_color=color_linea, fill_color='color', alpha=0.7, source=datos)
    
    # Se configuran las etiquetas de los ejes y la rejilla para que no se vean
    p.axis.axis_label = None
    p.axis.visible = False
    p.grid.grid_line_color = None
    
    # Se configura el toolbar para que se oculte cuando el mouse no esta encima de la grafica
    p.toolbar.autohide = True
    
    # Depende del genero se muestra una etiqueta distinta
    if genero == 'M':
        # Se configura la etiqueta para los datos de Mujeres
        etiqueta = HoverTool(
            tooltips = [('Jornada', "@JornadaLaboral"),
                        ('Mujeres', "@DocentesFemenino"),
                        ('Porcentaje', "@porcentajeM{0.2f}%"), # Se configura el formato 0.00 % para los porcentajes
                        ('Total H/M', "@TotalDocentes")],
            mode = 'mouse')
        p.add_tools(etiqueta)
    elif genero == 'H':
        # Se configura la etiqueta para los datos de Hombres
        etiqueta = HoverTool(
            tooltips = [('Jornada', "@JornadaLaboral"),
                        ('Hombres', "@DocentesMasculino"),
                        ('Porcentaje', "@porcentajeH{0.2f}%"), # Se configura el formato 0.00 % para los porcentajes
                        ('Total H/M', "@TotalDocentes")],
            mode = 'mouse')
        p.add_tools(etiqueta)
    else:
        print('Sin herramienta')

    # Se retorna el objeto figure
    return p

## Se crean 4 graficas usando la función creada anteriormente

In [9]:
pie1 = graficoPie('Nro de Mujeres por Jornada | Costa', sourceCosta, color_linea=paleta2[3], genero='M')
pie2 = graficoPie('Nro de Mujeres por Jornada | Sierra', sourceSierra, color_linea=paleta2[3], genero='M')
pie3 = graficoPie('Nro de Hombres por Jornada | Costa', sourceCosta, color_linea=paleta2[3], genero='H')
pie4 = graficoPie('Nro de Hombres por Jornada | Sierra', sourceSierra, color_linea=paleta2[3], genero='H')

## Configuracion de la vista

Se configura las pocisiones en las que las graficas se pocisionaran, la configuracion reprenseta una tabla de 2x2.

Se pasa la configuracion `scale_width` para que la vizualizacion de adapte al ancho del contendor y de la pantalla.

In [10]:
lienzo = layout([
    [pie1, pie3],
    [pie2, pie4]
], sizing_mode='scale_width')

## Mostramos los resultados

In [11]:
show(lienzo)