# Promedio de Estudiantes Hombres y Mujeres clasificados por Tipo de Institucion Educativa
Mediante esta grafica se intenta determinar que tipo de instituciones Educativas `['Fiscal', 'Fiscomisional', 'Laico', 'Religioso']` son las mas comunes en la provincia de Loja y cual de ellas contienen mas estudiantes.

## Importacion de librerias
Un ejemplo de las librerias que podemos importar para trabajar con **Bokeh** y **Pandas**.

In [1]:
#!/usr/bin/python
# -*- coding: utf-8 -*-
# Victoria

import pandas as pd

from bokeh.layouts import layout
from bokeh.plotting import figure, show, output_notebook
from bokeh.models import ColumnDataSource, FactorRange, Legend
from bokeh.models.tools import HoverTool
from bokeh.transform import factor_cmap
from bokeh.palettes import plasma, Spectral9

from lib.colores import *

## Asignar la salida de los graficos al propio notebook

In [2]:
output_notebook()

## Lectura del Arvhivo CSV

In [3]:
df = pd.read_csv('data/fuente2.csv', sep=';', encoding='windows-1252')

## Transformando la columna Tipo
En la columna `Tipo` los datos se encuentran de esta forma `['FiscalHighSchool', 'FiscomitionalHighSchool', 'LaicHighSchool', 'ReligiousHighSchool']`, mediante el siguiente metodo estos valores seran convertidos a `['Fiscal', 'Fiscomicional', 'Laico', 'Religioso']`.

In [4]:
def transformarTipo(texto):
    if texto == 'FiscalHighSchool':
        return 'Fiscal'
    elif texto == 'FiscomitionalHighSchool':
        return 'Fiscomisional'
    elif texto == 'LaicHighSchool':
        return 'Laico'
    elif texto == 'ReligiousHighSchool':
        return 'Religioso'
    else:
        return texto

## Aplicando el metodo de transformarTipo
Se usa el metodo `apply` para ejecutar una funcion `lambda` por cada iteracion de los valores que contiene la columna `Tipo`.

Se guarda una lista de los Tipos como factores.

In [5]:
df['Tipo'] = df['Tipo'].apply(lambda x: transformarTipo(x))
tipos = sorted(df.Tipo.unique())
tipos

['Fiscal', 'Fiscomisional', 'Laico', 'Religioso']

## Agrupaci칩n mediante el metodo groupby
Agrupamos los datos por las columnas `Canton` y `Tipo` se obtiene un promedio de cada columna.

In [6]:
grupoCT = df.groupby(['Canton','Tipo']).mean()

## Se convierten los DataFrames a datos de Bokeh
Mediante el objeto `ColumnDataSource` se convierte los datos de un `DataFrame` a datos de columnas, que es el formato en que trabaja **Bokeh**

In [7]:
source = ColumnDataSource(grupoCT)
source.column_names

['Canton_Tipo',
 'DocentesFemenino',
 'DocentesMasculino',
 'TotalDocentes',
 'TotalAdministrativos',
 'EstudiantesFemenino',
 'EstudiantesMasculino',
 'Total_Alumnos']

## Configuraci칩n de colores
### Creamos un objeto factor_cmap
Este metodo asigna a cada factor unico un color.

#### Ejemplo
Una lista de 3 colores \[azul, verde, rojo\] y una lista de factores unicos \['Fiscal', 'Laico', 'Religioso'\]
##### Resultado
- Fiscal -> azul
- Laico -> verde
- Religioso -> rojo

In [8]:
# Creamos una lista de factores unicos a partir de los valores de Canton_Tipo
factores = list(source.data['Canton_Tipo'])
colores = factor_cmap('Canton_Tipo', palette=paleta4, factors=tipos, start=1, end=2)
factores[:8]

[('CALVAS', 'Fiscal'),
 ('CALVAS', 'Fiscomisional'),
 ('CATAMAYO', 'Fiscal'),
 ('CATAMAYO', 'Fiscomisional'),
 ('CATAMAYO', 'Laico'),
 ('CELICA', 'Fiscal'),
 ('CELICA', 'Fiscomisional'),
 ('CHAGUARPAMBA', 'Fiscal')]

## Se crea el objeto figure
Se crea un objeto figure con una configuracion incial.

Se configuran el rango x con los factores se usa `*` para desempaquetar la lista, en tools se configuran las herrramientas que se podran usar en la grafica y active_scroll configura que el zoom con la rueda del mouse este activo desde el comienzo y este solo pueda ser horizontalmente.

In [9]:
p = figure(x_range=FactorRange(*factores), width=500, height=700, tools='xpan,box_zoom,xwheel_zoom,reset', active_scroll='xwheel_zoom')

# Se crean los tres graficos de barras verticales
r1 = p.vbar(x='Canton_Tipo', width=0.7, top='Total_Alumnos', alpha = 0.6, fill_color=colores, source=source)
r2 = p.vbar(x='Canton_Tipo', width=0.7, top='EstudiantesFemenino', alpha = 0.6, fill_color=colores, source=source)
r3 = p.vbar(x='Canton_Tipo', width=0.7, top='EstudiantesMasculino', alpha = 0.6, fill_color=colores, source=source)

# Se configura que la vista comience en 0
p.y_range.start = 0
p.x_range.range_padding = 0.01

# Configura que la rejilla no se vea
p.xgrid.grid_line_color = None

# Se configura el toolbar para que se oculte cuando el mouse no esta encima de la grafica
p.toolbar.autohide = True

## Configurando la grafica

In [10]:
# Se establece el titulo de la grafica
p.title.text='Promedio de Estudiantes por Tipo de Institucion'

# Se etablcen las etiquetas para los ejes
p.xaxis.axis_label = 'Tipo de institucion'
p.yaxis.axis_label = 'Promedio de estudiantes'

# Se inclinan los valores de x para una mejor visualizacion
p.xaxis.major_label_orientation = 1

In [11]:
# Se configura la etiqueta para que muestre datos
# al colocar el mouse por encima de las barras
etiqueta = HoverTool(
    tooltips = [('Promedio M', '@EstudiantesFemenino{0}'),
                ('Promedio H', '@EstudiantesMasculino{0}'),
                ('Promedio Total', '@Total_Alumnos{0}')],
    mode = 'vline'
)
# Se a침ade la etiqueta a la grafica
p.add_tools(etiqueta)

## Leyenda
Se configura un objeto `Legend`

In [12]:
# Objeto legend
leyenda = Legend(
    # Valores que aparecen
    items=[('Promedio Total', [r1]),
          ('Promedio Mujeres', [r2]),
          ('Promedio Hombres', [r3])]
)
# A침adimos la leyenda al grafico
p.add_layout(leyenda)

# Se configura la leyenda del grafico para que sea dinamica y al cliquear
# sobre los valores estos desaparezcan o aparezcan en el grafico.
p.legend.click_policy = 'hide'

## Configuracion de la vista
Se configura las pocisiones de la grafica.

Se pasa la configuracion scale_width para que la vizualizacion de adapte al ancho del contendor y de la pantalla.

In [13]:
lienzo = layout([
    [p]
], sizing_mode='scale_width')

## Mostramos los resultados
En esta grafica la Leyenda es dinamica, esto permite seleccionar que graficos se dibujan en la misma.

In [14]:
show(lienzo)