# Total de Alumnos clasificados por Cantones
Mediante un grafico de *Lineas* se intenta representar una comparativa del numero de alumnos Hombres y Mujeres que tienen cada Canton.

## Importacion de librerias
Un ejemplo de las librerias que podemos importar para trabajar con **Bokeh** y **Pandas**.

In [1]:
#!/usr/bin/python
# -*- coding: utf-8 -*-
# Victoria

import pandas as pd

from bokeh.layouts import layout
from bokeh.plotting import figure, show, output_notebook
from bokeh.models import ColumnDataSource
from bokeh.models.tools import HoverTool
from bokeh.transform import linear_cmap

from lib.colores import *

## Asignar la salida de los graficos al propio notebook

In [2]:
output_notebook()

## Lectura del Arvhivo CSV

In [3]:
df = pd.read_csv('data/fuente2.csv', sep=';', encoding='windows-1252')

## Agrupación mediante el metodo groupby
Agrupamos los datos por la columna `Canton` y realizamos una suma de todos sus valores.

In [4]:
grupo = df.groupby(['Canton']).sum()

# Se muestra el resultado de la agrupacion de datos
grupo

Unnamed: 0_level_0,DocentesFemenino,DocentesMasculino,TotalDocentes,TotalAdministrativos,EstudiantesFemenino,EstudiantesMasculino,Total_Alumnos
Canton,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
CALVAS,212,167,379,63,2731.0,2778,5509
CATAMAYO,139,89,228,32,2127.0,2177,4304
CELICA,65,52,117,22,786.0,876,1662
CHAGUARPAMBA,36,27,63,13,472.0,447,919
ESPINDOLA,97,87,184,26,1249.0,1340,2589
GONZANAMA,65,54,119,28,761.0,763,1524
LOJA,1437,777,2214,475,12102.496,18702,39085
MACARA,122,75,197,34,1626.0,1683,2355
OLMEDO,25,21,46,5,356.0,371,727
PALTAS,133,86,219,49,1661.0,1717,3378


## Se convierten los DataFrames a datos de Bokeh
Mediante el objeto `ColumnDataSource` se convierte los datos de un `DataFrame` a datos de columnas, que es el formato en que trabaja **Bokeh**

In [None]:
source = ColumnDataSource(grupo)

# Se muestran los nombres de los datos
source.column_names

['Canton',
 'DocentesFemenino',
 'DocentesMasculino',
 'TotalDocentes',
 'TotalAdministrativos',
 'EstudiantesFemenino',
 'EstudiantesMasculino',
 'Total_Alumnos']

## Creamos un objeto linear_cmap
Este asigna una distribucion de colores en forma linear tomando en cuenta el minimo y el maximo de los valores.

### Ejemplo
Una lista de 3 colores \[azul, verde, rojo\] y una lista de valores \[2, 15, 30, 50\] se obtiene el menor de los valores y se lo asigna al primer color 2 -> azul, se obtiene el mayor de los valores y se lo asigna al ultimo color 50 -> rojo, se obtiene una media entre el minimo y el maximo y este valor se asigna al color del medio 26 -> verde.

- Los valores que esten entre 2 y 25 tendran un color azul.
- Los valores que esten entre 26 y 49 tendran un color verde.
- Los valores que superen el 50 tendran un color rojo

In [None]:
colores = linear_cmap('Total_Alumnos', palette=paleta1, low=min(source.data['Total_Alumnos']), high=max(source.data['Total_Alumnos']))

## Se crea el objeto figure
Se crea un objeto figure con una configuracion incial.

Se configura su rango de datos en X con los valores de los cantones, un ancho de 900px y que no tenga ninguna herramienta.

In [None]:
p = figure(x_range=source.data['Canton'], width=900, tools='')

# Configuraciones adicionales para una mejor vizualizacion
p.y_range.start = 0 # Que la vista vertical empiece en 0
p.xgrid.grid_line_color = None # Que no se vean las lineas verticales

## Lineas y Circulos
Mediante el metodo `line` se crean las lineas que conformaran el grafico, para cada conjunto de datos `EstudiantesFemenino`, `EstudiantesMasculino` y `Total_Alumnos`.

Se repite la accion con el metodo `circle`.

In [None]:
p.line(x='Canton', y='EstudiantesFemenino', source=source, line_width=3, line_color=paleta1[0], line_alpha=0.8, line_dash='dashed', legend='Est. Mujeres')
p.line(x='Canton', y='EstudiantesMasculino', source=source, line_width=3, line_color=paleta1[1], line_alpha=0.8, line_dash='dashed', legend='Est. Hombres')
p.line(x='Canton', y='Total_Alumnos', source=source, line_width=3, line_color=paleta1[2], line_alpha=0.7, line_dash='solid', legend='Total H/M')

p.circle(x='Canton', y='EstudiantesFemenino', source=source, color=colores, line_color=paleta1[0], fill_alpha=0.70, size=11, legend='Est. Mujeres')
p.circle(x='Canton', y='EstudiantesMasculino', source=source, color=colores, line_color=paleta1[1], fill_alpha=0.70, size=11, legend='Est. Hombres')
p.circle(x='Canton', y='Total_Alumnos', source=source, color=colores, line_color=paleta1[2], fill_alpha=0.70, size=11, legend='Total H/M')

## Configuracion de la grafica
Se configuran algunos detalles de la grafica para una mejor visualizacion.

In [None]:
# Titulo de la grafica
p.title.text = 'Totales de Estudiantes por Cantón'
# Etiqueta del eje x
p.xaxis.axis_label = 'Cantones'
# Etiqueta del eje y
p.yaxis.axis_label = '# de Estudiantes'

# Se configuran que los valores de los ejes
# se represneten de forma inclinada
p.xaxis.major_label_orientation = -1
p.yaxis.major_label_orientation = 1

# Se configura el toolbar para que se oculte cuando el mouse no esta encima de la grafica
p.toolbar.autohide = True

# Se configura la leyenda del grafico para que sea dinamica y al cliquear
# sobre los valores estos desaparezcan o aparezcan en el grafico.
p.legend.click_policy = 'hide'

In [None]:
# Se configura la etiqueta para que muestre datos
# al colocar el mouse por encima de las lineas y circulos
etiqueta = HoverTool(
    tooltips = [('Cantón', '@Canton'),
                ('# Mujeres', '@EstudiantesFemenino{0}'),
                ('# Hombres', '@EstudiantesMasculino{0}'),
                ('Total', '@Total_Alumnos{0}')],
    mode='vline',
)
# Se añade la etiqueta a la grafica
p.add_tools(etiqueta)

## Configuracion de la vista
Se configura las pocisiones de la grafica.

Se pasa la configuracion scale_width para que la vizualizacion de adapte al ancho del contendor y de la pantalla.

In [None]:
lienzo = layout([
    [p]
], sizing_mode='scale_width')

## Mostramos los resultados
En esta grafica la Leyenda es dinamica, esto permite seleccionar que graficos se dibujan en la misma.

In [None]:
show(lienzo)