# PROYECTO DE VISUALIZACION DE DATOS 

## SET DE DATOS

Nuestro conjunto de datos está en formato `.csv`, por lo que usaremos `read_csv` de pandas.

**Los datos que trabajaremos son del sitio web Ecuador en cifras, sobre la probresa en ciudades como Quito, Guayaquil, y otras del Ecuador**

In [9]:
# guardamos nuestra tabla en una variable data, despues de haver sido leida por pandas
raw_data = pd.read_csv(
    './assets/datosPobreza.csv', # direccion donde esta nuestra data
    sep=';', # separador de datos para ser leidos por pandas
    decimal="," # el separador, o sino nuestros numeros seran tratados como strings si contienen "comas"
)

NameError: name 'pd' is not defined

`read_csv` devuelve un `DataFrame`, una estructura tabular de datos proporcionada por pandas.

¿Cómo hacemos para que este conjunto de datos se convierta en una estructura de datos pandas?
pandas hace que sea muy fácil importar datos en varios formatos con su conjunto de funciones de importación:

In [None]:
# esta es un arreglo comprimido que contiene formatos que puede leer pandas
[formatos for formatos in dir(pd) if formatos.startswith('read_')]

In [None]:
type(raw_data)

Un `DataFrame` está dotado de varios atributos y métodos útiles para explorar los datos.

Con la funcion `head()` sobre nuestro `DataFrame` podemos mostrar los primeras filas de nuestra data, para no presentar todas las filas. 

In [None]:
raw_data.head()

Con la funcion `[1:]` eliminamos la primera fila, ya que no son parte de los datos que usaremos

In [None]:
raw_data = raw_data[1:]

In [None]:
raw_data.shape  # numeros de campos de nuestra data

Un `DataFrame` se compone de dos componentes principales; 
 - Los datos mismos, que se pueden extraer a través del atributo de valores:

In [None]:
raw_data.values

 - Conjunto de índices, que son esencialmente etiquetas para las filas y columnas del DataFrame.

In [None]:
raw_data.index

In [None]:
raw_data.columns

Pero, un `índice` es más que un conjunto de etiquetas. Es importante destacar que asegura la **alineación de datos** cuando se agregan datos o se combinan estructuras de datos.

De hecho, podemos especificar un índice más apropiado para nuestros datos. El campo Año aquí es un índice único para los valores de análisis correspondientes.

`set_index` nos permite convertir cualquier columna (o matriz externa) que elijamos en el índice de fila.

In [None]:
temp = raw_data.set_index('Anios')
temp.head()

# Data
------
Para nuestra tabla agruparemos los datos de Quito para Repesentar nuestras graficas

In [None]:
data = raw_data.drop(['Período', 'Guayaquil', 'Guayaquil.1', 'Guayaquil.2', 'Cuenca', 'Cuenca.1', 'Cuenca.2', 'Machala', 'Machala.1', 'Machala.2', 'Ambato', 'Ambato.1', 'Ambato.2'], axis=1)
data.head()

Cambiaremos los nombres de las columnas de nuestra data para ver lo que representaremos

In [None]:
data.columns = ['Anios', 'Incidencia', 'Brecha', 'Severidad']
data.head()

### ¿Qué es incidencia de la pobreza?
Número de personas pobres expresado como porcentaje del total de la población en un determinado año. Se define como "pobres" a aquellas personas que pertenecen a hogares cuyo consumo per cápita, en un período determinado, es inferior al valor de la línea de pobreza.
### ¿Qué es la brecha de la pobreza?
La línea de pobreza es el equivalente monetario del costo de una canasta básica de bienes y servicios. La brecha de la pobreza refleja cuan pobres son los pobres y, por tanto, proporciona una idea de la profundidad de las carencias de ingreso o consumo que definen una situación de pobreza.
### ¿Qué es la severidad de la pobreza?
P es un promedio (sobre la población total, n) de las distancias que separan a individuos u hogares de la línea de pobreza, ponderado por un exponente . El valor del exponente permite que la misma fórmula dé como resultado la incidencia, brecha y severidad de la pobreza como casos especiales de la medida.

 ## Trazado en Python
 
 - **Bokeh**: Es una biblioteca de visualización interactiva de Python con gráficos novedosos.

Al usar la interfaz bokeh.plotting, necesitamos importar:

 - Use la función de `figure` para crear nuevos objetos de trazado para trabajar.
 - Las funciones `output_file`, `output_notebook` para indicar a Bokeh cómo mostrar el resultado.

In [None]:
from bokeh.io import show
from bokeh.plotting import figure

Importamos `gridplot` - para presentar varias graficas en una

In [None]:
from bokeh.layouts import gridplot

En este caso, estamos en `jupyter notebook`, así que llamamos a `output_notebook()`. Solo debemos llamar esto una vez para mostrar nuestras graficas en el cuaderno usando la funcion `show()` de bokeh.

In [None]:
from bokeh.io import output_notebook
output_notebook()

## MARCO TEORICO 

# Python 

Python es un lenguaje de programación interpretado cuya filosofía hace hincapié en una sintaxis que favorezca un código legible.

Se trata de un lenguaje de programación multiparadigma, ya que soporta orientación a objetos, programación imperativa y, en menor medida, programación funcional. Es un lenguaje interpretado, usa tipado dinámico y es multiplataforma.


# Pandas

Pandas es una biblioteca de código abierto con licencia de BSD que proporciona estructuras de datos y herramientas de análisis de datos de alto rendimiento y fácil de usar para el lenguaje de programación Python.

pandas es un proyecto patrocinado por NUMFocus. Esto ayudará a garantizar el éxito del desarrollo de los pandas como un proyecto de código abierto de clase mundial, y hace posible donar para el proyecto.

# Bokeh

Bokeh es una biblioteca de visualización interactiva de Python que se dirige a navegadores web modernos para su presentación. Su objetivo es proporcionar una construcción elegante y concisa de gráficos novedosos al estilo de D3.js y ampliar esta capacidad con interactividad de alto rendimiento en conjuntos de datos de gran tamaño o de transmisión

## PROPUESTAS DE VISUALIZACION



# GRAFICAS

## Grafico de Lineas

Caracteristicas que tendra nuestra grafica

In [None]:
graph_line = figure(
    plot_height=400, # ancho
    plot_width=900, # alto
    title='POBREZA-QUITO', # titulo
    tools='' # opciones de bokeh
)

Definimos los datos que representara cada "Linea", y otras opciones como color y leyenda

In [None]:
graph_line.line(
    x=data.Anios, # datos en x
    y=data.Incidencia, # datos en y
    color='#f4d341', # color de las lineas
    legend='Incidencia' # leyendad que representa nuestra grafica
)
graph_line.line(x=data.Anios, y=data.Brecha, color='#42f4bf', legend='Brecha')
graph_line.line(x=data.Anios, y=data.Severidad, color='#f44171', legend='Severidad')

Para no mostramos los trasados del plano y presentamos nuestra grafica

In [None]:
graph_line.xgrid.grid_line_color = None # eliminamos las lineas verticales
graph_line.ygrid.grid_line_color = None # horizontales
show(graph_line) # mostramos nuestra grafica

En esta grafica, podemos observa la pobreza decuardo con la insidencia, que desde el año 2008 al 2010, tiene una mayoria de pobreza y del 2010 al 2012 a disminuyido de la misma, y del 2012 en adelante aido dismuyendo la pobreza, minetras que la pobreza decuardo con la brecha, casi se aumnetado en un rango minimo, desde el año 2008 al 2016, y por ultimo la pobreza deacuerdo con la serevidad no a existido un rango alto de pobreza, si no que se a ido manteniendo en un porcentaje medio.

## Grafico de barras

Creamos un una variable contiene los parametros de nuestra grafica final

In [None]:
options = dict( # opciones que compartiran cada una de nuestras graficas
    plot_width=300, plot_height=250, # Tamaño
    tools='' # Herramientas de bokeh adicionales
)

Creamos un objeto de figura por cada grafica y establecemos sus opciones y titulo. (opciones)

In [None]:
graph_bar_1 = figure(
    title='Incidencia', # titulo de esta grafica en particular
    **options # opciones antes definidad
)
graph_bar_2 = figure(title='Brecha', **options)
graph_bar_3 = figure(title='Severidad', **options)

Definimos lo que cada una de nuestras graficas representara

In [None]:
graph_bar_1.vbar(
    x=data.Anios, # datos en x
    top=data.Incidencia, # valor maximo
    width=0.7, # ancho de cada barra
    line_color="white", # color del borde de cada barra
    color="#f4d341" # color de cada barra
)
graph_bar_2.vbar(x=data.Anios, top=data.Brecha, width=0.7, line_color="white", color="#42f4bf")
graph_bar_3.vbar(x=data.Anios, top=data.Severidad, width=0.7, line_color="white", color="#f44171")

Creamos una nueva figura que esta compuesta por las figuras creadas anteriormente

In [None]:
graph_bar = gridplot([[graph_bar_1, graph_bar_2, graph_bar_3]]) # agrupamos nuestas graficas
show(graph_bar) # Mostramos los resultados

En este grafico, podemos observar sobre la pobreza dependiendo de la  insidencia, brecha y serevidad de la ciudad de quito desde el año 2008 hasta el 2016, ya que nos daremos cuenta en cada año como va aumentado y disminuyendo, de la misma.


# Bibliografía 

Una pagina que utilizamos, para poder hacer las graficas fue. 

https://bokeh.pydata.org/en/latest/

y la que utilizamos para los datos fue 

https://pandas.pydata.org/