<a href="https://colab.research.google.com/github/danblanc/python-para-ciencia-de-datos/blob/nueva_rama/Script.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En este curso de Python, empleamos diversas librerías para realizar tareas específicas relacionadas con la visualización de datos y el desarrollo de aplicaciones interactivas. A continuación, se detallan las razones para elegir cada una de estas librerías y cómo se complementan entre sí.

1. Streamlit (streamlit)
Propósito: Streamlit permite crear aplicaciones web interactivas de manera rápida y sencilla. A través de una interfaz de usuario minimalista, los usuarios pueden interactuar con los datos y ver los resultados en tiempo real.
Por qué se utiliza:
Facilita la creación de dashboards y aplicaciones interactivas sin necesidad de profundos conocimientos de desarrollo web.
Ideal para prototipado rápido y compartir análisis de datos con otros usuarios.
Se integra bien con otras librerías de visualización de datos como Matplotlib, Plotly, y Altair.
2. Seaborn (seaborn)
Propósito: Seaborn se especializa en la visualización de datos estadísticos. Está construido sobre Matplotlib, pero simplifica la creación de gráficos complejos con líneas de código mínimas.
Por qué se utiliza:
Permite la creación de gráficos estadísticos complejos como mapas de calor, gráficos de correlación, y gráficos categóricos de manera sencilla.
Proporciona una estética predeterminada que facilita la creación de gráficos profesionales.
Simplifica el manejo de conjuntos de datos grandes y la visualización de relaciones entre variables.
3. Pandas (pandas)
Propósito: Pandas es la librería fundamental para la manipulación y análisis de datos en Python. Facilita el manejo de datos tabulares (similar a las hojas de cálculo de Excel).
Por qué se utiliza:
Permite la manipulación eficiente de grandes conjuntos de datos, incluyendo operaciones de filtrado, agrupación y agregación.
Es indispensable para la preparación y limpieza de datos antes de su análisis o visualización.
Se integra perfectamente con las librerías de visualización como Seaborn, Matplotlib, y Plotly.
4. Matplotlib (matplotlib.pyplot)
Propósito: Matplotlib es una librería versátil para crear gráficos estáticos. Permite el control total sobre los gráficos, lo que lo hace muy flexible.
Por qué se utiliza:
Es la base sobre la que están construidas otras librerías de visualización como Seaborn.
Proporciona una amplia gama de tipos de gráficos: líneas, dispersión, barras, histogramas, entre otros.
Aunque no es tan sencilla como Seaborn o Plotly, su flexibilidad es ideal para personalizar gráficos al máximo.
5. Numpy (numpy)
Propósito: Numpy es la librería fundamental para cálculos numéricos eficientes en Python. Proporciona una gran variedad de funciones para manejar matrices multidimensionales y realizar operaciones matemáticas avanzadas.
Por qué se utiliza:
Ofrece un rendimiento superior en comparación con las estructuras de datos nativas de Python (listas, diccionarios) para operaciones numéricas.
Es esencial para trabajar con grandes cantidades de datos y para optimizar cálculos complejos.
Proporciona las bases numéricas para otras librerías de análisis de datos como Pandas.
6. Plotly Express (plotly.express)
Propósito: Plotly Express es una librería de gráficos interactivos que permite crear gráficos complejos con pocos comandos. Los gráficos generados son altamente interactivos, lo que es útil para explorar datos.
Por qué se utiliza:
Facilita la creación de gráficos interactivos que permiten a los usuarios explorar datos a través de zoom, selección y otros controles.
Proporciona visualizaciones atractivas y dinámicas que se pueden integrar fácilmente en aplicaciones web con Streamlit.
Es ideal para gráficos tridimensionales, mapas de dispersión y gráficos de líneas interactivos.
7. Folium (folium)
Propósito: Folium es una librería utilizada para la creación de mapas interactivos. Permite integrar capas geoespaciales y personalizar los estilos de los mapas.
Por qué se utiliza:
Es ideal para visualizar datos geoespaciales en un mapa.
Permite la superposición de datos sobre mapas interactivos de manera sencilla, lo que es útil para análisis de geolocalización.
Se puede integrar directamente en aplicaciones web con Streamlit usando el control st_folium.
8. Streamlit Folium (streamlit_folium)
Propósito: Esta extensión de Streamlit permite integrar los mapas interactivos de Folium directamente en las aplicaciones de Streamlit.
Por qué se utiliza:
Facilita la visualización de mapas interactivos dentro de aplicaciones web sin necesidad de cambiar de entorno.
Permite a los usuarios interactuar con los mapas directamente desde la interfaz web.
9. Altair (altair)
Propósito: Altair es una librería de gráficos declarativos, lo que significa que define los gráficos especificando las relaciones entre los datos en lugar de controlar cada aspecto visual.
Por qué se utiliza:
Permite crear gráficos complejos y altamente personalizados de manera eficiente y con pocas líneas de código.
Facilita la interactividad y la visualización de grandes conjuntos de datos sin perder claridad.
Su enfoque declarativo hace que los gráficos sean fáciles de modificar y actualizar.

In [3]:
#########################################################import streamlit as st
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import plotly.express as px
import folium
# ################################################3###from streamlit_folium
import altair as alt

Mediante la lectura del archivo CSV con Pandas, los datos son transformados en una estructura de fácil manipulación, lo que permite una presentación clara y eficiente dentro de la interfaz de usuario. Esto garantiza una experiencia interactiva fluida para el análisis y visualización de los datos de la encuesta.Los usuarios van a interactuar con ellos mediante tablas, gráficos o mapas.

In [None]:
ECH_Seg_12024 = pd.read_csv('data/ECH_Seguimiento_Mes_1_2024.csv')

 Se introdujo un elemento visual, que en este caso puede ser el logo del Instituto Nacional de Estadística (INE), para mejorar el aspecto gráfico de la aplicación y reforzar la identidad institucional. La imagen, almacenada en la ruta data/ine.jpg, se ajusta automáticamente al ancho de la columna disponible.  
 La creación de la estructura de navegación mediante pestañas y la barra lateral de filtros, ambos elementos implementados para facilitar la interacción del usuario

**Función:** Añadir una referencia visual institucional (logo del INE).

**Impacto en la interfaz:** Mejora la presentación gráfica y refuerza la identidad de la fuente de datos.

**Impacto en la Experiencia del Usuario**
La combinación de pestañas y la barra lateral proporciona una interfaz intuitiva y amigable. Los usuarios pueden navegar de manera eficiente entre diferentes vistas de los datos y aplicar filtros dinámicos para adaptar las visualizaciones a sus necesidades. Esta estructura permite una exploración flexible y profundiza el análisis, lo que es crucial en aplicaciones de análisis de datos como la presentada en esta Encuesta Continua de Hogares (ECH).

In [None]:
st.image("data/ine.jpg", caption="", use_column_width=True)
st.title('PRESENTACION DE DATOS DE LA ENCUESTA CONTINUA DE HOGARES (ECH)')
st.header('CORRESPODIENTE A ENERO DEL 2024')
tabs = st.tabs(["Inicio", "Tabla", "Graficos", "Mapas"])
st.sidebar.title('Filtros')


Estos filtros implementados en la barra lateral permiten a los usuarios seleccionar diferentes criterios para personalizar la visualización de los datos, lo que facilita un análisis más detallado y específico. La adición de selectboxes para filtrar datos de acuerdo a **departamento**, **localidad**, **sexo** y **rango de edad** proporciona a los usuarios una experiencia interactiva enriquecida. Les permite explorar los datos de manera más efectiva y tomar decisiones informadas basadas en criterios específicos. Esta funcionalidad es crucial en la presentación de datos, ya que transforma una visión general en análisis más detallados y significativos.
**Interactividad:** La implementación de estos filtros interactivos en la barra lateral mejora la usabilidad de la aplicación, permitiendo a los usuarios ajustar los datos que desean analizar con facilidad. Esto fomenta un enfoque más específico y relevante en la visualización de datos.

**Análisis Personalizado:** Estos filtros permiten que los usuarios realicen análisis más focalizados y personalizados, ya que pueden seleccionar criterios relevantes para sus intereses o necesidades específicas.

In [None]:

# Selectbox para elegir el departamento
option_depto = st.sidebar.selectbox("Seleccione el Departamento:", ['Todos'] + ECH_Seg_12024["nom_dpto"].unique().tolist())

# Selectbox para elegir el localidad segun el departamento
if option_depto == 'Todos':
    option_localidad= st.sidebar.selectbox("Seleccione la Localidad:", ['Todos'] + ECH_Seg_12024["NOM_LOC_AGR_13"].unique().tolist())
else:
    option_localidad= st.sidebar.selectbox("Seleccione la Localidad:", ['Todos'] + ECH_Seg_12024[ECH_Seg_12024['nom_dpto'] == option_depto]["NOM_LOC_AGR_13"].unique().tolist())

#seleccion de sexo
sexo = ['Todos','Hombre', 'Mujer']
option_sexo = st.sidebar.selectbox("Seleccione el sexo:", sexo)

# Selectbox rango de edad
rango = ['Todos','0-18', '19-30', '31-40', '41-50', '51-60', '61-100', '>100']
option_rango = st.sidebar.selectbox("Seleccione rango de edad:", rango)


se presenta la lógica de filtrado implementada en la aplicación para la Encuesta Continua de Hogares (ECH), que permite a los usuarios personalizar su análisis de datos según múltiples criterios, incluyendo departamento, localidad, sexo y rango de edad.La lógica de filtrado se organiza a través de condiciones que utilizan los valores seleccionados en la barra lateral por el usuario para construir un DataFrame filtrado, df_filtradoFiltrado
Según el **Rango de Edad y Sexo** se implementa una estructura condicional que evalúa el rango de edad y el sexo para construir el DataFrame filtrado. Para cada combinación de rango de edad y sexo, se filtran los datos .
Filtrado para **Otros Rangos de Edad** Al final de las condiciones, también se incluye el filtrado para aquellos mayores de 100 años

**Propósito y Funcionalidad General**
Segmentación de Datos: Esta lógica de filtrado permite segmentar los datos de manera detallada, lo que permite a los usuarios realizar análisis más precisos en función de su selección.

**Interacción Personalizada:** Al permitir a los usuarios elegir sus criterios de filtrado, la aplicación se vuelve más interactiva y centrada en el usuario, mejorando la experiencia de análisis de datos.

In [None]:
if ((option_depto != 'Todos') and (option_localidad != 'Todos')):

        if option_rango == 'Todos':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad)]


        elif option_rango == '0-18':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] < 19)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] < 19)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] < 19)]


        elif option_rango == '19-30':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] > 18) & (ECH_Seg_12024['e27'] < 31)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] > 18) & (ECH_Seg_12024['e27'] < 31)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] > 18) & (ECH_Seg_12024['e27'] < 31)]


        elif option_rango == '31-40':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] > 30) & (ECH_Seg_12024['e27'] < 41)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] > 30) & (ECH_Seg_12024['e27'] < 41)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] > 30) & (ECH_Seg_12024['e27'] < 41)]


        elif option_rango == '41-50':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] > 40) & (ECH_Seg_12024['e27'] < 51)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] > 40) & (ECH_Seg_12024['e27'] < 51)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] > 40) & (ECH_Seg_12024['e27'] < 51)]


        elif option_rango == '51-60':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] > 50) & (ECH_Seg_12024['e27'] < 61)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] > 50) & (ECH_Seg_12024['e27'] < 61)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] > 50) & (ECH_Seg_12024['e27'] < 61)]


        elif option_rango == '61-100':
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] > 60) & (ECH_Seg_12024['e27'] < 101)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] > 60) & (ECH_Seg_12024['e27'] < 101)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] > 60) & (ECH_Seg_12024['e27'] < 101)]


        else:
            if option_sexo == 'Hombre':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 1) & (ECH_Seg_12024['e27'] > 100)]

            elif option_sexo == 'Mujer':
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e26'] == 2) & (ECH_Seg_12024['e27'] > 100)]

            else:
                df_filtrado = ECH_Seg_12024[(ECH_Seg_12024['nom_dpto'] == option_depto) & (ECH_Seg_12024['NOM_LOC_AGR_13'] == option_localidad) &
                                            (ECH_Seg_12024['e27'] > 100)]