Skip to content

Latest commit

 

History

History
96 lines (57 loc) · 7.33 KB

Consignas.md

File metadata and controls

96 lines (57 loc) · 7.33 KB

Proyecto Grupal: Flujos migratorios

img


Descripción del problema (Contexto y rol a desarrollar)

Contexto

Los procesos y flujos migratorios entre sociedades, aunque puedan parecer un fenómeno actual, se han dado a lo largo de toda la historia de la humanidad. La globalización y el avance en los medios de transporte han permitido generar flujos migratorios internacionales continuos y, en ocasiones, muy importantes, que dan forma y cambian constantemente la sociedad actual a un ritmo mucho mayor que hace siglos. Este proyecto se centrará en estudiar y analizar el porqué de tales flujos migratorios en el contexto actual.

La idea principal es documentar cómo y por qué, estos cambios pueden estar sujetos a distintas problemáticas como el contexto socioeconómico de los países/regiones, conflictos bélicos, la calidad de vida, entre otros factores.

Rol a desarrollar

Tu equipo/consultora es contratado por una ONG internacional, con el fin de estudiar los flujos migratorios y su impacto en diversos aspectos de los países afectados. Para ello, deben crear toda una solución de datos (data pipeline, bases de datos, data warehouse, dashboard, modelos predictivos, etc.) para poder comunicar eficazmente la relación de las migraciones humanas con los distintos aspectos socioeconómicos y geopolíticos.


Indicaciones

Deberán realizar un estudio puntual de cada uno de los datasets utilizados y presentar lo siguiente:

  • Análisis exploratorio de los datos (EDA). Reporte de calidad de datos (datos faltantes, outliers, valores nulos), el criterio utilizado para su manejo, además de un diccionario de datos.

  • Data Pipeline para el ETL

  • Proponer al menos 4 KPIs

  • Base de datos (DB), data warehouse (DW) y data lake. Debe estar corriendo de manera local o en un proveedor de servicios en la nube (AWS, GCP, Azure, etc).

  • Automatización del flujo de trabajo (Airflow, NiFi o similares).

  • Dashboard con los datos más relevantes para la creación de un storytelling.

  • Uso de modelos de Machine Learning para predecir olas migratorias en los próximos años.

  • Diagrama con la arquitectura de datos utilizada donde se visualice el nombre de las herramientas utilizadas. Revisen el siguiente ejemplo de diagrama.

  • Todo el trabajo debe incluirse en un repositorio de Github, donde crearan un archivo Readme que explique de manera resumida el trabajo realizado.
    Nota: el Readme utilizado para su repositorio no debe ser el de las consignas del Proyecto Grupal.

  • El proyecto además debe estar documentado en un archivo .doc o .pdf, donde puedan desarrollar el avance de su proyecto semana a semana, explicando qué tecnologías utilizan, quiénes son los miembros del equipo, cuáles son los productos a presentar, estimaciones de esfuerzos semana a semana y todo lo que deseen comunicar sobre su proyecto.

Alcance

Como grupo tienen la libertad de elegir los países que quieran analizar. Pueden ser flujos globales, tener en cuenta sólo determinados países o regiones (por ejemplo, migraciones dentro de América Latina), balanza de migración de un país/ países en particular, migración intra-estados/ provincial y su comparación con la inmigración/ emigración de ese mismo país (por ejemplo, estudiar cómo migran las personas dentro de Estados Unidos, y donde se asientan los inmigrantes que eligen a EUA como su destino para vivir). El período de tiempo no tiene restricción alguna, sientanse libres de elegir el que más les interese.

Indicadores

Los indicadores que se pueden tomar en cuenta son de libre elección pero deben responder a las necesidades del proyecto. Estos les ayudarán para dar un mayor respaldo a los datos que recaben e intenten vender como consultora. Por ejemplo, económicos (PIB), calidad de vida, esperanza de vida, costo de vida en países (con cuántos dólares se puede vivir al día), acceso a educación, acceso a salud, efectos de los conflictos armados en los flujos migratorios, etc.


Datasets

Del siguiente sitio web pueden tomar los archivos CSV como principal fuente para sus bases de datos. A su vez, deben complementarlo con al menos tres fuentes de datos adicionales, para ello pueden utilizar información de otros sitios (datasets, APIs, etc.) como las que están detalladas abajo o cualquiera que puedan encontrar en internet relacionadas al tema.

Fuente principal

Banco mundial

Fuentes complementarias

La lista no es exhaustiva, y de ninguna manera deben restringirse a sólo utilizar estas fuentes, pueden utilizar cualquier otra fuente de datos relacionada al tema que sume positivamente al proyecto.

Te recomendamos el uso de APIs para obtener datos adicionales para este proyecto, como podrían ser de clima (dato muy importante son las condiciones climáticas extremas, por ejemplo, en países que estén atravesando grandes sequías, relaciones entre temperatura promedio entre países que reciben migrantes o países desde donde migran, o las condiciones generales no favorezcan el desarrollo "pleno" para sus habitantes).


Lineamientos a evaluar

En este archivo se detalla lo que esperamos de ustedes semana tras semana


Disclaimer

De parte del equipo de Henry se aclara y remarca que el fin de los proyectos propuestos es exclusivamente pedagógico, con el objetivo de realizar simular un entorno laboral, en el cual se trabajan diversas temáticas ajustadas a la realidad. No reflejan necesariamente la filosofía y valores de la organización. Además, Henry no alienta ni tampoco recomienda a los alumnos y/o cualquier persona leyendo los repositorios (y entregas de proyectos) que tomen acciones con base a los datos que pudieran o no haber recabado. Toda la información expuesta y resultados obtenidos en los proyectos nunca deben ser tomados en cuenta para la toma real de decisiones (especialmente en la temática de finanzas, salud, política, etc.).