Skip to content

Team-17-Bedu/proyecto_python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

67 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation


Logo

Países con mayor calidad de vida

Proyecto final para el modulo "Procesamiento de datos con Python"

Acerca del proyecto

Este proyecto tiene como proposito realizar un analisis de la calidad de vida de ciertos paises, con el fin de determinar cuál de ellos podria ser la mejor opcion para vivir o buscar un empleo, todo esto, haciendo uso de herramientas estadísticas y computacionales, siendo el principal aliado, el lenguaje de programacion Python

Acerca de la beca

Esta beca es iniciativa del "Grupo Santander" enfocada en la formación de competencias tecnológicas con el objetivo de desarrollar habilidades digitales altamente valoradas en el mercado.

El programa logrará que el estudiante obtenga la capacidad de tomar decisiones, generar reportes, crear visualizaciones, responder preguntas y resolver problemas sobre bases de datos con las lenguajes R y Python haciendo uso de diferentes librerías, herramientas y paquetes para el análisis de datos.

Indíce

  • Identificación del problema.
  • Investigación.

Requerimientos

  • Jupyter Notebook

Introducción

Identificación del problema:


El ser humano siempre busca un mejor ambiente para desarrollarse. Buscando aquellos lugares donde pueda mejorar económicamente, laboralmente y personalmente. Pero muchas veces por falta de información no se contemplan países donde hay excelentes oportunidades, y en todo caso tampoco se tiene una idea de aquellos países donde van a surgir estas nuevas oportunidades.

Investigación

El índice de desarrollo humano (IDH) es un indicador nacido de la mano del Programa de Naciones Unidas para el Desarrollo (PNUD) que mide el nivel de desarrollo de cada país atendiendo a variables como la esperanza de vida, la educación o el ingreso per cápita.

A través de sus mediciones el índice de desarrollo humano de la ONU se encarga de mostrar las posibilidades de crecimiento económico de las sociedades del mundo y el modo en que sus estados les facilitan un entorno adecuado o no para dicho objetivo y sus condiciones de vida en general.

Este indicador se basa en el estudio de variables similares para cada rincón del mundo, como son la esperanza de vida, el nivel de educación medio por habitante y el PIB per cápita de cada país.

Calificaciones del índice de desarrollo humano

Tras una investigación y estudio de las características de cada nación, el IDH se encarga de marcar valores en cada uno de ellos entre 0 y 1, de menor calificación a más alta, de modo que se clasifica a cada lugar en un grupo correspondiente según su nivel de desarrollo:

  • Desarrollo humano muy alto (“High Human Development”), aquellos con niveles superiores al 0,80.

  • Desarrollo humano alto (“Medium Human Development”), cuyos niveles rondan entre 0,70 y 0,80.

  • Desarrollo humano medio (“Medium Human Development”), cuyos niveles rondan entre 0,50 y 0,70.

  • Desarrollo humano bajo (“Low Human Development”), ya con una valoración inferior a 0,55.

Objetivos del índice de desarrollo humano :

A grandes rasgos, este índice busca aportar luz al nivel de vida que experimenta cada lugar del mundo para así poder enfocar futuros programas de ayuda internacional en diferentes ámbitos, como infraestructuras, proyectos educativos e institucionales.

El indicador es realizado desde 1990 por parte de la ONU, sustituyendo los análisis de crecimiento previos, los cuales no enfatizaban el aspecto humano y su desarrollo, y se centraban especialmente en el punto de vista más económico.

La ONU mantiene el uso del índice de desarrollo humano en su continuo trabajo persiguiendo valores como la sostenibilidad y la reducción de los niveles de desigualdad entre continentes. De este modo, no solamente se tiene en cuenta el nivel de ingresos y rentas de los individuos de un país, sino que también mide temas como la educación y las condiciones de vida en las que se desenvuelve la persona.

Preguntas

Estas preguntas son planteadas para poderlas respondes con la información que se obtenga del analisis del dataset.

  1. ¿Cuáles son los mejores países con mejor IDH en el mundo?

  2. ¿Cuál será el IDH en los mejores países de aquí a 5 años?

  3. ¿Cuál es el IDH en México actual?

  4. ¿Cuál será el IDH de México aquí a 5 años?

  5. ¿Qué factores se ven relacionados con el IDH?

  6. ¿Cuáles son los principales factores que afectan al IDH?

  7. ¿Hay alguna relación entre el IDH con algún factor regional o zona?

  8. ¿A qué se debe el bajo IDH en algunos países?

  9. ¿Hay alguna relación entre la cantidad de población con el IDH?

  10. ¿Hay alguna relación entre la educación con el IDH?

  11. ¿Hay alguna relación entre la esperanza de vida con el IDH?

  12. ¿Hay alguna relación entre las oportunidades de empleo con el IDH?

  13. ¿Cuáles son los otros factores relevantes que afecte el IDH?

  14. ¿Cómo han cambiado el IDH atreves del tiempo?

  15. ¿Los países en vía de desarrollo entre que rango está el IDH?

  16. ¿En latino América, cual es el mejor país?

  17. ¿En América, cual es el mejor país?

  18. ¿En Asia, cuáles es el mejor país?

  19. ¿En África, cual es el mejor país?

  20. ¿En Europa, cual es el mejor país?

Preguntas sobre el dataset

  • ¿El conjunto de datos que tengo realmente me sirve para responder algunas de las preguntas que me planteé?

    • Sí, dado que las preguntas estan relacionadas conforme a la información que se puede obtener visualmente del dataset.
  • ¿Qué tamaño tiene mi conjunto de datos?

    • 764 filas y 61 columnas.
  • ¿Serán datos suficientes?

    • Sí,porque estamos obtniendo el índice de desarrollo humano.
  • ¿Qué columnas tengo y qué información tengo en cada una de esas columnas?

    • La expectativa del año, el ingreso per capita, la media educativa, maxima de escolaridad.
  • Los nombres que tienen mis columnas, ¿son el nombre más apropiado?

    • No, algunas columnas no cuentan con nombre pero se les estara dando un nuevo nombre.
  • ¿Qué tipos de datos tengo en cada columna?

    • Object, Float64, Int64.
  • ¿Parecen ser el tipo correcto de datos?

    • No, hay datos que se tendran que convertir a tipo numerico.
  • Si selecciono algunas filas al azar y las observo ¿estoy obteniendo los datos que debería? ¿o hay datos que parecen estar "sucios" o "incorrectos"?.

    • En algunas muestras si se llega obtener el valor esperado, mientras que otro es de manera distinta, ahi se tendra que analizar que hacer con ellos.

Dato curioso sobre el calculo del IDH

Como se calcúlalo el Índice de Desarrollo Humano

Para el calculo del IDH se establecen los valores mínimos y máximos, con el fin de transformar los indicadores en un resultado entre el 0 y el 1. Donde los 0 representan los "ceros naturales" y los 1 representan las "metas operacionales". Para ello se establecen los siguientes valores:

Dimensiones Indicador Mínimo Máximo
Salud Expectativa de Vida en años 20 años 85 años
Educación Expectativa de Escolaridad en años 0 años 18 años
Educación Media de Escolaridad en años 0 años 15 años
Ingreso Estándar de vida Ingresó Nacional Bruto per cápita (PPA en dólares de 2017) 100 75,000

La justificación de plantear que los "ceros naturales", o minimos, en la expectativa de vida sea de 20 años se basa en la evidencia histórica que ningún país en el siglo XXI tiene una expectativa menor a 20 años. Mientras que para la "meta aspiracional", o maximos, de la expectativa de vida es de 85 años, que es la meta aspiracional de los países en los últimos 30 años.

Las sociedades pueden subsistir sin educación formal, justificando los "ceros naturales" relacionados con la educación. Donde la máxima "meta aspiracional" es de 18 años, que es equivalente a obtener una maestría. Mientras la máxima media de educación es de 15 años, y se espera que sea usada hasta el año 2025.

El mínimo valor para el Ingreso Nacional Bruto per cápita es de $100, justificado de la considerable cantidad de producción no medida en economías cercanas al mínimo, que no se captura en datos oficiales. Mientras que el máximo se fija en $75,000. Kahneman Deaton(2010) ha demostrado que prácticamente no hay ganancia en el desarrollo humano y el bienestar en ingresos anuales superiores al $75,000.

Teniendo establecidos los mínimos y los máximos, los índices de dimensión se calculan como:

$DimensionIndice = \frac{Valor Actual - Valor Mínimo}{Valor Máximo - Valor Mínimo}$

La fórmula con lo que se calcula el HDI es la media geométrica de la siguiente operación:

HDI = (ISalud*IEducacion*IIngresos)1/3

Libreta de jupyter

Se encuentra un notebook principal con los pasos que se realizaron para la obtención de datos, limpieza, reestructura, dejar nuestro dataset listo y preparado para la siguiente fase. Routa del notebook: Notebook/Indice_de_Desarrollo_Humano.ipynb

Acerca de los colaboradores

Licencia

Distribuido bajo la licencia MIT. Consulte LICENCE para obtener más información.

About

Proyecto bases de python del modulo 3-fase 2

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •