Skip to content

adtsune/tipologia_cicle_dada_practica_2

Repository files navigation

TIPOLOGIA I CICLE DE VIDA DE LES DADES

PRÀCTICA 2 - NETEJA I ANÀLISI DE DADES - WORLD HEALTH INDICATORS DATASET

  • Integrants del Grup: Xavier Ventura i Anna De la Torre.

  • Llenguatge de programació: R.

  • Nom del dataset: world_health_indicators.csv

  • Link de descàrrega del dataset: https://zenodo.org/record/3751704#.XpXenHJS_IU

  • Data de captura de dades: 14 d'Abril de 2020 (Pràctica 1 - Web Scrapping).

  • Data de lliurament de la pràctica: 9 de Juny de 2020.

Descripció del dataset:

El dataset World Health Indicators conté dades relacionades amb l'àmbit de la salut pública i dades socioeconòmiques referents a 227 països i regions del món. Ha estat elaborat a partir de dades proporcionades per l'Organització de les Nacions Unides i pel Banc Mundial a través dels seus llocs web. Ambdues són organitzacions que treballen pel desenvolupament humà, la seguretat i l'erradicació de la pobresa al món.

Descripció de la pràctica:

Es realitza una selecció de dades, imputació de valors nuls i tractament de valors extrems. S’analitza la correlació entre indicadors socioeconòmics i indicadors sanitaris, amb especial èmfasi en aquelles variables que afecten l’esperança de vida d’homes i dones. S’estudien amb detall les diferències en l’esperança de vida segons diferents rangs de despesa sanitària pública. Finalment s’implementarà un model de regressió que permeti predir l’esperança de vida en funció de diferents variables correlacionades.

Descripció de fitxers

Fitxer descriptiu

  • M2_941_20192_Practica2_XV_AT.pdf - Fitxer que conté l'explicació de la pràctica, incloent la visualització dels resultats i les conclusions.

Fitxers de codi

  • M2_941_20192_Practica2_XV_AT.Rmd – Fitxer de codi en R, que llegeix el fitxer world_health_indicators.csv i aplica la neteja i anàlisi de dades, genera visualitzacions i crea l'arxiu world_health_indicators_final.csv amb el dataset final analitzat.

Fitxer.csv

  • world_health_indicators.csv - Fitxer amb el dataset original.

  • world_health_indicators_final.csv - Fitxer amb el dataset final analitzat (generat per M2_941_20192_Practica2_XV_AT.Rmd).

Referències

  1. Calvo, M., Pérez, D., Subirats, L. Introducció a la neteja i anàlisi de dades. Editorial UOC.
  2. Dalgaard, Peter (2002). Introductory statistics with R (Second Edition). New York : Springer
  3. Jason W. Osborne (2010). Data Cleaning Basics: Best Practices in Dealing with Extreme Scores. Newborn and Infant Nursing Reviews; 10 (1): pp. 1527-3369.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages