# 0. Presentación

En este cuaderno se realiza la etapa del ***Proceso KDD de Preproceso de Datos*** en este caso, aplicándola sobre el conjunto de datos de la OMS, para el análisis de datos en su vertiente de estudiar cuales son las causas de la expansión de las enfermedades infecciosas en la sociedad.

# 1. Librerías

Antes de iniciar cualquier tarea debemos de asegurarnos de que las librerías que sean necesarias están correctamente importadas.

In [None]:
# Carga y manipulación de datos
from google.colab import files
import io
 
# Librería para manipular DataFrames
import pandas as pd

# 2. Carga de datos

El primer paso es subir todos los archivos CSV que sean necesarios para llevar a cabo este proceso. En este caso cargamos la base de datos de la OMS tras pasar el proceso de selección de datos. Para ello utilizaremos las herramientas que nos ofrece Google Colab a la hora de subir archivos. 

In [None]:
data = pd.read_csv('oms_data.csv', index_col = ['Pais'])
data = data.drop(['Unnamed: 0'], axis=1)
data

Unnamed: 0_level_0,Total Fallecidos Vias Respiratorias,Media Fallecidos Vias Respiratorias,Total Fallecidos Sepsis,Media Fallecidos Sepsis,Total Fallecidos Meningitis Encefalitis,Media Fallecidos Meningitis Encefalitis,Total Fallecidos Malaria,Media Fallecidos Malaria,Total Fallecidos Sarampion,Media Fallecidos Sarampion,Total Fallecidos VIH,Media Fallecidos VIH,Total Fallecidos Diarrea,Media Fallecidos Diarrea,Vacunación contra la poliomielitis entre los niños de 1 año (%),Vacunación de antineumocócicas conjugadas en niños de 1 año (%),Vacunación de la primera dosis contra el sarampión (%),Vacunación de la segunda dosis contra el sarampión (%),Vacunación contra la hepatitis B entre los niños de 1 año (%),Vacunación contra Hib entre niños de 1 año (%),Vacunación contra la tos ferina y el toxoide tetánico diftérico en niños de 1 año (%),Vacunación con BCG en niños de 1 año (%),Centros de salud (Densidad por 100000 hab.),Hospitales (Densidad por 100000 hab.),Doctores medicos (por 10000 hab.),Enfermeros y personal de parto (por 10000 hab.),Farmaceuticos (por 10000 hab.),Camas de hospital (por 10000 hab.),Niños con bajo peso al nacer(%),Prevalencia de anemia en niños menores de 5 años (%),Niños amamantados en sus primeros 6 meses de vida (%),Concentracion de partículas finas (polucion) en el aire,"DALY debido al agua, saneamiento e higiene en niños menores de 5 años","Muertes debido al agua, saneamiento e higiene en niños menores de 5 años"
Pais,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1
Afghanistan,342325,19018.055556,132422,7356.777778,87773,4876.277778,1839,102.166667,64128,3562.666667,256,14.222222,196793,10932.944444,37.975610,28.076923,37.804878,21.047619,26.43750,23.966667,37.317073,42.414634,1.205,0.37,2.322167,3.563000,0.339308,4.322222,,7.426486,43.100000,53.2,2139966.0,62200.0
Albania,1709,94.944444,232,12.888889,347,19.277778,0,0.000000,2,0.111111,8,0.444444,199,11.055556,93.975610,68.153846,91.414634,87.285714,79.15625,36.200000,94.219512,91.585366,,1.36,13.587417,43.983167,4.477278,30.523077,4.71250,3.802703,15.600000,17.9,4284.0,116.0
Algeria,57438,3191.000000,34367,1909.277778,5136,285.333333,0,0.000000,7048,391.555556,209,11.611111,25187,1399.277778,78.536585,25.538462,73.292683,87.333333,45.40625,37.400000,75.634146,82.585366,,,13.764200,20.264800,2.541250,18.000000,7.45625,5.311892,14.966667,35.2,114938.0,3139.0
Andorra,0,0.000000,0,0.000000,0,0.000000,0,0.000000,0,0.000000,0,0.000000,0,0.000000,54.268293,43.461538,54.024390,54.666667,64.03125,68.466667,54.268293,,,,28.841154,31.692286,9.236786,,7.45625,1.701622,,9.9,3.0,0.0
Angola,477166,26509.222222,102661,5703.388889,73790,4099.444444,194517,10806.500000,38396,2133.111111,37764,2098.000000,360353,20019.611111,28.048780,25.230769,43.170732,7.714286,20.90625,22.300000,33.439024,51.121951,,,1.168000,7.249600,0.253000,8.000000,16.62500,9.080541,37.400000,27.9,1308451.0,37920.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Venezuela (Bolivarian Republic of),21296,1183.111111,20060,1114.444444,2918,162.111111,362,20.111111,2,0.111111,624,34.666667,14745,819.166667,73.073171,2.384615,70.682927,19.047619,43.37500,44.066667,64.219512,86.390244,,,18.387500,14.675250,,8.340000,8.69375,4.472973,7.100000,15.8,36820.0,857.0
Viet Nam,101760,5653.333333,26736,1485.333333,10556,586.444444,441,24.500000,16538,918.777778,4372,242.888889,58593,3255.166667,75.365854,,75.048780,53.666667,46.62500,28.666667,74.195122,79.146341,,,6.880167,10.424308,2.640333,26.925000,8.59375,5.489189,18.383333,29.7,189463.0,4905.0
Yemen,181798,10099.888889,64507,3583.722222,21755,1208.611111,9806,544.777778,16662,925.666667,583,32.388889,104175,5787.500000,51.024390,46.000000,49.317073,28.619048,39.03125,34.766667,52.000000,54.170732,4.785,2.97,3.481600,7.338556,0.582250,6.672222,,12.291892,13.025000,45.0,448442.0,12890.0
Zambia,150437,8357.611111,45546,2530.333333,25204,1400.222222,74649,4147.166667,16217,900.944444,112542,6252.333333,104496,5805.333333,73.292683,40.076923,75.463415,15.857143,40.12500,45.566667,74.219512,87.560976,8.790,0.45,0.734286,7.861857,0.359500,19.500000,12.43125,9.059459,36.583333,24.7,372317.0,10541.0


# 3. Preproceso de datos

El objetivo de este preproceso es calcular la variable objetivo del dataset, borrar columnas con información no útil o ambigua y el tratamiento de valores vacíos, entre otros cometidos.

## Cálculo de la variable de fallecimientos por enfermedades infecciosas

Lo primero de todo, es determinar cual va a ser la variable fallecimientos por enfermedades infecciosas con la que se trabajará a lo largo de este estudio. Esta variable será la media de la totalidad de niños fallecidos por todas las enfermedades infecciosas de las que ofrece datos OMS, que son las siguientes enfermedades infecciosas:

* Enfermedades que causan infecciones en las vías respiratorias
* Sepsis
* Meningitis y Encefalitis
* Malaría 
* Sarampión
* VIH
* Diarrea

La OMS ofrece datos desde el año 2000 hasta el 2017.

In [None]:
data['Media Fallecidos Enf. Infecciosas'] = (data['Media Fallecidos Vias Respiratorias'] + 
                                             data['Media Fallecidos Sepsis'] + 
                                             data['Media Fallecidos Meningitis Encefalitis'] + 
                                             data['Media Fallecidos Malaria'] + 
                                             data['Media Fallecidos Sarampion'] + 
                                             data['Media Fallecidos VIH'] + 
                                             data['Media Fallecidos Diarrea']) / 7
data

Unnamed: 0_level_0,Total Fallecidos Vias Respiratorias,Media Fallecidos Vias Respiratorias,Total Fallecidos Sepsis,Media Fallecidos Sepsis,Total Fallecidos Meningitis Encefalitis,Media Fallecidos Meningitis Encefalitis,Total Fallecidos Malaria,Media Fallecidos Malaria,Total Fallecidos Sarampion,Media Fallecidos Sarampion,Total Fallecidos VIH,Media Fallecidos VIH,Total Fallecidos Diarrea,Media Fallecidos Diarrea,Vacunación contra la poliomielitis entre los niños de 1 año (%),Vacunación de antineumocócicas conjugadas en niños de 1 año (%),Vacunación de la primera dosis contra el sarampión (%),Vacunación de la segunda dosis contra el sarampión (%),Vacunación contra la hepatitis B entre los niños de 1 año (%),Vacunación contra Hib entre niños de 1 año (%),Vacunación contra la tos ferina y el toxoide tetánico diftérico en niños de 1 año (%),Vacunación con BCG en niños de 1 año (%),Centros de salud (Densidad por 100000 hab.),Hospitales (Densidad por 100000 hab.),Doctores medicos (por 10000 hab.),Enfermeros y personal de parto (por 10000 hab.),Farmaceuticos (por 10000 hab.),Camas de hospital (por 10000 hab.),Niños con bajo peso al nacer(%),Prevalencia de anemia en niños menores de 5 años (%),Niños amamantados en sus primeros 6 meses de vida (%),Concentracion de partículas finas (polucion) en el aire,"DALY debido al agua, saneamiento e higiene en niños menores de 5 años","Muertes debido al agua, saneamiento e higiene en niños menores de 5 años",Media Fallecidos Enf. Infecciosas
Pais,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1
Afghanistan,342325,19018.055556,132422,7356.777778,87773,4876.277778,1839,102.166667,64128,3562.666667,256,14.222222,196793,10932.944444,37.975610,28.076923,37.804878,21.047619,26.43750,23.966667,37.317073,42.414634,1.205,0.37,2.322167,3.563000,0.339308,4.322222,,7.426486,43.100000,53.2,2139966.0,62200.0,6551.873016
Albania,1709,94.944444,232,12.888889,347,19.277778,0,0.000000,2,0.111111,8,0.444444,199,11.055556,93.975610,68.153846,91.414634,87.285714,79.15625,36.200000,94.219512,91.585366,,1.36,13.587417,43.983167,4.477278,30.523077,4.71250,3.802703,15.600000,17.9,4284.0,116.0,19.817460
Algeria,57438,3191.000000,34367,1909.277778,5136,285.333333,0,0.000000,7048,391.555556,209,11.611111,25187,1399.277778,78.536585,25.538462,73.292683,87.333333,45.40625,37.400000,75.634146,82.585366,,,13.764200,20.264800,2.541250,18.000000,7.45625,5.311892,14.966667,35.2,114938.0,3139.0,1026.865079
Andorra,0,0.000000,0,0.000000,0,0.000000,0,0.000000,0,0.000000,0,0.000000,0,0.000000,54.268293,43.461538,54.024390,54.666667,64.03125,68.466667,54.268293,,,,28.841154,31.692286,9.236786,,7.45625,1.701622,,9.9,3.0,0.0,0.000000
Angola,477166,26509.222222,102661,5703.388889,73790,4099.444444,194517,10806.500000,38396,2133.111111,37764,2098.000000,360353,20019.611111,28.048780,25.230769,43.170732,7.714286,20.90625,22.300000,33.439024,51.121951,,,1.168000,7.249600,0.253000,8.000000,16.62500,9.080541,37.400000,27.9,1308451.0,37920.0,10195.611111
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Venezuela (Bolivarian Republic of),21296,1183.111111,20060,1114.444444,2918,162.111111,362,20.111111,2,0.111111,624,34.666667,14745,819.166667,73.073171,2.384615,70.682927,19.047619,43.37500,44.066667,64.219512,86.390244,,,18.387500,14.675250,,8.340000,8.69375,4.472973,7.100000,15.8,36820.0,857.0,476.246032
Viet Nam,101760,5653.333333,26736,1485.333333,10556,586.444444,441,24.500000,16538,918.777778,4372,242.888889,58593,3255.166667,75.365854,,75.048780,53.666667,46.62500,28.666667,74.195122,79.146341,,,6.880167,10.424308,2.640333,26.925000,8.59375,5.489189,18.383333,29.7,189463.0,4905.0,1738.063492
Yemen,181798,10099.888889,64507,3583.722222,21755,1208.611111,9806,544.777778,16662,925.666667,583,32.388889,104175,5787.500000,51.024390,46.000000,49.317073,28.619048,39.03125,34.766667,52.000000,54.170732,4.785,2.97,3.481600,7.338556,0.582250,6.672222,,12.291892,13.025000,45.0,448442.0,12890.0,3168.936508
Zambia,150437,8357.611111,45546,2530.333333,25204,1400.222222,74649,4147.166667,16217,900.944444,112542,6252.333333,104496,5805.333333,73.292683,40.076923,75.463415,15.857143,40.12500,45.566667,74.219512,87.560976,8.790,0.45,0.734286,7.861857,0.359500,19.500000,12.43125,9.059459,36.583333,24.7,372317.0,10541.0,4199.134921


## Borrado de columnas ineccesarias

Después de calcular la variable objetivo, se procede al borrado de las columnas de la media y el total de muertes de niños a causa de enfermedades infecciosas.

In [None]:
lista_borrar = ["Total Fallecidos Vias Respiratorias", "Media Fallecidos Vias Respiratorias", 
                "Total Fallecidos Sepsis", "Media Fallecidos Sepsis", 
                "Total Fallecidos Meningitis Encefalitis", "Media Fallecidos Meningitis Encefalitis", 
                "Total Fallecidos Malaria", "Media Fallecidos Malaria", 
                "Total Fallecidos Sarampion", "Media Fallecidos Sarampion", 
                "Total Fallecidos VIH", "Media Fallecidos VIH", 
                "Total Fallecidos Diarrea", "Media Fallecidos Diarrea"]

data = data.drop(lista_borrar,axis=1)

In [None]:
data

Unnamed: 0_level_0,Vacunación contra la poliomielitis entre los niños de 1 año (%),Vacunación de antineumocócicas conjugadas en niños de 1 año (%),Vacunación de la primera dosis contra el sarampión (%),Vacunación de la segunda dosis contra el sarampión (%),Vacunación contra la hepatitis B entre los niños de 1 año (%),Vacunación contra Hib entre niños de 1 año (%),Vacunación contra la tos ferina y el toxoide tetánico diftérico en niños de 1 año (%),Vacunación con BCG en niños de 1 año (%),Centros de salud (Densidad por 100000 hab.),Hospitales (Densidad por 100000 hab.),Doctores medicos (por 10000 hab.),Enfermeros y personal de parto (por 10000 hab.),Farmaceuticos (por 10000 hab.),Camas de hospital (por 10000 hab.),Niños con bajo peso al nacer(%),Prevalencia de anemia en niños menores de 5 años (%),Niños amamantados en sus primeros 6 meses de vida (%),Concentracion de partículas finas (polucion) en el aire,"DALY debido al agua, saneamiento e higiene en niños menores de 5 años","Muertes debido al agua, saneamiento e higiene en niños menores de 5 años",Media Fallecidos Enf. Infecciosas
Pais,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,37.975610,28.076923,37.804878,21.047619,26.43750,23.966667,37.317073,42.414634,1.205,0.37,2.322167,3.563000,0.339308,4.322222,,7.426486,43.100000,53.2,2139966.0,62200.0,6551.873016
Albania,93.975610,68.153846,91.414634,87.285714,79.15625,36.200000,94.219512,91.585366,,1.36,13.587417,43.983167,4.477278,30.523077,4.71250,3.802703,15.600000,17.9,4284.0,116.0,19.817460
Algeria,78.536585,25.538462,73.292683,87.333333,45.40625,37.400000,75.634146,82.585366,,,13.764200,20.264800,2.541250,18.000000,7.45625,5.311892,14.966667,35.2,114938.0,3139.0,1026.865079
Andorra,54.268293,43.461538,54.024390,54.666667,64.03125,68.466667,54.268293,,,,28.841154,31.692286,9.236786,,7.45625,1.701622,,9.9,3.0,0.0,0.000000
Angola,28.048780,25.230769,43.170732,7.714286,20.90625,22.300000,33.439024,51.121951,,,1.168000,7.249600,0.253000,8.000000,16.62500,9.080541,37.400000,27.9,1308451.0,37920.0,10195.611111
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Venezuela (Bolivarian Republic of),73.073171,2.384615,70.682927,19.047619,43.37500,44.066667,64.219512,86.390244,,,18.387500,14.675250,,8.340000,8.69375,4.472973,7.100000,15.8,36820.0,857.0,476.246032
Viet Nam,75.365854,,75.048780,53.666667,46.62500,28.666667,74.195122,79.146341,,,6.880167,10.424308,2.640333,26.925000,8.59375,5.489189,18.383333,29.7,189463.0,4905.0,1738.063492
Yemen,51.024390,46.000000,49.317073,28.619048,39.03125,34.766667,52.000000,54.170732,4.785,2.97,3.481600,7.338556,0.582250,6.672222,,12.291892,13.025000,45.0,448442.0,12890.0,3168.936508
Zambia,73.292683,40.076923,75.463415,15.857143,40.12500,45.566667,74.219512,87.560976,8.790,0.45,0.734286,7.861857,0.359500,19.500000,12.43125,9.059459,36.583333,24.7,372317.0,10541.0,4199.134921


## Tratamiento valores vacíos

Consultamos que columnas de las existentes en el dataframe posee algún valor vacío.

In [None]:
pd.isnull(data).any()

Vacunación contra la poliomielitis entre los niños de 1 año (%)                          False
Vacunación de antineumocócicas conjugadas en niños de 1 año (%)                           True
Vacunación de la primera dosis contra el sarampión (%)                                   False
Vacunación de la segunda dosis contra el sarampión (%)                                    True
Vacunación contra la hepatitis B entre los niños de 1 año (%)                             True
Vacunación contra Hib entre niños de 1 año (%)                                            True
Vacunación contra la tos ferina y el toxoide tetánico diftérico en niños de 1 año (%)    False
Vacunación con BCG en niños de 1 año (%)                                                  True
Centros de salud (Densidad por 100000 hab.)                                               True
Hospitales (Densidad por 100000 hab.)                                                     True
Doctores medicos (por 10000 hab.)                 

Rellenamos los valores vacíos usando la media de esa columna. Después, comprobamos que ya no tenemos valores vacíos.

In [None]:
data.fillna(data.mean(), inplace=True)
pd.isnull(data).any()

Vacunación contra la poliomielitis entre los niños de 1 año (%)                          False
Vacunación de antineumocócicas conjugadas en niños de 1 año (%)                          False
Vacunación de la primera dosis contra el sarampión (%)                                   False
Vacunación de la segunda dosis contra el sarampión (%)                                   False
Vacunación contra la hepatitis B entre los niños de 1 año (%)                            False
Vacunación contra Hib entre niños de 1 año (%)                                           False
Vacunación contra la tos ferina y el toxoide tetánico diftérico en niños de 1 año (%)    False
Vacunación con BCG en niños de 1 año (%)                                                 False
Centros de salud (Densidad por 100000 hab.)                                              False
Hospitales (Densidad por 100000 hab.)                                                    False
Doctores medicos (por 10000 hab.)                 

## Redondeo de decimales

Redondeamos los decimales a simplemente 2, ya que se considera que aporta la misma información y no es un cambio relevante.


In [None]:
data = data.round(2)
data

Unnamed: 0_level_0,Vacunación contra la poliomielitis entre los niños de 1 año (%),Vacunación de antineumocócicas conjugadas en niños de 1 año (%),Vacunación de la primera dosis contra el sarampión (%),Vacunación de la segunda dosis contra el sarampión (%),Vacunación contra la hepatitis B entre los niños de 1 año (%),Vacunación contra Hib entre niños de 1 año (%),Vacunación contra la tos ferina y el toxoide tetánico diftérico en niños de 1 año (%),Vacunación con BCG en niños de 1 año (%),Centros de salud (Densidad por 100000 hab.),Hospitales (Densidad por 100000 hab.),Doctores medicos (por 10000 hab.),Enfermeros y personal de parto (por 10000 hab.),Farmaceuticos (por 10000 hab.),Camas de hospital (por 10000 hab.),Niños con bajo peso al nacer(%),Prevalencia de anemia en niños menores de 5 años (%),Niños amamantados en sus primeros 6 meses de vida (%),Concentracion de partículas finas (polucion) en el aire,"DALY debido al agua, saneamiento e higiene en niños menores de 5 años","Muertes debido al agua, saneamiento e higiene en niños menores de 5 años",Media Fallecidos Enf. Infecciosas
Pais,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
Afghanistan,37.98,28.08,37.80,21.05,26.44,23.97,37.32,42.41,1.20,0.37,2.32,3.56,0.34,4.32,10.13,7.43,43.10,53.2,2139966.0,62200.0,6551.87
Albania,93.98,68.15,91.41,87.29,79.16,36.20,94.22,91.59,6.95,1.36,13.59,43.98,4.48,30.52,4.71,3.80,15.60,17.9,4284.0,116.0,19.82
Algeria,78.54,25.54,73.29,87.33,45.41,37.40,75.63,82.59,6.95,2.24,13.76,20.26,2.54,18.00,7.46,5.31,14.97,35.2,114938.0,3139.0,1026.87
Andorra,54.27,43.46,54.02,54.67,64.03,68.47,54.27,72.01,6.95,2.24,28.84,31.69,9.24,29.72,7.46,1.70,29.89,9.9,3.0,0.0,0.00
Angola,28.05,25.23,43.17,7.71,20.91,22.30,33.44,51.12,6.95,2.24,1.17,7.25,0.25,8.00,16.62,9.08,37.40,27.9,1308451.0,37920.0,10195.61
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Venezuela (Bolivarian Republic of),73.07,2.38,70.68,19.05,43.38,44.07,64.22,86.39,6.95,2.24,18.39,14.68,3.26,8.34,8.69,4.47,7.10,15.8,36820.0,857.0,476.25
Viet Nam,75.37,46.82,75.05,53.67,46.62,28.67,74.20,79.15,6.95,2.24,6.88,10.42,2.64,26.93,8.59,5.49,18.38,29.7,189463.0,4905.0,1738.06
Yemen,51.02,46.00,49.32,28.62,39.03,34.77,52.00,54.17,4.78,2.97,3.48,7.34,0.58,6.67,10.13,12.29,13.02,45.0,448442.0,12890.0,3168.94
Zambia,73.29,40.08,75.46,15.86,40.12,45.57,74.22,87.56,8.79,0.45,0.73,7.86,0.36,19.50,12.43,9.06,36.58,24.7,372317.0,10541.0,4199.13


# 4. Exportación de datos 

Por último, convertimos el dataframe en un archivo CSV, para poder descargarlo.

In [None]:
data.to_csv('oms_data_preprocesado.csv')