# Variación de la población mundial en las últimas décadas
### Proyecto realizado por Carlos Fernández González

El punto de partida es una tabla que compara la población de la mayoría de países en los años 1980, 1990, 2000, 2010 y 2022. También incluye el continente al que pertenece dicho país y el puesto que tiene en la lista.

Comenzaremos importando una serie de módulos:

In [1]:
import csv
import math
import matplotlib

### FUNCIÓN DE LECTURA DEL ARCHIVO CSV

In [2]:
def lee_poblacion(fichero):
    '''
    Lee el archivo csv y devuelve una lista de tuplas.
    Todos los datos de entrada son de tipo str.
    Convierte los datos relativos a la población en enteros (int).
    
    '''
    with open ("world_population_datas.csv", encoding= 'utf-8') as f:
        lector = csv.reader(f)
        for linea in f:
            poblacion = [(Rank, Country, Continent, int(_2022_Population), int(_2010_Population), int(_2000_Population), int(_1990_Population), int(_1980_Population)) for Rank, Country, Continent, _2022_Population, _2010_Population, _2000_Population, _1990_Population, _1980_Population in lector]
        return poblacion

In [3]:
#prueba de la función de lectura
poblacion_mundial = lee_poblacion("world_population_datas.csv")
print(poblacion_mundial)

[('36', 'Afghanistan', 'Asia', 41128771, 28189672, 19542982, 10694796, 12486631), ('138', 'Albania', 'Europe', 2842321, 2913399, 3182021, 3295066, 2941651), ('34', 'Algeria', 'Africa', 44903225, 35856344, 30774621, 25518074, 18739378), ('213', 'American Samoa', 'Oceania', 44273, 54849, 58230, 47818, 32886), ('203', 'Andorra', 'Europe', 79824, 71519, 66097, 53569, 35611), ('42', 'Angola', 'Africa', 35588987, 23364185, 16394062, 11828638, 8330047), ('224', 'Anguilla', 'North America', 15857, 13172, 11047, 8316, 6560), ('201', 'Antigua and Barbuda', 'North America', 93763, 85695, 75055, 63328, 64888), ('33', 'Argentina', 'South America', 45510318, 41100123, 37070774, 32637657, 28024803), ('140', 'Armenia', 'Asia', 2780469, 2946293, 3168523, 3556539, 3135123), ('198', 'Aruba', 'North America', 106445, 100341, 89101, 65712, 62267), ('55', 'Australia', 'Oceania', 26177413, 22019168, 19017963, 17048003, 14706322), ('99', 'Austria', 'Europe', 8939617, 8362829, 8010428, 7678729, 7547561), ('91'

Efectivamente, nos devuelve una lista de tuplas con todos los datos sobre variación de población que buscábamos.

### FUNCIÓN DE TRANSFORMACIÓN

Tenemos una categoría (continente) que contiene un conjunto finito de valores que se repite. Para conocer cuáles y cuántos son esos valores (cuántos continentes hay, en este caso) podemos aplicar una función de transformación.

La idea es tomar los elementos en la columna "Continent" en una lista y transformar esta a un conjunto, de forma que no se repitan los valores.

In [9]:
def calcula_continentes(poblacion):
    '''
    Toma la lista de tuplas poblacion_mundial y extrae el elemento que corresponda al continente.
    '''
    lista_continentes = []
    for tupla in poblacion_mundial:
        continentes = tupla[2] #el elemento nº 2 de cada tupla es el continente.
        lista_continentes.append(continentes)
    lista_continentes = set(lista_continentes)
    return lista_continentes

In [11]:
#prueba de la función
continentes = calcula_continentes(poblacion_mundial)
print(continentes)
print("El número total de continentes es", len(continentes))

{'Asia', 'South America', 'Africa', 'Europe', 'Oceania', 'North America'}
El número total de continentes es 6


Se observa que contamos con seis continentes porque el creador del archivo ha considerado separar América del Norte y América del Sur.

### FUNCIÓN DE FILTRADO

También podemos aplicar una función que nos devuelva solo los países que cumplan alguna característica; por ejemplo, que su población sea superior a un número o que se encuentren en un continente determinado. Empecemos por esta última.

In [17]:
def filtra_por_continente(poblacion, continente):
    filtrados = [(b) for a, b, c, d, e, f, g, h in poblacion_mundial if c in continente]
    return filtrados

In [19]:
#prueba de la función
filtrado_por_continente = filtra_por_continente(poblacion_mundial, "Europe")
print("Los países que pertenecen a Europa son los siguientes:", filtrado_por_continente)

Los países que pertenecen a Europa son los siguientes: ['Albania', 'Andorra', 'Austria', 'Belarus', 'Belgium', 'Bosnia and Herzegovina', 'Bulgaria', 'Croatia', 'Cyprus', 'Czech Republic', 'Denmark', 'Estonia', 'Faroe Islands', 'Finland', 'France', 'Germany', 'Gibraltar', 'Greece', 'Guernsey', 'Hungary', 'Iceland', 'Ireland', 'Isle of Man', 'Italy', 'Jersey', 'Latvia', 'Liechtenstein', 'Lithuania', 'Luxembourg', 'Malta', 'Moldova', 'Monaco', 'Montenegro', 'Netherlands', 'North Macedonia', 'Norway', 'Poland', 'Portugal', 'Romania', 'Russia', 'San Marino', 'Serbia', 'Slovakia', 'Slovenia', 'Spain', 'Sweden', 'Switzerland', 'Ukraine', 'United Kingdom', 'Vatican City']


Apliquemos ahora una función que filtre según el número de habitantes del país en este año.

In [20]:
def filtra_por_habitantes_2022(poblacion, habitantes):
    filtrados = [(b) for a, b, c, d, e, f, g, h in poblacion_mundial if d > int(habitantes)]
    return filtrados

In [21]:
#prueba de la función
filtrado_por_habitantes_2022 = filtra_por_habitantes_2022(poblacion_mundial, 100000000)
print("Los países cuya población supera los 10000000 son los siguientes:", filtrado_por_habitantes_2022)

Los países cuya población supera los 10000000 son los siguientes: ['Bangladesh', 'Brazil', 'China', 'Egypt', 'Ethiopia', 'India', 'Indonesia', 'Japan', 'Mexico', 'Nigeria', 'Pakistan', 'Philippines', 'Russia', 'United States']
