# Piramides de Población

> Importamos las bibliotecas `matplotlib.pyplot`, `numpy` y `pandas`, lo cual es necesario para realizar visualizaciones y manipulaciones de datos en Python.

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

> Ahora puedes utilizar estas bibliotecas para crear gráficos, realizar operaciones numéricas y trabajar con los datos contenidos en los DataFrames de Pandas.

>
> Visite la Organización de las Naciones Unidas, en la siguiente direccion 
: [Departamento de Asuntos Económicos y Sociales: División de Población](https://population.un.org/wpp/Download/Standard/CSV/) y descargar el archivo:  **1950-2100, medium (ZIP, 12.38 MB) Population on 01 July, by 5-year age groups**. Guarde el archivo en la carpeta de trabajo y extraiga el archivo CSV:> 

## Lectura de un archivo CSV

> El código proporcionado utiliza la biblioteca pandas para leer un archivo `CSV` llamado `'WPP2022_PopulationByAge5GroupSex_Medium.csv'` y guarda los datos en un DataFrame llamado `df1`. Luego, se muestra una vista previa de las primeras filas del DataFrame utilizando el método `head()`.

In [None]:
df1 = pd.read_csv('WPP2022_PopulationByAge5GroupSex_Medium.csv', low_memory=False)
df1.head()

>El método `head()` muestra por defecto las primeras 5 filas del DataFrame `df1`. Si deseas mostrar un número diferente de filas, puedes pasar ese número como argumento al método `head()`. Por ejemplo, `df1.head(10)` mostrará las primeras 10 filas del DataFrame.

## Obtener la forma del DataFrame

> Para obtener la forma (`shape`) de un DataFrame llamado `df1`, puedes utilizar el atributo shape. Esto te dará una tupla que contiene el número de filas y columnas presentes en el DataFrame.

In [None]:
df1.shape

## Obtener la información del Dataframe

> El método `info()` en pandas proporciona información sobre un DataFrame, incluyendo el índice, el número de columnas, los nombres de las columnas, el número de valores no nulos y los tipos de datos de cada columna. Para obtener la información del DataFrame `df1`, puedes utilizar el siguiente código:

In [None]:
df1.info

> Esto muestra la información resumida del DataFrame, incluyendo el número total de filas, el nombre de cada columna, la cantidad de valores no nulos en cada columna y el tipo de datos de cada columna. También mostrará el uso de memoria del DataFrame.

## Obtener las columnas del Dataframe
>
> Para obtener los nombres de las columnas en el DataFrame `df1`, puedes utilizar el atributo `columns`. Esto te dará una lista con los nombres de las columnas presentes en el DataFrame.
>
> Aquí tienes un ejemplo de cómo usarlo:

In [None]:
df1.columns

> Se accede a cada uno de estos datos mediante:

In [None]:
len(df1)

In [None]:
len(df1.columns)

## Eliminar columnas del DataFrame. 

> La función `drop()` se utiliza para eliminar filas o columnas de un DataFrame en pandas. En este caso, se eliminan las columnas con los nombres `'SortOrder'`, `'LocID'`, `'Notes'`, `'ISO2_code'`, `'SDMX_code'`, `'LocTypeID'`, `'LocTypeName'`, `'ParentID'`, `'VarID'`, `'Variant'`y `'MidPeriod'` del DataFrame `df1`.
>
> Aquí está el código completo:

In [None]:
df1 = df1.drop(['SortOrder', 'LocID', 'Notes', 'ISO2_code', 'SDMX_code',
       'LocTypeID', 'LocTypeName', 'ParentID', 'VarID', 'Variant', 'AgeGrpSpan',
       'MidPeriod'], axis=1)
df1

> El argumento `axis=1` se utiliza para indicar que se deben eliminar columnas en lugar de filas. Después de ejecutar este código, el DataFrame `df1` se actualizará y contendrá solo las columnas restantes después de eliminar las mencionadas.
>
> Recuerda que si deseas guardar los cambios en el DataFrame original, debes asignar el resultado de `drop()` nuevamente a `df1`, como se muestra en el código anterior.

## Obtención de países únicos de la columna `"Location"` del DataFrame

> El código necesario para crear un conjunto (`set`) llamado `paises1` que contiene los valores únicos de la columna "Location" del DataFrame `pop_df1`. Esto se hace utilizando el constructor `set()` y pasando la columna como argumento.

Aquí tienes un ejemplo de cómo usarlo:

In [None]:
paises1 = set(df1.Location)
print(paises1)

> Esto imprimr el conjunto `paises1`, que contiene los valores únicos de la columna  `"Location"` del DataFrame `df1`.
>
> Recuerda que un conjunto (`set`) en Python es una colección desordenada de elementos únicos. Al crear un conjunto a partir de una columna, se eliminan automáticamente los duplicados, por lo que solo se conservan los valores únicos de la columna `"Location"`.

## Obtención de la cantidad de países únicos en el conjunto

In [None]:
cantidad_paises = len(paises1)
print("Cantidad de países únicos en el conjunto:", cantidad_paises)

> El código imprime la cantidad de países únicos presentes en el conjunto `paises1` y se mostrará el título `"Cantidad de países únicos en el conjunto:"` antes de la salida del resultado.

## Obtención de los valores únicos de la columna `"Time"` del DataFrame
Si deseas obtener los valores únicos de la columna `"Time"` del DataFrame `df1`, puedes utilizar la función `set()` para crear un conjunto de esos valores. Aquí tienes el código:

In [None]:
valores_unicos_time = set(df1.Time)
print(valores_unicos_time)

> Esto creará un conjunto llamado `valores_unicos_time` que contendrá los valores únicos de la columna `"Time"` del DataFrame `df1`. Luego, se imprimirá el conjunto para mostrar los valores únicos.
>
> Recuerda que un conjunto (`set`) en Python es una colección desordenada de elementos únicos. Al crear un conjunto a partir de una columna, se eliminan automáticamente los valores duplicados, dejando solo los valores únicos.

## Obtención del valor mínimo y máximo de la columna `"Time"`

> Si deseas obtener el valor mínimo de la columna `"Time"` en el DataFrame `df1`, puedes usar el método `min()`. Aquí tienes el código:

In [None]:
valor_minimo_time = df1.Time.min()
print("Valor mínimo del tiempo en el dataframe:", valor_minimo_time)

> Si deseas obtener el valor máximo de la columna `"Time"` en el DataFrame `df1`, puedes usar el método `max()`. Aquí tienes el código:

In [None]:
valor_maximo_time = df1.Time.max()
print("Valor máximo del tiempo en el dataframe:", valor_maximo_time)

> Asegúrate de que el nombre de la columna `"Time"` sea exactamente como está en tu DataFrame para obtener el resultado correcto.

## Obtención de las característica de las cohortes

> Una cohorte se refiere a un grupo de individuos que comparten una característica o experiencia común dentro de un período específico. En el contexto de estudios demográficos, una cohorte se define como un grupo de personas que nacen o experimentan un evento similar en un período de tiempo particular.
> 
> Las cohortes pueden ser utilizadas en diversas disciplinas, como la demografía, la sociología, la psicología y el marketing, entre otras. Al analizar las cohortes, se busca comprender cómo los eventos o características compartidas pueden influir en el comportamiento, las actitudes y las experiencias de un grupo a lo largo del tiempo.
> 
> Por ejemplo, en el ámbito demográfico, se pueden estudiar cohortes de nacimientos para analizar cómo los cambios en las tasas de natalidad afectan la estructura de la población a lo largo de las generaciones. También se pueden estudiar cohortes de ingreso para examinar cómo los eventos históricos, como recesiones económicas, afectan la trayectoria económica y laboral de un grupo de personas a lo largo de sus vidas.

### Valores únicos de la columna `"AgeGrp"`

> La columna `"AgeGrp"` hace referencia a los grupos de edad en un conjunto de datos demográficos. En lugar de representar edades individuales, se agrupan las edades en rangos específicos para facilitar el análisis y la visualización de los datos.
> 
> La columna `"AgeGrp"` suele contener etiquetas o códigos que representan los grupos de edad. Estos códigos pueden variar según el conjunto de datos y el propósito del estudio. Algunos ejemplos comunes de etiquetas de grupos de edad podrían ser `"0-4"` para el grupo de edad de 0 a 4 años, `"5-9"` para el grupo de edad de 5 a 9 años, `"10-14"` para el grupo de edad de 10 a 14 años, y así sucesivamente.
> 
> La columna `"AgeGrp"` se utiliza para clasificar los datos en categorías de grupos de edad, lo que facilita el análisis y la comparación entre diferentes grupos de población.
> 
> Es importante tener en cuenta que la columna `"AgeGrp"` suele estar relacionada con otras columnas demográficas, como la población o las tasas de natalidad y mortalidad, y se utiliza para realizar análisis demográficos y calcular estadísticas descriptivas sobre los diferentes grupos de edad en un conjunto de datos.

In [None]:
valores_unicos_agegrp = sorted(df1['AgeGrp'].unique())
valores_unicos_agegrp

### Valores únicos de la columna `"AgeGrpStart"`

> La columna `"AgeGrpStart"` hace referencia al comienzo del rango de edad en una determinada cohorte o grupo de edad en un conjunto de datos. Esta columna generalmente se utiliza para representar la edad inicial de un grupo demográfico específico.
> 
> En muchos conjuntos de datos demográficos, las edades se agrupan en rangos para facilitar el análisis y la visualización. La columna `"AgeGrpStart"` proporciona el valor de inicio de cada rango de edad en el conjunto de datos.
> 
> Por ejemplo, si estuviéramos analizando la distribución de la población por grupos de edad y tuviéramos una columna `"AgeGrpStart"`, podríamos encontrar valores como 0, 5, 10, 15, etc. Estos valores representarían el inicio de cada rango de edad en el conjunto de datos. En este caso, el rango de edad de 0 a 4 años podría tener un `"AgeGrpStart"` de 0, el rango de 5 a 9 años podría tener un `"AgeGrpStart"` de 5, y así sucesivamente.
> 
> Si deseas imprimir los valores únicos de la columna `"AgeGrpStart"` en forma ordenada, puedes seguir estos pasos:
> 
> 1. Obtén los valores únicos de la columna "AgeGrpStart" utilizando el método `unique()` de pandas.
> 2. Convierte los valores únicos en una lista.
> 3. Ordena la lista de valores únicos en forma ascendente utilizando la función `sorted()`.
> 4. Imprime los valores únicos ordenados.

In [None]:
valores_unicos_agegrpstart = sorted(df1['AgeGrpStart'].unique())
valores_unicos_agegrpstart

## Filtración mediante el metodo `query()`.

> El método `query()` de pandas se utiliza para filtrar el DataFrame `df1` y obtener las filas donde el valor de la columna `"Location"` igual a `"Peru"`. Aquí tienes el código completo:

In [None]:
peru = df1.query('Location == "Peru"')
print("Dimensiones del DataFrame 'peru':", peru.shape)
peru.head()

> El código filtra el DataFrame `df1` para obtener solo las filas donde el valor de la columna `"Location"` es `"Peru"` y almacena el resultado en el DataFrame `peru`. Luego, se imprime la forma (dimensiones) del DataFrame `peru` utilizando `peru.shape`, que devuelve una tupla con el número de filas y columnas del DataFrame.
>
> Finalmente, se muestra la vista previa (las primeras filas) del DataFrame `peru` utilizando `peru.head()`.

In [None]:
peru_2023 = df1.query('Location == "Peru"').query('Time == 2023')
print("Dimensiones del DataFrame 'peru_2023':", peru_2023.shape)
peru_2023.head()

> El siguiente código proporciona un resultado similar creando un DataFrame llamado `df_tmp` que contiene las filas del DataFrame `df1` donde el valor de la columna `"Location"` igual a `"Peru"` y el valor de la columna `"Time"` es 2023. Aquí tienes el código:

In [None]:
df_tmp = df1[(df1['Location']=='Peru') & (df1['Time']==2023)]
print("Dimensiones del DataFrame 'peru_2023':", df_tmp.shape)
df_tmp.head()

In [None]:
country = 'Peru'
year = 2023

df_tmp = df1[(df1['Location']==country) & (df1['Time']==year)]
df_tmp = df_tmp.sort_values('AgeGrpStart', ascending=True)

y = range(0, len(df_tmp))
x_male = df_tmp['PopMale']
x_female = df_tmp['PopFemale']

# max xlim
max_x_scale = max(max(x_female), max(x_male))+100

fig, axes = plt.subplots(ncols=2, sharey=True, figsize=(10, 8))

fig.patch.set_facecolor('xkcd:lemon yellow')
plt.figtext(.5,0.925, country + ": " +  str(year), fontsize=20, ha='center')

axes[0].barh(y, x_male, align='center', color='xkcd:cobalt blue')
axes[0].set(title='Varones')
axes[0].set(xlim=[0,max_x_scale])

axes[1].barh(y, x_female, align='center', color='xkcd:tangerine')
axes[1].set(title='Mujeres')
axes[1].set(xlim=[0,max_x_scale])
axes[1].grid()

axes[0].set(yticks=y, yticklabels=df_tmp['AgeGrp'])
axes[0].invert_xaxis()
axes[0].grid()

plt.show()

In [None]:
def plot_population_pyramid(country, year):
    df_tmp = df1[(df1['Location']==country) & (df1['Time']==year)]
    df_tmp = df_tmp.sort_values('AgeGrpStart', ascending=True)

    y = range(0, len(df_tmp))
    x_male = df_tmp['PopMale']
    x_female = df_tmp['PopFemale']

    # max xlim
    max_x_scale = max(max(x_female), max(x_male))+100

    fig, axes = plt.subplots(ncols=2, sharey=True, figsize=(10, 8))

    fig.patch.set_facecolor('xkcd:lemon yellow')
    plt.figtext(.5,0.925, country + ": " +  str(year), fontsize=20, ha='center')

    axes[0].barh(y, x_male, align='center', color='xkcd:cobalt blue')
    axes[0].set(title='Varones')
    axes[0].set(xlim=[0,max_x_scale])

    axes[1].barh(y, x_female, align='center', color='xkcd:tangerine')
    axes[1].set(title='Mujeres')
    axes[1].set(xlim=[0,max_x_scale])
    axes[1].grid()

    axes[0].set(yticks=y, yticklabels=df_tmp['AgeGrp'])
    axes[0].invert_xaxis()
    axes[0].grid()

    plt.show()

In [None]:
country = 'Argentina'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'United States of America'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Germany'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Ethiopia'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Israel'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Qatar'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Japan'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Saudi Arabia'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Azerbaijan'
year = 2023
plot_population_pyramid(country, year)

In [None]:
country = 'Estonia'
year = 2022
plot_population_pyramid(country, year)

In [None]:
country = 'Bahrain'
year = 2022
plot_population_pyramid(country, year)

In [None]:
country = 'Cuba'
year = 2022
plot_population_pyramid(country, year)

In [None]:
def plot_population_pyramid_perc(country, year):
    df_tmp = df1[(df1['Location']==country) & (df1['Time']==year)]
    df_tmp = df_tmp.sort_values('AgeGrpStart', ascending=True)

    y = range(0, len(df_tmp))
    x_male = df_tmp['PopMale']  / df_tmp['PopTotal'].sum() * 100
    x_female = df_tmp['PopFemale']  / df_tmp['PopTotal'].sum() * 100

    # max xlim
    max_x_scale = max(max(x_female), max(x_male))+0.25

    fig, axes = plt.subplots(ncols=2, sharey=True, figsize=(10, 8))

    fig.patch.set_facecolor('xkcd:light blue green')
    plt.figtext(.5,0.925, country + ": " +  str(year), fontsize=20, ha='center')

    axes[0].barh(y, x_male, align='center', color='xkcd:indigo blue')
    axes[0].set(title='Varones')
    axes[0].set(xlim=[0,max_x_scale])

    axes[1].barh(y, x_female, align='center', color='xkcd:vermillion')
    axes[1].set(title='Mujeres')
    axes[1].set(xlim=[0,max_x_scale])
    axes[1].grid()

    axes[0].set(yticks=y, yticklabels=df_tmp['AgeGrp'])
    axes[0].invert_xaxis()
    axes[0].grid()

    plt.show()

In [None]:
country = 'Cuba'
year = 2022
plot_population_pyramid_perc(country, year)

In [None]:
country = 'Bahrain'
year = 2022
plot_population_pyramid_perc(country, year)

In [None]:
country = 'Estonia'
year = 2022
plot_population_pyramid_perc(country, year)

## Creación de un directorio

> El código que se proporciona a continuación utiliza la función `os.makedirs()` para crear un directorio llamado `"Peru"` en tu sistema de archivos. Aquí tienes el código:

In [None]:
import os
os.makedirs('Peru')

> Después de ejecutar este código, se creará un directorio llamado `"Peru"` en el directorio actual o en la ruta especificada. Si el directorio ya existe, no se realizará ninguna acción.
>
> Puedes utilizar este directorio para organizar y almacenar archivos relacionados con los datos o resultados específicos de Perú en tu proyecto.

In [None]:
import math

country= 'Peru'
counter = 0
for yr in list(range(1950,2100,1)):
    year = yr
    df_tmp = df1[(df1['Location']==country) & (df1['Time']==year)]
    df_tmp = df_tmp.sort_values('AgeGrpStart',ascending=True)

    y = range(0, len(df_tmp))
    x_male = df_tmp['PopMale']  / df_tmp['PopTotal'].sum() * 100
    x_female = df_tmp['PopFemale']  / df_tmp['PopTotal'].sum() * 100
    
    # max xlim
    max_x_scale = math.ceil(max(max(x_female), max(x_male))) + 0.25

    fig, axes = plt.subplots(ncols=2, sharey=True, figsize=(10, 8))

    fig.patch.set_facecolor('xkcd:light blue green')
    plt.figtext(.5,.9, country + ": " +  str(year), fontsize=15, ha='center')

    axes[0].barh(y, x_male, align='center', color='xkcd:indigo blue')
    axes[0].set(title='Males')
    axes[0].set(xlim=[0,max_x_scale])

    axes[1].barh(y, x_female, align='center', color='xkcd:vermillion')
    axes[1].set(title='Females')
    axes[1].set(xlim=[0,max_x_scale])
    axes[1].grid()
    
    axes[0].set(yticks=y, yticklabels=df_tmp['AgeGrp'])
    axes[0].invert_xaxis()
    axes[0].grid()
    
    
    plt.savefig('Peru/anim_' + str(counter) + '.png')
    counter += 1

## Realiza una animación de las piramides de población con FFMPEG:
>  Descarga la versión de [FFMPEG](https://github.com/adaptlearning/adapt_authoring/wiki/Installing-FFmpeg) y sigue el procedimiento para su instalación:
>
> `ffmpeg -framerate 10 -i "anim_%d.png" -pix_fmt yuv420p out.mp4`

In [None]:
# pip install --upgrade pip

In [None]:
# pip install -U Flask

## Creacción de piramides de población en HTML

In [None]:
# Cree una versión más pequeña para ajustarse al límite de 100 MB en PythonAnywhere
df = pd.read_csv('WPP2022_PopulationByAge5GroupSex_Medium.csv')
df = df[['Location','Time', 'AgeGrp', 'AgeGrpStart', 'PopMale', 'PopFemale', 'PopTotal']]
df.to_csv('WPP2022_PopulationByAge5GroupSex.csv')
df.head()

/mysite/
    WPP2022_PopulationByAge5GroupSex.csv
    flask_app.py
    /templates/
        build-a-pyramid.html
        unprg.png

In [None]:
#!/usr/bin/env python
from flask import Flask, render_template, flash, request, jsonify, Markup
import matplotlib
import matplotlib.pyplot as plt
import io, os, base64
import numpy as np
import pandas as pd

# global variables
app = Flask(__name__)
pop_df = None
location_list = None

BASE_DIR = os.path.dirname(os.path.abspath(__file__))

@app.before_first_request
def startup():
        global pop_df, location_list

	# load and prepare the data
	pop_df = pd.read_csv(BASE_DIR + '/WPP2022_PopulationByAge5GroupSex.csv')
	location_list = sorted(list(set(pop_df['Location'])))

def get_population_pyramid(country, year):
	pop_df_tmp = pop_df[(pop_df['Location']==country) & (pop_df['Time']==year)].copy()
	pop_df_tmp = pop_df_tmp.sort_values('AgeGrpStart',ascending=True)
	return(pop_df_tmp)

@app.route("/", methods=['POST', 'GET'])
def build_pyramid():
	plot_to_show = ''
	selected_country = ''
	country_list = ''
	selected_year = ''

	if request.method == 'POST':
		selected_country = request.form['selected_country']
		selected_year = int(request.form['selected_year'])

		pop_df_tmp = get_population_pyramid(selected_country, selected_year)

		y = range(0, len(pop_df_tmp))
		x_male = pop_df_tmp['PopMale']
		x_female = pop_df_tmp['PopFemale']

		# max xlim
		max_x_scale = max(max(x_female), max(x_male))

		fig, axes = plt.subplots(ncols=2, sharey=True, figsize=(12, 10))

		fig.patch.set_facecolor('xkcd:light lavender')
		plt.figtext(.5,.9,selected_country + ": " +  str(selected_year), fontsize=16, ha='center')

		axes[0].barh(y, x_male, align='center', color='#4B63E9')
		axes[0].set(title='Males')
		axes[0].set(xlim=[0,max_x_scale])
		axes[1].barh(y, x_female, align='center', color='#F39C12')
		axes[1].set(title='Females')
		axes[1].set(xlim=[0,max_x_scale])
		axes[1].grid()
		axes[0].set(yticks=y, yticklabels=pop_df_tmp['AgeGrp'])
		axes[0].invert_xaxis()
		axes[0].grid()

		img = io.BytesIO()
		plt.savefig(img, format='png')
		img.seek(0)
		plot_url = base64.b64encode(img.getvalue()).decode()
		plot_to_show = Markup('<img src="data:image/png;base64,{}" style="width:100%;vertical-align:top">'.format(plot_url))

	return render_template('build-a-pyramid.html',
						plot_to_show = plot_to_show,
						selected_country = selected_country,
						location_list = location_list,
						selected_year = selected_year)
if __name__=='__main__':
    app.run(debug=True)

In [None]:
<!DOCTYPE html>
<html lang="en" >
<head>
  <meta charset="UTF-8">
  <title>Population Pyramids</title>
  <meta name="viewport" content="width=device-width, initial-scale=1">
  <script src="//ajax.googleapis.com/ajax/libs/jquery/1.9.1/jquery.min.js"></script>
  <link rel="stylesheet" href="https://www.w3schools.com/w3css/4/w3.css">

</head>

<body bgcolor="black">
  <div class="w3-center w3-padding">
    <H1> <img src="https://www.pythonanywhere.com/user/cazula/files/home/cazula/mysite/templates/unprg.png"> </H1>
    <H1><font color='#3364FF'> Análisis Económico de la Población (EC-480 10A)</font> </H1>
    <H1><font color='#F39C12'>Piramides de  Población</font>                              </H1>
    <H1><font color='#F4D03F'> (1950 - 2099)</font>                                        </H1>

    <FORM id='submit_content' method="POST" action="{{ url_for('build_pyramid') }}">

    <SELECT class="selectpicker" name="selected_country">
        <option value="{{selected_country}}" selected>{{selected_country}}</option>
        {% for country in location_list %}
            <option>{{country}}</option>
        {% endfor %}
    </SELECT>


    <SELECT class="selectpicker" name="selected_year" >
        <option value="{{selected_year}}" selected>{{selected_year}}</option>
        {% for year in range(1950, 2100, 1) %}
            <option value="{{year}}">{{year}}</option>
        {% endfor %}
    </SELECT>
    <button type="submit" form="submit_content" value="Submit">Build</button>
  </FORM>
</div>


  {{plot_to_show}}

<H5><font color='#E74C3C'> (Extraido de https://www.viralml.com/)</font> /H5>
</body>

</html>

## Bibliotecas para la visualización interactiva de piramides de población

In [None]:
import plotly.offline as pyoff
import plotly.graph_objs as go

import numpy as np

country = 'Peru'
year = 2022

pop_df_tmp = pop_df1[(pop_df1['Location']==country) & (pop_df1['Time']==year)]
pop_df_tmp = pop_df_tmp.sort_values('AgeGrpStart', ascending=True)


men_bins = np.array(pop_df_tmp['PopMale']/ pop_df_tmp['PopTotal'].sum() *100)
women_bins = np.array(-abs(pop_df_tmp['PopFemale'] / pop_df_tmp['PopTotal'].sum()*100))


y = list(pop_df1['AgeGrp'])

layout = go.Layout(yaxis=go.layout.YAxis(title='Cohortes'),
                   xaxis=go.layout.XAxis(
                       range=[-5, 5],
                       tickvals=[-5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5],
                       ticktext=[5, 4, 3, 2, 1, 0, 1, 2, 3, 4, 5],
                       title='Porcentaje'),
                   barmode='overlay',
                   bargap=0.1)

data = [go.Bar(y=y,
               x=women_bins,
               orientation='h',
               name='Mujeres',
               text= -1*women_bins.astype('float').round(2),
               hoverinfo='text',
               marker=dict(color='powderblue')
               ),
        go.Bar(y=y,
               x=men_bins.round(2),
               orientation='h',
               name='Hombres', 
               hoverinfo='x',
               marker=dict(color='seagreen')
               )]

pyoff.iplot(dict(data=data, layout=layout))

In [None]:
country = 'Peru'
year = 2022

pop_df_tmp = pop_df1[(pop_df1['Location']==country) & (pop_df1['Time']==year)]
pop_df_tmp = pop_df_tmp.sort_values('AgeGrpStart', ascending=True)

y = list(pop_df_tmp['AgeGrp'])
male = np.array(pop_df_tmp['PopMale']/ pop_df_tmp['PopTotal'].sum() *100)
female = np.array(-abs(pop_df_tmp['PopFemale'] / pop_df_tmp['PopTotal'].sum()*100))

# Creamos una Figura.

fig = go.Figure()

fig.add_trace(go.Bar(
                    y = y,
                    x = male.round(2),
                    name = 'Hombres',
                orientation = 'h'
))

fig.add_trace(go.Bar(
                    y = y,
                    x = female,
                    name = 'Mujeres',
                orientation = 'h',
               text= -1*female.astype('float').round(2),
               hoverinfo='text',
))

fig.update_layout(
    template = 'plotly_white',
    title = 'Piramide Poblacional Peru 2022',
    title_font_size =24,
    barmode = 'relative',
    bargap = 0.0,
    bargroupgap = 0)

fig.show()