#Ejercicio de visualización de datos
Makeover Monday ofrece un reto semanal de recrear o mejorar visualizaciones de datos. ¡Tu tarea es elegir uno de las visualizaciones de datos para recrear o mejorar!

Para hacer esto:

* Elegir un conjunto de datos de la Data Sets list. Puedes elegir un conjunto de datos reciente o uno del año anterior, ¡siempre y cuando te interese!
* Descarga los datos que elegiste.
* Usa Python para crear una visualización informativa y placentera a la vista usando los datos que seleccionaste.

También necesitas subir tu trabajo para esta tarea a GitHub, ¡así todos pueden ver lo fabulosa que es la visualización que creaste!

Para hacer esto:

* Crea un nuevo repositorio de GitHub con un nombre informativo para su visualización o datos. (Nota: aquí hay instrucciones de cómo hacerlo si no estás segur. Asegúrate de marcar la casilla «Inicie este repositorio con un README.»).
* Agrega tu código al repositorio GitHub que creaste. Puedes hacerlo en Google Colab seleccionando Archivo > «Guardar una Copia en GitHub».
* Edita el README para crear un resumen informativo de los ejercicios que explican el propósito de la tarea/visualización, los datos y qué muestra/dice la visualización que creaste. ¡También podrías querer incluir una imagen estática de tu visualización final en el README! (Nota: los README son archivos markdown. Aquí hay una hoja con soluciones de markdown syntax.) ¡Intenta hacerlo lo más informativo y profesional posible, ya que esto es lo primero que las personas verán cuando entren a tu repositorio GitHub!

Una vez termines, envía un vínculo a tu repositorio GitHub para entregar esta tarea.

Elijo la siguiente base que habla de mujeres en el poder politico por pais
https://data.world/makeovermonday/2020w30

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
filename='/content/drive/MyDrive/Colab Notebooks/Ejercicios 08 Julio/Viz5_August_Female_Political_Representation.csv'
df=pd.read_csv(filename)
df.head(10)

Unnamed: 0,Country Name,Country Code,Year,Proportion of seats held by women in national parliaments (%)
0,Albania,ALB,1997,
1,Albania,ALB,1998,
2,Albania,ALB,1999,0.051613
3,Albania,ALB,2000,0.051613
4,Albania,ALB,2001,0.057143
5,Albania,ALB,2002,0.057143
6,Albania,ALB,2003,0.057143
7,Albania,ALB,2004,0.064286
8,Albania,ALB,2005,0.071429
9,Albania,ALB,2006,0.071429


Vamos a explorar un poco mas la data, veamos que años estan considerados, son datos del 1997 al 2019

In [None]:
df.describe()


Unnamed: 0,Year,Proportion of seats held by women in national parliaments (%)
count,4945.0,4793.0
mean,2008.0,0.171003
std,6.63392,0.104108
min,1997.0,0.0
25%,2002.0,0.09673
50%,2008.0,0.160714
75%,2014.0,0.22449
max,2019.0,0.6375


In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4945 entries, 0 to 4944
Data columns (total 4 columns):
 #   Column                                                         Non-Null Count  Dtype  
---  ------                                                         --------------  -----  
 0   Country Name                                                   4945 non-null   object 
 1   Country Code                                                   4945 non-null   object 
 2   Year                                                           4945 non-null   int64  
 3   Proportion of seats held by women in national parliaments (%)  4793 non-null   float64
dtypes: float64(1), int64(1), object(2)
memory usage: 154.7+ KB


Hay bastante dato nulo en el % en el parlamento

In [None]:
df['Country Name'].value_counts()

Albania                                   23
Mozambique                                23
Nauru                                     23
Nepal                                     23
Netherlands                               23
                                          ..
Heavily indebted poor countries (HIPC)    23
High income                               23
Honduras                                  23
Hungary                                   23
Zimbabwe                                  23
Name: Country Name, Length: 215, dtype: int64

Cambiare los titulos de las columnas para dejar una data mas comoda

In [None]:
df.columns = ['Nombre_Pais',
              'Codigo_Pais',
              'Años',
              'Participacion_Parlamento']
df.head()

Unnamed: 0,Nombre_Pais,Codigo_Pais,Años,Participacion_Parlamento
0,Albania,ALB,1997,
1,Albania,ALB,1998,
2,Albania,ALB,1999,0.051613
3,Albania,ALB,2000,0.051613
4,Albania,ALB,2001,0.057143


Hare 2 DF para comparar 1997 con 2019

In [None]:
filter1997=df['Años']==1997
df1=df.loc[filter1997, :]#Filtro de 1997
df1.head()

Unnamed: 0,Nombre_Pais,Codigo_Pais,Años,Participacion_Parlamento
0,Albania,ALB,1997,
23,Algeria,DZA,1997,0.031579
46,Andorra,AND,1997,0.071429
69,Angola,AGO,1997,0.095455
92,Antigua and Barbuda,ATG,1997,0.052632


In [None]:
filter2019=df['Años']==2019
df2=df.loc[filter2019, :] #Filtro de 2019
df2.head()

Unnamed: 0,Nombre_Pais,Codigo_Pais,Años,Participacion_Parlamento
22,Albania,ALB,2019,0.295082
45,Algeria,DZA,2019,0.257576
68,Andorra,AND,2019,0.464286
91,Angola,AGO,2019,0.3
114,Antigua and Barbuda,ATG,2019,0.111111


In [None]:
titulo1997='EL MUNDO EN 1997'
titulo2019='EL MUNDO EN 2019'
leyenda='Participacion Mujeres en el Parlamento'

In [None]:
import plotly.express as px
import matplotlib.pyplot as plt


fig1 = px.choropleth(df1, locations='Codigo_Pais',
                    color='Participacion_Parlamento', hover_name='Nombre_Pais',
                    color_continuous_scale="Viridis", 
                    title= 'EL MUNDO EN 1997')

fig1.update_layout(margin={"r":0,"t":0,"l":0,"b":0})
fig1.show()

In [None]:
fig2 = px.choropleth(df2, locations='Codigo_Pais',
                    color='Participacion_Parlamento', hover_name='Nombre_Pais',
                    color_continuous_scale="Viridis", 
                    title= 'EL MUNDO EN 2019')

fig2.update_layout(margin={"r":0,"t":0,"l":0,"b":0})
fig2.show()