## Reto 4: Gráficas de Barras Apiladas

### 1. Objetivos:
    - Aprender a generar e interpretar gráficas de barras apiladas

---
    
### 2. Desarrollo:

### a) Uso de tierra de propiedades en venta en Melbourne, Australia

Ya usamos un treemap para visualizar el uso de tierra de propiedades en venta en Melbourne, Australia. Vamos a realizar el mismo análisis pero ahora utilizando gráficas de barras apiladas, para ver qué diferencias y similitudes tienen. Queremos visualizar lo mismo que en el Reto 1: después de segmentar nuestros datos por regiones y por tipos de propiedad, ¿cómo se compara el uso de tierra de cada uno con los demás?

El Reto consiste en dos partes. La primera parte es la siguiente:

1. Lee el dataset 'melbourne_housing-clean.csv'.
2. Realiza una gráfica de barras convencional donde el eje `x` sea el nombre de la región ('region_name') y el eje `y` sea la suma total del 'land_size' de todas las propiedades que se encuentran en esa región. Asegúrate de que las barras estén ordenadas de mayor a menor.
3. Asegúrate de que el título y los nombres de ejes sean adecuados. Además elige una paleta de colores agradable para las barras. Ten cuidado con los nombres de los tics en el eje `x`: si quedan muy apretados, tendrás que girarlos para que sean legibles.

La segunda parte del Reto es la siguiente:

1. Vamos ahora a realizar una segunda agrupación. Además de agrupar tus datos por región, también agrúpalos por tipo de propiedad.
2. Realiza una gráfica de barras apilada con las siguientes características:

  a) El eje `x` son los nombres de las regiones
  b) El eje `y` es el total de 'land_size' de todas las propiedades contenidas en cada región
  c) Cada barra estará dividida en 3 partes (cuando aplique), una parte por cada tipo de propiedad
  
Lo que estamos obteniendo entonces es la misma gráfica de barras de la primera parte, pero con cada barra segmentada por tipo de propiedad. De esta manera es fácil ver la contribución que tiene cada tipo de propiedad al total de 'land_size' en cada región.
3. Asegúrate como siempre de que la gráfica sea agradable y comprensible.

Comenta tus hallazgos con tus compañeros y la experta. Específicamente discutan las preguntas siguientes: ¿Cómo se compara esta visualización con el treemap que realizamos en el Reto 1? ¿Cuál te parece más clara de las dos? ¿Hay información en cada una de las gráficas que no es posible extraer de la otra? ¿En qué contexto utilizarías tú cada una de ellas?

In [4]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

In [2]:
#mount drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
#leer archivo /content/drive/MyDrive/Colab Notebooks/Datasets/melbourne_housing-clean.csv
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Datasets/melbourne_housing-clean.csv')


In [5]:
land_size_region = df.groupby('region_name')['land_size'].sum().sort_values(ascending=False)
land_size_region

Unnamed: 0_level_0,land_size
region_name,Unnamed: 1_level_1
Southern Metropolitan,2215203.0
Northern Metropolitan,1693920.0
Western Metropolitan,1378361.0
Eastern Metropolitan,733325.0
South-Eastern Metropolitan,235090.0
Eastern Victoria,149633.0
Western Victoria,26714.0
Northern Victoria,24973.0


In [8]:
# Convert the land_size_region Series to a DataFrame with appropriate column names
land_size_region_df = land_size_region.reset_index()  # Reset the index to create a 'region_name' column
# Now, 'region_name' and 'land_size' are columns in land_size_region_df

graph = px.bar(land_size_region_df, x='region_name', y='land_size', title='Land Size by Region') # Pass the DataFrame
graph.show()

In [9]:
land_size_region_type = df.groupby(['region_name', 'type'])['land_size'].sum()
land_size_region_type.head(5)

Unnamed: 0_level_0,Unnamed: 1_level_0,land_size
region_name,type,Unnamed: 2_level_1
Eastern Metropolitan,h,640076.0
Eastern Metropolitan,t,36518.0
Eastern Metropolitan,u,56731.0
Eastern Victoria,h,147122.0
Eastern Victoria,u,2511.0


In [10]:
graph=px.bar(land_size_region_type.reset_index(), x='region_name', y='land_size', color='type', title='Land Size by Region and Type')
graph.show()