## Reto 1: Treemaps

### 1. Objetivos:
    - Aprender a generar e interpretar treemaps
 
---
    
### 2. Desarrollo:

In [1]:
!pip install plotly --upgrade

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting plotly
  Downloading plotly-5.10.0-py2.py3-none-any.whl (15.2 MB)
[K     |████████████████████████████████| 15.2 MB 180 kB/s 
Installing collected packages: plotly
  Attempting uninstall: plotly
    Found existing installation: plotly 5.5.0
    Uninstalling plotly-5.5.0:
      Successfully uninstalled plotly-5.5.0
Successfully installed plotly-5.10.0


In [2]:
import plotly.express as px
import pandas as pd

### a) Árbol taxonómico de Nidovirales

Un uso muy común para estructuras de árbol y treemaps son los árboles taxonómicos. Como bien sabes, una especie puede diverger en varias especies pero no hay forma **natural** en la que una especie pueda provenir de la combinación de 2 especies (sí hay hoy en día mezclas interespecies generadas con bioingeniería, pero no suceden espontáneamente en la naturaleza). Es decir, un nodo en un nivel puede tener varias conexiones a nodos en el nivel inferior, pero sólo pueden tener **una** conexión a un nodo de un nivel superior.

Tu primer Reto es generar un Treemap para representar el siguiente árbol taxonómico de Nidovirales:

In [None]:
from IPython.display import Image
Image('../Imgs/taxonomy_tree_of_the_order_nidovirales.png')

In [4]:
fig = px.treemap(
    parents = ["", "Nidovirales", "Arteriviridae", "Arterivirus", "Arterivirus",
               "Nidovirales", "Coronaviridae", "Coronaviridae", "Coronavirinae", "Coronavirinae","Coronavirinae","Coronavirinae", "Alpha-CoV", "Alpha-CoV", "Alpha-CoV", "Beta-CoV", "Beta-CoV", "Beta-CoV", "Gamma-CoV", "Torovirinae", "Torovirinae", "Bafinivirus", "Torovirus","Torovirus","Torovirus",
               "Nidovirales", "Mesoniviridae", "Alphamesonivirus",
               "Nidovirales", "Roniviridae", "Okavirus"],
    names = ["Nidovirales", "Arteriviridae", "Arterivirus", "PRRSV", "EAV",
             "Coronaviridae", "Coronavirinae", "Torovirinae", "Alpha-CoV","Beta-CoV","Gamma-CoV","Delta-CoV", "TGEV", "PEDV", "FCoV", "SARS-CoV", "MHV", "MERS-CoV", "IBV", "Bafinivirus", "Torovirus", "WBV", "BToV", "PToV", "HToV",
             "Mesoniviridae","Alphamesonivirus", "DKNV",
             "Roniviridae", "Okavirus", "YHV"]
)
fig.show()

### b) Uso de tierra de distintos tipos de propiedades en Melbourne, Australia

Para este Reto vamos a usar nuestro dataset 'melbourne_housing-clean.csv'. Queremos usar un Treemap para visualizar el uso de tierra de los distintos tipos de propiedades agrupados por región. El treemap tiene que tener las siguientes características:

1. Debe de tener un primer nivel superior que tenga como valor el nombre de la ciudad: 'Melbourne'. Obviamente, todos los demás niveles estarán contenidos dentro de este primer nivel.
2. Para los niveles inferiores, los datos deberán de ser agrupados utilizando el nombre de la región y después el tipo de propiedad ('region_name' y 'type').
3. El valor que vamos a utilizar para determinar el tamaño de los rectángulos en el treemap va a ser el de tamaño de tierra o 'land_size'.

Comenta con tus compañeros y la experta tus hallazgos.

In [5]:
df = pd.read_csv("https://raw.githubusercontent.com/jaeem006/beduadp/master/Datasets/melbourne_housing-clean.csv", index_col = 0)
df.sample(3)

Unnamed: 0,suburb,address,rooms,type,price,method,seller_g,date,distance,postcode,bedroom_2,bathroom,car,land_size,council_area,latitude,longitude,region_name,property_count
6552,Williamstown,2/125 Ferguson St,1,u,331000.0,S,Williams,28/05/2016,8.0,3016.0,1.0,1.0,1.0,0.0,Hobsons Bay,-37.8586,144.8933,Western Metropolitan,6380.0
4403,Northcote,4/75 Gadd St,2,t,650000.0,VB,Nelson,7/05/2016,5.5,3070.0,2.0,2.0,2.0,55.0,Darebin,-37.7627,144.9898,Northern Metropolitan,11364.0
1541,Burwood,1/24 Edwards St,3,t,1145000.0,S,Jellis,18/03/2017,11.7,3125.0,3.0,2.0,2.0,329.0,Whitehorse,-37.8484,145.1013,Southern Metropolitan,5678.0


In [13]:
pd.DataFrame(df.query("council_area == 'Melbourne'")\
.groupby(['region_name','type'])\
[['land_size']].mean()\
.to_records())

Unnamed: 0,region_name,type,land_size
0,Eastern Metropolitan,h,88.0
1,Eastern Victoria,h,0.0
2,Northern Metropolitan,h,249.296875
3,Northern Metropolitan,t,230.628571
4,Northern Metropolitan,u,573.662921
5,South-Eastern Metropolitan,h,1496.0
6,Southern Metropolitan,h,332.518519
7,Southern Metropolitan,t,45.25
8,Southern Metropolitan,u,672.842105
9,Western Metropolitan,h,554.0


In [14]:
df_treemap = pd.DataFrame(df.query("council_area == 'Melbourne'")\
                          .groupby(['region_name','type'])\
                          [['land_size']].mean()\
                          .to_records()) #TIL
#df_treemap['council_area'] = 'Melbourne'
df_treemap

Unnamed: 0,region_name,type,land_size
0,Eastern Metropolitan,h,88.0
1,Eastern Victoria,h,0.0
2,Northern Metropolitan,h,249.296875
3,Northern Metropolitan,t,230.628571
4,Northern Metropolitan,u,573.662921
5,South-Eastern Metropolitan,h,1496.0
6,Southern Metropolitan,h,332.518519
7,Southern Metropolitan,t,45.25
8,Southern Metropolitan,u,672.842105
9,Western Metropolitan,h,554.0


In [15]:
fig = px.treemap(df_treemap,
                 path = [px.Constant("Melbourne"), 'region_name', 'type'],
                 values = 'land_size')
fig.show()