# Análise dos fatores de Construção e Habitação

In [1]:
import pandas as pd
import os
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
import plotly.express as px
import numpy as np
import matplotlib.pyplot as plt
from auxiliary.auxiliary_funcs import processar_ficheiro,carregar_municipios,aplicar_kmeans,elbow_rule, save_clustered_df_to_csv,filter_for_only_municipalities

data_path ='../data/dados_municipio/Construção e Habitação (9)/'


**Valor mediano das rendas**

In [2]:
df_valor_mediano_rendas = processar_ficheiro(data_path+'Valor mediano das rendas por m2.xls',0)
df_valor_mediano_rendas = carregar_municipios(df_valor_mediano_rendas)
df_valor_mediano_rendas = df_valor_mediano_rendas[['local','codigo','Valor mediano das rendas por m2']]
df_valor_mediano_rendas = df_valor_mediano_rendas[df_valor_mediano_rendas['Valor mediano das rendas por m2'] != 0.0] # remove 0 values
df_valor_mediano_rendas = df_valor_mediano_rendas[df_valor_mediano_rendas['codigo'].str.len() <= 7]


df_valor_mediano_rendas


Unnamed: 0,local,codigo,Valor mediano das rendas por m2
4,Arcos de Valdevez,1111601,4.64
5,Caminha,1111602,5.83
6,Melgaço,1111603,3.29
7,Monção,1111604,6.58
8,Paredes de Coura,1111605,3.84
...,...,...,...
627,Calheta (R.A.M.),3003101,5.59
628,Câmara de Lobos,3003102,6.78
629,Funchal,3003103,11.51
630,Machico,3003104,5.98


In [3]:
clustered_df = aplicar_kmeans(df_valor_mediano_rendas, 3, nome_cluster='Rendas')
save_clustered_df_to_csv(clustered_df, "csv_files/", "7_Rendas.csv")

Rendas
0    114
1     67
2     31
Name: count, dtype: int64
File saved to csv_files/7_Rendas.csv


**Valor mediano vendas**

In [4]:
df_valor_mediano_vendas = processar_ficheiro(data_path+'Valor mediano das vendas por m2.xls',0)
df_valor_mediano_vendas = carregar_municipios(df_valor_mediano_vendas)
df_valor_mediano_vendas = df_valor_mediano_vendas[['local','codigo','Valor mediano das vendas por m2']]
df_valor_mediano_vendas = df_valor_mediano_rendas[df_valor_mediano_rendas['Valor mediano das rendas por m2'] != 0.0] # remove 0 values
df_valor_mediano_vendas = df_valor_mediano_rendas[df_valor_mediano_rendas['codigo'].str.len() <= 7]
df_valor_mediano_vendas


Unnamed: 0,local,codigo,Valor mediano das rendas por m2,Rendas
4,Arcos de Valdevez,1111601,4.64,0
5,Caminha,1111602,5.83,1
6,Melgaço,1111603,3.29,0
7,Monção,1111604,6.58,1
8,Paredes de Coura,1111605,3.84,0
...,...,...,...,...
627,Calheta (R.A.M.),3003101,5.59,1
628,Câmara de Lobos,3003102,6.78,1
629,Funchal,3003103,11.51,2
630,Machico,3003104,5.98,1


In [5]:
clustered_df = aplicar_kmeans(df_valor_mediano_rendas, 3, nome_cluster='Vendas')
save_clustered_df_to_csv(clustered_df, "csv_files/", "7_Vendas.csv")

Vendas
0    114
1     67
2     31
Name: count, dtype: int64
File saved to csv_files/7_Vendas.csv


**Alojamentos**

In [6]:
df_alojamentos = processar_ficheiro(data_path+'Alojamentos.xls',0)
df_alojamentos = filter_for_only_municipalities(df_alojamentos)
df_alojamentos = df_alojamentos[['local','codigo','Alojamentos']]
df_alojamentos

Unnamed: 0,local,codigo,Alojamentos
5,Arcos de Valdevez,1111601,17810
42,Caminha,1111602,14378
57,Melgaço,1111603,7846
71,Monção,1111604,13863
96,Paredes de Coura,1111605,6341
...,...,...,...
3413,Porto Santo,3003201,4562
3415,Ribeira Brava,3003107,6980
3420,Santa Cruz,3003108,20391
3426,Santana,3003109,4888


In [7]:
clustered_df = aplicar_kmeans(df_alojamentos, 3, nome_cluster='Alojamentos')
save_clustered_df_to_csv(clustered_df, "csv_files/", "7_Alojamentos.csv")

Alojamentos
0    274
1     30
2      2
Name: count, dtype: int64
File saved to csv_files/7_Alojamentos.csv


**Densidade de Alojamentos**

In [8]:
df_densidade_alojamentos = processar_ficheiro(data_path+'Densidade de alojamentos.xls',0)
df_densidade_alojamentos = filter_for_only_municipalities(df_densidade_alojamentos)
df_densidade_alojamentos = df_densidade_alojamentos[['local','codigo','Densidade de alojamentos']]
df_densidade_alojamentos

Unnamed: 0,local,codigo,Densidade de alojamentos
4,Arcos de Valdevez,1111601,39.8
41,Caminha,1111602,105.3
56,Melgaço,1111603,32.9
70,Monção,1111604,65.6
95,Paredes de Coura,1111605,45.9
...,...,...,...
3412,Porto Santo,3003201,106.9
3414,Ribeira Brava,3003107,106.6
3419,Santa Cruz,3003108,250.8
3425,Santana,3003109,51.2


In [9]:
clustered_df = aplicar_kmeans(df_densidade_alojamentos, 3, nome_cluster='Densidade_alojamentos')
save_clustered_df_to_csv(clustered_df, "csv_files/", "7_Densidade Alojamentos.csv")

Densidade_alojamentos
0    285
1     17
2      4
Name: count, dtype: int64
File saved to csv_files/7_Densidade Alojamentos.csv


**Edifícios concluídos**

In [10]:
df_edificios_concluidos = processar_ficheiro(data_path+'Edifícios concluídos.xls',1)
df_edificios_concluidos = carregar_municipios(df_edificios_concluidos)
df_edificios_concluidos = df_edificios_concluidos[['local','codigo','Total']]
df_edificios_concluidos

Unnamed: 0,local,codigo,Total
4,Arcos de Valdevez,1111601,100.0
5,Caminha,1111602,33.0
6,Melgaço,1111603,12.0
7,Monção,1111604,74.0
8,Paredes de Coura,1111605,16.0
...,...,...,...
339,Porto Santo,3003201,15.0
340,Ribeira Brava,3003107,4.0
341,Santa Cruz,3003108,61.0
342,Santana,3003109,12.0


In [11]:
clustered_df = aplicar_kmeans(df_edificios_concluidos, 3, nome_cluster='Edificios Concluidos')
save_clustered_df_to_csv(clustered_df, "csv_files/", "7_Edificios Concluidos.csv")

Edificios Concluidos
0    246
1     51
2     11
Name: count, dtype: int64
File saved to csv_files/7_Edificios Concluidos.csv
