# Análise exploratória de dados espaciais (AEDE)

In [None]:
%matplotlib inline 
                    # para os gráficos aparecerem
import pandas as pd
import matplotlib.pyplot as plt
import geopandas as gp
import pysal as ps
import palettable
import nupis
import seaborn as sns
sns.set(style='whitegrid', palette='pastel') 

## A mesorregião Sul/Sudoeste de MG

In [None]:
# objeto ssm:  unir shapefile do Sul/Sudoeste de MG com dataframe atlas
# resultado: apenas informações (geográficas e do atlas) do Sul/Sudoeste de MG
ssm = nupis.mesclar_shp_df(shp='ssm.shp', df='atlas.csv') 
w_ssm = ps.queen_from_shapefile('ssm.shp')   # cria a matriz de vizinhaça no formato queen

Na última aula prática vimos como comparar os resultados da mesorregião Sul/Sudoeste de MG com duas de suas microrregiões em relação a alguma variável:

**Comparar o comportamento do Sul/Sudoeste de MG e 2 microrregiões quanto a alguma variável do atlas**

Obtivemos (para a variável *rdpc*):

- mapa temático  
- valor de I global e significância  
- diagrama de dispersão de Moran  
- mapa LISA

**Sul/Sudoeste de MG**

In [None]:
# mapa temático rdpc
nupis.mapa(ssm, 'rdpc')

In [None]:
# I de Moran
IM = ps.Moran(ssm.rdpc, w_ssm)
nupis.moran_resumo(IM)

In [None]:
# diagrama de dispersão de Moran
nupis.moran_dispersao(IM)

In [None]:
# mapa LISA - usando a função pronta do nupis
nupis.lisa_mapa(ssm.rdpc, 'ssm.shp', p_thres=0.05)

In [None]:
# mapa LISA
# usando código da função nupis.lisa_mapa diretamente
# permitindo alterar opções
w_ssm = ps.queen_from_shapefile('ssm.shp')
lisa = ps.Moran_Local(ssm.rdpc, w_ssm)
fig = plt.figure(figsize=(9, 7))
shp = ps.open('ssm.shp')
import pysal.contrib.viz.mapping as maps
base = maps.map_poly_shp(shp)
base = maps.base_lisa_cluster(base, lisa, p_thres=0.05)
base.set_edgecolor('1')
base.set_linewidth(0.1)
ax = maps.setup_ax([base], [shp.bbox])

boxes, labels = maps.lisa_legend_components(lisa, p_thres=0.05)
plt.legend(boxes, labels, fancybox=True, bbox_to_anchor=(1, 1))

plt.show();

## Microrregiões do Sul/Sudoeste de MG

In [None]:
ssm.nome_micro.unique()

Para escolher microrregiões (escolhidas: Poços de Caldas e Varginha):

In [None]:
pocos = ssm.query('nome_micro == "Poços de Caldas"')
pocos.head()

In [None]:
pocos.to_file('pocos.shp')    # salvar o shapefile da microrregião
w_pcd = ps.queen_from_shapefile('pocos.shp') # calcular a matriz de vizinhança

In [None]:
# mapa temático rdpc
x = palettable.cartocolors.diverging.Temps_7.mpl_colormap
ax = pocos.plot(column='rdpc', scheme='quantiles', k=4,
             linewidth=0, figsize=(7,7), legend=True, cmap=x)
ax.set_axis_off()
leg = ax.get_legend()
leg.set_bbox_to_anchor((1.6, 0.7));

In [None]:
# I de Moran
IM = ps.Moran(pocos.rdpc, w_pcd)
nupis.moran_resumo(IM)

In [None]:
# diagrama de dispersão de Moran
nupis.moran_dispersao(IM)

In [None]:
# mapa LISA com a função pronta do nupis
nupis.lisa_mapa(pocos.rdpc, 'pocos.shp', p_thres=0.05)

In [None]:
# usando código da função nupis.lisa_mapa diretamente
w_pcd = ps.queen_from_shapefile('pocos.shp')
lisa = ps.Moran_Local(pocos.rdpc, w_pcd)
fig = plt.figure(figsize=(5, 6))
shp = ps.open('pocos.shp')
import pysal.contrib.viz.mapping as maps
base = maps.map_poly_shp(shp)
base = maps.base_lisa_cluster(base, lisa, p_thres=0.05)
base.set_edgecolor('1')
base.set_linewidth(0.1)
ax = maps.setup_ax([base], [shp.bbox])

boxes, labels = maps.lisa_legend_components(lisa, p_thres=0.05)
plt.legend(boxes, labels, fancybox=True, bbox_to_anchor=(1.5, 1))

plt.show();

Microrregião de Varginha:

In [None]:
vgn = ssm.query('nome_micro == "Varginha"')
vgn.head()

In [None]:
vgn.to_file('vgn.shp')    # salvar o shapefile da microrregião
w_vgn = ps.queen_from_shapefile('vgn.shp') # calcular a matriz de vizinhança

In [None]:
# mapa temático rdpc
ax = vgn.plot(column='rdpc', scheme='quantiles', k=4,
             linewidth=0, figsize=(7,7), legend=True, cmap=x)
ax.set_axis_off()
leg = ax.get_legend()
leg.set_bbox_to_anchor((1.6, 0.7));

In [None]:
# I de Moran
IM = ps.Moran(vgn.rdpc, w_vgn)
nupis.moran_resumo(IM)

In [None]:
# diagrama de dispersão de Moran
nupis.moran_dispersao(IM)

In [None]:
# mapa LISA
nupis.lisa_mapa(vgn.rdpc, 'vgn.shp', p_thres=0.05)

In [None]:
# usando código da função nupis.lisa_mapa diretamente
w_vgn = ps.queen_from_shapefile('vgn.shp')
lisa = ps.Moran_Local(vgn.rdpc, w_vgn)
fig = plt.figure(figsize=(5, 6))
shp = ps.open('vgn.shp')
import pysal.contrib.viz.mapping as maps
base = maps.map_poly_shp(shp)
base = maps.base_lisa_cluster(base, lisa, p_thres=0.05)
base.set_edgecolor('1')
base.set_linewidth(0.1)
ax = maps.setup_ax([base], [shp.bbox])

boxes, labels = maps.lisa_legend_components(lisa, p_thres=0.05)
plt.legend(boxes, labels, fancybox=True, bbox_to_anchor=(1.5, 1))

plt.show();

**Mas quais são esses municípios significativos no mapa LISA?**

Uma dúvida surge: quais foram os municípios identificados como *clusters* ou *outliers* pelos mapas LISA?

Vamos considerar a mesorregião Sul/Sudoeste de MG.

In [None]:
# mapa LISA do Sul/Sudoeste de MG
# usando código da função nupis.lisa_mapa diretamente
# permitindo alterar opções
w_ssm = ps.queen_from_shapefile('ssm.shp')
lisa = ps.Moran_Local(ssm.rdpc, w_ssm)
fig = plt.figure(figsize=(9, 7))
shp = ps.open('ssm.shp')
import pysal.contrib.viz.mapping as maps
base = maps.map_poly_shp(shp)
base = maps.base_lisa_cluster(base, lisa, p_thres=0.05)
base.set_edgecolor('1')
base.set_linewidth(0.1)
ax = maps.setup_ax([base], [shp.bbox])

boxes, labels = maps.lisa_legend_components(lisa, p_thres=0.05)
plt.legend(boxes, labels, fancybox=True, bbox_to_anchor=(1, 1))

plt.show();

In [None]:
# tentando identificar qual(is) município(s) foi(ram) HL, por exemplo:
import numpy as np

In [None]:
lisa.p_sim  # pseudovalores do LISA

In [None]:
sig = lisa.p_sim < 0.05  # identificar significativos
sig

In [None]:
lisa.p_sim[sig]   # identificar quais valores-p foram significativos

In [None]:
lisa.q      # a quais quadrantes eles pertencem

In [None]:
lisa.q[sig]  # identificar os quadrantes dos significativos

In [None]:
posicoes = np.where(sig)    # municípios significativos

In [None]:
posicoes

In [None]:
ssm['quad'] = lisa.q
ssm['quad']

In [None]:
# se queremos os municípios identificados como HL queremos o quadrante 4
ssm.loc[posicoes[0], ['nome_mun', 'quad']].query('quad == 4')

Identifique os municípios pertencentes a qualquer quadrante de sua preferência:

1 - HH  
2 - LH  
3 - LL  
4 - HL

In [None]:
# identificar os municípios HH


In [None]:
# identificar os municípios LH


In [None]:
# identificar os municípios LL


### Identificar os municípios significativos para a microrregião de Varginha:

In [None]:
vgn = ssm.query('nome_micro == "Varginha"')
vgn.head()

In [None]:
# problema: os índices dos municípios não começam em 0, isso pode trazer problemas
# para fazer com que os índices comecem em 0:

# vgn = ssm.query("nome_micro == 'Varginha'").reset_index().drop('index', axis=1)
# vgn.head()

In [None]:
vgn.to_file('vgn.shp')    # salvar o shapefile da microrregião

In [None]:
# usando código da função nupis.lisa_mapa diretamente
w_vgn = ps.queen_from_shapefile('vgn.shp')
lisa = ps.Moran_Local(vgn.rdpc, w_vgn)
fig = plt.figure(figsize=(5, 6))
shp = ps.open('vgn.shp')
import pysal.contrib.viz.mapping as maps
base = maps.map_poly_shp(shp)
base = maps.base_lisa_cluster(base, lisa, p_thres=0.05)
base.set_edgecolor('1')
base.set_linewidth(0.1)
ax = maps.setup_ax([base], [shp.bbox])

boxes, labels = maps.lisa_legend_components(lisa, p_thres=0.05)
plt.legend(boxes, labels, fancybox=True, bbox_to_anchor=(1.5, 1))

plt.show();

In [None]:
lisa.p_sim  # pseudovalores do LISA

In [None]:
sig = lisa.p_sim < 0.05  # identificar significativos
sig

In [None]:
lisa.p_sim[sig]   # identificar quais valores-p foram significativos

In [None]:
lisa.q     # a quais quadrantes eles pertencem

In [None]:
lisa.q[sig]  # identificar os quadrantes dos significativos

In [None]:
posicoes = np.where(sig)    # municípios significativos

In [None]:
posicoes

In [None]:
vgn['quad'] = lisa.q
vgn['quad']   # problema com índice dos municípios de Varginha (não começam em 0)

In [None]:
# se queremos os municípios identificados como HH queremos o quadrante 1
vgn.loc[posicoes[0], ['nome_mun', 'quad']].query('quad == 1')

In [None]:
# se queremos os municípios identificados como HL queremos o quadrante 4
vgn.loc[posicoes[0], ['nome_mun', 'quad']].query('quad == 4')

In [None]:
# se queremos os municípios identificados como LH queremos o quadrante 2
vgn.loc[posicoes[0], ['nome_mun', 'quad']].query('quad == 2')

### Identificar os municípios significativos outra microrregião do Sul/Sudoeste de MG:

In [None]:
ssm.nome_micro.unique()