# Análise exploratória de dados espaciais (AEDE)

Nesse notebook:

- para a mesorregião Sul/Sudoeste de MG:  
-- plotar mapas temáticos  
-- obter valores e significância do $I$ de Moran  
-- plotar mapas LISA
-  para o estado de MG:
-- plotar mapas temáticos  
-- obter valores e significância do $I$ de Moran  
-- plotar mapas LISA  
- plotar o estado de MG com diferentes divisões (mesorregiões, microrregiões)

In [None]:
%matplotlib inline 
                    # para os gráficos aparecerem
import pandas as pd
import matplotlib.pyplot as plt
import geopandas as gp
import pysal as ps
import palettable
import nupis
import seaborn as sns
sns.set(style='whitegrid', palette='pastel') 

In [None]:
# objeto ssm:  unir shapefile do Sul/Sudoeste de MG com dataframe atlas
# resultado: apenas informações (geográficas e do atlas) do Sul/Sudoeste de MG
ssm = nupis.mesclar_shp_df(shp='ssm.shp', df='atlas.csv') 
w = ps.queen_from_shapefile('ssm.shp')   # cria a matriz de vizinhaça no formato queen

In [None]:
ssm.head()

In [None]:
ssm.columns

In [None]:
ssm.shape

In [None]:
# plotar apenas o mapa com os limites territoriais
ssm.plot();

In [None]:
# plotar o mapa sem grades e eixos
mp = ssm.plot()
mp.set_axis_off();

Mapa temático (escolher uma variável para representar no mapa):
- scheme - equal_interval ou quantiles
- número de categorias k
- cmap - cor do mapa (abaixo)

In [None]:
# mapa temático - t_flsuper no ssm com 4 intervalos iguais
ax = ssm.plot(column='t_flsuper', scheme='equal_interval', k=4,
             linewidth=0, figsize=(7,7), legend=True, cmap='Set1')
ax.set_axis_off();

In [None]:
# fazer mapa temático da mesma variável com intervalos iguais, mas com diferentes k


In [None]:
# mapa temático - t_flsuper no ssm com 4 intervalos baseados em quantis


In [None]:
# fazer mapa temático da mesma variável com intervalos baseados em quantis, mas com diferentes k
# o que significam os diferentes intervalos (se k = 2, se k = 5)?


In [None]:
# usar algum gráfico descritivo que represente os mesmos valores e dê ideia da dispersão


In [None]:
nupis.mapa??

In [None]:
# opção do pacote nupis - já define alguns valores como padrão
nupis.mapa(ssm, 't_flsuper')  # mapa com os valores da variável, mapa temático

In [None]:
# usando a função do mapa do nupis, escolher outra variável


In [None]:
# escolher outra paleta de cor para o choropleth
x = palettable.wesanderson.Cavalcanti_5_r.mpl_colormap
nupis.mapa(ssm, 't_flsuper', cmap=x)

as paletas disponíveis estão [aqui](https://jiffyclub.github.io/palettable/#finding-palettes). 

In [None]:
IM = ps.Moran(ssm.t_flsuper, w)  # variável no dataframe e matriz de vizinhança 
nupis.moran_resumo(IM)           # função do nupis que retorna uma saída organizada do I de Moran

In [None]:
nupis.moran_dispersao(IM)   # diagrama de dispersão de Moran que recebe o objeto criado antes

Modificar os títulos dos eixos no diagrama de dispersão de Moran.

In [None]:
nupis.moran_dispersao(IM, xlabel='taxa de frequência ao ensino superior', ylabel='taxa de frequência ao ensino superior nos vizinhos')

In [None]:
# obter I de Moran e diagrama de dispersão de Moran para outra variável



In [None]:
# incluir nomes dos eixos do diagrama



### Mapas LISA

In [None]:
nupis.lisa_mapa(ssm.t_flsuper, 'ssm.shp', p_thres=0.05)   # função do nupis para obter o mapa LISA

In [None]:
# obter mapa LISA para outra variável



<br>
<br>
Calcular o I de Moran para mais de uma variável.

In [None]:
# I de Moran para mais variáveis - escolher 5 variáveis
nupis.moran_df(ssm[['t_analf25m', 't_flbas']], w)

## O estado de MG 

In [None]:
mg = nupis.mesclar_shp_df(shp='31MUE250GC_SIR.shp', df='atlas.csv')  # juntar shapefile com dataframe
w = ps.queen_from_shapefile('31MUE250GC_SIR.shp')   # cria a matriz de vizinhaça no formato queen

In [None]:
# plotar o mapa


In [None]:
# plotar o mapa sem grades


In [None]:
# obter mapa temático de t_flsuper com intervalos iguais


In [None]:
# obter mapa temático de t_flsuper com intervalos baseados em quantis


In [None]:
# melhorar a posição da legenda


In [None]:
# obter boxplot da variável t_flsuper para MG


In [None]:
# obter I de Moran para t_flsuper para MG e avaliar significância


In [None]:
# obter diagrama de dispersão de Moran para a mesma variável
# com nomes nos eixos


In [None]:
# obter mapa LISA para t_flsuper em MG


### Plotar mesorregiões de MG

In [None]:
mg.nome_meso.unique()

In [None]:
len(mg.nome_meso.unique())

In [None]:
# mapa de MG dividido por mesorregiões
ax = mg.plot(column='nome_meso',
             linewidth=0, figsize=(7,7), legend=True, cmap='Set1')
ax.set_axis_off()

In [None]:
# alterando opções da legenda
ax = mg.plot(column='nome_meso',
             linewidth=0, figsize=(7,7), legend=True, cmap='Set1')
ax.set_axis_off()

leg = ax.get_legend()
leg.set_bbox_to_anchor((1.5, 0.7));  # 0 a 1: (esquerda-direita, baixo-cima)

### Plotar microrregiões de MG

### Plotar microrregiões do Sul/Sudoeste de MG