In [None]:
import numpy as np
import pandas as pd
import geopandas as gpd
import geodatasets 
import matplotlib.pyplot as plt
import seaborn as sns
import esda
from pysal.lib import weights
from splot.esda moran_scatterplot, lisa_cluster, plot_local_autocorrelation
import contextily as ctx

`conda install --channel conda-forge pysal` 
<br> 
<a href="https://pysal.org/docs/install/">pysal</a>

`conda install --channel conda-forge esda` 
<br> 
<a href="https://pysal.org/esda/installation.html">esda</a>

`conda install -c conda-forge splot` 
<br> 
<a href="https://pysal.org/notebooks/viz/splot/intro.html">splot</a>

`conda install contextily --channel conda-forge` 
<br> 
<a href="https://contextily.readthedocs.io/en/latest/index.html">contextily</a>

<font style="font-size:2.5em;color:red">Autocorrelación espacial</font>

Es el grado de dependencia espacial, asociación o correlación entre el valor de una observación de una entidad espacial y la valores de observaciones vecinas de la misma variable. Los términos “espacial
asociación” y “dependencia espacial” se utilizan a menudo para reflejar también la autocorrelación espacial.

De acuerdo con la primera ley de la geografía, los objetos en un vecindario tienden a
tienen más similitudes e interacciones que los que están más lejos. Esto es lo que llamamos **dependencia espacial**. Para medir la **dependencia espacial**, usamos métricas de **autocorrelación espacial**. En pocas palabras, las medidas de **autocorrelación espacial** se relacionan con el valor de una variable en una ubicación específica y los valores de la misma variable en ubicaciones vecinas. 

Las autocorrelaciones espaciales pueden ser **positivas** o **negativas**. En la autocorrelación espacial **positiva**, los datos de ubicaciones que presentan mas cercanías uno del otro en el espacio presentan más probabilida de que sean similares que los datos de ubicaciones más alejadas. Por ejemplo, los ingresos de los habitantes de una ciudad, los hogares con mayores ingresos tienden a ubicarse en regiones específicas de la ciudad a diferencia de los hogares de menores ingresos que se ubican en otros sectores o áreas.<br>

Con la autocorrelación espacial **negativa**, las entidades espaciales vecinas tienden a tener valores diferentes. Esto es similar a la correlación **negativa**, donde los valores altos de una variable indican valores bajos de la otra. Cuando no existe autocorrelación espacial, existe una distribución **aleatoria** de los valores en relación a sus ubicaciones, sin asociación aparente entre ellos.

Las medidas de autocorrelación espacial para toda un área de estudio se denominan medidas de **autocorrelación espacial global**. Algunos de los métodos más empleados son: <br>

* Índice de Moran
* Estadística general
* Índice C de Geary

Debido a que en situaciones la información espacial no es homogenea. Debido a la falta de uniformidad y continuidad la autocorrelación espacial puede variar de un espacio a otro (heterogeneidad), es por ello que se recomienda realizar una **autocorrelación espacial local**. Algunos métodos empleados son: <br>

* Índice local de Moran
* Estadísticas Getis-Ord Gi y Gi*

<font style="font-size:2em; color:green">1. Índice de Moran</font>

Calcula la autocorrelación espacial global teniendo en cuenta ubicaciones características y valores de  los atributos (de una sola variable) simultáneamente. Matemáticamente se expresa como (ec.1):

$
I = \frac{n}{\sum_{i}^{n} \sum_{j}^{n} W_{ij}} \frac{\sum_{i}^{n} \sum_{j}^{n} W_{ij} (x_{i} - \bar x) (x_{j} - \bar x)}{\sum_{i}^{n} (x_{i} - \bar x)^{2}} \tag{1}
$

$n$: número de características espaciales (datos vectoriales) <br>
$x_i$: valor del atributo de la característica $i$, (recuerde que una variable también se llama atributo en el contexto del análisis espacial).<br>
$x_j$: valor del atributo de la característica $j$.<br>
$\bar x$: valor promedio del atributo.<br>
$W_{ij}$: es el peso espacial entre $i$ y $j$.<br>
$\sum_{i}^{n} \sum_{j}^{n} W_{ij}$: agregación de todos los pesos espaciales.

El índice I de Moran (ec. 2) es una estadística inferencial. Se interpreta con base en el valor esperado calculado, E(I), bajo la hipótesis nula de ausencia de autocorrelación espacial (aleatoriedad espacial completa) y se evalúa estadísticamente utilizando un valor $p$ y una puntuación $z$.

$
E(I) = \frac{-1}{n-1} \tag{2}
$ <br>

Donde $n$ corresponde al número total de entidades espaciales.

El valor esperado es el valor que habría resultado si el conjunto de datos fueron el resultado de la aleatoriedad espacial completa. Cuantos más objetos espaciales hay, más tiende a cero el valor esperado.

Los valores positivos del índice $I$ de Moran significativamente mayores que el valor esperado $E(I)$ indican agrupación y autocorrelación espacial positiva (es decir, las ubicaciones cercanas tienen valores similares).

Los valores negativos del índice $I$ de Moran significativamente más pequeños que el valor esperado $E(I)$ indican una autocorrelación espacial negativa, lo que significa que las ubicaciones vecinas tienen valores diferentes. Los valores cercanos al valor esperado indican que no hay autocorrelación.

Si el valor $p$ es grande (normalmente $p > 0.05$), los resultados no son estadísticamente
significativos y no podemos rechazar la hipótesis nula. La interpretación en la jerga estadística es que no podemos rechazar la hipótesis nula de que la distribución espacial de los valores es el resultado de una completa aleatoriedad espacial debido a la falta de evidencia suficiente.

Un valor $p$ pequeño (normalmente $p < 0.05$) indica que podemos rechazar la hipótesis nula que indica aleatoriedad espacial completa y aceptar que existe una autocorrelación espacial.

Cuando el valor $z$ es positivo, hay autocorrelación espacial positiva y hay agrupación de valores altos o bajos. Las ubicaciones cercanas tendrán valores similares en el mismo lado de la media.

Si el valor $z$ es negativo, hay una autocorrelación espacial negativa y un patrón disperso de los valores. Las ubicaciones cercanas tendrán valores de atributos diferentes en los lados opuestos de la media (es decir, una característica con un valor alto repele otras características con un valor bajo).

![image.png](attachment:image.png)

![image.png](attachment:image.png)

<a href="https://doi.org/10.15446/rcdg.v28n1.76919">La autocorrelación espacial y el desarrollo de la geografía cuantitativa</a>