# 4. Вариации на тему НРМ


> В разработке


## 0. Подготовка данных


Импортируем библиотеки


In [32]:
import geopandas as gpd

import osmnx as ox


from libpysal.weights import Queen
from pysal.lib import weights

**Загружаем данные о плотности населения Краснодара, агрегированные по квадратной сетке регулярных ячеек**


In [33]:
sq_grid = gpd.read_file('./data/krs_pop_sqgrid.geojson')

sq_grid.explore(tiles='cartodbpositron')

Записывем СК сетки в переменную и название города, с которым мы работаем


In [34]:
krs_crs = sq_grid.estimate_utm_crs()
place="Krasnodar city"

**Загружаем точки торговли из osm**


In [35]:
tags_retail = {
    'shop': [
        'supermarket',
        'convenience',
        'grocery'
    ]
}

retail = ox.features_from_place(place, tags_retail)

retail.explore(tiles='cartodbpositron')

**Фильтруем данные и считаем количесто точек по ячейкам регулярной сетки**


In [36]:
retail_pts = retail[retail.geometry.type == "Point"].copy()

# убираем пустые геометрии
retail_pts = retail_pts[~retail_pts.geometry.is_empty & retail_pts.geometry.notna()].copy()

# перепроецируем в UTM-зону
retail_pts = retail_pts.to_crs(krs_crs)

# объединяем с ячейками сетки
join = gpd.sjoin(
    retail_pts[["geometry"]],
    sq_grid[["geometry"]],
    how="left",
    predicate="within"
)

# считаем количество точек по каждой ячейке
counts = join.groupby("index_right").size().rename("retail_cnt")

# записываем посчитанное в исходную сетку
sq_grid["retail_cnt"] = sq_grid.index.map(counts)

# смотрим на результат
sq_grid.explore(column="retail_cnt", tiles='cartodbpositron',
        missing_kwds={
        "color": "lightgrey",
        "label": "No data"
    })



Оставляем только ячейки внутри Краснодара


In [37]:
krs_border = ox.geocode_to_gdf(place)
krs_border_utm = krs_border.to_crs(krs_crs)

krs_grid = sq_grid[sq_grid.intersects(krs_border_utm.geometry.iloc[0])].copy()

krs_grid.explore(column="retail_cnt", tiles='cartodbpositron')



## 1. Выделение локальных центров


### 1.1 Расчёт пространственного лага (среднего значения в соседних ячейках)


In [38]:
# Б
df = krs_grid.copy()

#изучаемое значение
x_col = "retail_cnt"  

# убираем Nan
df[x_col] = df[x_col].fillna(0)

# веса Queen
w = Queen.from_dataframe(df)

print("Number of islands (no neighbors):", len(w.islands))

#row-стандартизация весов
w.transform = "r"

# пространственный лаг и отклонение
x = df[x_col].values
wx = weights.lag_spatial(w, x)# Wx_i

df["W_" + x_col] = wx


Number of islands (no neighbors): 0


  w = Queen.from_dataframe(df)


### 1.2 Вычсление отклонений от пространственного лага


In [39]:
df["dev"] = df[x_col] - df["W_" + x_col]    # d_i = x_i - Wx_i


### 1.3 Определение центров


In [40]:
# стандартизация (z-score)
dev_mean = df["dev"].mean()
dev_std = df["dev"].std(ddof=0)
df["dev_z"] = (df["dev"] - dev_mean) / dev_std

# центры по порогу
df["center_1sd"] = df["dev_z"] >= 1
df["center_3sd"] = df["dev_z"] >= 2

df[["dev", "dev_z", "center_1sd", "center_3sd"]].head()

Unnamed: 0,dev,dev_z,center_1sd,center_3sd
278,0.0,0.014793,False,False
279,0.0,0.014793,False,False
306,0.0,0.014793,False,False
307,0.0,0.014793,False,False
308,0.0,0.014793,False,False


### 1.4 Изучаем результат


In [41]:
df["center_type"] = "no center"
df.loc[df["dev_z"] >= 1, "center_type"] = "center (≥1σ)"
df.loc[df["dev_z"] >= 2, "center_type"] = "core center (≥3σ)"

df.explore(
    column="center_type",
    categorical=True,
    legend=True,
    tiles="cartodbpositron",
    tooltip=[x_col, "dev_z"]
)


### 1.3 Заключительные ремарки


В разработке
