# Geodatenhandling 2

**Inhalt:** Geopandas für Fortgeschrittene

**Nötige Skills**
- Basic pandas skills
- Funktionen und pandas
- Erste Schritte mit Geopandas
- Geodatenhandling 1

**Lernziele**
- Punkte, Linien, Polygone revisited
- Eigenschaften von geometrischen Shapes
- Shapes modifizieren und kombinieren
- Geodaten modifizieren und selektieren

## Das Beispiel

Geschäfte in Chicago.

Wir checken: In welchen Stadtteilen gibt es keine Lebensmittelläden, wo sind die "Food deserts"

- `Boundaries - Census Tracts - 2010.zip`, census tracts in Chicago from [here](https://data.cityofchicago.org/Facilities-Geographic-Boundaries/Boundaries-Census-Tracts-2010/5jrd-6zik)
- `Grocery_Stores_-_2013.csv`, grocery stores in Chicago from [here](https://data.cityofchicago.org/Community-Economic-Development/Grocery-Stores-2013/53t8-wyrc)

**Credits to:**
- http://www.jonathansoma.com/lede/foundations-2017/

## Setup

In [None]:
import pandas as pd
import geopandas as gpd
from shapely.geometry import Point, LineString, Polygon

In [None]:
import warnings
from shapely.errors import ShapelyDeprecationWarning
warnings.filterwarnings("ignore", category=ShapelyDeprecationWarning) 

## Geometries

Zum Aufwärmen, nochmals ein paar Shapes from scratch

### Point

Kreieren Sie einen Punkt an der Koordinate (5, 5):

### Line

Zeichnen Sie
- eine Linie durch die Punkte (20, 0) und (0, 20)
- eine Linie durch die Punkte (15, 0) und (0, 15)
- eine Linie durch die Punkte (25, 0) und (0, 25)

In [None]:
linie1

### Polygon

Zeichnen Sie ein Polygon mit den Eckpunkten (0, 0), (10, 0), (10, 10), (0, 10):

In [None]:
polygon1

### Plotten

Erstellen Sie ein Dataframe mit einer Spalte "geometry", das die Punkte, Linien und das Polygon enthält

Wandeln Sie das dataframe in ein Geodataframe um (Geometriespalte definieren!)

In [None]:
gdf

Wenn das Geodataframe richtig erstellt wurde, können wir es plotten:

In [None]:
gdf.plot(alpha=0.5, linewidth=2, edgecolor='black', markersize=5)

## Shapes vergleichen

Wir können geometrische Shapes auf verschiedene Weise miteinander "vergleichen".

* **contains:** has the other object TOTALLY INSIDE  (boundaries can't touch!!!) "a neighborhood CONTAINS restaurants"
* **intersects:** is OVERLAPPING at ALL, unless it's just boundaries touching
* **touches:** only the boundaries touch, like a tangent
* **within:** is TOTALLY INSIDE of the other object "a restaurant is WITHIN a neighborhood"
* **disjoint:** no touching!!! no intersecting!!!!
* **crosses:** goes through but isn't inside - "a river crossing through a city"

Referenz und weitere Vergleiche: http://geopandas.org/reference.html)

Das funktioniert ganz einfach:

In [None]:
polygon1.contains(punkt1)

In [None]:
punkt1.contains(polygon1)

**Quizfragen:**

In [None]:
#Liegt der Punkt 1 innerhalb von Polygon 1?


In [None]:
#Berührt die Linie 1 das Polygon 1?


In [None]:
#Überschneidet sich die Linie 3 mit dem Polygon 1?


In [None]:
#Überschneidet sich die Linie 2 mit dem Polygon 1?


In [None]:
#Ist das Polygon 1 völlig losgelöst von der Linie 3?


## Import

Und nun zu unserem eigentlichen Beispiel:

**Ein Stadtplan von Chicago mit den Quartieren (census tracts)**

Ist bereits als Shapefile vorhanden! Wir können direkt mit Geopandas einlesen.

In [None]:
tracts = gpd.read_file("dataprojects/Food Deserts/Boundaries - Census Tracts - 2010/geo_export_085dcd7b-113c-4a6d-8d43-5926de1dcc5b.shp")

In [None]:
tracts.head(2)

In [None]:
tracts.plot()

**Eine Liste aller Lebensmittelläden**

Ist erst als csv-Liste da. Wir müssen mit Pandas einlesen:

In [None]:
df = pd.read_csv("dataprojects/Food Deserts/Grocery_Stores_-_2013.csv")

In [None]:
df.head(2)

Um von Pandas zu Geopandas zu gelangen:
- Geometrie erstellen
- Geodataframe erstellen
- Koordinatensystem intialisieren

In [None]:
points = df.apply(lambda row: Point(row['LONGITUDE'], row['LATITUDE']), axis=1)

In [None]:
grocery_stores = gpd.GeoDataFrame(df, geometry=points)

In [None]:
grocery_stores = grocery_stores.set_crs('epsg:4326')

In [None]:
grocery_stores.plot()

**Wir plotten mal alles zusammen**

In [None]:
ax = tracts.plot(figsize=(15,15), color='lightgrey', linewidth=0.25, edgecolor='white')
grocery_stores.plot(ax=ax, color='red', markersize=8, alpha = 0.8)

## Analyse

Uns interessiert: Wo sind die Gebiete, in denen es in einem bestimmten Umkreis von Metern keine Lebensmittelläden gibt?

Um das zu beantworten, müssen wir zuerst in ein brauchbares Koordinatensystem wechseln, das auf Metern basiert.

### Projektion ändern

Wir entscheiden uns für eine Variante der Mercator-Projektion.
Das ist praktisch, weil:
- "Die wichtigste Eigenschaft der Mercator-Projektion ist ihre Winkeltreue. Diese bedeutet auch, dass in kleinen Bereichen der Längenmaßstab in allen Richtungen gleich ist." https://de.wikipedia.org/wiki/Mercator-Projektion
- Die Koordinaten sind nicht in Längen-/Breitengrad, sondern in Metern angegeben (die CH-Koordinaten sind auch eine Variante der Mercator-Projektion)

In [None]:
grocery_stores = grocery_stores.to_crs({'proj': 'merc'})
tracts = tracts.to_crs({'proj': 'merc'})

Andere Projektionen wären:
- 'tmerc': transverse mercator
- 'aea': albers equal area

**Wir haben nun ein neues Koordinatensystem**

In [None]:
ax = tracts.plot(figsize=(15,15), color='lightgrey', linewidth=0.25, edgecolor='white')
grocery_stores.plot(ax=ax, color='red', markersize=8, alpha = 0.8)

### Buffer erstellen

Wie sieht die Karte aus, wenn wir um jedes Lebensmittelgeschäft einen Kreis von 500 Metern ziehen?

In [None]:
ax = tracts.plot(figsize=(15,15), color='lightgrey', linewidth=0.25, edgecolor='white')
grocery_stores.buffer(500).plot(ax=ax, color='red', markersize=8, alpha=0.4)

### Union

Nächster Schritt: Wir fügen alle Punkte zu einer Fläche zusammen

In [None]:
near_area = grocery_stores.buffer(500).unary_union

Jetzt können wir testen, ob die einzelnen Quartiere diese Fläche berühren

In [None]:
tracts.disjoint(near_area)

In [None]:
tracts[tracts.disjoint(near_area)].plot()

### Plot

Wir plotten dieselbe Karte wie vorher - und zusätzlich noch jene Tracts, welche die Punktefläche nicht berühren

In [None]:
#Bisherige Karte
ax = tracts.plot(figsize=(15,15), color='lightgrey', linewidth=0.25, edgecolor='white')
grocery_stores.buffer(500).plot(ax=ax, color='red', markersize=8, alpha=0.4)

#Neu: Desert-Tracts
tracts[tracts.disjoint(near_area)].plot(ax=ax, color='darkblue', alpha=0.4)

ax.set_title('City tracts that have no grocery store within 500m distance')