Erstellt von Paula Denk &nbsp; • &nbsp; Stand: 17. Dezember 2020

# Geovisualisierung

### Aufgabe
1. Kontrolle eines Jupyter Notebooks

2. Geokoordinaten von Konzentrationslagern nur anhand ihrer Namen ermitteln und auf einer Karte visualisieren.

## 1. Pakete installieren und importieren

Falls die benötigten Pakete noch nicht installiert sind, kann dies mit den folgenden Befehlen nachgeholt werden. Dafür muss in jeder Zeile das # entfernt werden. Damit werden in Python Kommentare gekennzeichnet. Das sind Codeteile, die beim Übersetzen nicht beachtet werden sollen. Damit das Paket Geopandas importiert werden kann, muss das Paket Pyproj die Version 2.5.0 haben.

In [None]:
#!pip install geopy
#!pip install altair
#!pip install pandas
#!pip install pyproj == 2.5.0
#!pip install geopandas
#!pip install OSMPythonTools

Nach der Installation müssen die Pakete noch importiert werden, damit die darin enthaltenen Funktionen verwendet werden können. Mit dem Schlüsselwort **as** kann für jedes Paket ein Kurztitel vergeben werden.

In [1]:
#from geopy.geocoders import Nominatim as ngp
import altair as alt
import pandas as pd
import geopandas as gpd

#### Übersicht über die benötigten Pakete
**Altair:** Visualisierung

**GeoPandas:** Laden einer Tabelle mit Informationen über Ländergrenzen

**GeoPy:** Ermittlung von Geokoordinaten

**Pandas:** Laden einer Tabelle mit Länderinformationen

## 2. Geodaten in das richtige Format bringen
zuerst laden wir unsere CSV mit pandas in ein Datenframe ein.

In [2]:
df = pd.read_csv("staed_B.csv")

Jetzt müssen wir noch uns die Spalten angucken, die nicht im entsprechenden Land sind.<br>
Dies kann mit folgender syntax geschehen:<br>

for row in df["land"]:<br>
    print(row)
    

In [3]:
df.dropna(inplace=True)

Jetzt wir entfernen wir die Länder die nicht im gewünschten Land sind.
for row in df["land"]:
    if not row == "GB":
        df.drop(df.loc[df['land']==row].index, inplace=True)
jetzt müssen noch die Einträge entfernt werden, die keinen Eintrag haben
df.dropna(inplace=True)
als weiteres entfernen wir globale geokoordinaten
df.drop(0,inplace=True)

In [4]:
for row in df["land"]:
    if not row == "GB":
        df.drop(df.loc[df['land']==row].index, inplace=True)

In [5]:
df.drop(0,inplace=True)

In [6]:
df

Unnamed: 0,Geoids,Anzahl,name,land,gekoord
1,https://www.geonames.org/2648402,5,Gloucestershire,GB,"[51.83333, -2.16667]"
2,https://www.geonames.org/11609031,4,Derbyshire,GB,"[53.13543, -1.61125]"
4,https://www.geonames.org/2654141,3,Buxton,GB,"[53.25741, -1.90982]"
5,https://www.geonames.org/2647639,3,Halesowen,GB,"[52.44859, -2.04938]"
6,https://www.geonames.org/2633868,3,Wiltshire,GB,"[51.25, -1.91667]"
7,https://www.geonames.org/2637532,3,Somerset,GB,"[51.08333, -3.0]"
8,https://www.geonames.org/7293250,3,Matlock Bath,GB,"[53.12184, -1.56465]"
10,https://www.geonames.org/2636796,3,Stoney Middleton,GB,"[53.27525, -1.65555]"
11,https://www.geonames.org/2649991,3,English Channel,GB,"[50.0, -1.0]"
12,https://www.geonames.org/2640098,3,Pooles Cavern,GB,"[53.25, -1.93333]"


Wir müssen die Daten jetzt für das Paket Altair aufbereiten. Die Syntax ist wie folgt:<br>
("Name", {'coordinates': [lat, lon] , 'type': 'Point'})<br>
Für jeden Eintrag in der Tabelle muss ein solcher Datensatz gebildet werden<br>
An besten geschieht das in neuer Spalte in unserer Tabelle

Um die gefundenen Geokoordinaten auf einer Karte darstellen zu können, müssen sie in ein Geodataframe eingefügt werden. Dies geschieht mithilfe des Paketes GeoPandas.

In [None]:
[data for data in df["gekoord"]]

In [8]:
daten = df.loc[:,['name','gekoord']]

In [None]:
for row in daten["gekoord"]:
    #daten["gekoord"] = "{\"coordinates\":"+ daten["gekoord"] +", \"type\": \"Point\"})"
    print("{\"coordinates\":"+ str(daten["gekoord"]) +", \"type\": \"Point\"})")
    #print(row)

In [None]:
daten.iloc[i]["gekoord"]

In [None]:
def clean_text(row):
    # return the list of decoded cell in the Series instead 
    return [r.str.decode('unicode_escape') for r in row]

In [22]:
for i in range(len(daten["gekoord"])):
    #print(daten.iloc[i]["gekoord"])
    #print("{\"coordinates\":"+ str(daten.iloc[i]["gekoord"]) +", \"type\": \"Point\"})")
    daten.iloc[i]["gekoord"] = '{"coordinates":'+ str(daten.iloc[i]["gekoord"]) +', "type": "Point"}'
    print('{"coordinates":'+ str(daten.iloc[i]["gekoord"]) +', "type": "Point"}')


{"coordinates":{"coordinates":{"coordinates":[51.83333, -2.16667], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[53.13543, -1.61125], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[53.25741, -1.90982], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[52.44859, -2.04938], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[51.25, -1.91667], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[51.08333, -3.0], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[53.12184, -1.56465], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[53.27525, -1.65555], "type": "Point"}, "type": "Point"}, "type": "Point"}
{"coordinates":{"coordinates":{"coordinates":[5

In [None]:
daten['gekoord'] = daten["gekoord"].apply(clean_text)

In [None]:
daten["gekoord"] = daten["gekoord"].str.replace("\\","")

In [None]:
daten["gekoord"] = daten["gekoord"].replace(to_replace= r'\\', value= '', regex=True)

In [None]:
{"coordinates": [geokoordi], "type": "Point"})
staedte = gpd.GeoDataFrame(staedte, columns = ['name', 'geometry'])
staedte = gpd.GeoDataFrame(staedte, columns = ['name', 'geometry'])

In [10]:
staedte = gpd.GeoDataFrame(list(zip([eintrag for eintrag in daten["name"]],[eintrag for eintrag in daten["gekoord"]])), columns = ['name', 'geometry'])

In [None]:
staedte.geometry.str.decode('unicode_escape')

In [18]:
staedte = staedte.apply(lambda x: x.str.replace('\"','\'',regex=True))

In [29]:
staedte= staedte.drop(8)

In [31]:
staedte=staedte.drop(17)

In [34]:
staedte["geometry"]

0     {'coordinates':[51.83333, -2.16667], 'type': '...
1     {'coordinates':[53.13543, -1.61125], 'type': '...
2     {'coordinates':[53.25741, -1.90982], 'type': '...
3     {'coordinates':[52.44859, -2.04938], 'type': '...
4     {'coordinates':[51.25, -1.91667], 'type': 'Poi...
5     {'coordinates':[51.08333, -3.0], 'type': 'Point'}
6     {'coordinates':[53.12184, -1.56465], 'type': '...
7     {'coordinates':[53.27525, -1.65555], 'type': '...
9     {'coordinates':[53.25, -1.93333], 'type': 'Poi...
10    {'coordinates':[53.3673, -1.84251], 'type': 'P...
11    {'coordinates':[53.13838, -1.5556], 'type': 'P...
12    {'coordinates':[51.50853, -0.12574], 'type': '...
13    {'coordinates':[51.3751, -2.36172], 'type': 'P...
14    {'coordinates':[51.50132, -2.71208], 'type': '...
15    {'coordinates':[53.34312, -1.77506], 'type': '...
16    {'coordinates':[55.9713, -3.1723], 'type': 'Po...
18    {'coordinates':[52.5, -2.08333], 'type': 'Point'}
19    {'coordinates':[53.18333, -1.61667], 'type

In [None]:
for row in staedte["geometry"]:
    row = row.replace("\"","\'")

In [None]:
for i in range(len(daten["gekoord"])):
    #print(daten.iloc[i]["gekoord"])
    #print("{\"coordinates\":"+ str(daten.iloc[i]["gekoord"]) +", \"type\": \"Point\"})")
    staedte.iloc[i]["geometry"] = "{\"coordinates\":"+ str(daten.iloc[i]["gekoord"]) +", \"type\": \"Point\"}"

In [None]:
koordinaten1 = {"coordinates": [loc1.latitude, loc1.longitude], "type": "Point"}
ort1 = ("Konzentrationslager Auschwitz", {"coordinates": [loc1.latitude, loc1.longitude], "type": "Point"})

## 3. Geodaten visualisieren
Die gefundenen Geokoordinaten sind nun in einer Form, dass sie mithilfe des Paketes Altair visualisiert werden können. Zuvor müssen jedoch die Geodaten von Polen geladen werden, um die Lage der Konzentrationslager als Punkte auf einer Polenkarte darstellen zu können. Aus Gründen der Erweiterbarkeit werden hier sämtliche Länderdaten in Variablen gespeichert und nicht nur die Polens.

### 3.1 Laden und Aufbereiten der Länderdaten
Es werden die Informationen über die einzelnen Länder und die Lage ihrer Grenzen in zwei Variablen geladen.

In [12]:
# Allgemeine Länderinformationen
geonames = pd.read_csv("https://www.geonames.org/countryInfoCSV", sep='\t')

# Lage der Ländergrenzen
polygons = gpd.read_file("https://datahub.io/core/geo-countries/r/countries.geojson")

Mit dem folgenden Code wird eine Tabelle erstellt, welche Namen, dreistelligen Ländercode, Continent und Koordinaten der Grenzen eines jeden Landes enthält. Es wurde der dreistellige Ländercode gewählt, weil nur dieser in beiden geladenen Tabellen vorhanden ist.

In [13]:
# Auswahl der Spalten aus geonames und Setzen des Schlüssels
geonames = geonames[['name', 'iso alpha3', 'continent']]
geonames = geonames.set_index("iso alpha3")

# Löschen der Spalte ADMIN (enthält Ländernamen) und Setzen des Schlüssels
polygons = polygons.drop(columns = ["ADMIN"])
polygons = polygons.set_index("ISO_A3")

# Verbindung der beiden Tabellen
countries = polygons.join(geonames, how = 'inner')

Für die Polenkarte wird aus der nun entstandenen Tabelle `countries` die entsprechende Zeile ausgewählt. Die Informationen werden im Anschluss ausgegeben.

In [14]:
gb = countries[countries['name'] == 'United Kingdom']
print(gb)

                                              geometry            name  \
GBR  MULTIPOLYGON (((-6.28751 49.91401, -6.29727 49...  United Kingdom   

    continent  
GBR        EU  


### 3.2 Erstellen der Karte
Mithilfe des Pakets Altair wird nun eine Karte von Polen erstellt.

In [15]:
gb = alt.Chart(gb).mark_geoshape(
    fill = "lightgray",
    stroke = "darkgray"
).properties(
    width = 600,
    height = 600
)

Die Konzentrationslager sollen als Punkte auf der Karte eingetragen werden. Zusätzlich soll der Name angezeigt werden, wenn man mit der Maus darüberfährt.

In [32]:
punkte = alt.Chart(staedte).mark_circle(
    opacity = 1
).encode(
    latitude = 'geometry.coordinates[0]:Q',
    longitude = 'geometry.coordinates[1]:Q',
    tooltip = 'name'
)

Durch das Addieren werden die beiden Karten übereinandergelegt und zusammen ausgegeben.

In [None]:
gb

In [33]:
punkte



## Fazit und Ausblick
In diesem Dokument wurde vieles händisch gemacht, was auch automatisiert umgesetzt hätte werden können. Im nächsten Schritt könnte man beispielsweise einbauen, dass mittels einer Liste aller Konzentrationslager deren Geokoordinaten gefunden und aufbereitet werden. Mit diesen Informationen könnte eine Europakarte mit allen Konzentrationslagern erstellt werden.