 # GIS GZ – Übung 1: Einstieg ins Projekt und Repetition von Python

## Wichtiges zum Datenhandling
Heute arbeiten wir in Jupyter Notebook über die virtuelle Plattform mybinder.org. Damit Ihr Code bei einem Systemfehler nicht verloren geht, speichern Sie immer wieder ein Backup auf Ihre lokale Festplatte. Vergessen Sie am Schluss nicht, Ihre Dateien in Ihren persönlichen Ordner zu speichern. 

## Einleitung
In der heutigen Übung greifen Sie Ihre bisherigen Kenntnisse in Python auf. Dabei erstellen Sie erstens einen Glättungsalgorithmus, der Ihnen über eine Suchmatrix die Werte des Zentroiden glättet. Zweitens stellen Sie das Kinosterben in Zürich dar, indem Sie einen tabellarischen Datensatz laden und eine Funktion erstellen, die Ihnen ausgibt, wie viele Kinos in welchem Jahr offen waren. Dabei arbeiten Sie mit den libraries pandas (optional csv), numpy und matplotlib.

## Lernziele
* Sie können Vor- und Nachteile unterschiedlicher Datentypen gegeneinander abwägen.
* Sie können in Python libraries importieren, Daten laden und speichern, loops und if-statements durchführen, Variablen speichern und abrufen, Funktionen erstellen und Code debuggen.
* Sie können sich in einem Team organisieren und Aufgaben gemeinsam lösen.
* Freiwillig: Sie können eine eigene Python-Umgebung einrichten.

## Verwendete libraries und Funktionen

Zuerst importieren wir die nötigen libraries der heutigen Übung. Standardmässig verwenden wir für `numpy`, `pandas` und `matplotlib` Abkürzungen.

In [2]:
import os
import numpy as np
import pandas as pd
import csv
import matplotlib.pyplot as plt
import geopandas
from shapely.geometry import Point
from datetime import date

Anschliessend definieren wir eine Funktion, die Ihnen X- und Y-Werte als Plot ausgibt.

In [3]:
def show_points(df):
    """
    Shows the points passed with the data frame
    :param df: The data frame that contains the points that should be visualized
    :return:
    """

    # Plot the district map
    district_map = geopandas.read_file('data\\stadtkreis.json')
    fig, ax = plt.subplots(figsize=(10, 8))
    ax.set_aspect('equal')
    district_map.plot(ax=ax, color='white', edgecolor='black')

    # Translate the points from the dataframe to Point objects, import them to a geodataframe with LV95 as source
    # CRS, project the geodataframe to WGS84 and display it
    geometry = [Point(xy) for xy in zip(df['X_LV95'], df['Y_LV95'])]
    gdf = geopandas.GeoDataFrame(df, geometry=geometry, crs={'init': 'epsg:2056'})
    gdf = gdf.to_crs({'init': 'epsg:4326'})
    gdf.plot(ax=ax, color='red')

    # Show the whole plot and return
    plt.draw()
    return

Zudem brauchen wir eine Funktion, die uns Rasterdaten anzeigt

In [6]:
def show_raster(array_1, array_2):
    """
    Visualizes two rasters next to each other
    :param array_1: The raster that should be displayed on the left
    :param array_2: The raster that should be displayed on the right
    :return:
    """

    # Create a figure with one row and two columns
    fig = plt.figure(figsize=(10, 20))

    # Add a first subplot on the left
    fig.add_subplot(121)
    plt.imshow(array_1)

    # Add another subplot on the right
    fig.add_subplot(122)
    plt.imshow(array_2)

    # Show the plot and return
    plt.show()
    return

## Aufgabe 1

Definieren Sie ein zweidimensionales numpy array mit 100 Spalten und 100 Zeilen und weisen Sie jeder Zelle einen zufälligen Ganzzahlenwert von 0 und 255 zu. 
$$0 \leq x \leq 255$$

Erstellen Sie ein zweites array in derselben Grösse und glätten Sie die Werte des ursprünglichen arrays, indem Sie pro Zelle den Mittelwert der 8 umliegenden Zellen und der Zentrumszelle berechnen und diesen Mittelwert der Zentrumszelle zuweisen. 
*Hinweis: Vergessen Sie dabei nicht, dass Zellen ausserhalb des numpy arrays liegen, nicht berücksichtigt werden dürfen.*

<img src="images/lattices_r1.png" alt="Image_01" style="width: 150px;"/>

Stellen Sie beide arrays mit der Funktion `show_raster` dar und beschreiben Sie die Unterschiede.

## Aufgabe 2

Laden Sie die `kinos.csv` entweder mit `csv` oder mit `pandas` in ein Datenobjekt. Wenden Sie einen Filter an, der Ihnen nur die Kinos anzeigt, die aktuell in Betrieb sind. Erzeugen Sie aus dieser Teilmenge einen Plot der X-, und Y-Koordinaten. In welchem Datum wurden die Koordinaten abgespeichert?

*Hinweis: Spaltennamen = `X_LV95`,`Y_LV95`.*
*Hinweis: Transformieren Sie den String mit dem Jahr in den datetime-Datentyp. Vielleicht könnte es auch nützlich sein, sich nur auf das Jahr zu beschränken.*

Gruppieren Sie anschliessend die Kinos nach der Kategorie `BisISO`. Erzeugen Sie einen 2D Scatterplot aller Kinos, die vor 1970 geschlossen wurden und einen Plot mit den restlichen Kinos, die 1970 und später geschlossen wurden.

Zusatzaufgabe: Erstellen Sie eine Funktion, in die Sie das Jahr eingeben und die Ihnen als Ausgabewert die Anzahl an Kinos angibt, die in diesem Jahr offen waren. 

# Projekt
Formieren Sie sich in Dreiergruppen (oder Vierergruppen, wenn nicht anders möglich) und wählen Sie ein Thema oder erstellen Sie ein Konzept. Wichtig: Ihre Gruppe und Ihr Thema muss von der Übungsleitung abgesegnet werden, ehe Sie beginnen. Lesen Sie daher die Anforderungen an das Projekt nochmals genau durch. Definieren Sie den Arbeitsablauf ganz genau und überlegen Sie sich im Vornherein, welche Funktionen sich kombinieren lassen, um zu Ihrem gewünschten Resultat zu gelangen. Suchen Sie anschliessend nach den Daten (oder fragen Sie die Übungleitung).