# Vektorimuotoinen paikkatieto

Vektoriaineistot ovat paikkatietoa joko piste- viiva- tai polygon-muodossa. Tässä osiossa tutustutaan vektoridatan käsittelyn perusteisiin Pythonissa.

# Shapely ja geometriat

**Shapely** on vektoriaineistojen kannalta olennainen kirjasto, sillä se toteuttaa tuen geometrioiden luontiin, esittämiseen ja moniin spatiaalisiin operaatioihin. Shapelyä ei usein käytetä suoraan, mutta koska GeoPandasin geometriat perustuvat täysin Shapelyyn, on hyvä ymmärtää perusteet.

Aloitetaan ottamalla käyttöön Shapely-kirjastosta pisteet, viivat ja monikulmiot.

In [None]:
from shapely import Point, LineString, Polygon

Voimme nyt luoda pisteen, eli **Point**-olion:

In [None]:
point = Point(1, 2)
point

In [None]:
print(point)

Voimme ottaa mukaan myös kolmannen ulottuvuuden:

In [None]:
point_3d = Point(2, 4, 1)
point_3d

Tehdään seuraavaksi monta pistettä, ja muodostetaan niistä viiva (**LineString**-olio):

In [None]:
point_1 = Point(0, 0)
point_2 = Point(-1, 1)
point_3 = Point(0.5, 1.5)
point_4 = Point(1, 0.5)

list_of_points = [point_1, point_2, point_3, point_4]

line = LineString(list_of_points)
line

Shapely-geometrioilla on monia hyödyllisiä attribuutteja. Tässä esimerkiksi viivan pituus ja massakeskipiste.

In [None]:
print(line.length)
print(line.centroid)

Monikulmion luonti onnistuu samaan tapaan:

In [None]:
polygon = Polygon(list_of_points)
polygon

Monikulmiolle voidaan laskea myös alue:

In [None]:
print(polygon.centroid)
print(polygon.area)
polygon.buffer(1)

In [None]:
from shapely import MultiPoint, MultiLineString, MultiPolygon

multipoint = MultiPoint(
    [Point(1, 2), Point(3, 4)]
)
multiline = MultiLineString(
    [LineString([(1, 7), (6, 4)]), LineString([(0, -1), (-4, 5)])]
)
multipolygon = MultiPolygon(
    [Polygon([(0, 0), (-10, 0), (2, 20)]), Polygon([(3, 6), (10, 6), (11, 20)])]
)
multipolygon

## Harjoitus - ympyrä

Tee Shapely-geometrioita ja metodeja hyödyntäen "ympyrä".
1. Vinkki: et tarvitse yhtäkään uutta `import`-komentoa.
2. Vinkki: tämä on hieman kompakysymys. Helpompaa voi olla ajatella: miten teen mahdollisimman pyöreän monikulmion?

In [None]:
# Kirjoita ratkaisu


## Ratkaisu

In [None]:
my_circle = Point(1,1).buffer(10)

print(type(my_circle))
my_circle

# GeoPandas

Seuraavaksi siirrytään vektoriaineistojen käsittelyssä erittäin monikäyttöiseen **GeoPandas**-kirjastoon.

In [None]:
from pathlib import Path
import geopandas as gpd

In [None]:
file_path = Path("./data/kunnat.gpkg")

municipalities = gpd.read_file(file_path)

In [None]:
municipalities.head()

In [None]:
type(municipalities)

In [None]:
type(municipalities.geometry)

In [None]:
type(municipalities["geometry"])

In [None]:
type(municipalities.geometry.iloc[0])

In [None]:
municipalities.plot()

In [None]:
parainen = municipalities.loc[municipalities["nimi"] == "Parainen"]
parainen

In [None]:
parainen.plot()

Kokeile myös DataFramen `explore`-metodia.

In [None]:
parainen.explore()

In [None]:
municipalities.area

In [None]:
parainen.area

In [None]:
municipalities.crs

In [None]:
municipalities_wgs = municipalities.to_crs(epsg=4326)
municipalities_wgs.crs

In [None]:
municipalities_wgs.plot(aspect="equal")

# 1. Taulukosta kartalle

In [None]:
import pandas as pd

lightnings = pd.read_csv("./data/lightnings.csv")
lightnings.head()

In [None]:
geo_lightnings = gpd.GeoDataFrame(lightnings)
geo_lightnings.head()

In [None]:
geo_lightnings = geo_lightnings.set_geometry(
    gpd.points_from_xy(x=lightnings["longitude"], y=lightnings["latitude"])
)

geo_lightnings.head()

In [None]:
geo_lightnings.plot(markersize=0.01)

In [None]:
geo_lightnings.crs

In [None]:
geo_lightnings = geo_lightnings.set_crs(epsg=4326)
geo_lightnings.crs

In [None]:
geo_lightnings = geo_lightnings.to_crs(epsg=3067)
geo_lightnings.head()

# 2. Salamahavainnot kunnittain

In [None]:
municipalities_with_lightnings = municipalities.sjoin(
    geo_lightnings,
    predicate="contains",
)

In [None]:
municipalities_with_lightnings

In [None]:
# Group by district name
group_by = municipalities_with_lightnings.groupby("nimi")

lightnings_by_municipality = group_by.size()
lightnings_by_municipality
#lightnings_by_municipality = lightnings_by_municipality.to_frame()
lightnings_by_municipality = pd.DataFrame(lightnings_by_municipality, columns=["lightning_count"])

In [None]:
type(lightnings_by_municipality)

In [None]:
municipalities = municipalities.merge(
    lightnings_by_municipality,
    left_on="nimi",
    right_on="nimi",
    how="left",
)

In [None]:
municipalities.plot(
    column="lightning_count"
)

In [None]:
area_km2 = municipalities.area / 1000000
area_km2

In [None]:
municipalities["lightnings_per_km2"] = municipalities["lightning_count"] / area_km2
municipalities.head()

In [None]:
municipalities.plot(column="lightnings_per_km2")

# 3. Tulosten visualisointi

In [None]:
municipalities.plot(
    column="lightnings_per_km2",
    legend=True,
    figsize=(7, 7),
    cmap="Oranges",
)

In [None]:
municipalities.plot(
    column="lightnings_per_km2",
    legend=True,
    figsize=(7, 7),
    scheme="quantiles",
)

In [None]:
municipalities.plot(
    column="lightnings_per_km2",
    legend=True,
    figsize=(7, 7),
    scheme="naturalbreaks",
)

In [None]:
m = municipalities.explore(
    column="lightnings_per_km2",
    tiles="CartoDB Positron",
    cmap="cividis",
    scheme="naturalbreaks",
    style_kwds={"fillOpacity": 1},
)

In [None]:
m

In [None]:
out_file_path = Path("./map.html")

m.save(out_file_path)