# Opschonen shapefiles

Dit notebook schoont de shapefiles op waar nodig. Instructies:

- Kopieer de provinciefolders uit de OneDrive: `Spheer AI/Spheer AI - General/Projecten/Veg_2_Hab/Data/Vegetatiekarteringen` naar `testing/vegetatiekarteringen` (of naar iets anders, dan moet je `originele_karteringen_prefix` aanpassen onder **config**)
- Geef in `opgeschoonde_shapefiles_prefix` de naam van de folder waar de opgeschoonde shapefiles moeten komen. Dit is ook het folder waaruit de shapefilekarteringen moeten worden geladen in het `alle_karteringen_door_veg2hab.ipynb` notebook.
- Run de rest van de cellen. Deze zullen eerst alle karteringen overkopieren, en daarna de op te schonen karteringen overschrijven met een opgeschoonde versie.

### Imports

In [1]:
import pandas as pd
import geopandas as gpd
import os

originele_karteringen_prefix = '../testing/vegetatiekarteringen/'
opgeschoonde_shapefiles_prefix = '../testing/opgeschoonde_shapefiles/'

if not os.path.exists(opgeschoonde_shapefiles_prefix):
    os.makedirs(opgeschoonde_shapefiles_prefix)

  shapely_geos_version, geos_capi_version_string


### Inladen benodigde informatie


In [2]:
# info over de karteringen
overzicht = pd.read_excel(
    "../data/Overzicht_vegetatiekarteringen.xlsx", 
    sheet_name="Vegetatiekarteringen", 
    engine='openpyxl',
    usecols=[
        "provincie", 
        "naam_kartering", 
        "path_shapes", 
        "landelijke_typologie beschikbaar?", 
        "locatie_landelijke_typologie",
    ],
    dtype="string"
)

# benodigde info voor de shapefile karteringen
shape_info = pd.read_excel(
    "../data/shapefilekarteringinfo.xlsx",
    engine='openpyxl',
    usecols=[
        "naam_kartering",
        "ElmID_col",
        "datum_col",
        "opmerking_col",
        "vegtype_col_format",
        "sbb_of_vvn",
        "SBB_col",
        "VvN_col",
        "split_char",
        "perc_col",
    ],
    dtype="string"
)
# Convert all pd.NA to None to prevent having to do "if not pd.isna()" everywhere
# NOTE: dit naar vegkaartering.py?
shape_info = shape_info.applymap(lambda x: None if pd.isna(x) else x)

overzicht = overzicht[overzicht["landelijke_typologie beschikbaar?"] == "Ja"]
overzicht.path_shapes = overzicht.path_shapes.apply(lambda x: originele_karteringen_prefix + x[2:])

### Kopieren

In [3]:
def read_kartering(name):
    row = overzicht[overzicht.naam_kartering == name].iloc[0]
    path = row.path_shapes
    gdf = gpd.read_file(path)
    return path, gdf

def save_kartering(path, gdf):
    path = path.replace(originele_karteringen_prefix, opgeschoonde_shapefiles_prefix)
    if not os.path.exists(os.path.dirname(path)):
        os.makedirs(os.path.dirname(path))
    gdf.to_file(path)

for naam in list(overzicht.naam_kartering):
    path, gdf = read_kartering(naam)
    save_kartering(path, gdf)
    print(f"Copied {naam} to {path}")

Copied Asserbos2015 to ../testing/vegetatiekarteringen/DR/Asserbos2015/Asserbos2015.shp
Copied BG_Drenthe2014 to ../testing/vegetatiekarteringen/DR/BG_Drenthe2014/BG_Drenthe2014.shp
Copied BG_Holtingerveld_bossen2016 to ../testing/vegetatiekarteringen/DR/BG_Holtingerveld_bossen2016/BG_Holtingerveld_bossen2016_gdb.shp
Copied BG_Hondsrug2019 to ../testing/vegetatiekarteringen/DR/BG_Hondsrug2019/BG_Hondsrug2019.shp
Copied BG_meerdere_terreinen2020 to ../testing/vegetatiekarteringen/DR/BG_meerdere_terreinen2020/BG_2020_Arnoud.shp
Copied BG_Nolde2018 to ../testing/vegetatiekarteringen/DR/BG_Nolde2018/BG_Nolde2018.shp
Copied DEF_Holtingerveld2013 to ../testing/vegetatiekarteringen/DR/DEF_Holtingerveld2013/DEF_Holtingerveld2013.shp
Copied GL_Zuidlaardermeer2019 to ../testing/vegetatiekarteringen/DR/GL_Zuidlaardermeer2019/GL_Zuidlaardermeer2019.shp
Copied HDL_De_Stroeten2016 to ../testing/vegetatiekarteringen/DR/HDL_De_Stroeten2016/HDL_de_Stroeten2016_concept.shp
Copied HDL_Hijkerveld-Smilder_

  # This is added back by InteractiveShellApp.init_path()


Copied Bosgroep_SNLMonitoring_2014 to ../testing/vegetatiekarteringen/DR/BG_Drenthe2014/Bosgroep_SNLmonitoring2014.gdb
Copied NM_SBB_Fochteloerveen_randen2016 to ../testing/vegetatiekarteringen/DR/NM_SBB_Fochteloerveen_randen2016/NM_SBB_Fochteloerveen_randen2016.shp
Copied NM_DCR_2013 to ../testing/vegetatiekarteringen/DR Extra/NM_DCR2013/NM_Fochteloerveen_DCR2013.shp
Copied NM_Westerbork2017 to ../testing/vegetatiekarteringen/DR/NM_Westerbork2017/NM_Westerbork2017.shp
Copied PRV_Witterdiep2021 to ../testing/vegetatiekarteringen/DR/PRV_Witterdiep2021/PRV_Witterdiep2021.shp
Copied SBB0756_Drentsche_A2009 to ../testing/vegetatiekarteringen/DR/SBB0756_Drentsche_A2009/SBB0756_DrentscheAa2009.shp
Copied SBB0757_De_Velden2009 to ../testing/vegetatiekarteringen/DR/SBB0757_De_Velden2009/SBB0757deVelden2009.shp
Copied SBB0763_Terhorst2009 to ../testing/vegetatiekarteringen/DR/SBB0763_Terhorst2009/SBB0763_Terhorst2009.shp
Copied SBB0816_Norg2010 to ../testing/vegetatiekarteringen/DR/SBB0816_Norg

### Opschonen

In [4]:
path, gdf = read_kartering("BG_Holtingerveld_bossen2016")

# omwisselen van omgekeerde SBB en VvN
mask = gdf["OBJECTID_1"].isin([359, 24, 166, 215])
gdf.loc[mask, "F1_VvN"], gdf.loc[mask, "F1_SBB"] = gdf.loc[mask, "F1_SBB"], gdf.loc[mask, "F1_VvN"]

# "-" in perc_col vervangen door None
perc_cols = ["F1_Perc", "F2_Perc", "F3_Perc", "F4_Perc"]
for col in perc_cols:
    gdf[col] = gdf[col].apply(lambda x: None if x == "-" else x)

# save
save_kartering(path, gdf)

In [5]:
path, gdf = read_kartering("HDL_meerdere_terreinen2016")

# Weghalen " RG" suffix van CODE_SBB
gdf["CODE_SBB"] = gdf["CODE_SBB"].str.replace(" RG", "")

# save
save_kartering(path, gdf)

In [6]:
path, gdf = read_kartering("HDL_meerdere_terreinen2017")

# Vervangen van "-" en "?" door None in VGTYPE_VvN
# NOTE: Bij de vraagtekens staat in de opmerking dat het onduidelijk is, moeten we daar wat mee?
gdf["VGTYPE_VvN"] = gdf["VGTYPE_VvN"].apply(lambda x: None if x == "?" else x)

# save
save_kartering(path, gdf)

In [7]:
path, gdf = read_kartering("NM_Fochteloerveen2013_14")

# Vervangen van "nvt" en "vegetatieloos" door None in VVNCode
gdf["VVNCode"] = gdf["VVNCode"].apply(lambda x: None if x in ["nvt", "vegetatieloos"] else x)

# save
save_kartering(path, gdf)

In [8]:
path, gdf = read_kartering("SBB0756_Drentsche_A2009")

# Vervangen van 50A+ door 50A in SBBTYPE1
gdf["SBBTYPE1"] = gdf["SBBTYPE1"].apply(lambda x: "50A" if x == "50A+" else x)

# save
save_kartering(path, gdf)

In [9]:
path, gdf = read_kartering("Mandefjild_2015")

# Omwisselen 2_SBB2 en 2_VVN1 waar VLAKNR_DEF 1017, 1072, 1037, 1038, 1079, 1077 is
mask = gdf["VLAKNR_DEF"].isin([1017, 1072, 1037, 1038, 1079, 1077])
gdf.loc[mask, "2_VVN1"], gdf.loc[mask, "2_SBB2"] = gdf.loc[mask, "2_SBB2"], gdf.loc[mask, "2_VVN1"]

# Omwisselen (3_SBB1 en 3_SBB2) en (3_VVN1 en 3_VVN2) waar VLAKNR_DEF 1111
mask = gdf["VLAKNR_DEF"].isin([1111])
gdf.loc[mask, "3_SBB1"], gdf.loc[mask, "3_SBB2"] = gdf.loc[mask, "3_SBB2"], gdf.loc[mask, "3_SBB1"]
gdf.loc[mask, "3_VVN1"], gdf.loc[mask, "3_VVN2"] = gdf.loc[mask, "3_VVN2"], gdf.loc[mask, "3_VVN1"]

# "11Aa2c" in 1_SBB1 vervangen door "11A2c" (Staat ook als VvN 11Aa2a in de shapefile)
gdf["1_SBB1"] = gdf["1_SBB1"].apply(lambda x: "11A2c" if x == "11Aa2c" else x)

# "36Ab" in 2_SBB1 vervangen door "36A-b" (Staat ook als VvN 36RG1 in de shapefile)
gdf["2_SBB1"] = gdf["2_SBB1"].apply(lambda x: "36A-b" if x == "36Ab" else x)

# "41RG/DG" in 1_VVN1 vervangen door "41"
gdf["1_VVN1"] = gdf["1_VVN1"].apply(lambda x: "41" if x == "41RG/DG" else x)

# save
save_kartering(path, gdf)

In [10]:
path, gdf = read_kartering("KetlikerSkar_2016")

# Vervangen van "PteAqu" en "0" door None in VegCode
gdf["VegCode"] = gdf["VegCode"].apply(lambda x: None if x in ["PteAqu", "0"] else x)

# save
save_kartering(path, gdf)

In [11]:
path, gdf = read_kartering("Bosgroep_SNLMonitoring_2014")

# Vervangen van "open water" en "zand" door None in CODE_SBB
# NOTE: Willen we dit vertalen naar de goeie 50A/50B/50C?
gdf["CODE_SBB"] = gdf["CODE_SBB"].apply(lambda x: None if x in ["open water", "zand"] else x)

# save
save_kartering(path, gdf)

  # This is added back by InteractiveShellApp.init_path()
