In [33]:
import pandas as pd

In [34]:
# Load the CSV file
file_path = 'WENR-landgebruik.csv'
data = pd.read_csv(file_path, delimiter=';', header=5)
data.columns = ['LGN-Klassen', 'LGN2018', 'LGN2021', "Verschil", "Categorie"]
data.head()

data

Unnamed: 0,LGN-Klassen,LGN2018,LGN2021,Verschil,Categorie
0,6 - Overige gewassen,130266,139234,8968,Landbouw
1,8 - Glastuinbouw,14017,12944,-1072,Landbouw
2,9 - Boomgaarden,3191,2898,-293,Landbouw
3,10 - Bloembollen,31995,30563,-1433,Landbouw
4,61 - Boomkwekerijen,20874,19432,-1441,Landbouw
5,62 - Fruitkwekerijen,25216,24656,-560,Landbouw
6,26 - Bebouwing in buitengebied,20181,24219,4038,Bebouwd gebied
7,27 - Overig grondgebruik in buitengebied,81015,96309,15294,Bebouwd gebied
8,45 - Natuurlijk beheerde agrarische graslanden,0,111078,111078,Natuur
9,11 - Loofbos,108875,171659,62785,Natuur


In [35]:
# Keep only the columns LGN-Klassen, LGN2021 and Category
data = data[['LGN-Klassen', 'LGN2021', 'Categorie']]

# Remove rows that are 0
data = data[data['LGN2021'] != 0]

# Drop the row for Zout water
data = data[data['LGN-Klassen'] != 'Zout water']

data

Unnamed: 0,LGN-Klassen,LGN2021,Categorie
0,6 - Overige gewassen,139234,Landbouw
1,8 - Glastuinbouw,12944,Landbouw
2,9 - Boomgaarden,2898,Landbouw
3,10 - Bloembollen,30563,Landbouw
4,61 - Boomkwekerijen,19432,Landbouw
5,62 - Fruitkwekerijen,24656,Landbouw
6,26 - Bebouwing in buitengebied,24219,Bebouwd gebied
7,27 - Overig grondgebruik in buitengebied,96309,Bebouwd gebied
8,45 - Natuurlijk beheerde agrarische graslanden,111078,Natuur
9,11 - Loofbos,171659,Natuur


In [36]:
# Sum all the areas
total_area = data['LGN2021'].sum()

print(f'Total area: {total_area} ha')

# Calculate the percentage of each class
data['Percentage'] = data['LGN2021'] / total_area

data


Total area: 3192372 ha


Unnamed: 0,LGN-Klassen,LGN2021,Categorie,Percentage
0,6 - Overige gewassen,139234,Landbouw,0.043615
1,8 - Glastuinbouw,12944,Landbouw,0.004055
2,9 - Boomgaarden,2898,Landbouw,0.000908
3,10 - Bloembollen,30563,Landbouw,0.009574
4,61 - Boomkwekerijen,19432,Landbouw,0.006087
5,62 - Fruitkwekerijen,24656,Landbouw,0.007723
6,26 - Bebouwing in buitengebied,24219,Bebouwd gebied,0.007587
7,27 - Overig grondgebruik in buitengebied,96309,Bebouwd gebied,0.030168
8,45 - Natuurlijk beheerde agrarische graslanden,111078,Natuur,0.034795
9,11 - Loofbos,171659,Natuur,0.053772


In [37]:
# Sanity check, the sum of all percentages should be 1
print(data['Percentage'].sum())

0.9999999999999999


In [38]:
# Group by category and sum the areas
data_grouped = data.groupby('Categorie').sum()

data_grouped


Unnamed: 0_level_0,LGN-Klassen,LGN2021,Percentage
Categorie,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Bebouwd gebied,26 - Bebouwing in buitengebied27 - Overig gron...,613069,0.192042
Binnenwater,16 - Zoet water,373844,0.117105
Infrastructuur,251 - Hoofdinfrastructuur en spoorbaanlichamen...,194494,0.060925
Landbouw,6 - Overige gewassen8 - Glastuinbouw9 - Boomga...,229727,0.071961
Natuur,45 - Natuurlijk beheerde agrarische graslanden...,1781238,0.557967


In [39]:
# Sanity check, the sum of all percentages should be 1
print(data_grouped['Percentage'].sum())

1.0
