In [102]:
import pandas as pd

In [103]:
# Load the CSV file
file_path = 'WENR-landgebruik.csv'
data = pd.read_csv(file_path, delimiter=';')
data.columns = ['LGN-Klassen', 'LGN2018', 'LGN2021', "Verschil", "Categorie"]
data.head()

data

Unnamed: 0,LGN-Klassen,LGN2018,LGN2021,Verschil,Categorie
0,1 - Agrarisch gras,1044153,1043216,-937,Landbouw
1,2 - Maïs,234015,210430,-23585,Landbouw
2,3 - Aardappelen,172041,164446,-7596,Landbouw
3,4 - Bieten,90146,84797,-5349,Landbouw
4,5 - Granen,162007,160177,-1831,Landbouw
5,6 - Overige gewassen,130266,139234,8968,Landbouw
6,8 - Glastuinbouw,14017,12944,-1072,Landbouw
7,9 - Boomgaarden,3191,2898,-293,Landbouw
8,10 - Bloembollen,31995,30563,-1433,Landbouw
9,61 - Boomkwekerijen,20874,19432,-1441,Landbouw


In [104]:
# Keep only the columns LGN-Klassen, LGN2021 and Category
data = data[['LGN-Klassen', 'LGN2021', 'Categorie']]

# Remove rows that are 0
data = data[data['LGN2021'] != 0]

# Drop the row for Zout water
data = data[data['LGN-Klassen'] != '17 - Zout water']

data

Unnamed: 0,LGN-Klassen,LGN2021,Categorie
0,1 - Agrarisch gras,1043216,Landbouw
1,2 - Maïs,210430,Landbouw
2,3 - Aardappelen,164446,Landbouw
3,4 - Bieten,84797,Landbouw
4,5 - Granen,160177,Landbouw
5,6 - Overige gewassen,139234,Landbouw
6,8 - Glastuinbouw,12944,Landbouw
7,9 - Boomgaarden,2898,Landbouw
8,10 - Bloembollen,30563,Landbouw
9,61 - Boomkwekerijen,19432,Landbouw


In [105]:
# Sum all the areas
total_area = data['LGN2021'].sum()

print(f'Total area: {total_area} ha')

# Calculate the percentage of each class
data['Percentage'] = data['LGN2021'] / total_area

data


Total area: 3684614 ha


Unnamed: 0,LGN-Klassen,LGN2021,Categorie,Percentage
0,1 - Agrarisch gras,1043216,Landbouw,0.283128
1,2 - Maïs,210430,Landbouw,0.05711
2,3 - Aardappelen,164446,Landbouw,0.04463
3,4 - Bieten,84797,Landbouw,0.023014
4,5 - Granen,160177,Landbouw,0.043472
5,6 - Overige gewassen,139234,Landbouw,0.037788
6,8 - Glastuinbouw,12944,Landbouw,0.003513
7,9 - Boomgaarden,2898,Landbouw,0.000787
8,10 - Bloembollen,30563,Landbouw,0.008295
9,61 - Boomkwekerijen,19432,Landbouw,0.005274


In [106]:
# Sanity check, the sum of all percentages should be 1
print(data['Percentage'].sum())

1.0


In [107]:
# Group by category and sum the areas
data_grouped = data.groupby('Categorie').sum()

data_grouped


Unnamed: 0_level_0,LGN-Klassen,LGN2021,Percentage
Categorie,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Bebouwd gebied,26 - Bebouwing in buitengebied27 - Overig gron...,613069,0.166386
Binnenwater,16 - Zoet water,373844,0.101461
Infrastructuur,251 - Hoofdinfrastructuur en spoorbaanlichamen...,194494,0.052785
Landbouw,1 - Agrarisch gras2 - Maïs3 - Aardappelen4 - B...,2003871,0.543848
Natuur,11 - Loofbos12 - Naaldbos30 - Kwelders31 - Ope...,499336,0.135519


In [108]:
# Sort them by percentage

data_grouped = data_grouped.sort_values('Percentage', ascending=False)

data_grouped

Unnamed: 0_level_0,LGN-Klassen,LGN2021,Percentage
Categorie,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Landbouw,1 - Agrarisch gras2 - Maïs3 - Aardappelen4 - B...,2003871,0.543848
Bebouwd gebied,26 - Bebouwing in buitengebied27 - Overig gron...,613069,0.166386
Natuur,11 - Loofbos12 - Naaldbos30 - Kwelders31 - Ope...,499336,0.135519
Binnenwater,16 - Zoet water,373844,0.101461
Infrastructuur,251 - Hoofdinfrastructuur en spoorbaanlichamen...,194494,0.052785


In [109]:
# Sanity check, the sum of all percentages should be 1
print(data_grouped['Percentage'].sum())

0.9999999999999999
