In [2]:
import pandas as pd
import json

# Stap 1: Plak hier de JSON-output van het vorige script.
# In een echte applicatie zou je dit uit een bestand lezen, 
# maar voor nu plakken we het direct in de code.
json_data = {
  "0083_01-01-2025 tot 01-07-2026_akkoord.pdf": {
    "verhogingen": [
      {
        "datum": "01/01/2025",
        "percentage": "3,50%/0,84%"
      },
      {
        "datum": "01/09/2025",
        "percentage": "1,50%"
      },
      {
        "datum": "01/01/2026",
        "percentage": "2,00%"
      }
    ]
  },
  "0182_01-01-2025 tot 01-01-2027_akkoord.pdf": {
    "verhogingen": [
      {
        "datum": "01/01/2025",
        "percentage": "2,50%/2,75%"
      },
      {
        "datum": "01/07/2025",
        "percentage": "1,0%"
      },
      {
        "datum": "01/01/2026",
        "percentage": "2,5%"
      }
    ]
  },
  "1069_01-01-2025 tot 01-01-2027_akkoord.pdf": {
    "verhogingen": [
      {
        "datum": "01/01/2025",
        "percentage": "9,00%"
      },
      {
        "datum": "01/01/2026",
        "percentage": "4,00%"
      }
    ]
  },
  "2070_01-01-2025 tot 01-01-2028_akkoord.pdf": {
    "verhogingen": [
      {
        "datum": "01/01/2025",
        "percentage": "3,75%/3,75%"
      },
      {
        "datum": "01/01/2026",
        "percentage": "3,85%"
      },
      {
        "datum": "01/01/2027",
        "percentage": "3,95%/4,00%"
      }
    ]
  }
}

# Stap 2: Verwerk de JSON-data naar een lijst van rijen
processed_data = []
for filename, data in json_data.items():
    # Maak een dictionary voor de huidige rij
    row_data = {}
    
    # Haal de eerste 4 cijfers uit de bestandsnaam voor de Cao-code
    row_data['Cao-code'] = filename[:4]
    
    # Haal de lijst met verhogingen op
    increases = data.get('verhogingen', [])
    
    # Vul de datum- en percentagekolommen
    for i, increase in enumerate(increases):
        # Kolomnaam voor de datum (bv. '1e datum nieuwe cao')
        date_col_name = f"{i+1}e datum nieuwe cao"
        # Kolomnaam voor het percentage
        perc_col_name = f"{i+1}e percentage nieuwe cao"
        
        row_data[date_col_name] = increase.get('datum')
        row_data[perc_col_name] = increase.get('percentage')
        
    processed_data.append(row_data)

# Stap 3: Maak een Pandas DataFrame
# Definieer de kolomvolgorde om overeen te komen met de screenshot (tot 7 verhogingen)
column_order = ['Cao-code']
for i in range(1, 8): # Maximaal 7 verhogingen
    column_order.append(f"{i}e datum nieuwe cao")
    column_order.append(f"{i}e percentage nieuwe cao")

df = pd.DataFrame(processed_data)

# Zorg ervoor dat alle kolommen bestaan, ook als er minder dan 7 verhogingen zijn
for col in column_order:
    if col not in df.columns:
        df[col] = None # of pd.NA

# Zet de kolommen in de juiste volgorde
df = df[column_order]

# Stap 4: Sla het DataFrame op als een Excel-bestand
output_excel_path = 'cao_samenvatting.xlsx'
# index=False zorgt ervoor dat de DataFrame index niet wordt weggeschreven
df.to_excel(output_excel_path, index=False)

print(f"Excel-bestand succesvol aangemaakt op: {output_excel_path}")
print("\nVoorbeeld van de data:")
print(df.head())

Excel-bestand succesvol aangemaakt op: cao_samenvatting.xlsx

Voorbeeld van de data:
  Cao-code 1e datum nieuwe cao 1e percentage nieuwe cao 2e datum nieuwe cao  \
0     0083          01/01/2025                    3,50%          01/09/2025   
1     0182          01/01/2025              2,50%/2,75%          01/07/2025   
2     1069          01/01/2025                    9,00%          01/01/2026   
3     2070          01/01/2025              3,75%/3,75%          01/01/2026   

  2e percentage nieuwe cao 3e datum nieuwe cao 3e percentage nieuwe cao  \
0                    1,50%          01/01/2026                    2,00%   
1                     1,0%          01/01/2026                     2.5%   
2                    4,00%                 NaN                      NaN   
3                    3,85%          01/01/2027              3,95%/4,00%   

  4e datum nieuwe cao 4e percentage nieuwe cao 5e datum nieuwe cao  \
0                None                     None                None   
1  