# Analyse der PV-Vergütungen in der Schweiz
Dieses Notebook analysiert die Photovoltaik-Anlagen Vergütungen in der Schweiz, einschliesslich ihrer Verteilung und Entwicklung.

## Daten laden, aufbereiten und anreichern
In diesem Abschnitt werden die Daten geladen, gefiltert und für die Analyse vorbereitet.

In [None]:
# Bibliotheken importieren
import pandas as pd

# CSV-Dateien laden
evu_df = pd.read_csv('../data/vese/evu_ergebnisse.csv', sep=';')  # EVU-Daten
gemeinde_df = pd.read_csv('../data/vese/gemeinde_ergebnisse.csv', sep=';')  # Gemeinde-Daten

# Datenframes basierend auf `nrElcom` zusammenführen
merged_df = pd.merge(evu_df, gemeinde_df, on='nrElcom', how='inner')  # Inner Join

# Gemeindestand.csv laden, um Kantone und BFS Gde-nummer zuzuordnen
gemeindestand_df = pd.read_csv('../data/vese/Gemeindestand.csv', sep=';')  # Mapping-Daten

# Mapping-Dictionary für Kantone und BFS Gde-nummer erstellen
gemeinde_to_kanton = gemeindestand_df.set_index('BFS Gde-nummer')['Kanton'].to_dict()

# Kantone und BFS Gde-nummer zuordnen
merged_df['Kanton'] = merged_df['idofs'].map(gemeinde_to_kanton)

# Fehlende Werte in 'energy1' und 'eco1' mit 0 auffüllen
merged_df = merged_df.copy()  # Sicherstellen, dass auf einer Kopie gearbeitet wird
merged_df['energy1'] = merged_df['energy1'].fillna(0)  # NaN durch 0 ersetzen
merged_df['eco1'] = merged_df['eco1'].fillna(0)

# Zeilen entfernen, in denen sowohl 'energy1' als auch 'eco1' 0 sind
merged_df = merged_df[~((merged_df['energy1'] == 0) & (merged_df['eco1'] == 0))]

# Vergütung berechnen
merged_df['remuneration'] = merged_df['energy1'] + merged_df['eco1']  # Gesamtvergütung berechnen

In [None]:
# Bibliotheken für Visualisierung importieren
import plotly.express as px

df = merged_df.groupby(['year', 'Kanton'])['remuneration'].mean().reset_index()  # Durchschnitt berechnen
df.rename(columns={'remuneration': 'avg_remuneration'}, inplace=True)  # Spalte umbenennen

# Durchschnittliche Vergütung auf 2 Dezimalstellen runden
df['avg_remuneration'] = df['avg_remuneration'].round(2)

# Feste Reihenfolge für Kantone definieren
fixed_canton_order = sorted(df['Kanton'].unique())  # Alphabetische Sortierung

# Top-4-Kantone pro Jahr identifizieren
def assign_canton_group(row, top_cantons_per_year):
    # Prüfen, ob der Kanton zu den Top-4 gehört
    if row['Kanton'] in top_cantons_per_year.get(row['year'], []):
        return row['Kanton']
    return 'Other'

# Top-4-Kantone für jedes Jahr berechnen
top_cantons_per_year = (
    df.groupby('year', group_keys=False)  # Gruppierung nach Jahr
    .apply(lambda group: group.nlargest(4, 'avg_remuneration')['Kanton'].tolist())  # Top-4 auswählen
    .to_dict()  # In Dictionary umwandeln
)

# Kantonsgruppe zuweisen
df['canton_group'] = df.apply(assign_canton_group, axis=1, top_cantons_per_year=top_cantons_per_year)

# Interaktives Balkendiagramm mit Jahr-Schieberegler erstellen
fig = px.bar(df, x='Kanton', y='avg_remuneration', color='canton_group',
             animation_frame='year',
             title='Durchschnittliche Vergütung pro Kanton und Jahr',
             labels={'avg_remuneration': 'Durchschnittliche Vergütung (CHF)', 'Kanton': 'Kanton'},
             category_orders={'Kanton': fixed_canton_order},  # Feste Reihenfolge
             color_discrete_map={
                 'Other': '#D9D9D9'  # Grau für andere Kantone
             },
             template='simple_white')

# Layout anpassen
fig.update_layout(
    xaxis_title='',
    yaxis_title='Rp/kWh',
    title_font=dict(size=16, family='Arial', color='black'),
    xaxis=dict(showgrid=False),
    yaxis=dict(showgrid=True, zeroline=True, zerolinecolor='black', range=[0, 31]),
    showlegend=False
)

# Diagramm anzeigen
fig.show()

fig.write_html("../docs/assets/diagramme/pv_vergütungen.html")

In [None]:
import folium
import json
from shapely.geometry import shape, mapping
from shapely.ops import transform
from functools import partial
import pyproj

df = merged_df[merged_df['year'] == 2024].copy()

# Prepare cumulative data
cumulative_map_data = df.groupby(['idofs'])['remuneration'].mean().reset_index()

# Load and simplify GeoJSON
with open('../data/electricity_production_plants/gemeinden.geojson', 'r', encoding='utf-8') as f:
    geojson_data = json.load(f)

# Assign default values to missing municipalities
average_remuneration = cumulative_map_data['remuneration'].mean()
missing_bfs = set(geojson_data['features'][i]['properties']['gemeinde_BFS_NUMMER'] for i in range(len(geojson_data['features']))) - set(cumulative_map_data['idofs'])
for bfs in missing_bfs:
    cumulative_map_data = pd.concat([cumulative_map_data, pd.DataFrame({'idofs': [bfs], 'remuneration': [average_remuneration]})], ignore_index=True)

simplified_features = []
for feature in geojson_data['features']:
    geom = shape(feature['geometry'])
    simplify = partial(
        pyproj.Transformer.from_crs('EPSG:4326', 'EPSG:4326', always_xy=True).transform
    )
    simplified_geom = transform(simplify, geom).simplify(0.001, preserve_topology=True)
    feature['geometry'] = mapping(simplified_geom)
    bfs_nr = feature['properties']['gemeinde_BFS_NUMMER']
    remuneration = cumulative_map_data.loc[cumulative_map_data['idofs'] == bfs_nr, 'remuneration'].values[0] if bfs_nr in cumulative_map_data['idofs'].values else 0
    feature['properties']['remuneration'] = f"{remuneration:.2f}"
    feature['properties']['bfs-str'] = str(feature['properties']['gemeinde_BFS_NUMMER'])
    simplified_features.append(feature)

geojson_data['features'] = simplified_features

map = folium.Map(location=[46.8, 8.33], zoom_start=7)

# Add choropleth layer with optimized color palette
folium.Choropleth(
    geo_data=geojson_data,
    name='Choropleth',
    data=cumulative_map_data,
    columns=['idofs', 'remuneration'],
    key_on='feature.properties.gemeinde_BFS_NUMMER',
    fill_color='RdYlGn',  # Reverse color palette for green to red
    fill_opacity=0.9,  # Increased opacity for better visibility
    line_opacity=0.6,  # Slightly thicker boundary lines
    line_color='black',
    legend_name='Vergütung (Rp/kWh)',
    threshold_scale=[0, 5, 10, 15, 20, 25, cumulative_map_data['remuneration'].max()],  # Adjust thresholds to include all values
).add_to(map)

# Add tooltips and customize boundary style
folium.GeoJson(
    geojson_data,
    name="Gemeinden",
    style_function=lambda feature: {
        'color': 'black',
        'weight': 0.5,  # Slightly thicker boundary lines
        'fillOpacity': 0
    },
    tooltip=folium.GeoJsonTooltip(
        fields=['gemeinde_NAME', 'bfs-str', 'remuneration'],
        aliases=['Gemeinde:', 'BFS-Nummer:', 'Vergütung (Rp/kWh):'],
        localize=True
    )
).add_to(map)

# Add title and save map
title_html = '''
<div style="font-size:20px;position: absolute;z-index: 1000;left: 25%;"><b>Choroplethenkarte von der Vergütung der PV Anlagen pro Gemeinde im Jahr 2024</b></div>
'''
map.get_root().html.add_child(folium.Element(title_html))

map.save('../docs/assets/diagramme/map_pv_vergütungen.html')

map