In [1]:
# INSTALLATION
import pandas as pd
import numpy as np
import numpy as geek
!pip install babel
from babel.dates import format_date, get_month_names
import openpyxl
import requests
import calendar
import os
import glob
from io import BytesIO
from io import StringIO
from datetime import date, datetime, timezone, timedelta
!pip install eurostat
import eurostat
!pip install datawrapper
from datawrapper import Datawrapper
from google.colab import drive, userdata
DW_ACCESS_TOKEN = userdata.get('datawrapper1')
dw = Datawrapper(access_token=DW_ACCESS_TOKEN)
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
# UPDATE Treibhausgasemissionen (UBA)

# URL zur Excel-Dateien
url_em_thg_sek = "https://www.umweltbundesamt.de/sites/default/files/medien/361/dokumente/2023_03_15_em_entwicklung_in_d_ksg-sektoren_pm.xlsx"

# Herunterladen der Excel-Dateien
response = requests.get(url_em_thg_sek)
excel_data = BytesIO(response.content)

# Definieren des Bereichs, der eingelesen werden soll
rows_to_read = list(range(10, 14)) +[16]

# Einlesen der Daten aus Excel-Datei
em_thg_sek_raw = pd.read_excel(excel_data, sheet_name="Daten Sektor Energiew.", engine='openpyxl', skiprows=lambda x: x not in rows_to_read).dropna(axis=1, how='all')

# Auswahl relevanter Spalten
em_thg_sek_raw = em_thg_sek_raw.drop(columns=['Unnamed: 2'])

# Speichern der Rohdaten
em_thg_sek_raw.to_csv('/content/drive/MyDrive/Datenablage/em_thg_sek.csv', index=False)

#Transponiere Spalte zu Zeile
em_thg_sek_y=em_thg_sek_raw.set_index('Sektor ').transpose().reset_index()

em_thg_sek_y.to_csv('/content/drive/MyDrive/Datenablage/em_thg_sek.csv', index=False)

em_thg_sek_y.rename(columns={'CRF 1.A.1 - Energiewirtschaft': 'Energiewirtschaft'}, inplace=True)
em_thg_sek_y.rename(columns={'CRF 1.A.3.e - Erdgasverdichter': 'Erdgasverdichter'}, inplace=True)
em_thg_sek_y.rename(columns={'CRF 1.B - Diffuse Emissionen aus Brennstoffen': 'Diffuse Emissionen aus Brennstoffen'}, inplace=True)
em_thg_sek_y.rename(columns={'CRF 1.A.3.d - Küsten- & Binnenschifffahrt': 'Küsten- & Binnenschifffahrt'}, inplace=True)
em_thg_sek_y.rename(columns={'1 - Energiewirtschaft': 'Aktueller Zielpfad'}, inplace=True)

# Spalten nach benutzerdefinierter Reihenfolge sortieren
Reihenfolge = {'index' : 0, 'Energiewirtschaft': 1, 'Diffuse Emissionen aus Brennstoffen': 2, 'Erdgasverdichter': 3, 'Aktueller Zielpfad': 4}
em_thg_sek_y = em_thg_sek_y[sorted(em_thg_sek_y.columns, key=lambda x: Reihenfolge.get(x, float('inf')))]

#Lösche Spalten im Zielpfad, die auch aktuelle Daten haben (bis 2022)
em_thg_sek_y.loc[em_thg_sek_y.index.isin([30, 31, 32]), 'Aktueller Zielpfad'] = None

# Speichern der Datentabelle
em_thg_sek_y.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_thg_sek_y.csv', index=False)


# Update des Charts
CHART_ID = "WqCsU"
dw.add_data(chart_id=CHART_ID, data=em_thg_sek_y)
dw.publish_chart(chart_id=CHART_ID, display=False)




{'data': {'publicId': 'WqCsU',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'WqCsU',
  'type': 'stacked-column-chart',
  'title': 'Treibhausgasemissionen im Sektor Energiewirtschaft',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:42:36.879Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/WqCsU/58/',
  'publicVersion': 58,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': True,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {},
    'upload-method': 'copy'},
   'describe': {'source-name': 'UBA',
    'source-url': 'https://www.umweltbundesamt.de/sites/default/files/medien/361/dokumente/2023_03_15_em_entwicklung_in_d_ksg-sektoren_pm.xlsx',
    'intro': 'in Mio. t CO₂ Äquivalente',
    'byline': 'dena',
    'aria-description': '',
    'number-format': '-',
    'number-divisor': 0,
    'number-append': '',
    'number-prepend': '',
    'hide-title': False},
   'visualize': {'dark-m

In [None]:
# UPDATE Preise Gas, Öl, Kohle (Worldbank, Bloomberg)

# URL zur Excel-Dateien
url_em_preise_boerse = "https://thedocs.worldbank.org/en/doc/5d903e848db1d1b83e0ec8f744e55570-0350012021/related/CMO-Historical-Data-Monthly.xlsx"

# Herunterladen der Excel-Dateien
response = requests.get(url_em_preise_boerse)
excel_data = BytesIO(response.content)

# Einlesen der Daten aus Excel-Datei
em_preise_boerse_raw = pd.read_excel(excel_data, sheet_name="Monthly Prices", header=4, skiprows=range(5,6), na_values="…", engine='openpyxl')

# Speichern der Rohdaten
em_preise_boerse_raw.to_csv('/content/drive/MyDrive/Datenablage/em_preise_boerse_raw.csv', index=False)

# Umbennenen der Spalten
em_preise_boerse_m = em_preise_boerse_raw.rename(columns={em_preise_boerse_raw.columns[0]: 'Date'})
em_preise_boerse_m = em_preise_boerse_m.rename(columns={
    'Crude oil, Brent': 'Rohöl, Brent ($/bbl)',
    'Natural gas, Europe': 'Erdgas, TTF ($/mmbtu)',
    'Coal, Australian': 'Steinkohle, Australien ($/mt)',
    'Coal, South African **': 'Steinkohle, Südafrika ($/mt)'
})

# Filtern der gewünschten Spalten
selected_columns = ['Date', 'Rohöl, Brent ($/bbl)', 'Erdgas, TTF ($/mmbtu)',
                     'Steinkohle, Australien ($/mt)', 'Steinkohle, Südafrika ($/mt)']
em_preise_boerse_m = em_preise_boerse_m[selected_columns]

# Speichern der Datentabelle
em_preise_boerse_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_preise_boerse_m.csv', index=False)

# Update des Charts
CHART_ID = "5VyuL"
dw.add_data(chart_id=CHART_ID, data=em_preise_boerse_m)
dw.publish_chart(chart_id=CHART_ID, display=False)

{'data': {'publicId': '5VyuL',
  'language': 'de-DE',
  'theme': 'dena',
  'id': '5VyuL',
  'type': 'd3-lines',
  'title': 'Energiepreise im Großhandel ',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:42:43.687Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/5VyuL/106/',
  'publicVersion': 106,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'X.1': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'Jahr': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'Datum': {'type': 'auto',
      'ignore': False,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''

In [None]:
# Emissionszertifikate EU-ETS (EEX)
# Die Daten werden über einen Loop abgerufen, da sich die URL jedes Jahr nur um die entsprechende Jahreszahl ändert

# Basis-URL für die Excel-Dateien
base_url = "https://public.eex-group.com/eex/eua-auction-report/emission-spot-primary-market-auction-report-{year}-data.xlsx"

# Aktuelles Jahr abrufen
current_year = datetime.now().year

# Erstes Jahr festlegen
first_year = 2021

# Liste für die Datenframes
dfs = []

# Loop über die Jahre
for year in range(current_year, first_year - 1, -1):
    # URL für das aktuelle Jahr erstellen
    current_url = base_url.format(year=year)

    # Überprüfen, ob die URL existiert
    response = requests.head(current_url)
    if response.status_code == 200:
        # Excel-Datei herunterladen
        response = requests.get(current_url)
        excel_data = BytesIO(response.content)

        # Daten aus Excel-Datei einlesen
        current_df = pd.read_excel(excel_data, header=5, engine='openpyxl')

        # Datenframe zur Liste hinzufügen
        dfs.append(current_df)

# Datenframes zusammenführen
em_preise_euets_raw = pd.concat(dfs, ignore_index=True)

# Speichern der Rohdaten
em_preise_euets_raw.to_csv('/content/drive/MyDrive/Datenablage/em_preise_euets_raw.csv', index=False)

# Filtern der Daten
em_preise_euets_d = em_preise_euets_raw[em_preise_euets_raw["Auction Name"] == "Auction 4. Period DE"]

# Auswahl relevanter Spalten auswählen
em_preise_euets_d = em_preise_euets_d[["Date", "Auction Price €/tCO2", "Minimum Bid €/tCO2", "Maximum Bid €/tCO2"]]

# Umbenennen der Spalten


# Speichern der Datentabelle
em_preise_euets_d.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_preise_euets_d.csv', index=False)

# Update des Charts
CHART_ID = "7MO47"
dw.add_data(chart_id=CHART_ID, data=em_preise_euets_d)
dw.publish_chart(chart_id=CHART_ID, display=False)

  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")
  warn("Workbook contains no default style, apply openpyxl's default")


{'data': {'publicId': '7MO47',
  'language': 'de-DE',
  'theme': 'dena',
  'id': '7MO47',
  'type': 'd3-lines',
  'title': ' Auktionspreise für CO₂-Emissionsberechtigungen',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:42:56.341Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/7MO47/112/',
  'publicVersion': 112,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [{'id': '1c1c1c1c1c',
      'row': 0,
      'time': 1695903547136,
      'value': 'Auktionspreis €/tCO2',
      'column': 6,
      'ignored': False,
      'previous': 'Auction Price €/tCO2'},
     {'id': '1d1d1d1d1d',
      'row': 0,
      'time': 1695903563562,
      'value': 'Minimalgebot €/tCO2',
      'column': 7,
      'ignored': False,
      'previous': 'Minimum Bid €/tCO2'},
     {'id': '1e1e1e1e1e',
      'row': 0,
      'time': 1695903590957,
      'value': 'Maximalgebot €/tCO2',
      'column': 8,
      'ignored': False,
      'previous': 'Maximum Bid €/tCO2'},
    

In [None]:
# UPDATE Erdgas Importe (BNetzA)

# URL zur Excel-Dateien
url_em_imp_gas = "https://www.bundesnetzagentur.de/_tools/SVG/js2/_functions/csv_export.html?view=renderCSV&id=1081248"

# Herunterladen der Excel-Dateien
response = requests.get(url_em_imp_gas)
excel_data = BytesIO(response.content)

# Einlesen der Daten aus Excel-Datei
em_imp_gas_raw = pd.read_csv(excel_data, skipinitialspace=True, delimiter=';', encoding='utf-8')

# Speichern der Rohdaten
em_imp_gas_raw.to_csv('/content/drive/MyDrive/Datenablage/em_imp_gas_raw.csv', index=False)

# Umbennenen der Datumsspalte
em_imp_gas_raw.rename(columns={'.': 'Datum'}, inplace=True)

# Liste der Länder, die umbenannt werden sollen
umlaute_laender = {'D�nemark': 'Dänemark', '�sterreich': 'Österreich'}

# Überprüfen, ob die relevanten Spalten vorhanden sind und sie umbenennen
for umlaut_col, new_col in umlaute_laender.items():
    if umlaut_col in em_imp_gas_raw.columns:
        em_imp_gas_raw = em_imp_gas_raw.rename(columns={umlaut_col: new_col})

# Liste der relevanten Spalten für die Zusammenfassung
eu_laender = ['Schweiz', 'Frankreich', 'Österreich', 'Dänemark']
relevant_columns = eu_laender + ['Deutschland Import']

# Prüfen, ob alle relevanten Spalten vorhanden sind
if set(relevant_columns).issubset(set(em_imp_gas_raw.columns)):
    # Spalten zusammenfassen und umbenannten DataFrame erstellen
    new_column_name = 'Andere_EU_Länder'
    em_imp_gas_d = em_imp_gas_raw.assign(
        **{
            new_column_name: lambda x: x[eu_laender].sum(axis=1)
        }
    ).drop(relevant_columns, axis=1)

    # Speichern der Datentabelle
    em_imp_gas_d.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_imp_gas_d.csv', index=False)
else:
    missing_columns = set(relevant_columns) - set(em_imp_gas_raw.columns)
    print(f"Fehler: {missing_columns} not in index")

# Update des Charts
CHART_ID = "57KkC"
dw.add_data(chart_id=CHART_ID, data=em_imp_gas_d)
dw.publish_chart(chart_id=CHART_ID, display=False)

{'data': {'publicId': '57KkC',
  'language': 'de-DE',
  'theme': 'dena',
  'id': '57KkC',
  'type': 'd3-area',
  'title': 'Erdgasimporte nach Deutschland',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:43:01.034Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/57KkC/105/',
  'publicVersion': 105,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [{'id': 'YywP_lv9K8',
      'row': 0,
      'time': 1701276171414,
      'value': 'Andere EU-Staaten',
      'column': 8,
      'ignored': False,
      'previous': 'Andere_EU_Länder'}],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'X.1': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'monat': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'num

In [None]:
# UPDATE LNG Importe (ENTSO-G, NDR)

# URL zur Excel-Dateien
url_em_imp_lng = "https://static.dwcdn.net/data/Qa2I3.csv"

# Herunterladen der Excel-Dateien
response = requests.get(url_em_imp_lng)
excel_data = BytesIO(response.content)

# Einlesen der Daten aus Excel-Datei
em_imp_lng_raw = pd.read_csv(excel_data, delimiter=',')

# Speichern der Rohdaten
em_imp_lng_raw.to_csv('/content/drive/MyDrive/Datenablage/em_imp_lng_raw.csv', index=False)

# Konvertieren der 'periodFrom'-Spalte in ein DateTime-Objekt
em_imp_lng_raw['periodFrom'] = pd.to_datetime(em_imp_lng_raw['periodFrom'], format="%Y-%m-%d %H:%M")

# Extrahieren des Datums ohne Uhrzeit
em_imp_lng_raw['Datum'] = em_imp_lng_raw['periodFrom'].dt.date

# Umbenennen der Spalten
em_imp_lng_d = em_imp_lng_raw.rename(columns={
    'BRUNSBUETTEL HAFEN (FSRU) (DE)': 'Brunsbüttel (FSRU)',
    'Baltic Energy Gate (Port) (DE)': 'Baltic Energy Gate (Port)',
    'Wilhelmshaven, LNG-Terminal 1 (DE)': 'Wilhelmshaven, LNG-Terminal 1'
})

em_imp_lng_d = em_imp_lng_d[['Datum',
                   'Brunsbüttel (FSRU)',
                   'Baltic Energy Gate (Port)',
                   'Wilhelmshaven, LNG-Terminal 1']]

# Füllen Sie leere Zellen im gesamten DataFrame mit dem Wert "N.A."
em_imp_lng_d.fillna('NA', inplace=True)

# Speichern der Datentabelle
em_imp_lng_d.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_imp_lng_d.csv', index=False)

# Update des Charts
CHART_ID = "G89a9"
dw.add_data(chart_id=CHART_ID, data=em_imp_lng_d)
dw.publish_chart(chart_id=CHART_ID, display=False)

  em_imp_lng_d.fillna('NA', inplace=True)


{'data': {'publicId': 'G89a9',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'G89a9',
  'type': 'd3-area',
  'title': 'Flüssigerdgas (LNG)-Importe',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:43:05.529Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/G89a9/101/',
  'publicVersion': 101,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'X.1': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''}},
    'external-data': 'https://raw.githubusercontent.com/anneberner/Tabellen_duke/main/em_imp_lng_m.csv',
    'upload-method': 'copy',
    'use-datawrapper-cdn': False},
   'describe': {'source-name': 'ENTSO-G',
    'source-url': 'https://transparency.entsog.eu/',
    'intro': 'in GWh/Tag ',
    'byline': 'dena',
    'aria-descript

In [None]:
# UPDATE Kohle Importe (Destatis)
# Zum Update des Charts werden (1) aktuelle Daten aus mit einer URL heruntergeladen, (2) ältere Daten aus einem manuellen Download ausgelesen, (3) die Datensätze zusammengeführt und
# (4) ein weiterer Datensatz erstellt, um die beiden letzten Jahre auf Monatsbasis gegenüberzustellen

# (1) URL zur CSV-Datei
url_em_imp_kohle = 'https://www-genesis.destatis.de/genesisWS/rest/2020/data/table?username=felix.menze%40dena.de&password=Daten_1234&name=43511-0001&area=free&compress=false&transpose=false&startyear=1990&job=false&stand=01.01.1970%2001%3A00&language=de'


# (1) Herunterladen der Excel-Dateien
response = requests.get(url_em_imp_kohle)

# (2) Speichern der Rohdaten
#em_imp_kohle_base_raw.to_csv('/content/drive/MyDrive/Datenablage/em_imp_kohle_base_raw.csv', index=False)

json_data = response.json()

# Den relevanten Abschnitt der JSON-Daten extrahieren (Tabelle)
content = json_data["Object"]["Content"]

# Den Inhalt in Zeilen aufteilen
lines = content.split('\n')

# Die gewünschte Header-Zeile befindet sich in der Zeile mit den Spaltenbezeichnern (normalerweise 2 Zeilen vor den eigentlichen Daten)
header_line = lines[4].split(';')  # Header befindet sich in der Zeile 3 (Index 2)

# Die erste leere Spalte wird ignoriert, wir benötigen nur die relevanten Spaltennamen
header = header_line  # Entferne das erste leere Element

# Daten beginnen in der 4. Zeile (Index 3)
data = [line.split(';') for line in lines[6:] if line]  # Ignoriere die erste Spalte (die leer ist)

# DataFrame erstellen
em_imp_kohle_m = pd.DataFrame(data, columns=header)

# Optional: Filtern von leeren oder unvollständigen Daten
em_imp_kohle_m = em_imp_kohle_m.dropna()

em_imp_kohle_m['Datum'] = em_imp_kohle_m.iloc[:, 1].astype(str) + ' ' + em_imp_kohle_m.iloc[:, 0].astype(str)
em_imp_kohle_m = em_imp_kohle_m[['Datum', 'Einfuhr von Steinkohle in Tonnen']]
em_imp_kohle_m.rename(columns={'Einfuhr von Steinkohle in Tonnen': 'Einfuhr von Steinkohle in Megatonnen'}, inplace=True)
em_imp_kohle_m['Einfuhr von Steinkohle in Megatonnen'] = pd.to_numeric(em_imp_kohle_m['Einfuhr von Steinkohle in Megatonnen'], errors='coerce') / 1000000

# (3) Speichern der Datentabelle
em_imp_kohle_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_imp_kohle_m.csv', index=False)

# (3) Update des Charts
CHART_ID_3 = "6ES2l"
dw.add_data(chart_id=CHART_ID_3, data=em_imp_kohle_m)
dw.publish_chart(chart_id=CHART_ID_3, display=False)

# (4) Pivot-Tabelle erstellen
em_imp_kohle_change_m = em_imp_kohle_m.copy()
em_imp_kohle_change_m[['Monat', 'Jahr']] = em_imp_kohle_change_m['Datum'].str.split(expand=True)
em_imp_kohle_change_m = em_imp_kohle_change_m[['Monat', 'Jahr', 'Einfuhr von Steinkohle in Megatonnen']]
em_imp_kohle_change_m = em_imp_kohle_change_m.pivot(index='Monat', columns='Jahr', values='Einfuhr von Steinkohle in Megatonnen')

# (4) Spaltennamen ändern und Zurücksetzen des Indexes, um Monatsspalte zu behalten
month_order_german = ['Januar', 'Februar', 'März', 'April', 'Mai', 'Juni', 'Juli', 'August', 'September', 'Oktober', 'November', 'Dezember']
em_imp_kohle_change_m = em_imp_kohle_change_m.reindex(month_order_german)
em_imp_kohle_change_m = em_imp_kohle_change_m.reset_index()

# (4) Berechnung der prozentualen Veränderung aktuelles Jahr und Vorjahr
last_two_columns = em_imp_kohle_change_m.iloc[:, -2:].apply(pd.to_numeric, errors='coerce')
percentage_change = (last_two_columns.iloc[:, 1] - last_two_columns.iloc[:, 0]) / last_two_columns.iloc[:, 0] * 100
em_imp_kohle_change_m['Veränderung (%)'] = percentage_change.fillna('na')

# (4) Speichern der Datentabelle
em_imp_kohle_change_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_imp_kohle_change_m.csv', index=False)

# First column and Last 3 columns
em_imp_kohle_change_m_end = em_imp_kohle_change_m.iloc[:, [0, -1, -2, -3, -4]]
# (4) Update des Charts
CHART_ID_4 = "2QtX1"
dw.add_data(chart_id=CHART_ID_4, data=em_imp_kohle_change_m_end)
dw.publish_chart(chart_id=CHART_ID_4, display=False)

{'data': {'publicId': '2QtX1',
  'language': 'de-DE',
  'theme': 'dena',
  'id': '2QtX1',
  'type': 'tables',
  'title': 'Steinkohleimporte nach Deutschland',
  'lastEditStep': 5,
  'publishedAt': '2025-04-10T14:33:47.380Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/2QtX1/120/',
  'publicVersion': 120,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [{'id': 'xS_xCffLUk',
      'row': 0,
      'time': 1697535427168,
      'value': 'Veränderung',
      'column': 4,
      'ignored': False,
      'previous': '%'},
     {'id': 'jamyXDnsLg',
      'row': 0,
      'time': 1701338236372,
      'value': 'Monat',
      'column': 0,
      'ignored': False,
      'previous': 'Einfuhr in Tonnen nach Monat'}],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'2022': {'type': 'number',
      'ignore': False,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
  

In [None]:
# prompt: # (4) Berechnung der prozentualen Veränderung aktuelles Jahr und Vorjahr
# last_two_columns = em_imp_kohle_change_m.iloc[:, -2:].apply(pd.to_numeric, errors='coerce')
# percentage_change = (last_two_columns.iloc[:, 1] - last_two_columns.iloc[:, 0]) / last_two_columns.iloc[:, 0] * 100
# em_imp_kohle_change_m['Veränderung (%)'] = percentage_change.fillna('na')
# This code in the above cell needs to be changed to calculate the percent change in the last two columns per row. Since the last column only hast data in the first row, this means all other percent changes are na

import pandas as pd
# (4) Berechnung der prozentualen Veränderung aktuelles Jahr und Vorjahr
for index, row in em_imp_kohle_change_m.iterrows():
    try:
        current_year_value = pd.to_numeric(row.iloc[-2])
        previous_year_value = pd.to_numeric(row.iloc[-1])
        percentage_change = ((current_year_value - previous_year_value) / previous_year_value) * 100
        em_imp_kohle_change_m.loc[index, 'Veränderung (%)'] = percentage_change
    except (ValueError, TypeError):
        em_imp_kohle_change_m.loc[index, 'Veränderung (%)'] = 'na'


In [None]:
# UPDATE Wasserstoff Importe (Destatis, Dashboard Deutschland)
# ++++++ WICHTIG: csv Datei muss manuell heruntergeladen werden (https://www.dashboard-deutschland.de/indicator/tile_1654002158461) und im Drive Ordner "Datenquellen" abgelegt werden ++++++

# (1) URL zur CSV-Datei
url = "https://www.dashboard-deutschland.de/api/attachments/get?tileid=tile_1654002158461&attachmentName=Importe%20und%20Exporte%20von%20Wasserstoff.csv"

# (1) Herunterladen der Excel-Dateien
response = requests.get(url)
csv_data = BytesIO(response.content)

df = pd.read_csv(csv_data, encoding='utf-8', delimiter=';', header=5)

# Speichern der Rohdaten
df.to_csv('/content/drive/MyDrive/Datenablage/em_imp_h2_raw.csv', index=False)

# Umbenennender Spalten
df = df.rename(columns={'Wasserstoffimporte': 'Importe', 'Wasserstoffexporte': 'Exporte'})

# Hinzufügen einer Saldo-Spalte (Importe-Exporte)
df['Importe'] = df['Importe'].str.replace(',', '.')
df['Exporte'] = df['Exporte'].str.replace(',', '.')
df['Importe'] = pd.to_numeric(df['Importe'], errors='coerce')
df['Exporte'] = pd.to_numeric(df['Exporte'], errors='coerce')
df['Saldo'] = df['Importe'] - df['Exporte']

# Speichern der Datentabelle
df.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_imp_h2_m.csv', index=False)

# Update der Charts
# (1) Saldo
CHART_ID_1 = "G4OIF"
dw.add_data(chart_id=CHART_ID_1, data=df)
dw.publish_chart(chart_id=CHART_ID_1, display=False)

# (2) Import und Export
CHART_ID_2 = "Gfs5i"
dw.add_data(chart_id=CHART_ID_2, data=df)
dw.publish_chart(chart_id=CHART_ID_2, display=False)

{'data': {'publicId': 'Gfs5i',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'Gfs5i',
  'type': 'd3-lines',
  'title': 'Außenhandel von Wasserstoff',
  'lastEditStep': 5,
  'publishedAt': '2025-04-10T14:15:42.008Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/Gfs5i/109/',
  'publicVersion': 109,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'X.1': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'Jahr': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'Monat': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},

In [None]:
# UPDATE Rohöl Importe (Eurostat)

#Herunterladen (API) und Filtern der Daten
data_filter = {'geo': ['DE'], 'siec': ['O4100_TOT']}
em_imp_oil_raw = eurostat.get_data_df('nrg_ti_oilm', filter_pars=data_filter)

# Speichern der Rohdaten
em_imp_oil_raw.to_csv('/content/drive/MyDrive/Datenablage/imp_oil_raw.csv', index=False)

#Entfernen irrelevanter Spalten
columns_to_remove = ["freq", "siec", "unit", "geo\\TIME_PERIOD"]
em_imp_oil_raw = em_imp_oil_raw.drop(columns=columns_to_remove)
em_imp_oil_m = pd.melt(em_imp_oil_raw, id_vars=['partner'], var_name='Datum', value_name='value', col_level=0)

# Verwenden von pivot, um die Werte aus "Datum" als separate Spalten zu erhalten
em_imp_oil_m = em_imp_oil_m.pivot(index='Datum', columns='partner', values='value')

# Zurücksetzen des Index, um die "Datum"-Spalte als normale Spalte zu haben
em_imp_oil_m.reset_index(inplace=True)

# Umbenennen der Spalten
em_imp_oil_m.rename(columns={'RU': 'Russland', 'TOTAL': 'Total'}, inplace=True)
em_imp_oil_m = em_imp_oil_m.fillna('na')

# Auswahl relevanter Spalten
em_imp_oil_m = em_imp_oil_m[['Datum', 'Russland', 'Total']]

# Speichern der Datentabelle
em_imp_oil_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_imp_oil_m.csv', index=False)

# Update des Charts
CHART_ID = "g8Vtp"
dw.add_data(chart_id=CHART_ID, data=em_imp_oil_m)
dw.publish_chart(chart_id=CHART_ID, display=False)

{'data': {'publicId': 'g8Vtp',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'g8Vtp',
  'type': 'd3-lines',
  'title': 'Rohölimporte nach Deutschland',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:45:23.057Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/g8Vtp/100/',
  'publicVersion': 100,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [{'id': 'xclC76GDpA',
      'row': 0,
      'time': 1695828127181,
      'value': 'Russland',
      'column': 5,
      'ignored': False,
      'previous': 'RU'},
     {'id': 'KTh4NWVS9q',
      'row': 0,
      'time': 1695828139442,
      'value': 'Total',
      'column': 6,
      'ignored': False,
      'previous': 'TOTAL'}],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'X.1': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     

In [None]:
# UPDATE Verbraucherpreisindex für Industrieprodukte (HICP) (Eurostat)

#Herunterlade (API) und Filtern der Daten
data_filter = {'geo': ['DE'], 'unit': ['I15']}
em_hicp_raw = eurostat.get_data_df('prc_hicp_midx', filter_pars=data_filter)

#Speichern der Rohdaten
em_hicp_raw.to_csv('/content/drive/MyDrive/Datenablage/em_hicp_raw.csv', index=False)

# Erstellen der neuen Spalte "Energie" basierend auf "coicop"
em_hicp_raw['Energieträger'] = np.select(
    [
        em_hicp_raw['coicop'] == 'CP0451',
        em_hicp_raw['coicop'] == 'CP0454',
        em_hicp_raw['coicop'] == 'CP0453',
        em_hicp_raw['coicop'] == 'CP0455',
        em_hicp_raw['coicop'] == 'CP0452',
        em_hicp_raw['coicop'] == 'CP07222',
        em_hicp_raw['coicop'] == 'CP07221'
    ],
    [
        'Elektrizität',
        'Kohle',
        'Flüssige Brennstoffe',
        'Fernwärme',
        'Erdgas',
        'Benzin',
        'Diesel'
    ],
    default='NA'
)

# Entfernen der Zeilen, in denen die Spalte "Energie" keinen Wert hat
em_hicp_m = em_hicp_raw[em_hicp_raw['Energieträger']!='NA']

#Entfernen irrelevanter Spalten
columns_to_remove = ["freq", "unit", "coicop", "geo\\TIME_PERIOD"]
em_hicp_m = em_hicp_m.drop(columns=columns_to_remove)
em_hicp_m = pd.melt(em_hicp_m, id_vars=['Energieträger'], var_name='Datum', value_name='value', col_level=0)

# Verwenden von pivot, um die Werte aus "Datum" als separate Spalten zu erhalten
em_hicp_m = em_hicp_m.pivot(index='Datum', columns='Energieträger', values='value')

# Zurücksetzen des Index, um die "Datum"-Spalte als normale Spalte zu haben
em_hicp_m.reset_index(inplace=True)
em_hicp_m = em_hicp_m.fillna("NA")

# Speichern der Datentabelle
em_hicp_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_hicp_m.csv', index=False)

# Update des Charts
CHART_ID = "dgPGM"
dw.add_data(chart_id=CHART_ID, data=em_hicp_m)
dw.publish_chart(chart_id=CHART_ID, display=False)

{'data': {'publicId': 'dgPGM',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'dgPGM',
  'type': 'd3-lines',
  'title': 'Preisniveaus für Energieträger in Deutschland',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:45:35.929Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/dgPGM/123/',
  'publicVersion': 123,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'upload-method': 'copy'},
   'describe': {'source-name': 'Eurostat',
    'source-url': 'https://ec.europa.eu/eurostat/databrowser/view/prc_hicp_midx/default/table?lang=de',
    'intro': 'Verbraucherpreisindex (2015 = 100)',
    'byline': 'dena',
    'aria-description': '',
    'number-format': '-',
    'number-divisor': 0,
    'number-append': '',
    'number-prepend': '',
    'hide-title': False},
   'visualize': {'dark-mode-invert': True,
    'highlighted-series': [],
    'highlighted-

In [None]:
# UPDATE Verbraucherpreisindex für Industrieprodukte (HICP) (Eurostat) und USA

#Herunterlade (API) und Filtern der Daten
data_filter = {'geo': ['DE'], 'unit': ['I15']}
em_hicp_raw = eurostat.get_data_df('prc_hicp_midx', filter_pars=data_filter)

#Speichern der Rohdaten
em_hicp_raw.to_csv('/content/drive/MyDrive/Datenablage/em_hicp_raw.csv', index=False)

# Erstellen der neuen Spalte "Energie" basierend auf "coicop"
em_hicp_raw['Energieträger'] = np.select(
    [
        em_hicp_raw['coicop'] == 'CP0451',
        em_hicp_raw['coicop'] == 'CP0454',
        em_hicp_raw['coicop'] == 'CP0453',
        em_hicp_raw['coicop'] == 'CP0455',
        em_hicp_raw['coicop'] == 'CP0452',
        em_hicp_raw['coicop'] == 'CP07222',
        em_hicp_raw['coicop'] == 'CP07221'
    ],
    [
        'Elektrizität',
        'Kohle',
        'Flüssige Brennstoffe',
        'Fernwärme',
        'Erdgas',
        'Benzin',
        'Diesel'
    ],
    default='NA'
)

# Entfernen der Zeilen, in denen die Spalte "Energie" keinen Wert hat
em_hicp_m = em_hicp_raw[em_hicp_raw['Energieträger']!='NA']

#Entfernen irrelevanter Spalten
columns_to_remove = ["freq", "unit", "coicop", "geo\\TIME_PERIOD"]
em_hicp_m = em_hicp_m.drop(columns=columns_to_remove)
em_hicp_m = pd.melt(em_hicp_m, id_vars=['Energieträger'], var_name='Datum', value_name='value', col_level=0)

# Verwenden von pivot, um die Werte aus "Datum" als separate Spalten zu erhalten
em_hicp_m = em_hicp_m.pivot(index='Datum', columns='Energieträger', values='value')

# Zurücksetzen des Index, um die "Datum"-Spalte als normale Spalte zu haben
em_hicp_m.reset_index(inplace=True)
em_hicp_m = em_hicp_m.fillna("NA")

# Speichern der Datentabelle
em_hicp_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_hicp_m.csv', index=False)

# Update des Charts
CHART_ID = "dgPGM"
dw.add_data(chart_id=CHART_ID, data=em_hicp_m)
dw.publish_chart(chart_id=CHART_ID, display=False)

{'data': {'publicId': 'dgPGM',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'dgPGM',
  'type': 'd3-lines',
  'title': 'Preisniveaus für Energieträger in Deutschland',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:45:41.266Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/dgPGM/124/',
  'publicVersion': 124,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'upload-method': 'copy'},
   'describe': {'source-name': 'Eurostat',
    'source-url': 'https://ec.europa.eu/eurostat/databrowser/view/prc_hicp_midx/default/table?lang=de',
    'intro': 'Verbraucherpreisindex (2015 = 100)',
    'byline': 'dena',
    'aria-description': '',
    'number-format': '-',
    'number-divisor': 0,
    'number-append': '',
    'number-prepend': '',
    'hide-title': False},
   'visualize': {'dark-mode-invert': True,
    'highlighted-series': [],
    'highlighted-

In [None]:
# UPDATE Strompreis Börse (SMARD)

# Definition der Funktion um Daten von SMARD-API abzurufen
def get_json_smard(filter_num, name, freq="day", start_year=2020, end_year=datetime.now().year):
    data_frames = []

    for year in range(start_year, end_year + 1):
        tz_offset = timedelta(hours=1)  # UTC+1
        timestamp = int((datetime(year, 1, 1, tzinfo=timezone(tz_offset)) - datetime(1970, 1, 1, tzinfo=timezone.utc)).total_seconds()) * 1000
        link = f"https://www.smard.de/app/chart_data/{filter_num}/DE/{filter_num}_DE_{freq}_{timestamp}.json"

        response = requests.get(link)

        if response.status_code == 200:
            data = pd.DataFrame(response.json().get('series', []), columns=['V1', 'V2'])
            if not data.empty:
                data['Datum'] = pd.to_datetime(data['V1'], unit='ms', utc=True).dt.tz_convert('Europe/Berlin').dt.date
                data[name] = data['V2']
                data = data[['Datum', name]]
                data_frames.append(data)
            else:
                print(f"No data for year {year}")
        else:
            print(f"Failed to fetch data for year {year}. Status code: {response.status_code}")

    # Daten kombinieren
    if data_frames:
        result = pd.concat(data_frames, ignore_index=True)
        return result
    else:
        print("No data available for the specified years.")
        return pd.DataFrame()

# Datenabruf
filter_num = "4169"
name_def = "Day-Ahead-Preis"
em_preise_strom_raw = get_json_smard(filter_num, name_def)

#Speichern der Rohdaten
em_preise_strom_raw.to_csv('/content/drive/MyDrive/Datenablage/em_preise_strom_raw.csv', index=False)

em_preise_strom_d = em_preise_strom_raw.copy()

# Konvertiere das Datum in ein Datetime-Objekt
em_preise_strom_d['Datum'] = pd.to_datetime(em_preise_strom_raw['Datum'])

# Füge die Spalte für den 7-Tage-Durchschnitt hinzu
em_preise_strom_d['7-Tage-Durchschnitt'] = em_preise_strom_d['Day-Ahead-Preis'].rolling(window=7).mean()

# Füge die Spalte für den 30-Tage-Durchschnitt hinzu
em_preise_strom_d['30-Tage-Durchschnitt'] = em_preise_strom_d['Day-Ahead-Preis'].rolling(window=30).mean()

#Speichern der Datentabelle
em_preise_strom_d.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_preise_strom_d.csv', index=False)

# Update des Charts
CHART_ID = "UdCqO"
dw.add_data(chart_id=CHART_ID, data=em_preise_strom_d)
dw.publish_chart(chart_id=CHART_ID, display=False)

{'data': {'publicId': 'UdCqO',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'UdCqO',
  'type': 'd3-lines',
  'title': ' Strompreise im Großhandel\n',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:45:48.917Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/UdCqO/102/',
  'publicVersion': 102,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'X.1': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'Einheit': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''}},
    'external-data': 'https://raw.githubusercontent.com/anneberner/Tabellen_duke/main/em_preise_strom_m.csv',
    'upload-method': 'copy',
    'use-datawrapper-c

In [None]:
# UPDATE Kommerzieller Stromhandel (SMARD)
# Definition der Funktion um Daten von SMARD-API abzurufen
# Definition der Funktion um Daten von SMARD-API abzurufen
def get_json_smard(filter_num, name, freq="month", start_year=2021, end_year=datetime.now().year):
    data_frames = []

    for year in range(start_year, end_year + 1):
        tz_offset = timedelta(hours=1)  # UTC+1
        timestamp = int((datetime(year, 1, 1, tzinfo=timezone(tz_offset)) - datetime(1970, 1, 1, tzinfo=timezone.utc)).total_seconds()) * 1000
        link = f"https://www.smard.de/app/chart_data/{filter_num}/DE/{filter_num}_DE_{freq}_{timestamp}.json"

        response = requests.get(link)

        if response.status_code == 200:
            data = pd.DataFrame(response.json().get('series', []), columns=['V1', 'V2'])
            if not data.empty:
                data['Datum'] = pd.to_datetime(data['V1'], unit='ms', utc=True).dt.tz_convert('Europe/Berlin').dt.date
                data[name] = data['V2']
                data = data[['Datum', name]]
                data_frames.append(data)
            else:
                print(f"No data for year {year}")
        else:
            print(f"Failed to fetch data for year {year}. Status code: {response.status_code}")

    # Daten kombinieren
    if data_frames:
        result = pd.concat(data_frames, ignore_index=True)
        return result
    else:
        print("No data available for the specified years.")
        return pd.DataFrame()

# Datenabruf
filter_num = "4629"
name_def = "Außenhandel Saldo"
em_außenhandel_raw = get_json_smard(filter_num, name_def)

# Speichern der Rohdaten
em_außenhandel_raw.to_csv('/content/drive/MyDrive/Datenablage/em_außenhandel_raw.csv', index=False)

# Umrechnung der Spalte Außenhandel Saldo in TWh
em_außenhandel_raw['Außenhandel Saldo'] = em_außenhandel_raw['Außenhandel Saldo'] * 0.000001

# Konvertiere die "Datum"-Spalte in ein Datumsformat
em_außenhandel_raw['Datum'] = pd.to_datetime(em_außenhandel_raw['Datum'])

# Erstelle separate Spalten für "Monat" und "Jahr"
em_außenhandel_raw['Monat'] = em_außenhandel_raw['Datum'].dt.month
em_außenhandel_raw['Jahr'] = em_außenhandel_raw['Datum'].dt.year

# Umformung des Datensatzes Long -> Wide zur Gegenüberstellung der Jahre
em_außenhandel_m = em_außenhandel_raw.pivot_table(values='Außenhandel Saldo',
                                                index='Monat',
                                                columns='Jahr',
                                                aggfunc='sum').reset_index()

# Umwandlung der Monatsspalte in ausgeschriebene Monate
deutsche_monate = ['Januar', 'Februar', 'März', 'April', 'Mai', 'Juni', 'Juli', 'August', 'September', 'Oktober', 'November', 'Dezember']

def nummer_zu_monat(nummer):
    return deutsche_monate[nummer - 1]

# Anwendung der Funktion auf die Spalte "Monat" im DataFrame
em_außenhandel_m['Monat'] = em_außenhandel_m['Monat'].apply(nummer_zu_monat)

# Aktueller Monat und Jahr
aktuelles_datum = datetime.now()
aktueller_monat = aktuelles_datum.month
aktuelles_jahr = aktuelles_datum.year

# Konvertiere die Jahres-Spalte in object-Typ, bevor wir 'na' hinzufügen
if str(aktuelles_jahr) in em_außenhandel_m.columns:
    em_außenhandel_m[str(aktuelles_jahr)] = em_außenhandel_m[str(aktuelles_jahr)].astype(object)

# Ersetzen von Nullwerten für Monate größer oder gleich dem aktuellen Monat im aktuellen Jahr
for monat in range(aktueller_monat, 13):
    em_außenhandel_m[aktuelles_jahr][em_außenhandel_m['Monat'] == deutsche_monate[monat - 1]] = 'na'

def rearrange_columns(df, n_years=3):
    # Konvertiere die Spaltennamen in Strings
    year_columns = [str(col) for col in df.columns if isinstance(col, int)]

    # Spaltennamen sortieren
    sorted_columns = sorted(year_columns, reverse=True)

    # Die ersten n_years Jahre auswählen
    selected_years = sorted_columns[:n_years]

    # Spalten in der gewünschten Reihenfolge neu anordnen
    new_column_order = ['Monat'] + selected_years

    # Rückgabe des DataFrames mit den neuen Spalten
    return df[['Monat'] + [int(year) for year in selected_years]]

# Anwendung der Spaltenreihenfolge
em_außenhandel_m = rearrange_columns(em_außenhandel_m, n_years=3)

#Speichern der Datentabelle
em_außenhandel_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_außenhandel_m.csv', index=False)

# Update des Charts
CHART_ID = "or240"
dw.add_data(chart_id=CHART_ID, data=em_außenhandel_m)
dw.publish_chart(chart_id=CHART_ID, display=False)

You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  em_außenhandel_m[aktuelles_jahr][em_außenhandel_m['Monat'] == deutsche_monate[monat - 1]] = 'na'
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html

{'data': {'publicId': 'or240',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'or240',
  'type': 'd3-lines',
  'title': 'Kommerzieller Außenhandel von Strom',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:45:54.581Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/or240/68/',
  'publicVersion': 68,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'2021': {'type': 'auto',
      'ignore': True,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''},
     'Monat': {'type': 'date',
      'ignore': False,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''}},
    'upload-method': 'copy'},
   'describe': {'source-name': 'SMARD',
    'source-url': 'https://www.smard.de/home',
    'intro': 'in TWh/Monat',
    'bylin

In [None]:
# UPDATE Verbraucherpreisindex für Energie (HICP) (Eurostat)

#Herunterlade (API) und Filtern der Daten
data_filter = {'geo': ['DE', 'EU27_2020'], 'unit': ['I15']}
hicp_raw = eurostat.get_data_df('prc_hicp_midx', filter_pars=data_filter)

#Speichern der Rohdaten
#em_hicp_raw.to_csv('/content/drive/MyDrive/Datenablage/em_hicp_raw.csv', index=False)

# Erstellen der neuen Spalte "Energie" basierend auf "coicop"
hicp_raw['Energieträger'] = np.select(
    [
        #hicp_raw['coicop'] == 'CP0451',
        #em_hicp_raw['coicop'] == 'CP0454',
        #em_hicp_raw['coicop'] == 'CP0453',
        #em_hicp_raw['coicop'] == 'CP0455',
        #hicp_raw['coicop'] == 'CP0452',
        #em_hicp_raw['coicop'] == 'CP07222',
        #em_hicp_raw['coicop'] == 'CP07221'
        hicp_raw['coicop'] == 'NRG'
           ],
    [
        #'Elektrizität',
        #'Kohle',
        #'Flüssige Brennstoffe',
        #'Fernwärme',
        #'Erdgas',
        #'Benzin',
        #'Diesel'
        'Energie'
    ],
    default='NA'
)

# Entfernen der Zeilen, in denen die Spalte "Energie" keinen Wert hat
hicp_m = hicp_raw[hicp_raw['Energieträger']!='NA']

#Entfernen irrelevanter Spalten
hicp_m['Energieträger'] = hicp_m['Energieträger'] + ' ' + hicp_m['geo\\TIME_PERIOD']
columns_to_remove = ["freq", "unit", "coicop", "geo\\TIME_PERIOD"]
hicp_m = hicp_m.drop(columns=columns_to_remove)
hicp_m = pd.melt(hicp_m, id_vars=['Energieträger'], var_name='Datum', value_name='value', col_level=0)

# Verwenden von pivot, um die Werte aus "Datum" als separate Spalten zu erhalten
hicp_m = hicp_m.pivot(index='Datum', columns='Energieträger', values='value')

# Zurücksetzen des Index, um die "Datum"-Spalte als normale Spalte zu haben
hicp_m.reset_index(inplace=True)
hicp_m = hicp_m.fillna("NA")

# Umbenennen der Spalten
hicp_m.rename(columns={'Energie DE': 'Deutschland', 'Energie EU27_2020': 'EU27'}, inplace=True)

# Speichern der Datentabelle
hicp_m.to_csv('/content/drive/MyDrive/Fertige_Tabellen/kedi_hicp_m.csv', index=False)

# Update des Chart
CHART_ID = "R10lZ"
dw.add_data(chart_id=CHART_ID, data=hicp_m)
dw.publish_chart(chart_id=CHART_ID, display=False)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  hicp_m['Energieträger'] = hicp_m['Energieträger'] + ' ' + hicp_m['geo\\TIME_PERIOD']


{'data': {'publicId': 'R10lZ',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'R10lZ',
  'type': 'd3-lines',
  'title': 'Preisindex für Energie ',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:46:01.672Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/R10lZ/40/',
  'publicVersion': 40,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'Erdgas DE': {'type': 'auto', 'ignore': True},
     'Elektrizität DE': {'type': 'auto', 'ignore': True},
     'Erdgas EU27_2020': {'type': 'auto', 'ignore': True},
     'Elektrizität EU27_2020': {'type': 'auto', 'ignore': True}},
    'upload-method': 'copy'},
   'describe': {'source-name': 'Eurostat',
    'source-url': 'https://ec.europa.eu/eurostat/databrowser/view/prc_hicp_midx/default/table?lang=de',
    'intro': 'Harmonisierter Verbraucherpreisindex (2015 = 100)',
    'byline': 'dena',
   

In [None]:
# NEU Haushalts-Strompreise (bdew)
#Wir haben die Daten nicht als automatischen Download, sondern nur manuell


# Einlesen aus Ablage im Drive-Ordner "Datenquellen" mit End-Marker
df_raw = pd.read_csv('/content/drive/MyDrive/Datenquellen/data-ojEOF.csv', parse_dates=True, delimiter=',', decimal=',',)
df_raw = df_raw.drop(columns=['Summe'])

# Speichern der Rohdaten
df_raw.to_csv('/content/drive/MyDrive/Datenablage/em_preis_hh_raw.csv', index=False)

# Ersetzte NaN mit 0
df_raw = df_raw.fillna(0)

# Spalte Sonstige einfügen
df_raw["Sonstige Umlagen"] = (df_raw['KWK-Aufschlag'] + df_raw['§19 StromNEV-Umlage'] + df_raw['Offshore-Netzumlage'] + df_raw['Umlage f. abschaltbare Lasten'])

# Spalten umbenennen
df_raw = df_raw.rename(
    columns={
        "X.1": "Zeit",
        "EEG-Umlage¹": "EEG-Umlage",
        "Beschaffung, Vertrieb (ab 2006)": "Beschaffung, Vertrieb",
        "Netzentgelt inkl. Messung und Messstellenbetrieb (ab 2006)": "Netzentgelt"
    }
)

# Spalten löschen
Spalten_unerw = ['KWK-Aufschlag', '§19 StromNEV-Umlage', 'Offshore-Netzumlage', 'Umlage f. abschaltbare Lasten' ]
df_raw = df_raw.drop(Spalten_unerw, axis=1)


Reihenfolge = {'Zeit': 1, 'Beschaffung, Vertrieb': 2,'Netzentgelt': 3, 'Mehrwertsteuer': 4, 'Stromsteuer': 5}
df_raw = df_raw[sorted(df_raw.columns, key=lambda x: Reihenfolge.get(x, float('inf')))]


# Speichern der Tabelle
df_raw.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_preis_hh_y.csv', index=False)

print(df_raw)

# Update des Charts
CHART_ID = "Cw8TE"
dw.add_data(chart_id=CHART_ID, data=df_raw)
dw.publish_chart(chart_id=CHART_ID, display=False)

    Zeit  Beschaffung, Vertrieb  Mehrwertsteuer  Stromsteuer  \
0   2014                  7.381           4.650         2.05   
1   2015                  7.050           4.580         2.05   
2   2016                  6.260           4.600         2.05   
3   2017                  5.710           4.670         2.05   
4   2018                  6.200           4.710         2.05   
5   2019                  7.090           4.860         2.05   
6   2020                  7.510           5.080         2.05   
7   2021                  7.930           5.130         2.05   
8   2022                 16.970           6.050         2.05   
9   2023                 23.830           7.300         2.05   
10  2024                 17.935           6.603         2.05   

    Netzentgelt inkl. Messung und Messstellenbetrieb  Konzessionsabgabe  \
0                                               6.63               1.66   
1                                               6.74               1.66   
2     

{'data': {'publicId': 'Cw8TE',
  'language': 'de-DE',
  'theme': 'dena',
  'id': 'Cw8TE',
  'type': 'd3-bars-stacked',
  'title': 'Strompreise für Haushalte',
  'lastEditStep': 5,
  'publishedAt': '2024-11-14T16:46:05.728Z',
  'publicUrl': 'https://datawrapper.dwcdn.net/Cw8TE/47/',
  'publicVersion': 47,
  'deleted': False,
  'forkable': False,
  'isFork': False,
  'metadata': {'data': {'changes': [],
    'transpose': False,
    'vertical-header': True,
    'horizontal-header': True,
    'column-format': {'Zeit': {'type': 'date',
      'ignore': False,
      'number-append': '',
      'number-format': 'auto',
      'number-divisor': 0,
      'number-prepend': ''}},
    'upload-method': 'copy'},
   'describe': {'source-name': 'bdew',
    'source-url': 'https://www.bdew.de/service/daten-und-grafiken/bdew-strompreisanalyse/',
    'intro': 'in ct/kWh',
    'byline': 'dena',
    'aria-description': '',
    'number-format': '-',
    'number-divisor': 0,
    'number-append': '',
    'number-p

In [None]:
# Update Großhandelspreise Strom EU (Ember)

# URL zur Excel-Dateien
url = "https://ember-climate.org/app/uploads/2022/09/european_wholesale_electricity_price_data_monthly-5.csv"

# Herunterladen der Excel-Dateien
response = requests.get(url)
csv_data = BytesIO(response.content)

# Einlesen des festgelegten Bereichs
df = pd.read_csv(csv_data, delimiter=',')

# Liste der EU-27 Länder in englischer Sprache (keine Daten für Malta und Zypern)
eu_27_countries = ['Germany', 'France', 'Italy', 'Spain', 'Poland', 'Romania', 'Netherlands', 'Belgium', 'Greece', 'Portugal', 'Sweden', 'Hungary', 'Austria', 'Bulgaria', 'Czechia', 'Denmark', 'Finland', 'Slovakia', 'Ireland', 'Croatia', 'Lithuania', 'Slovenia', 'Estonia', 'Latvia', 'Luxembourg']
german_country_names = ['Deutschland', 'Frankreich', 'Italien', 'Spanien', 'Polen', 'Rumänien', 'Niederlande', 'Belgien', 'Griechenland', 'Portugal', 'Schweden', 'Ungarn', 'Österreich', 'Bulgarien', 'Tschechien', 'Dänemark', 'Finnland', 'Slowakei', 'Irland', 'Kroatien', 'Litauen', 'Slowenien', 'Estland', 'Lettland', 'Luxemburg']
country_mapping = dict(zip(eu_27_countries, german_country_names))

# Die Spalte "Date" in "Datum" umbenennen und das Datumsformat ändern
df['Date'] = pd.to_datetime(df['Date'])
df['Datum'] = df['Date'].dt.strftime('%m-%Y')

# Pivot-Tabelle erstellen und nach EU-27 Ländern filtern
df = df.pivot_table(index='Datum', columns='Country', values='Price (EUR/MWhe)')[eu_27_countries]

# Ländernamen mit deutschen Entsprechungen ersetzen
df.columns = [country_mapping[col] for col in df.columns]

# Index zurücksetzen, um Datum als separate Spalte zu erhalten
df = df.reset_index()

# Minimalwerte für jedes Datum extrahieren und in die Spalte "Minimum" eintragen
df['Minimum'] = df.drop(columns='Datum').min(axis=1, skipna=True)
df['Maximum'] = df.drop(columns='Datum').max(axis=1, skipna=True)

# Die gewünschten Spalten auswählen
selected_columns = ['Datum', 'Deutschland', 'Frankreich', 'Polen', 'Minimum', 'Maximum']
df = df[selected_columns]

# DataFrame nach der Spalte "Datum" sortieren
df['Datum'] = pd.to_datetime(df['Datum'], format='%m-%Y')
df = df.sort_values(by='Datum')
df['Datum'] = df['Datum'].dt.strftime('%m-%Y')

# Speichern des Datensatzes
df.to_csv('/content/drive/MyDrive/Fertige_Tabellen/em_strom_eu_m.csv', index=False)

# Update des Charts
CHART_ID = "hfjwP"
dw.add_data(chart_id=CHART_ID, data=df)
dw.publish_chart(chart_id=CHART_ID, display=False)

ParserError: Error tokenizing data. C error: Expected 1 fields in line 5, saw 2


In [None]:
df_raw

**Github Push Test**

In [None]:
!git log

[33mcommit 024c5b24b7cac4cf312678e4efecf5af0352cf4b[m[33m ([m[1;36mHEAD -> [m[1;32mmain[m[33m)[m
Author: Your Name <you@example.com>
Date:   Thu Apr 17 10:00:17 2025 +0000

    Push notebook from Colab

[33mcommit f3b548c0536f9854359380a1de0f5b7988dea501[m
Author: Your Name <you@example.com>
Date:   Thu Apr 17 09:47:37 2025 +0000

    Push notebook from Colab

[33mcommit 49da346625bf260c428dbe2eb2c9955290ce9d5a[m[33m ([m[1;31morigin/main[m[33m, [m[1;31morigin/HEAD[m[33m)[m
Author: dena-dat <daten@dena.de>
Date:   Thu Apr 17 10:21:57 2025 +0200

    Initial commit


In [None]:
import os
import shutil
import IPython
from IPython.display import display, Javascript
import time
from google.colab import userdata
github_secret = userdata.get('github')
# Set your GitHub credentials
GITHUB_USER = "gregshookdena"
GITHUB_TOKEN = github_secret
REPO_URL = f"https://{GITHUB_USER}:{GITHUB_TOKEN}@github.com/dena-dat/infocenter.git"
REPO_DIR = "/content/infocenter"
NOTEBOOK_FILENAME = "Kapitel_Energieträger.ipynb"  # Change to your notebook name
COMMIT_MESSAGE = "Push notebook from Colab"
BRANCH = "main"  # or "master" if your repo uses that

# === STEP 1: Save notebook from UI
display(Javascript('''
(async function() {
    const saveButton = document.querySelector('colab-toolbar').shadowRoot.querySelector('#save-notebook');
    saveButton.click();
})();
'''))

time.sleep(5)  # Let Colab finish saving

# === STEP 2: Clone the GitHub repo
if not os.path.exists(REPO_DIR):
    !git clone {REPO_URL} {REPO_DIR}
else:
    print("Repo already cloned at", REPO_DIR)

# === STEP 3: Copy the notebook into the cloned repo
src = f"/content/drive/MyDrive/dUKE_Kapitel/Kapitel_Energieträger.ipynb"
dst = os.path.join(REPO_DIR, NOTEBOOK_FILENAME)
shutil.copy(src, dst)

# === STEP 4: Git commit & push
os.chdir(REPO_DIR)
!git config --global user.email "you@example.com"
!git config --global user.name "Your Name"
!git add {NOTEBOOK_FILENAME}
!git commit -m "{COMMIT_MESSAGE}" || echo "Nothing to commit"
!git push origin {BRANCH}

<IPython.core.display.Javascript object>

Repo already cloned at /content/infocenter
[main fa302a9] Push notebook from Colab
 1 file changed, 1 insertion(+)
 create mode 100644 "Kapitel_Energietr\303\244ger.ipynb"
Enumerating objects: 4, done.
Counting objects: 100% (4/4), done.
Delta compression using up to 2 threads
Compressing objects: 100% (3/3), done.
Writing objects: 100% (3/3), 34.95 KiB | 4.37 MiB/s, done.
Total 3 (delta 0), reused 0 (delta 0), pack-reused 0
To https://github.com/dena-dat/infocenter.git
   49da346..fa302a9  main -> main


In [None]:
NOTEBOOK_FILENAME = "Kapitel_Energiemärkte.ipynb"  # Change to your notebook name
COMMIT_MESSAGE = "Push notebook from Colab"
BRANCH = "main"  # or "master" if your repo uses that

# === STEP 1: Save notebook from UI
display(Javascript('''
(async function() {
    const saveButton = document.querySelector('colab-toolbar').shadowRoot.querySelector('#save-notebook');
    saveButton.click();
})();
'''))

time.sleep(5)  # Let Colab finish saving

# === STEP 2: Clone the GitHub repo
if not os.path.exists(REPO_DIR):
    !git clone {REPO_URL} {REPO_DIR}
else:
    print("Repo already cloned at", REPO_DIR)

# === STEP 3: Copy the notebook into the cloned repo
src = f"/content/drive/MyDrive/dUKE_Kapitel/Kapitel_Energiemärkte.ipynb"
dst = os.path.join(REPO_DIR, NOTEBOOK_FILENAME)
shutil.copy(src, dst)

# === STEP 4: Git commit & push
os.chdir(REPO_DIR)
!git config --global user.email "you@example.com"
!git config --global user.name "Your Name"
!git add {NOTEBOOK_FILENAME}
!git commit -m "{COMMIT_MESSAGE}" || echo "Nothing to commit"
!git push origin {BRANCH}

<IPython.core.display.Javascript object>

Repo already cloned at /content/infocenter
[main 9232965] Push notebook from Colab
 1 file changed, 1 insertion(+), 1 deletion(-)
 rewrite "Kapitel_Energiem\303\244rkte.ipynb" (93%)
Enumerating objects: 7, done.
Counting objects: 100% (7/7), done.
Delta compression using up to 2 threads
Compressing objects: 100% (6/6), done.
Writing objects: 100% (6/6), 33.60 KiB | 3.36 MiB/s, done.
Total 6 (delta 2), reused 0 (delta 0), pack-reused 0
remote: Resolving deltas: 100% (2/2), done.[K
remote: [1;31merror[m: GH013: Repository rule violations found for refs/heads/main.[K
remote: 
remote: - GITHUB PUSH PROTECTION[K
remote:   —————————————————————————————————————————[K
remote:     Resolve the following violations before pushing again[K
remote: 
remote:     - Push cannot contain secrets[K
remote: 
remote:     [K
remote:      (?) Learn how to resolve a blocked push[K
remote:      https://docs.github.com/code-security/secret-scanning/working-with-secret-scanning-and-push-protection/worki

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive
