In [18]:
import requests
import pandas as pd
from scipy.stats import ttest_ind

# URL der CSV-Datei
url = 'https://raw.githubusercontent.com/opencampus-sh/einfuehrung-in-data-science-und-ml/main/wetter.csv'
    
def csv_download(url):
    # Lade die Datei herunter
    response = requests.get(url)

    # Überprüfe, ob der Download erfolgreich war
    if response.status_code == 200:
        # Speichern der Datei auf der Festplatte
        with open('wetterdaten.csv', 'wb') as file:
            file.write(response.content)
        print("Datei erfolgreich heruntergeladen und gespeichert.")

        # Lade die CSV-Datei in ein pandas DataFrame
        df_wetterdaten = pd.read_csv('wetterdaten.csv')

        # Zeige die ersten 5 Zeilen an
        # print(df_wetterdaten.head())

    else:
        print(f"Fehler beim Download. Status-Code: {response.status_code}")
        
    return df_wetterdaten


def durchschnittberechnen_spalte(wetterdaten, spaltenName):
    durchschnitt = wetterdaten[spaltenName].mean()
    return durchschnitt


df_wetterdaten = csv_download(url)

# Bestimmen der Durchschnittstemperatur des betrachteten Zeitraumes
temperaturDurchschnitt = durchschnittberechnen_spalte(df_wetterdaten, 'Temperatur')
print(f"Die Durchschnittstemperatur über den gesamten betrachteten Zeitraum beträgt: {temperaturDurchschnitt:.2f} °C")

# Bestimmen der Durchschnittstemperatur von 1.7. bis 31.7.
# Definiere den gewünschten Zeitraum
start_datum = '2012-07-01'
end_datum = '2012-07-31'
# Filtere die Zeilen, die in diesen Zeitraum fallen
df_juli = df_wetterdaten[(df_wetterdaten['Datum'] >= start_datum) & (df_wetterdaten['Datum'] <= end_datum)]
temperaturDurchschnitt_Zeitraum_Juli = durchschnittberechnen_spalte(df_juli, 'Temperatur')
print(f"Die Durchschnittstemperatur zwischen {start_datum} und {end_datum} beträgt: {temperaturDurchschnitt_Zeitraum_Juli:.2f} °C")


# Bestimmen der Durchschnittstemperatur von 1.5. bis 31.5.
# Definiere den gewünschten Zeitraum
start_datum = '2012-05-01'
end_datum = '2012-05-31'
# Filtere die Zeilen, die in diesen Zeitraum fallen
df_mai = df_wetterdaten[(df_wetterdaten['Datum'] >= start_datum) & (df_wetterdaten['Datum'] <= end_datum)]
temperaturDurchschnitt_Zeitraum_Mai = durchschnittberechnen_spalte(df_mai, 'Temperatur')
print(f"Die Durchschnittstemperatur zwischen {start_datum} und {end_datum} beträgt: {temperaturDurchschnitt_Zeitraum_Mai:.2f} °C")


# Berechne die Differenz der Durchschnittstemperaturen
differenz = temperaturDurchschnitt_Zeitraum_Juli - temperaturDurchschnitt_Zeitraum_Mai

# Interpretation
if differenz > 0:
    print(f"Die Durchschnittstemperatur im Juli ist um {differenz:.1f}K höher als im Mai.")
elif differenz < 0:
    print(f"Die Durchschnittstemperatur im Mai ist um {differenz:.1f}K höher als im Juli.")
else:
    print("Die Durchschnittstemperaturen im Mai und Juli sind gleich.")



    

Datei erfolgreich heruntergeladen und gespeichert.
Die Durchschnittstemperatur über den gesamten betrachteten Zeitraum beträgt: 12.10 °C
Die Durchschnittstemperatur zwischen 2012-07-01 und 2012-07-31 beträgt: 18.63 °C
Die Durchschnittstemperatur zwischen 2012-05-01 und 2012-05-31 beträgt: 15.13 °C
Die Durchschnittstemperatur im Juli ist um 3.5K höher als im Mai.
