# Datenquelle
### Einlesen der Daten

In [10]:
import yfinance as yf
import warnings

def download_stock_data(ticker_symbol, time_period, csv_filename):
    """
    Lädt Aktiendaten von Yahoo Finance herunter und speichert sie als CSV.
    
    Args:
        ticker_symbol (str): Das Ticker-Symbol der Aktie (z.B. "MSFT" für Microsoft)
        time_period (str): Der Zeitraum für die Daten (z.B. "5y", "1mo", "max")
        csv_filename (str): Der Dateiname zum Speichern der CSV-Datei
    
    Returns:
        pandas.DataFrame: Der heruntergeladene Datensatz
    """
    # Warnungen unterdrücken
    warnings.filterwarnings('ignore')
    
    # Ticker-Objekt abrufen
    stock = yf.Ticker(ticker_symbol)
    
    # Historische Daten herunterladen
    hist_data = stock.history(period=time_period)
    
    # Die ersten Zeilen der Daten anzeigen
    print(f"Daten für {ticker_symbol} über {time_period} heruntergeladen:")
    print(hist_data.head())
    
    # Daten als CSV speichern
    hist_data.to_csv(csv_filename)
    print(f"Daten wurden in {csv_filename} gespeichert.")
    
    return hist_data

### Ausführen der Funktion

In [11]:
# Verwendung der Funktion
if __name__ == "__main__":
    # Microsoft Daten für 5 Jahre herunterladen
    msft_data = download_stock_data("MSFT", "5y", "microsoft_aktien_daten.csv")

Daten für MSFT über 5y heruntergeladen:
                                 Open        High         Low       Close  \
Date                                                                        
2020-05-07 00:00:00-04:00  176.283621  176.647354  174.761711  175.738037   
2020-05-08 00:00:00-04:00  177.058931  177.078079  175.508306  176.771774   
2020-05-11 00:00:00-04:00  175.307248  179.480547  175.020106  178.743530   
2020-05-12 00:00:00-04:00  178.800992  179.030705  174.493688  174.694687   
2020-05-13 00:00:00-04:00  174.732990  176.168759  168.980337  172.052887   

                             Volume  Dividends  Stock Splits  
Date                                                          
2020-05-07 00:00:00-04:00  28316000        0.0           0.0  
2020-05-08 00:00:00-04:00  30877800        0.0           0.0  
2020-05-11 00:00:00-04:00  30892700        0.0           0.0  
2020-05-12 00:00:00-04:00  32038200        0.0           0.0  
2020-05-13 00:00:00-04:00  44711500       

### Exploration der Daten
Anzahl der Zeilen und Spalten

In [12]:
import pandas as pd

df = pd.read_csv('microsoft_aktien_daten.csv')
rows, columns = df.shape
print(f"Der Datensatz enthält {rows} Zeilen und {columns} Spalten.")

Der Datensatz enthält 1256 Zeilen und 8 Spalten.
