# Inhaltsverzeichnis des Skripts:

[[_TOC_]]

---

### Vorliegende Datentyp:

**quantitative Daten auf Kardinalskala**

*Vorliegende Columns:*

- **Date:** Datum
- **Open:** Eröffnungskurs
- **High:** Höchstkurs
- **Low:** Tiefkurs
- **Close:** Schlusskurs
- **Volume:** Handelsvolumen

In [None]:
########################################################
#--------------- benötigten Librarys ------------------#
########################################################

import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os

### Download und Speicherung der Datei

In [None]:
def download_stock_data(ticker_symbol, time_period, data_folder="../data"):
    """
    Lädt Aktiendaten von Yahoo Finance herunter und speichert sie als CSV.
    
    Args:
        ticker_symbol (str): Das Ticker-Symbol der Aktie (z.B. "MSFT" für Microsoft)
        time_period (str): Der Zeitraum für die Daten (z.B. "5y", "1mo", "max")
        data_folder (str): Pfad zum Datenordner, standardmäßig "../data" (eine Ebene hoch und dann in 'data')
    
    Returns:
        pandas.DataFrame: Der heruntergeladene Datensatz
        pandas.DataFrame: Statistische Zusammenfassung
    """
    
    # Erstelle Dateinamen aus dem Ticker-Symbol
    file_name = f"{ticker_symbol.lower()}_aktien_daten.csv"
    csv_file_location = os.path.join(data_folder, file_name)

    # Ticker-Objekt abrufen
    stock = yf.Ticker(ticker_symbol)
    
    # Historische Daten herunterladen
    hist_data = stock.history(period=time_period)
    
    # Daten als CSV speichern
    hist_data.to_csv(csv_file_location)
    print(f"Daten wurden in {csv_file_location} gespeichert.")

    # Erste Spalte zu Datum konvertieren und als Index setzen
    hist_data = hist_data.reset_index()
    hist_data['Date'] = pd.to_datetime(hist_data['Date']).dt.normalize()  # Entfernt die Uhrzeit
    hist_data = hist_data.set_index('Date')
    hist_data.to_csv(csv_file_location, date_format='%Y-%m-%d')

    # Entferne die Spalten 'Dividends' und 'Stock Splits'
    columns_to_drop = ['Dividends', 'Stock Splits']
    hist_data = hist_data.drop(columns=columns_to_drop, errors='ignore')

    # Konvertiere alle numerischen Spalten zu Float
    for col in hist_data.columns:
        hist_data[col] = pd.to_numeric(hist_data[col], errors='coerce')

    # Allgemeine Infos
    print(f"+{'-'*48}+")
    print(f"|{'Allgemeine Informationen der Aktien-Daten':^48}|")
    print(f"+{'-'*48}+ \n")
    hist_data.info()
    
    # Statistische Zusammenfassung
    data_zusammenfassung = hist_data.describe()
    print(f"\n\n")
    print(f"+{'-'*48}+")
    print(f"|{'Statistische Zusammenfassung der Aktien-Daten':^48}|")
    print(f"+{'-'*48}+ \n")
    print(data_zusammenfassung)

    return hist_data, data_zusammenfassung, csv_file_location


# Verwendung der Funktion
if __name__ == "__main__":
    # Aktien Daten herunterladen
    data = download_stock_data("005930.KS", "max")

Daten wurden in ../data/005930.ks_aktien_daten.csv gespeichert.
+------------------------------------------------+
|   Allgemeine Informationen der Aktien-Daten    |
+------------------------------------------------+ 

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 6347 entries, 2000-01-04 00:00:00+09:00 to 2025-05-13 00:00:00+09:00
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   Open    6347 non-null   float64
 1   High    6347 non-null   float64
 2   Low     6347 non-null   float64
 3   Close   6347 non-null   float64
 4   Volume  6347 non-null   int64  
dtypes: float64(4), int64(1)
memory usage: 297.5 KB



+------------------------------------------------+
| Statistische Zusammenfassung der Aktien-Daten  |
+------------------------------------------------+ 

               Open          High           Low         Close        Volume
count   6347.000000   6347.000000   6347.000000   6347.000000  6.347000e+03
mean  