In [None]:
import pandas as pd
import matplotlib.pyplot as plt

def analyze_days_difference(file_path, start_date_col, end_date_col, date_format=None):
    """
    Analizuje różnicę dni między dwiema kolumnami dat i zwraca Series z ilością wystąpień liczby dni.

    Parametry:
    file_path (str): Ścieżka do pliku CSV.
    start_date_col (str): Nazwa kolumny z datą początkową.
    end_date_col (str): Nazwa kolumny z datą końcową.
    date_format (str, opcjonalne): Format dat w pliku CSV, jeśli znany.

    Zwraca:
    pd.Series: Series zawierający zliczone ilości wystąpień różnicy dni.
    """
    # Wczytanie danych
    df = pd.read_csv(file_path)

    # Usunięcie wierszy, gdzie jedna z dat jest null
    df = df.dropna(subset=[start_date_col, end_date_col])

    # Konwersja kolumn na typ datetime
    if date_format:
        df[start_date_col] = pd.to_datetime(df[start_date_col], format=date_format, errors='coerce')
        df[end_date_col] = pd.to_datetime(df[end_date_col], format=date_format, errors='coerce')
    else:
        df[start_date_col] = pd.to_datetime(df[start_date_col], errors='coerce')
        df[end_date_col] = pd.to_datetime(df[end_date_col], errors='coerce')

    # Usunięcie wierszy z niepoprawnymi datami (NaT)
    df = df.dropna(subset=[start_date_col, end_date_col])

    # Obliczenie różnicy dni
    df['days_difference'] = (df[end_date_col] - df[start_date_col]).dt.days

    # Zliczenie ilości wystąpień liczby dni
    days_count = df['days_difference'].value_counts().sort_index()

    # Zwrócenie Series z ilością wystąpień
    return days_count

def plot_histogram(days_count, x_min=None, x_max=None):
    """
    Tworzy histogram liczby dni między datami na podstawie dostarczonych zliczonych danych.

    Parametry:
    days_count (pd.Series): Series zawierający zliczone ilości wystąpień różnicy dni.
    x_min (int, opcjonalne): Minimalna wartość na osi X.
    x_max (int, opcjonalne): Maksymalna wartość na osi X.
    """
    # Tworzenie histogramu
    plt.figure(figsize=(10, 6))
    if x_min is not None and x_max is not None:
        days_count = days_count[(days_count.index >= x_min) & (days_count.index <= x_max)]

    days_count.plot(kind='bar')
    plt.xlabel('Liczba dni')
    plt.ylabel('Liczba wystąpień')
    plt.title('Histogram liczby dni między datami')
    plt.show()

# Przykład użycia funkcji
days_count = analyze_days_difference('nazwa_pliku.csv', 'data_start', 'data_end', date_format='%d-%m-%Y')

# Przykład wywołania funkcji do tworzenia histogramu z ustawieniem zakresu osi X
plot_histogram(days_count, x_min=0, x_max=30)


In [None]:
def display_statistics(days_count):
    """
    Oblicza statystyki opisowe dla days_count za pomocą describe() i wyświetla je w formie tabeli.

    Parametry:
    days_count (pd.Series): Series zawierający zliczone ilości wystąpień różnicy dni.
    """
    # Obliczenie statystyk za pomocą describe()
    statistics = days_count.describe()

    # Konwersja do DataFrame i transpozycja dla lepszego wyświetlania
    statistics_df = pd.DataFrame(statistics).T

    # Wyświetlenie tabeli
    print(statistics_df)

# Przykład użycia funkcji
days_count = analyze_days_difference('nazwa_pliku.csv', 'data_start', 'data_end', date_format='%d-%m-%Y')

# Wywołanie funkcji do wyświetlenia statystyk w tabeli
display_statistics(days_count)