In [None]:
import pandas as pd

def count_unique_values_by_month(file_path, date_column, start_individual_month):
    # Wczytanie danych z pliku CSV
    df = pd.read_csv(file_path)

    # Konwersja kolumny daty na datetime
    df[date_column] = pd.to_datetime(df[date_column])

    # Dodanie kolumny miesiąc i rok
    df['month'] = df[date_column].dt.month
    df['year'] = df[date_column].dt.year

    # Lista kolumn (poza kolumną z datą, miesiącem i rokiem)
    columns = df.columns.difference([date_column, 'month', 'year'])

    # Lista miesięcy od lipca 2023 do czerwca 2024
    periods = [(2023, month) for month in range(7, 13)] + [(2024, month) for month in range(1, 7)]

    # Tworzenie pustego słownika do przechowywania wyników
    results = {column: [0]*12 for column in columns}

    # Zbiór przechowujący unikatowe wartości z pierwszego okresu (do start_individual_month)
    initial_uniques = {column: set() for column in columns}
    # Zbiór przechowujący unikatowe wartości z poprzednich indywidualnych miesięcy
    previous_uniques = {column: set() for column in columns}

    # Przetwarzanie okresów
    for i, (year, month) in enumerate(periods):
        monthly_data = df[(df['year'] == year) & (df['month'] == month)]
        if not monthly_data.empty:
            if i < start_individual_month:
                # Liczenie unikatowych wartości dla pierwszych miesięcy razem
                for column in columns:
                    initial_uniques[column].update(monthly_data[column].dropna().unique())
            else:
                # Liczenie unikatowych wartości indywidualnie od start_individual_month
                for column in columns:
                    current_uniques = set(monthly_data[column].dropna().unique())
                    new_uniques = current_uniques - initial_uniques[column] - previous_uniques[column]
                    results[column][i] = len(new_uniques)
                    previous_uniques[column].update(new_uniques)

    # Dodanie wyników z pierwszych miesięcy do wyników
    for column in columns:
        results[column][start_individual_month - 1] = len(initial_uniques[column])

    return results

# Użycie funkcji z plikiem CSV
file_path = 'path_to_your_file.csv'
date_column = 'data'
start_individual_month = 5

results = count_unique_values_by_month(file_path, date_column, start_individual_month)

# Wyświetlenie wyników
for column, unique_counts in results.items():
    print(f"Column: {column}, Unique counts by month: {unique_counts}")
