In [None]:
import pandas as pd
import matplotlib.pyplot as plt

def count_unique_values_by_period(file_path, date_column, initial_periods):
    # Wczytanie danych z pliku CSV
    df = pd.read_csv(file_path)

    # Konwersja kolumny daty na datetime
    df[date_column] = pd.to_datetime(df[date_column])

    # Dodanie kolumny miesiąc i rok
    df['month'] = df[date_column].dt.month
    df['year'] = df[date_column].dt.year

    # Lista kolumn (poza kolumną z datą, miesiącem i rokiem)
    columns = df.columns.difference([date_column, 'month', 'year'])

    # Lista okresów od lipca 2023 do czerwca 2024
    periods = [(2023, month) for month in range(7, 13)] + [(2024, month) for month in range(1, 7)]

    # Tworzenie pustego słownika do przechowywania wyników
    results = {column: [] for column in columns}

    # Zbiór przechowujący unikatowe wartości z pierwszego okresu (do initial_periods)
    initial_uniques = {column: set() for column in columns}
    # Zbiór przechowujący unikatowe wartości z poprzednich indywidualnych miesięcy
    previous_uniques = {column: set() for column in columns}

    # Przetwarzanie okresów
    for i, (year, month) in enumerate(periods):
        monthly_data = df[(df['year'] == year) & (df['month'] == month)]
        if not monthly_data.empty:
            if i < initial_periods:
                # Liczenie unikatowych wartości dla pierwszych okresów razem
                for column in columns:
                    initial_uniques[column].update(monthly_data[column].dropna().unique())
            else:
                # Liczenie unikatowych wartości indywidualnie od initial_periods
                for column in columns:
                    current_uniques = set(monthly_data[column].dropna().unique())
                    new_uniques = current_uniques - initial_uniques[column] - previous_uniques[column]
                    results[column].append(len(new_uniques))
                    previous_uniques[column].update(new_uniques)

    # Dodanie wyników z pierwszych okresów do wyników
    for column in columns:
        results[column] = [len(initial_uniques[column])] + results[column]

    return results

def plot_unique_counts(results, initial_periods):
    months_labels = [
        'Jul 2023', 'Aug 2023', 'Sep 2023', 'Oct 2023', 'Nov 2023', 'Dec 2023',
        'Jan 2024', 'Feb 2024', 'Mar 2024', 'Apr 2024', 'May 2024', 'Jun 2024'
    ]

    # Dostosowanie etykiet miesięcy do initial_periods
    months_labels = months_labels[:initial_periods] + months_labels[initial_periods:]

    for column, counts in results.items():
        if len(set(counts)) > 1:  # Sprawdzanie, czy wartości nie są stałe
            plt.figure(figsize=(10, 6))
            plt.plot(months_labels, counts, marker='o')
            plt.title(f'Unique Counts per Period for {column}')
            plt.xlabel('Period')
            plt.ylabel('Unique Counts')
            plt.xticks(rotation=45)
            plt.grid(True)
            plt.tight_layout()
            plt.show()

# Użycie funkcji z plikiem CSV
file_path = 'path_to_your_file.csv'
date_column = 'data'
initial_periods = 5

results = count_unique_values_by_period(file_path, date_column, initial_periods)

# Wyświetlenie wyników i tworzenie wykresów
plot_unique_counts(results, initial_periods)


In [None]:
def plot_unique_counts(results, start_individual_month):
    months_labels = [
        'Jul 2023', 'Aug 2023', 'Sep 2023', 'Oct 2023', 'Nov 2023', 'Dec 2023',
        'Jan 2024', 'Feb 2024', 'Mar 2024', 'Apr 2024', 'May 2024', 'Jun 2024'
    ]

    # Dostosowanie etykiet miesięcy do start_individual_month
    months_labels = months_labels[start_individual_month-1:]

    for column, counts in results.items():
        if len(set(counts)) > 1:  # Sprawdzanie, czy wartości nie są stałe
            plt.figure(figsize=(10, 6))
            plt.plot(months_labels, counts, marker='o')
            plt.title(f'Unique Counts per Month for {column}')
            plt.xlabel('Month')
            plt.ylabel('Unique Counts')
            plt.xticks(rotation=45)
            plt.grid(True)
            plt.tight_layout()
            plt.show()

# Użycie funkcji z plikiem CSV
file_path = 'path_to_your_file.csv'
date_column = 'data'
start_individual_month = 5

results = count_unique_values_by_month(file_path, date_column, start_individual_month)

# Wyświetlenie wyników i tworzenie wykresów
plot_unique_counts(results, start_individual_month)