In [1]:
import os
import random
from datetime import datetime, timedelta
from openpyxl import Workbook

def generate_transaction(id_counter):
    """
    Funkcja generuje pojedynczą tranzakcję bankową z dokładnie określonymi nagłówkami kolumn.
    """
    
    txn = {}
    # Klucz 1: Mandant (Kürzel)
    txn["Mandant (Kürzel)"] = random.choice(["ABC", "XYZ", "DEF"])
    
    # Klucz 2: Indizname
    txn["Indizname"] = f"Indiz_{id_counter}"
    
    # Klucz 3: Indizdefinition/Szenario
    txn["Indizdefinition/Szenario"] = "Test scenario"
    
    # Klucz 4: Auswertungszeitraum – okres analizy, przykładowo ostatnie 30 dni
    txn["Auswertungszeitraum"] = f"{(datetime.now() - timedelta(days=30)).strftime('%Y-%m-%d')} bis {datetime.now().strftime('%Y-%m-%d')}"
    
    # Klucz 5: Orig. Transaktionsnr. – oryginalny numer tranzakcji
    txn["Orig. Transaktionsnr."] = f"TX{id_counter:06d}"
    
    # Klucz 6: Kontonr. – numer konta (przykładowo nadawcy)
    txn["Kontonr."] = str(random.randint(1000000000, 9999999999))
    
    # Klucz 7: Kundennr. – numer klienta
    txn["Kundennr."] = str(random.randint(100000, 999999))
    
    # Klucz 8: Transaktionstyp – typ tranzakcji (Credit/Debit)
    txn["Transaktionstyp"] = random.choice(["Credit", "Debit"])
    
    # Klucz 9: Habenumsatz – kwota transakcji
    haveumsatz = round(random.uniform(10, 1000), 2)
    txn["Habenumsatz"] = haveumsatz
    
    # Klucz 10: Buchungstag – data księgowania
    base_date = datetime.now() - timedelta(days=365)
    random_days = timedelta(days=random.randint(0, 365))
    buchungstag = base_date + random_days
    txn["Buchungstag"] = buchungstag.strftime("%Y-%m-%d")
    
    # Klucz 11: Umsatz in Euro – załóżmy równoważność do Habenumsatz
    txn["Umsatz in Euro"] = haveumsatz
    
    # Klucz 12: Umsatz in Originalwährung – ta sama kwota
    txn["Umsatz in Originalwährung"] = haveumsatz
    
    # Klucz 13: Währung – wybierana losowo
    currency = random.choice(["PLN", "USD", "EUR"])
    txn["Währung"] = currency
    
    # Klucz 14: Barumsatz – przykładowa kwota operacji gotówkowej
    txn["Barumsatz"] = round(random.uniform(0, 500), 2)
    
    # Klucz 15: Scheckumsatz – przykładowa kwota operacji czekowej
    txn["Scheckumsatz"] = round(random.uniform(0, 300), 2)
    
    # Klucz 16: Währungsumtausch – flaga dotycząca przewalutowania
    txn["Währungsumtausch"] = random.choice(["Yes", "No"])
    
    # Klucz 17: Wertpapierumsatz – przykładowa kwota operacji papierów wartościowych
    txn["Wertpapierumsatz"] = round(random.uniform(0, 2000), 2)
    
    # Klucz 18: Auslandsumsatz – przykładowa kwota operacji zagranicznej
    txn["Auslandsumsatz"] = round(random.uniform(0, 1500), 2)
    
    # Klucz 19: Gehaltszahlung – informacja o płatności wynagrodzenia
    txn["Gehaltszahlung"] = random.choice(["Ja", "Nein"])
    
    # Klucz 20: Verwendungszweck Z.1 – opis lub tytuł transakcji
    txn["Verwendungszweck Z.1"] = f"Test payment {id_counter}"
    
    # Klucz 21: Verwendungszweck Z.2 – dodatkowy opis
    txn["Verwendungszweck Z.2"] = "Additional info"
    
    # Klucz 22: Land Gegenpartei – kraj kontrahenta
    txn["Land Gegenpartei"] = random.choice(["DE", "PL", "US", "FR", "GB"])
    
    # Klucz 23: Name Gegenpartei – nazwa kontrahenta
    txn["Name Gegenpartei"] = random.choice(["Amazon", "eBay", "Spotify", "Netflix", "Google"])
    
    # Klucz 24: Posten – przykładowy numer pozycji
    txn["Posten"] = str(random.randint(1, 100))
    
    # Klucz 25: Wertpapierkürzel – skrót papieru wartościowego
    txn["Wertpapierkürzel"] = random.choice(["", "AAPL", "GOOG", "MSFT"])
    
    # Klucz 26: Verantwortlicher Erfasser – odpowiedzialna osoba lub system
    txn["Verantwortlicher Erfasser"] = "System"
    
    # Klucz 27: Erfassungsdatum – data rejestracji, ustawiamy dzisiejszą datę
    txn["Erfassungsdatum"] = datetime.now().strftime("%Y-%m-%d")
    
    # Klucz 28: Auftraggeber – zleceniodawca
    txn["Auftraggeber"] = "Test Originator"
    
    # Klucz 29: Begünstigter – beneficjent
    txn["Begünstigter"] = "Test Beneficiary"
    
    # Klucz 30: Konto Gegenpartei – numer konta kontrahenta
    txn["Konto Gegenpartei"] = str(random.randint(1000000000, 9999999999))
    
    # Klucz 31: BIC Gegenpartei – przykładowy kod BIC
    txn["BIC Gegenpartei"] = ''.join(random.choices("ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789", k=8))
    
    # Klucz 32: SEPA-Adresse – adres SEPA
    txn["SEPA-Adresse"] = "sepa@example.com"
    
    # Klucz 33: SEPA-Daten – dane SEPA
    txn["SEPA-Daten"] = "SEPA Info"
    
    # Klucz 34: SEPA-Datum – data operacji SEPA (przyjmujemy Buchungstag)
    txn["SEPA-Datum"] = buchungstag.strftime("%Y-%m-%d")
    
    # Klucz 35: SEPA-Typ – typ operacji SEPA
    txn["SEPA-Typ"] = random.choice(["Credit Transfer", "Direct Debit"])
    
    # Klucz 36: Sortengeschäft – rodzaj transakcji
    txn["Sortengeschäft"] = "Standard"
    
    # Klucze 37-62: Zusatzfeld 01 do Zusatzfeld 26 – dodatkowe pola (puste)
    for i in range(1, 27):
        key = f"Zusatzfeld {i:02d}"
        txn[key] = ""
    
    return txn

def write_transactions_to_excel(filename, transactions):
    """
    Funkcja zapisuje listę tranzakcji do pliku Excel na zakładce 
    'Transaktionen zum Indiztreffer' używając podanych nagłówków.
    """
    from openpyxl import Workbook

    wb = Workbook()
    ws = wb.active
    ws.title = "Transaktionen zum Indiztreffer"

    fieldnames = [
        "Mandant (Kürzel)",
        "Indizname",
        "Indizdefinition/Szenario",
        "Auswertungszeitraum",
        "Orig. Transaktionsnr.",
        "Kontonr.",
        "Kundennr.",
        "Transaktionstyp",
        "Habenumsatz",
        "Buchungstag",
        "Umsatz in Euro",
        "Umsatz in Originalwährung",
        "Währung",
        "Barumsatz",
        "Scheckumsatz",
        "Währungsumtausch",
        "Wertpapierumsatz",
        "Auslandsumsatz",
        "Gehaltszahlung",
        "Verwendungszweck Z.1",
        "Verwendungszweck Z.2",
        "Land Gegenpartei",
        "Name Gegenpartei",
        "Posten",
        "Wertpapierkürzel",
        "Verantwortlicher Erfasser",
        "Erfassungsdatum",
        "Auftraggeber",
        "Begünstigter",
        "Konto Gegenpartei",
        "BIC Gegenpartei",
        "SEPA-Adresse",
        "SEPA-Daten",
        "SEPA-Datum",
        "SEPA-Typ",
        "Sortengeschäft",
        "Zusatzfeld 01",
        "Zusatzfeld 02",
        "Zusatzfeld 03",
        "Zusatzfeld 04",
        "Zusatzfeld 05",
        "Zusatzfeld 06",
        "Zusatzfeld 07",
        "Zusatzfeld 08",
        "Zusatzfeld 09",
        "Zusatzfeld 10",
        "Zusatzfeld 11",
        "Zusatzfeld 12",
        "Zusatzfeld 13",
        "Zusatzfeld 14",
        "Zusatzfeld 15",
        "Zusatzfeld 16",
        "Zusatzfeld 17",
        "Zusatzfeld 18",
        "Zusatzfeld 19",
        "Zusatzfeld 20",
        "Zusatzfeld 21",
        "Zusatzfeld 22",
        "Zusatzfeld 23",
        "Zusatzfeld 24",
        "Zusatzfeld 25",
        "Zusatzfeld 26"
    ]

    # Zapis nagłówka
    ws.append(fieldnames)

    # Zapis danych; wiersze tworzymy w kolejności nagłówków
    for txn in transactions:
        row = [txn.get(field, "") for field in fieldnames]
        ws.append(row)

    wb.save(filename)
    
import os
import random

def create_directory(directory):
    """Tworzy katalog, jeśli nie istnieje."""
    if not os.path.exists(directory):
        os.makedirs(directory)

def generate_transactions_for_file(count, id_counter):
    """
    Generuje `count` unikalnych transakcji wykorzystując funkcję generate_transaction.
    Zwraca listę transakcji oraz zaktualizowany licznik identyfikatorów.
    """
    transactions = []
    for _ in range(count):
        transactions.append(generate_transaction(id_counter))
        id_counter += 1
    return transactions, id_counter

def inject_duplicates(transactions, file_index, transactions_by_file, transactions_per_file, duplicate_probability=0.7):
    """
    Opcjonalnie wstrzykuje duplikaty transakcji.
    
    Jeśli file_index > 1 oraz losowy warunek (prawdopodobieństwo duplicate_probability) są spełnione, 
    losowo wybiera wcześniejszy plik i zastępuje losowe pozycje w bieżącej liście transakcji kopiami z danego pliku.
    """
    if file_index > 1 and random.random() < duplicate_probability:
        source_file_index = random.randint(1, file_index - 1)
        source_transactions = transactions_by_file[source_file_index]
        max_duplicates = transactions_per_file // 2
        duplicate_count = random.randint(1, max_duplicates)
        duplicate_positions = random.sample(range(transactions_per_file), duplicate_count)
        for pos in duplicate_positions:
            transactions[pos] = random.choice(source_transactions)
    return transactions

def process_file(file_index, transactions_per_file, id_counter, transactions_by_file, directory, duplicate_probability=0.7):
    """
    Przetwarza pojedynczy plik:
      - Generuje unikalne transakcje.
      - Opcjonalnie wstrzykuje duplikaty (w oparciu o wcześniejsze pliki).
      - Miesza kolejność transakcji.
      - Zapisuje dane do pliku Excel w katalogu `directory` z nazwą wg wzorca.
    
    Zwraca zaktualizowany licznik identyfikatorów (id_counter).
    """
    # Generujemy transakcje unikalne dla bieżącego pliku
    transactions, id_counter = generate_transactions_for_file(transactions_per_file, id_counter)
    
    # Wstrzykujemy duplikaty z wcześniej wygenerowanych plików, jeśli warunki są spełnione
    transactions = inject_duplicates(transactions, file_index, transactions_by_file, transactions_per_file, duplicate_probability)
    
    # Mieszamy kolejność transakcji, aby zachować losowość
    random.shuffle(transactions)
    
    # Zapisujemy transakcje, aby można je było wykorzystać przy duplikowaniu w późniejszych plikach
    transactions_by_file[file_index] = transactions
    
    # Ustalanie nazwy pliku wg wzorca: transactions_1_<numer_pliku>.xlsx
    filename = os.path.join(directory, f"transactions_1_{file_index}.xlsx")
    write_transactions_to_excel(filename, transactions)
    
    return id_counter

def main():
    random.seed(42)  # dla powtarzalności wyników
    id_counter = 1

    # Konfiguracja: liczba plików oraz liczba transakcji na każdy plik
    num_files = 6
    transactions_per_file = 10
    directory = "Indikatoren"
    
    create_directory(directory)
    transactions_by_file = {}
    
    # Przetwarzamy kolejne pliki, używając wydzielonych funkcji
    for i in range(1, num_files + 1):
        id_counter = process_file(i, transactions_per_file, id_counter, transactions_by_file, directory)

if __name__ == "__main__":
    main()
