In [27]:
import torch
import csv
import pandas as pd
from collections import Counter

In [28]:
train_dataset_path = "train_dataset.csv"
test_dataset_path = "test_dataset.csv"
train_dataset_ERRORS_path = "train_dataset_ERRORS.csv"
test_dataset_ERRORS_path = "test_dataset_ERRORS.csv"

In [29]:
def count_errors(file_path, awgn_row_name):
    
    data = pd.read_csv(file_path)
    # print(data.head(3))
    
    if awgn_row_name not in data.columns or 'codeword' not in data.columns:
        raise ValueError(f"Kolumny {awgn_row_name} lub 'codeword' nie zostały znalezione w danych.")

    # Inicjalizacja listy do przechowywania liczby błędów oraz licznika dla rozkładu liczby błędów
    error_counts = []
    error_distribution = Counter()
    max_errors = 0
    
    # Przetwarzanie wszystkich wierszy w pliku
    for index, row in data.iterrows():
        # Odczytaj wektor z kolumny 'awgn_sign_codeword_0'
        awgn_vector = row[awgn_row_name]
        
        # Konwersja ciągu znaków na listę wartości liczbowych
        if isinstance(awgn_vector, str):
            awgn_vector = list(map(float, awgn_vector.strip('[]').split(',')))
    
        # Przekształć wektor według podanych reguł
        transformed_vector = [0 if elem >= 0 else 1 for elem in awgn_vector]
        
        # Odczytaj oryginalny wektor z kolumny 'codeword'
        original_vector = row['codeword']
        if isinstance(original_vector, str):
            original_vector = list(map(float, original_vector.strip('[]').split(',')))
    
        # Policz błędy
        error_count = sum(1 for t, o in zip(transformed_vector, original_vector) if t != o)
        error_counts.append(error_count)
    
        # Zaktualizuj maksymalną liczbę błędów
        max_errors = max(max_errors, error_count)
    
        # Zaktualizuj licznik liczby błędów
        error_distribution[error_count] += 1
    
    # Dodaj wyniki do DataFrame dla całego pliku
    data['error_counts'] = error_counts
    
    print(f'PLIK: {file_path}')
    # Wyświetl maksymalną liczbę błędów w całym pliku
    print(f"Maksymalna liczba błędów dla wiersza: {max_errors}")
    
    # Wyświetl rozkład liczby błędów w całym pliku
    print("\nRozkład liczby błędów w pliku:")
    for error_count, occurrences in sorted(error_distribution.items()):
        print(f"Liczba błędów = {error_count}: wystąpiło {occurrences} razy")

In [30]:
count_errors(train_dataset_path, "awgn_sign_codeword_0")

PLIK: train_dataset.csv
Maksymalna liczba błędów dla wiersza: 9

Rozkład liczby błędów w pliku:
Liczba błędów = 0: wystąpiło 29312 razy
Liczba błędów = 1: wystąpiło 37730 razy
Liczba błędów = 2: wystąpiło 22132 razy
Liczba błędów = 3: wystąpiło 8350 razy
Liczba błędów = 4: wystąpiło 2131 razy
Liczba błędów = 5: wystąpiło 395 razy
Liczba błędów = 6: wystąpiło 43 razy
Liczba błędów = 7: wystąpiło 2 razy
Liczba błędów = 9: wystąpiło 1 razy


In [31]:
count_errors(test_dataset_path, "awgn_sign_codeword_0-7")

PLIK: test_dataset.csv
Maksymalna liczba błędów dla wiersza: 7

Rozkład liczby błędów w pliku:
Liczba błędów = 0: wystąpiło 710228 razy
Liczba błędów = 1: wystąpiło 201535 razy
Liczba błędów = 2: wystąpiło 66391 razy
Liczba błędów = 3: wystąpiło 17729 razy
Liczba błędów = 4: wystąpiło 3916 razy
Liczba błędów = 5: wystąpiło 566 razy
Liczba błędów = 6: wystąpiło 78 razy
Liczba błędów = 7: wystąpiło 5 razy


In [32]:
count_errors(train_dataset_ERRORS_path, "awgn_sign_codeword_0")

PLIK: train_dataset_ERRORS.csv
Maksymalna liczba błędów dla wiersza: 9

Rozkład liczby błędów w pliku:
Liczba błędów = 1: wystąpiło 37730 razy
Liczba błędów = 2: wystąpiło 22132 razy
Liczba błędów = 3: wystąpiło 8350 razy
Liczba błędów = 4: wystąpiło 2131 razy
Liczba błędów = 5: wystąpiło 395 razy
Liczba błędów = 6: wystąpiło 43 razy
Liczba błędów = 7: wystąpiło 2 razy
Liczba błędów = 9: wystąpiło 1 razy


In [33]:
count_errors(test_dataset_ERRORS_path, "awgn_sign_codeword_0-7")

PLIK: test_dataset_ERRORS.csv
Maksymalna liczba błędów dla wiersza: 7

Rozkład liczby błędów w pliku:
Liczba błędów = 1: wystąpiło 201535 razy
Liczba błędów = 2: wystąpiło 66391 razy
Liczba błędów = 3: wystąpiło 17729 razy
Liczba błędów = 4: wystąpiło 3916 razy
Liczba błędów = 5: wystąpiło 566 razy
Liczba błędów = 6: wystąpiło 78 razy
Liczba błędów = 7: wystąpiło 5 razy
