**Sekcja 1: Importowanie bibliotek**

W tej sekcji importowane są różne biblioteki, takie jak pandas, sklearn, PyQt5, numpy i sys, które będą używane w dalszej części kodu.

* **pandas** - Biblioteka służąca do manipulacji i analizy danych, umożliwiająca operacje na ramkach danych.

* **sklearn.model_selection.train_test_split** - Funkcja do podziału zbioru danych na zestawy treningowy i testowy.

* **sklearn.ensemble.RandomForestClassifier** -  Klasa implementująca algorytm lasów losowych do klasyfikacji.

* **sklearn.preprocessing.OrdinalEncoder**, **LabelEncoder** - Klasa do kodowania zmiennych kategorycznych w formie liczbowej.

* **sklearn.metrics.classification_report**, **confusion_matrix** - Funkcje do generowania raportu klasyfikacji oraz macierzy pomyłek dla modelu klasyfikacji.

* **PyQt5** - Biblioteka do tworzenia interfejsów graficznych w języku Python.

* **numpy** - Biblioteka do operacji na macierzach i wektorach.

* **sys** - Biblioteka umożliwiająca dostęp do funkcji specyficznych dla interpretera Pythona.


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import OrdinalEncoder, LabelEncoder
from sklearn.metrics import classification_report, confusion_matrix

from PyQt5.QtWidgets import QComboBox, QMainWindow, QApplication, QWidget, QVBoxLayout, QLineEdit, QPushButton, QDialog, QLabel, QMessageBox, QFileDialog, QLabel, QMessageBox
from PyQt5.QtGui import QIcon, QIntValidator, QRegExpValidator, QDoubleValidator
from PyQt5.QtCore import QRegExp, pyqtSlot

import numpy as np
import sys


**Sekcja 2: Definicja klasy MultiColumnLabelEncoder oraz jej metod**


Klasa **MultiColumnLabelEncoder** jest zaprojektowana do obsługi kodowania wielu kolumn w ramce danych przy użyciu obiektów LabelEncoder. Jest to przydatne, gdy chcemy przekształcić dane kategoryczne na dane numeryczne.

Definicja klasy i jej konstruktor:

In [None]:
class MultiColumnLabelEncoder:
    def __init__(self, columns):
        self.columns = columns  # array of column names to encode
        # ['Gender', 'Married', 'Dependents', 'Education', 'Self_Employed', 'Property_Area']
        self.gender_enc = LabelEncoder()
        self.married_enc = LabelEncoder()
        self.dependents_enc = LabelEncoder()
        self.education_enc = LabelEncoder()
        self.self_employed_enc = LabelEncoder()
        self.property_enc = LabelEncoder()
        self.name_map = {'Gender': self.gender_enc, 'Married': self.married_enc, 'Dependents': self.dependents_enc,
                         'Education': self.education_enc, 'Self_Employed': self.self_employed_enc, 'Property_Area': self.property_enc}


* **columns** -  Lista nazw kolumn, które zostaną zakodowane.
* Dla każdej kolumny tworzony jest osobny obiekt LabelEncoder.
* **name_map** -  Słownik łączący nazwy kolumn z odpowiadającymi im obiektami LabelEncoder.

**Metoda fit:**

In [None]:
    def fit(self, X):
        if self.columns is not None:
            for col in self.columns:
                self.name_map[col].fit(X[col])

* Metoda dopasowuje obiekty LabelEncoder do danych w każdej z kolumn.

**Metoda transform:**

In [None]:
    def transform(self, X):
        output = X.copy()
        if self.columns is not None:
            for col in self.columns:
                output[col] = self.name_map[col].transform(output[col])
        return output

* Metoda przekształca dane w kolumnach, używając wcześniej dopasowanych obiektów LabelEncoder.

**Metoda fit_transform:**

In [None]:
    def fit_transform(self, X):
        self.fit(X)
        return self.transform(X)

* Metoda wykonuje jednoczesne dopasowanie i transformację danych.

**Sekcja 3: Wczytywanie i przetwarzanie danych:**

In [None]:
df = pd.read_csv("loan-train.csv")
df = df.drop(columns=["Loan_ID"])
df = df[df[['Gender', 'Married', 'Dependents', 'Self_Employed',
        'LoanAmount', 'Loan_Amount_Term', 'Credit_History']].notnull().all(1)]

* **pd.read_csv("loan-train.csv")**: Wczytuje dane z pliku CSV do ramki danych df.

* **df.drop(columns=["Loan_ID"])**: Usuwa kolumnę "Loan_ID" ze zbioru danych.

* **df[['Gender', 'Married', ...]].notnull().all(1)**: Tworzy maskę, która zwraca True tylko dla wierszy, które nie zawierają brakujących wartości w określonych kolumnach.

* **df[df[...].notnull().all(1)]**: Wybiera wiersze, które spełniają warunek braku brakujących wartości.

**Przetwarzanie danych przy użyciu MultiColumnLabelEncoder**

In [None]:
X = df[df.columns[:-1]]
enc = MultiColumnLabelEncoder(columns=[
                              'Gender', 'Married', 'Dependents', 'Education', 'Self_Employed', 'Property_Area'])
X = enc.fit_transform(X)
y = df[df.columns[-1]]

* **df[df.columns[:-1]]** - Wybiera wszystkie kolumny oprócz ostatniej jako cechy (X).
* **df[df.columns[-1]]** - Wybiera ostatnią kolumnę jako etykietę (y).
* **MultiColumnLabelEncoder(columns=[...])** - Utworzenie instancji klasy **MultiColumnLabelEncoder** z określonymi kolumnami do zakodowania.
* **enc.fit_transform(X)**: Dopasowanie i transformacja danych za pomocą klasy MultiColumnLabelEncoder.

In [None]:
Podział danych na zestawy treningowy i testowy, uczenie modelu i ewaluacja

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

classifier = RandomForestClassifier()
classifier.fit(X_train, y_train)
y_pred = classifier.predict(X_test)

print(classification_report(y_test, y_pred))
cm = confusion_matrix(y_test, y_pred)
print(f"Confusion matrix: {cm}")
print(f"Cross validation: {classifier.score(X_test, y_test)}")

* **train_test_split(X, y, test_size=0.2)** - Dzieli dane na zestawy treningowy i testowy.

* **RandomForestClassifier()** - Utworzenie instancji klasyfikatora lasu losowego.

* **classifier.fit(X_train, y_train)** - Trening modelu na danych treningowych.

* **classifier.predict(X_test)** - Predykcje na danych testowych.

* **classification_report(y_test, y_pred)** - Generuje raport klasyfikacyjny dla modelu.

* **confusion_matrix(y_test, y_pred)** - Tworzy macierz pomyłek dla modelu.

* **classifier.score(X_test, y_test)** - Oblicza dokładność modelu na danych testowych.

**Sekcja 4: Główne okno aplikacji**

Klasa MainWindow

Klasa MainWindow definiuje główne okno aplikacji. Tworzy interfejs użytkownika za pomocą biblioteki PyQt5, który umożliwia użytkownikowi wprowadzanie danych i wykonanie pewnych akcji. Klasa MainWindow definiuje kompletny interfejs użytkownika, umożliwiający wprowadzanie danych, obliczenia oraz eksport danych do pliku CSV. Każdy element interfejsu jest odpowiednio skonfigurowany, a funkcje obsługi zdarzeń są podpięte do przycisków, aby uruchamiać określone akcje.

In [None]:
class MainWindow(QMainWindow):

    def __init__(self):
        super().__init__()

        lbl_gender = QLabel('Gender')
        lbl_married = QLabel('Married')
        lbl_dependents = QLabel('Dependents')
        lbl_education = QLabel('Education')
        lbl_self_employed = QLabel('Self employed')
        lbl_applicant_income = QLabel('Applicant income')
        lbl_coapplicant_income = QLabel('Coapplicant income')
        lbl_loan_amount = QLabel('Loan amount')
        lbl_loan_term = QLabel('Loan amount term')
        lbl_credit_history = QLabel('Credit history')
        lbl_area = QLabel('Property area')


        self.cb_gender = QComboBox()
        self.cb_gender.addItems(['Male', 'Female'])

        self.cb_married = QComboBox()
        self.cb_married.addItems(['Yes', 'No'])

        self.cb_dependents = QComboBox()
        self.cb_dependents.addItems(['0', '1', '2', '3+'])

        self.cb_education = QComboBox()
        self.cb_education.addItems(['Graduate', 'Not Graduate'])

        self.cb_self_employed = QComboBox()
        self.cb_self_employed.addItems(['Yes', 'No'])

        self.le_applicant_income = QLineEdit()
        self.le_applicant_income.setValidator(QIntValidator())
        self.le_applicant_income.setPlaceholderText("4583")

        self.le_coapplicant_income = QLineEdit()
        self.le_coapplicant_income.setValidator(QDoubleValidator())
        self.le_coapplicant_income.setPlaceholderText("1508.0")

        self.le_loan_amount = QLineEdit()
        self.le_loan_amount.setValidator(QDoubleValidator())
        self.le_loan_amount.setPlaceholderText("128.0")

        self.exp_loan_term = QRegExp(
            "^(360.|120.|180.|60.|300.|480.|240.|36.|84.)$")
        self.le_loan_term = QLineEdit()
        self.le_loan_term.setValidator(QRegExpValidator(self.exp_loan_term))
        self.le_loan_term.setPlaceholderText("360.")

        self.exp_credit_history = QRegExp("^(1.|0.)$")
        self.le_credit_history = QLineEdit()
        self.le_credit_history.setValidator(
            QRegExpValidator(self.exp_credit_history))
        self.le_credit_history.setPlaceholderText("1.")

        self.cb_area = QComboBox()
        self.cb_area.addItems(['Rural', 'Urban', 'Semiurban'])

        btn_calculate = QPushButton('Calculate')
        btn_calculate.clicked.connect(self.on_click)

        btn_export_to_csv = QPushButton('Export CSV')
        btn_export_to_csv.clicked.connect(self.export_csv)


        layout = QVBoxLayout()
        layout.addWidget(lbl_gender)
        layout.addWidget(self.cb_gender)
        layout.addWidget(lbl_married)
        layout.addWidget(self.cb_married)
        layout.addWidget(lbl_dependents)
        layout.addWidget(self.cb_dependents)
        layout.addWidget(lbl_education)
        layout.addWidget(self.cb_education)
        layout.addWidget(lbl_self_employed)
        layout.addWidget(self.cb_self_employed)
        layout.addWidget(lbl_applicant_income)
        layout.addWidget(self.le_applicant_income)
        layout.addWidget(lbl_coapplicant_income)
        layout.addWidget(self.le_coapplicant_income)
        layout.addWidget(lbl_loan_amount)
        layout.addWidget(self.le_loan_amount)
        layout.addWidget(lbl_loan_term)
        layout.addWidget(self.le_loan_term)
        layout.addWidget(lbl_credit_history)
        layout.addWidget(self.le_credit_history)
        layout.addWidget(lbl_area)
        layout.addWidget(self.cb_area)
        layout.addWidget(btn_calculate)
        layout.addWidget(btn_export_to_csv)

        container = QWidget()
        container.setLayout(layout)

        self.setCentralWidget(container)

* **QLabel** - Tworzy etykiety dla pól wejściowych.
* **QComboBox** - Tworzy rozwijalne listy (combobox) dla pól wejściowych.
* **QLineEdit** - Tworzy pola wejściowe, z odpowiednimi walidatorami dla wartości liczbowych.
* **QPushButton** - Tworzy przyciski, a następnie łączy je z odpowiednimi funkcjami obsługi zdarzeń (slotami).

**Układ interfejsu:**

* **QVBoxLayout** - Tworzy pionowy układ, w którym umieszczane są wszystkie elementy interfejsu.
* **QWidget** - Tworzy kontener, w którym umieszczony jest układ pionowy.

**Funkcje obsługi zdarzeń:**

* **on_click** - Funkcja obsługująca zdarzenie kliknięcia przycisku "Calculate".
* **export_csv** -  Funkcja obsługująca zdarzenie kliknięcia przycisku "Export CSV".

**Funkcja obsługi zdarzeń on_click**

Metoda on_click została oznaczona dekoratorem @pyqtSlot(), co wskazuje, że jest to funkcja obsługująca zdarzenia, która może być wywoływana w odpowiedzi na interakcję użytkownika.

In [None]:
@pyqtSlot()
    def on_click(self):
        if not self.exp_loan_term.exactMatch(self.le_loan_term.text()) or not self.exp_credit_history.exactMatch(self.le_credit_history.text()):
            print("Value does not match the regex!")
            return

* **self.exp_loan_term.exactMatch(self.le_loan_term.text())** - Sprawdza, czy wartość w polu le_loan_term pasuje do określonego wyrażenia regularnego dla okresu kredytu.
* **self.exp_credit_history.exactMatch(self.le_credit_history.text())** - Sprawdza, czy wartość w polu le_credit_history pasuje do określonego wyrażenia regularnego dla historii kredytowej.
Jeśli któreś z pól nie pasuje do wyrażenia regularnego, zostanie wypisane ostrzeżenie.

**Sekcja 5: Tworzenie i Przekształcanie Ramki Danych**

In [None]:
        frame = pd.DataFrame.from_dict({
            # str
            "Gender":                  [str(self.cb_gender.currentText())],
            'Married':                  [str(self.cb_married.currentText())],
            'Dependents':               [str(self.cb_dependents.currentText())],
            'Education':      [str(self.cb_education.currentText())],
            'Self_Employed':        [str(self.cb_self_employed.currentText())],
            # numpy.int64
            'ApplicantIncome':      np.fromstring(self.le_applicant_income.text(), dtype=np.int64, sep=' '),
            # numpy.float64
            'CoapplicantIncome':    np.fromstring(self.le_coapplicant_income.text(), dtype=np.float64, sep=' '),
            # numpy.float64
            'LoanAmount':     np.fromstring(self.le_coapplicant_income.text(), dtype=np.float64, sep=' '),
            # numpy.float64
            'Loan_Amount_Term':  np.fromstring(self.le_loan_amount.text(), dtype=np.float64, sep=' '),
            # numpy.float64
            'Credit_History':    np.fromstring(self.le_credit_history.text(), dtype=np.float64, sep=' '),
            'Property_Area': [str(self.cb_area.currentText())]
        })
        transformed_frame = enc.transform(frame)
        predicted_value = classifier.predict(transformed_frame)
        msg_box = QMessageBox(self)
        if predicted_value[0] == 'Y':
            msg_box.setText("Approved the loan application!")
        else:
            msg_box.setText("Rejected the loan application!")
        msg_box.exec()

* **pd.DataFrame.from_dict(...)** - Tworzy ramkę danych na podstawie słownika, w którym klucze to nazwy kolumn, a wartości to listy danych.

* Wartości w kolumnach są pobierane z różnych pól interfejsu użytkownika, takich jak rozwijalne listy, pola tekstowe itp.

* **np.fromstring(...)** - Konwertuje tekst wprowadzony przez użytkownika na odpowiednie typy danych NumPy (np.int64, np.float64) za pomocą funkcji fromstring.

* Utworzona ramka danych frame zostaje przekształcona przy użyciu wcześniej utworzonej klasy **MultiColumnLabelEncoder (enc.transform)**.

* Model **RandomForestClassifier (classifier)** jest używany do przewidzenia wartości na podstawie przekształconej ramki danych.

* Wynik predykcji jest wyświetlany za pomocą okna komunikatu **(QMessageBox)**. Jeśli wartość to 'Y', informuje o zatwierdzeniu wniosku o pożyczkę; w przeciwnym razie odrzuca go.

**Sekcja 6: Funkcja Eksportu do Pliku CSV**


In [None]:
    def export_csv(self):
        options = QFileDialog.Options()
        options |= QFileDialog.DontUseNativeDialog
        fileName, _ = QFileDialog.getSaveFileName(self, "Export CSV", "", "CSV Files (*.csv);;All Files (*)", options=options)

        if fileName:
            frame = pd.DataFrame.from_dict({
                # str
                "Gender": [str(self.cb_gender.currentText())],
                'Married': [str(self.cb_married.currentText())],
                'Dependents': [str(self.cb_dependents.currentText())],
                'Education': [str(self.cb_education.currentText())],
                'Self_Employed': [str(self.cb_self_employed.currentText())],
                # numpy.int64
                'ApplicantIncome': np.fromstring(self.le_applicant_income.text(), dtype=np.int64, sep=' '),
                # numpy.float64
                'CoapplicantIncome': np.fromstring(self.le_coapplicant_income.text(), dtype=np.float64, sep=' '),
                # numpy.float64
                'LoanAmount': np.fromstring(self.le_coapplicant_income.text(), dtype=np.float64, sep=' '),
                # numpy.float64
                'Loan_Amount_Term': np.fromstring(self.le_loan_amount.text(), dtype=np.float64, sep=' '),
                # numpy.float64
                'Credit_History': np.fromstring(self.le_credit_history.text(), dtype=np.float64, sep=' '),
                'Property_Area': [str(self.cb_area.currentText())]
            })
            transformed_frame = enc.transform(frame)
            predicted_value = classifier.predict(transformed_frame)
            frame['Loan_Status'] = predicted_value[0]
            frame['Probability'] = classifier.predict_proba(transformed_frame)[:, 1]

            frame.to_csv(fileName, index=False)
            QMessageBox.information(self, "Export CSV", "Data exported successfully!")

* **QFileDialog.getSaveFileName** - Otwiera okno dialogowe, które pozwala użytkownikowi wybrać lokalizację i nazwę pliku do zapisu.

* **pd.DataFrame.from_dict(...)** - Tworzy ramkę danych na podstawie słownika, który zawiera dane z pól interfejsu użytkownika.

* **enc.transform** - Przekształca ramkę danych przy użyciu wcześniej utworzonej klasy **MultiColumnLabelEncoder**.

* **classifier.predict** - Przewiduje wartość na podstawie przekształconej ramki danych przy użyciu modelu **RandomForestClassifier**.

* Dodawanie dwóch nowych kolumn **(Loan_Status i Probability)** do ramki danych.

* **frame.to_csv** - Zapisuje ramkę danych do pliku CSV na podanej ścieżce.

* **QMessageBox.information** - Wyświetla informację o pomyślnym eksporcie danych.

**Sekcja 7: Końcowa Część Kodu Aplikacji**

In [None]:
# Inicjalizacja obiektu aplikacji PyQt
app = QApplication(sys.argv)

# Utworzenie instancji głównego okna aplikacji
w = MainWindow()

# Wyświetlenie głównego okna
w.show()

# Uruchomienie pętli głównej aplikacji
app.exec_()

* **QApplication(sys.argv)** - Inicjalizuje obiekt aplikacji PyQt, umożliwiając obsługę interfejsu graficznego.
* **MainWindow()** - Tworzy instancję głównego okna aplikacji (w), które zostało wcześniej zdefiniowane w klasie MainWindow.
* **w.show()** - Wyświetla główne okno aplikacji.
* **app.exec_()** - Uruchamia pętlę główną aplikacji, umożliwiając interakcję z użytkownikiem. Funkcja ta zwraca kod zakończenia aplikacji po zamknięciu głównego okna.