# MedAId 
## Paczka umożliwiająca przewidywanie Stanu Pacjentów za Pomocą Narzędzi Klasyfikacyjnych 
#### Autorzy: Zofia Kamińska, Mateusz Deptuch, Karolina Dunal
### Specyfikacja Narzędzia
Nasze narzędzie jest stworzone z myślą o lekarzach, aby wspomóc ich w procesie podejmowania decyzji medycznych. Głównym celem jest analiza tabelarycznych danych pacjentów, takich jak wiek, waga, poziom cholesterolu, itp., w celu przewidywania:
- Czy pacjent ma daną chorobę (klasyfikacja binarna).
- Poziomu zaawansowania choroby (klasyfikacja wieloklasowa).
- Ryzyka zgonu pacjenta (klasyfikacja binarna).

### Kluczowe Funkcjonalności
- Obsługa zarówno klasyfikacji binarnej, jak i wieloklasowej.
- Zautomatyzowane przetwarzanie danych: oczyszczanie, analiza wstępna i przygotowanie cech.
- Interpretacja wyników modeli za pomocą narzędzi takich jak SHAP.
- Porównanie wyników różnych modeli ML z różnymi metrykami (np. dokładność, ROC-AUC, czułość, specyficzność).

### Grupa Docelowa
Grupą docelową są lekarze i personel medyczny. Narzędzie jest przeznaczone dla użytkowników, którzy:
- Chcą wykorzystać dane pacjentów w celu lepszego podejmowania decyzji medycznych.
- Nie posiadają zaawansowanej wiedzy z zakresu programowania czy uczenia maszynowego.
- Potrzebują intuicyjnych wizualizacji i interpretacji wyników modeli.



# Przegląd Istniejących Rozwiązań
Poniżej przedstawiono istniejące narzędzia o podobnej funkcjonalności:

### 1. Pharm-AutoML
- **Opis**: Narzędzie skoncentrowane na analizie danych biomedycznych z użyciem AutoML. Umożliwia analizę genomu, farmakogenomiki i danych biomarkerów.
- **Zalety**: Specjalizacja w biomedycynie, zintegrowane modele biomarkerowe.
- **Ograniczenia**: Ograniczona aplikacja do tabelarycznych danych klinicznych.

### 2. Cardea (MIT)
- **Opis**: Platforma uczenia maszynowego skupiona na przewidywaniu wyników pacjentów na podstawie danych klinicznych, takich jak elektroniczne kartoteki zdrowotne (EHR).
- **Zalety**: Doskonała integracja z EHR, zastosowanie zaawansowanych modeli.
- **Ograniczenia**: Skupienie na EHR może utrudnić zastosowanie w prostych danych tabelarycznych.

### 3. MLJAR
- **Opis**: Narzędzie AutoML obsługujące dane tabelaryczne w wielu dziedzinach, w tym medycynie.
- **Zalety**: Uniwersalność, przyjazne raporty, intuicyjne w obsłudze.
- **Ograniczenia**: Brak medycznej specjalizacji, co może wpłynąć na interpretowalność w kontekście klinicznym.

### Porównanie z Naszym Narzędziem
Nasze narzędzie jest unikalne dzięki specjalizacji w medycynie. W przeciwieństwie do MLJAR, nasze wyniki są dostosowane do potrzeb lekarzy. Różnimy się też od Cardea i Pharm-AutoML, które mają węższy zakres zastosowań.


## Architektura Narzędzia
### Struktura folderów:
- `data/` - dane wejściowe
- `medaid/` - kod źródłowy narzędzia
- `tests/` - testy jednostkowe

## Przepływ Przetwarzania Danych:
### Paczka MedAId składa się z trzech głównych komponentów:
1. **Przetwarzanie Danych** (`preprocessing)/`: Wczytywanie danych, oczyszczanie, kodowanie zmiennych kategorycznych, podział na zbiór treningowy i testowy. **(można bardzije szczegółowo opisać)**
2. **Modelowanie**(`training/`): Tworzenie modeli klasyfikacyjnych, trenowanie, ocena i porównanie modeli, zapisanie modeli do pliku. **(można bardzije szczegółowo opisać)**
3. **Interpretacja Wyników**(`reporting/`): Tworzenie wizualizacji wyników modeli, generowanie raportu, analiza SHAP, porównanie metryk. **(można bardzije szczegółowo opisać)**

## Opis obiektu klasy medaid
#### Atrybuty: **do uzupełnienia**
#### Metody: **do uzupełnienia**

### Przykładowe Użycie - do uzupełnienia
