![alt text](../../pythonexposed-high-resolution-logo-black.jpg "Optionele titel")

# Oefening 1: Interface Ontwerpen

1. **Ontwerp een interface** genaamd `Shape` met de methoden `draw()` en `calculate_area()`.
2. **Implementeer de interface** in twee klassen: `Circle` en `Square`.

In [None]:
# Oplossing:

# Oefening 2: Abstracte Klassen en Loonsberekening

1. **Maak een abstracte klasse** genaamd `Personeelslid` met:
   - Een constructor die de naam van het personeelslid opslaat.
   - Een abstracte methode `bereken_loon()`.

2. **Implementeer de abstracte klasse** in drie subklassen:
   - **`Arbeider`**: Bereken het loon op basis van een uurloon en het aantal gewerkte uren.
   - **`Bediende`**: Bereken het loon als een vast maandsalaris.
   - **`Zelfstandige`**: Bereken het loon als 85% van een factuurbedrag.

3. **Maak een lijst** van verschillende personeelsleden, zoals:
   - Een arbeider met een uurloon van €20 en 160 gewerkte uren.
   - Een bediende met een maandsalaris van €3000.
   - Een zelfstandige met een factuurbedrag van €5000.

4. **Itereer door de lijst** en druk de naam en het loon van elk personeelslid af.

5. **Controleer** dat alle loonsberekeningen correct zijn geïmplementeerd en dat het script geen fouten geeft als je extra personeelsleden toevoegt.

# Oefening 3 - Optioneel en specifiek voor Data Science: Gebruik van Interfaces in Data Processing

## **Doel van de Oefening**
In deze oefening leer je:

1. Een abstracte klasse (interface) ontwerpen om consistente datastructuurverwerking te garanderen.
2. Verschillende implementaties bouwen (voor Excel, CSV, en JSON).
3. Polymorfisme toepassen om alle bestandstypen via een uniforme methode te verwerken.
4. Concrete toepassing van objectgeoriënteerde principes, zoals abstractie, method-overriding, en polymorfisme.

---

## **Probleemstelling**
Je werkt aan een data science-project waarin gegevens van tweedehandswagens verwerkt moeten worden. Deze gegevens komen in verschillende formaten binnen: **Excel**, **CSV**, en **JSON**. Je hebt als taak om een gestandaardiseerde data pipeline te bouwen die de gegevens uit elk formaat kan:

1. **Valideren** volgens specifieke regels.
2. **Transformeren** naar een uniform CSV-formaat.
3. **Rapporteren** over de resultaten van de verwerking.

Om dit te realiseren gebruik je een **interface** om de structuur te definiëren van de datastructuurverwerking. Elke implementatie volgt dezelfde interface, maar bevat specifieke logica voor het verwerken van een bepaald bestandsformaat.

---

## **Specificaties**

### **Interface**
Je bouwt een abstracte klasse die de volgende methoden definieert:

- **`load_data(file_path: str)`**:
  - Laadt de data vanuit een specifiek bestandsformaat.

- **`validate_data()`**:
  - Controleert de data op volledigheid en validiteit.

- **`transform_data(output_path: str)`**:
  - Transformeert de data naar een uniform CSV-formaat en slaat het bestand op.

### **Validatieregels**
1. **Merk**:
   - Het merk van de wagen moet aanwezig zijn en in lowercase staan.
   - Controleer of het merk bestaat in een lijst van bekende merken.
   - Corrigeer schrijffouten met **fuzzy matching**.

2. **Wagen Type**:
   - Het type moet overeenkomen met een referentielijst per merk.
   - Gebruik fuzzy matching om het type te corrigeren.

3. **Cilinderinhoud**:
   - De waarde moet liggen tussen **1000** en **4000 cc**.

4. **Bouwjaar**:
   - Het bouwjaar moet liggen tussen **1990** en het huidige jaar.

5. **Brandstof**:
   - Het brandstoftype moet worden omgerekend naar **dummy-variabelen** (‘benzine’, ‘diesel’, ‘lpg’, ‘elektrisch’).

6. **Kilometerstand**:
   - De kilometerstand moet liggen tussen **0** en **300000**.

### **Transformaties**
1. **String Normalisatie**:
   - Alle stringvelden moeten worden genormaliseerd naar lowercase en speciale tekens moeten worden verwijderd (zoals ‘-’ en ‘_’).

2. **Brandstof Dummy Encoding**:
   - Maak handmatig dummy-kolommen voor de verschillende brandstoftypes.

3. **ID’s voor Merken**:
   - Zet het merk om naar een unieke ID in plaats van de naam in tekst.

4. **Rapportage**:
   - Genereer een rapport (TXT-bestand) met:
     - Aantal rijen in het originele bestand.
     - Aantal correct verwerkte rijen.
     - Aantal fouten per controle.

---

## **Oplossing Structuur**

### **1. Interface Ontwerp**
Definieer een abstracte klasse `DataProcessor` als interface met de volgende methoden:

```python
from abc import ABC, abstractmethod
import pandas as pd

class DataProcessor(ABC):
    @abstractmethod
    def load_data(self, file_path: str):
        """Laad de data vanuit een bestand."""
        pass

    @abstractmethod
    def validate_data(self):
        """Valideer de data volgens specifieke regels."""
        pass

    @abstractmethod
    def transform_data(self, output_path: str):
        """Transformeer de data en sla deze op in een uniform formaat."""
        pass
```

### **2. Implementaties**
Maak drie klassen die de `DataProcessor`-interface implementeren: één voor Excel, één voor CSV, en één voor JSON.

#### **ExcelProcessor**
```python
class ExcelProcessor(DataProcessor):
    def __init__(self):
        self.data = None

    def load_data(self, file_path: str):
        """Laad een Excel-bestand."""
        self.data = pd.read_excel(file_path)

    def validate_data(self):
        """Valideer data in het Excel-bestand."""
        print("Validatie uitgevoerd voor Excel-bestand.")
        # Voeg validatieregels toe

    def transform_data(self, output_path: str):
        """Transformeer de data en sla op als CSV."""
        print("Transformatie uitgevoerd voor Excel-bestand.")
        self.data.to_csv(output_path, index=False)
```

#### **CSVProcessor**
```python
class CSVProcessor(DataProcessor):
    def __init__(self):
        self.data = None

    def load_data(self, file_path: str):
        """Laad een CSV-bestand."""
        self.data = pd.read_csv(file_path)

    def validate_data(self):
        """Valideer data in het CSV-bestand."""
        print("Validatie uitgevoerd voor CSV-bestand.")
        # Voeg validatieregels toe

    def transform_data(self, output_path: str):
        """Transformeer de data en sla op als CSV."""
        print("Transformatie uitgevoerd voor CSV-bestand.")
        self.data.to_csv(output_path, index=False)
```

#### **JSONProcessor**
```python
class JSONProcessor(DataProcessor):
    def __init__(self):
        self.data = None

    def load_data(self, file_path: str):
        """Laad een JSON-bestand."""
        self.data = pd.read_json(file_path)

    def validate_data(self):
        """Valideer data in het JSON-bestand."""
        print("Validatie uitgevoerd voor JSON-bestand.")
        # Voeg validatieregels toe

    def transform_data(self, output_path: str):
        """Transformeer de data en sla op als CSV."""
        print("Transformatie uitgevoerd voor JSON-bestand.")
        self.data.to_csv(output_path, index=False)
```

---

### **3. Polymorfisme in Actie**
Creéer een functie `process_file` die een `DataProcessor`-object gebruikt om bestanden van verschillende typen te verwerken:

```python
def process_file(processor: DataProcessor, file_path: str, output_path: str):
    """Verwerk een bestand met een gegeven processor."""
    processor.load_data(file_path)
    processor.validate_data()
    processor.transform_data(output_path)
```

### **4. Gebruik van de Implementatie**
Voorbeeldgebruik:

```python
if __name__ == "__main__":
    # Verwerk een Excel-bestand
    excel_processor = ExcelProcessor()
    process_file(excel_processor, "cars.xlsx", "processed_cars_from_excel.csv")

    # Verwerk een CSV-bestand
    csv_processor = CSVProcessor()
    process_file(csv_processor, "cars.csv", "processed_cars_from_csv.csv")

    # Verwerk een JSON-bestand
    json_processor = JSONProcessor()
    process_file(json_processor, "cars.json", "processed_cars_from_json.csv")
```


In [1]:
# Oplossing