## Serializacja i deserializacja

Serializacja i deserializacja danych to ważne zagadnienie w Pythonie, szczególnie w kontekście pracy z danymi, API czy przechowywania danych w różnych formatach. W materiałach dotyczących tego tematu można omówić kilka kluczowych bibliotek, takich jak:

### 1. **`pickle`**
   - **Zastosowanie:** Serializacja i deserializacja obiektów Pythona do i z formatu binarnego.
   - **Zalety:**
     - Wbudowana w standardową bibliotekę Pythona.
     - Obsługuje szeroki zakres obiektów Pythona.
   - **Wady:**
     - Nie jest bezpieczna dla niezaufanych danych (możliwość wykonania złośliwego kodu).
   - **Przykład:**
     ```python
     import pickle
     
     data = {"key": "value", "number": 42}
     serialized = pickle.dumps(data)
     deserialized = pickle.loads(serialized)
     ```

### 2. **`json`**
   - **Zastosowanie:** Serializacja do formatu JSON (czytelnego dla ludzi) i deserializacja z JSON.
   - **Zalety:**
     - Wbudowana w standardową bibliotekę Pythona.
     - Doskonała do pracy z API i formatem tekstowym.
   - **Wady:**
     - Ograniczona obsługa niestandardowych typów danych (tylko podstawowe typy).
   - **Przykład:**
     ```python
     import json
     
     data = {"key": "value", "number": 42}
     serialized = json.dumps(data)
     deserialized = json.loads(serialized)
     ```

### 3. **`yaml`** (zewnętrzna biblioteka `PyYAML`)
   - **Zastosowanie:** Praca z formatem YAML, często używanym do konfiguracji.
   - **Zalety:**
     - Czytelność dla ludzi.
     - Obsługa bardziej złożonych struktur danych niż JSON.
   - **Wady:**
     - Nie jest częścią standardowej biblioteki.
   - **Przykład:**
     ```python
     import yaml
     
     data = {"key": "value", "number": 42}
     serialized = yaml.dump(data)
     deserialized = yaml.safe_load(serialized)
     ```

### 4. **`marshmallow`**
   - **Zastosowanie:** Serializacja i deserializacja z walidacją danych.
   - **Zalety:**
     - Obsługa niestandardowych schematów.
     - Walidacja danych podczas serializacji/deserializacji.
   - **Wady:**
     - Wymaga definiowania schematów.
   - **Przykład:**
     ```python
     from marshmallow import Schema, fields
     
     class DataSchema(Schema):
         key = fields.Str(required=True)
         number = fields.Int(required=True)
     
     schema = DataSchema()
     data = {"key": "value", "number": 42}
     serialized = schema.dumps(data)
     deserialized = schema.loads(serialized)
     ```

### 5. **`MessagePack`**
   - **Zastosowanie:** Binarny format serializacji, bardziej efektywny niż JSON.
   - **Zalety:**
     - Szybkość i wydajność.
     - Obsługa bardziej skomplikowanych struktur.
   - **Wady:**
     - Potrzebna zewnętrzna biblioteka (`msgpack`).
   - **Przykład:**
     ```python
     import msgpack
     
     data = {"key": "value", "number": 42}
     serialized = msgpack.packb(data)
     deserialized = msgpack.unpackb(serialized)
     ```

### 6. **`protobuf` (Google Protocol Buffers)**
   - **Zastosowanie:** Serializacja danych w formacie binarnym, używana w systemach rozproszonych.
   - **Zalety:**
     - Wysoka wydajność.
     - Obsługa różnych języków programowania.
   - **Wady:**
     - Wymaga definiowania schematów w plikach `.proto`.
   - **Przykład:** Wymaga dodatkowego przygotowania pliku `.proto` i generowania kodu.

### 7. **`dill`**
   - **Zastosowanie:** Rozszerzona wersja `pickle`, obsługuje więcej typów obiektów (np. funkcje).
   - **Zalety:**
     - Możliwość serializacji funkcji i innych nietypowych obiektów.
   - **Wady:**
     - Jak `pickle`, nie jest bezpieczna dla niezaufanych danych.
   - **Przykład:**
     ```python
     import dill
     
     def example_function(x):
         return x + 1
     
     serialized = dill.dumps(example_function)
     deserialized = dill.loads(serialized)
     ```

### 8. **`avro`**
   - **Zastosowanie:** Format binarny używany w aplikacjach big data.
   - **Zalety:**
     - Wsparcie dla dużych ilości danych i integracja z systemami big data, np. Apache Hadoop.
   - **Wady:**
     - Potrzebna zewnętrzna biblioteka i znajomość schematów.

Jeśli przygotowujesz materiały na szkolenie, dobrym pomysłem jest omówienie podstawowych narzędzi (`pickle`, `json`) i przedstawienie bardziej zaawansowanych rozwiązań, takich jak `marshmallow`, `protobuf` czy `MessagePack`, w zależności od potrzeb uczestników. Czy potrzebujesz przykładowych ćwiczeń dla uczestników szkolenia?

## Pydantic

### **Dlaczego warto używać Pydantic?**
- **Walidacja danych:** Automatycznie waliduje dane podczas deserializacji.
- **Wsparcie dla typów danych:** Obsługuje typy z `typing` (np. `List`, `Dict`, `Optional`), a także niestandardowe typy.
- **Konwersja danych:** Automatycznie konwertuje typy, np. string na datę.
- **Integracja:** Świetnie współpracuje z frameworkami, takimi jak **FastAPI**.
- **Łatwa serializacja:** Eksport danych do formatu JSON lub słownika.

---

### **Podstawowy przykład z Pydantic**

```python
from pydantic import BaseModel
from typing import List, Optional

# Definicja modelu danych
class User(BaseModel):
    id: int
    name: str
    email: Optional[str] = None
    tags: List[str] = []

# Dane wejściowe do walidacji/deserializacji
input_data = {
    "id": 123,
    "name": "Rafał",
    "tags": ["python", "data"]
}

# Walidacja i deserializacja
user = User(**input_data)
print(user)

# Serializacja do JSON
print(user.json())

# Serializacja do dict
print(user.dict())
```

**Wynik:**
```plaintext
id=123 name='Rafał' email=None tags=['python', 'data']
{"id":123,"name":"Rafał","email":null,"tags":["python","data"]}
{'id': 123, 'name': 'Rafał', 'email': None, 'tags': ['python', 'data']}
```

---

### **Zaawansowane funkcje Pydantic**

#### 1. **Walidacja i konwersja typów**
Pydantic automatycznie konwertuje typy danych, np. string na datę.

```python
from pydantic import BaseModel
from datetime import datetime

class Event(BaseModel):
    title: str
    date: datetime

event = Event(title="Python Summit", date="2024-12-15T12:00:00")
print(event)
```

---

#### 2. **Walidacja niestandardowa**
Można dodać własne walidatory dla bardziej skomplikowanych przypadków.

```python
from pydantic import BaseModel, validator

class Product(BaseModel):
    name: str
    price: float

    @validator('price')
    def validate_price(cls, value):
        if value <= 0:
            raise ValueError("Price must be greater than 0")
        return value

product = Product(name="Laptop", price=1500)
print(product)
```

---

#### 3. **Integracja z JSON i serializacja**
Pydantic wspiera serializację do JSON, w tym automatyczne konwertowanie niestandardowych typów.

```python
from pydantic import BaseModel
from datetime import datetime

class Task(BaseModel):
    title: str
    deadline: datetime

task = Task(title="Finish project", deadline=datetime.now())
print(task.json())
```

---

### **Zastosowania Pydantic**
- **API i FastAPI:** Automatyczne walidowanie i serializowanie danych w endpointach.
- **ETL:** Walidacja i czyszczenie danych podczas ich przetwarzania.
- **Konfiguracja aplikacji:** Walidacja plików konfiguracyjnych.
- **Praca z JSON i złożonymi strukturami danych:** Deserializacja wejściowych danych w formacie JSON.
