# Python w firmie

Na dzisiejszych zajęciach omówimy kilka zagadnień i użytecznych bibliotek 

- tworzenie środowisk wirtualnych służąych do odseparowania niezależnych projektów programistycznych,
- narzędzia do zwiększania czytelności kodu (*type hinting*),
- narzędzia do tworzenia modeli danych i walidacji danych (pydantic),
- tworzenie testów do aplikacji w Pythonie (pytest).

Na końcu znajduje się krótki przegląd innych przydatnych narzędzi i zagadnień takich jak statyczna analiza typów, jakość kodu, formatowanie kodu, generowanie dokumentacji, profiler, debugger oraz przygotowywanie własnych pakietów.


## 1. Środowisko wirtualne

Środowisko wirtualne (virtual environment) w Pythonie to narzędzie, które umożliwia tworzenie izolowanych przestrzeni dla projektów Pythonowych. Każde środowisko wirtualne ma własne miejsce do przechowywania interpretera języka Python oraz zestawu bibliotek. Dzięki temu można mieć różne wersje bibliotek dla różnych projektów, co zapobiega konfliktom między zależnościami.

Oto główne cechy i korzyści środowiska wirtualnego:
- Izolacja zależności: Każdy projekt może mieć własne, niezależne od innych, zależności, co jest szczególnie przydatne, gdy różne projekty wymagają różnych wersji tej samej biblioteki.
- Ułatwienie współpracy: Środowiska wirtualne umożliwiają tworzenie plików requirements.txt, które zawierają listę wszystkich bibliotek potrzebnych do danego projektu. Dzięki temu inni programiści mogą łatwo zainstalować te same zależności i pracować nad tym samym kodem.
- Prostota zarządzania: Używając narzędzi takich jak `venv` (wbudowanego w Pythona od wersji 3.3) lub `virtualenv` (narzędzie zewnętrzne), można łatwo tworzyć i zarządzać wieloma środowiskami wirtualnymi.
- Ochrona systemu: Ponieważ środowiska wirtualne są odizolowane od głównego systemu, instalacja i testowanie różnych pakietów nie wpływa na resztę systemu.
- Elastyczność: Środowiska wirtualne pozwalają na eksperymentowanie z różnymi konfiguracjami i wersjami pakietów, co jest przydatne w procesie nauki, eksperymentowania lub rozwiązywania specyficznych problemów projektowych.

Aby utworzyć środowisko wirtualne w Pythonie, można użyć polecenia `python -m venv nazwa_srodowiska`, a następnie aktywować je za pomocą `source nazwa_srodowiska/bin/activate` na systemach Unixowych lub `nazwa_srodowiska\Scripts\activate` na Windows. Po aktywacji środowiska można instalować pakiety za pomocą `pip` (narzędzie do zarządzania pakietami), które będą dostępne tylko w tym środowisku.

In [None]:
%python -m venv myenv #tworzenie środowiska wirtualnego
%source myenv/bin/activate #aktywacja środowiska wirtualnego
#instalacja pakietów
%pip install numpy
%pip install -r requirements.txt #instalacja wymaganych pakietów
%pip install git+url_of_git_repository.git #instalacja z GitHub (ewnetualnie dodać @branch_name)
%pip install path/to/package #instalacja własnego pakietu
#deaktywacja środowiska wirtualnego
%deactivate
#usunięcie środowiska wirtualnego
%rm -rf myenv

Składnia pliku requirements.txt jest dość prosta  i istenieje kilka sposobów podania wersji pakietu:

Przydatne jest też zrzucenie wszystkich aktualnie zainstalowanych bibliotek w aktywnym środowisku do pliku requirements.txt aby je np. odtworzyć w innym miejscu.

## 2. Typing - wskazówki typu

Mimo, że Python jest dynamicznie typowanym językiem to istnieje możliwość deklarowania typu poprzez *type hinting*. Funkcjonalność ta została wprowadzona oficjalnie od wersji Pythona 3.5 poprzez wbudowany moduł `typing`. Mechanizm ten pozwalaja na pisanie bardziej precyzyjnego i bezpiecznego kodu, który jest czytelniejszy, lepiej dokumentowany i łatwiejszy w utrzymaniu.

*Uwaga*: Należy pamiętać, że *type hinting* to tylko wskazówki i nie wpływają one na wykonywanie programu. Mogą one być jednak wykorzystywane przez środowiska programistyczne (IDE), linter, narzędzia do statycznej analizy kodu (*type checker*, np. pakiet mypy), itd.

Dla standardowych typów i kolekcji możemy korzystać w wprost z wbudowanych typów Pythona (od wersji 3.9). Wtedy przykładowo:
- `int` - Reprezentuje dowolną liczbę całkowitą.
- `str` - Reprezentuje dowolny napis.
- `list[T]` - Oznacza listę, której wszystkie elementy są tego samego typu. Na przykład `list[int]` oznacza listę liczb całkowitych.
- `dict[K, V]` - Słownik, gdzie K oznacza typ klucza, a V typ wartości. Na przykład `dict[str, int]` oznacza słownik z kluczami typu `string` i wartościami typu `int`.
- `tuple[T1, T2, ...]` - Krotka, w której każdy element ma zdefiniowany typ. Na przykład `tuple[int, str, float]` oznacza krotkę składającą się z liczby całkowitej, łańcucha znaków i liczby zmiennoprzecinkowej.

In [None]:
# Standardowe typy
count: int = 1024
text: str = 'Lorem ipsum dolor sit amet'
status: bool = True
# Kolekcje
numbers: list[int] = [1, 2, 3]
ages: dict[str, int] = {"Alice": 30, "Bob": 25}
person: tuple[int, str, float] = (1, "Alice", 4.5)
# Funkcje
def add_num(a: int, b: int) -> int:
    return(a + b)

Gdy ktoś korzysta z wcześniejszych wersji Pythona (od 3.5 do 3.8) to należy skorzystać z biblioteki `typing` aby oznaczyć typ kolekcji. Wtedy dla powyższych przykładów dla kolekcji należy użyć:

In [None]:
from typing import List, Dict, Tuple

numbers: List[int] = [1, 2, 3]
ages: Dict[str, int] = {"Alice": 30, "Bob": 25}
person: Tuple[int, str, float] = (1, "Alice", 4.5)

Biblioteka `typing` udostępnia bardziej zaawansowanych wskazówek typów (https://docs.python.org/3/library/typing.html#special-types). Przykładowo:

- `Any` - Oznacza dowolny typ. 
- `Union[T1, T2, ...]` - Reprezentuje typ, który może być jednym z typów `T1`,`T2`, `...`; można też używać notacji `|`. Na przykład `Union[str, int]` oznacza typ `string` lub `int`. Równoważna reprezentacj dla tego przykładu a to `str | int`.
Special type indicating an unconstrained type.
- `Optional[T]` - Typ, który może być albo typem T albo None. Jest to przydatne w przypadku funkcji, które mogą zwracać None jako wartość. Ten sam efekt moża uzzyskać za pomocą `Union[T,None]` lub `T | None`. Porównaj też z **optional** z Programowania Obiektowego: (https://docs.oracle.com/javase/8/docs/api/java/util/Optional.html).
- `ClassVar` - Specjalna konstrukcja do reprezentowania atrubutów klasowych.

Poniżej są przykłady ich użycia:

In [None]:
from typing import Optional, ClassVar, Union

def get_age(name: str) -> Optional[int]:
    if name == "Alice":
        return 30
    else:
        return None
    
class Starship:
    stats: ClassVar[dict[str, int]] = {'count': 0} # class variable
    damage: Union[int, str] = 10                   # instance variable

# Przykład użycia
print(type(get_age("Alice")))
print(type(get_age("John")))

**Typ generyczny** (ang. *generic type*) w Pythonie to mechanizm pozwalający na pisanie kodu, który może być stosowany do różnych typów danych bez utraty informacji o tych typach. Typy generyczne pozwalają na opóźnienie w dostarczeniu specyfikacji typu danych w elementach takich jak klasy czy metody do momentu użycia ich w trakcie wykonywania programu. Innymi słowy, typy generyczne pozwalają na napisanie klasy lub metody, która może działać z każdym typem danych. Jest to przydatne w sytuacjach, gdzie chcielibyśmy uniknąć tworzenia wielu funkcji lub klas dla różnych typów danych. Przykłado, możemy spojrzeć na listę w Pythonie jak na generyczny typ danych gdyż może ona przechowywać elementy dowolnego typu.

`TypeVar` - Umożliwia tworzenie typu generycznego, który może dowolnym typem i jest określony dopiero w trakcie użycia. 

In [None]:
from typing import TypeVar

T = TypeVar('T')

def first(lst: list[T]) -> T:
    return lst[0]

print(type(first([1, 2, 3])))
print(type(first(['a', 'b', 'c'])))
print(type(first([['a', 'b'], [3]])))

`Generic[T]` - Używane do tworzenia klas generycznych. Pozwala na definiowanie klas, które mogą działać z różnymi typami.

In [None]:
from typing import Generic, TypeVar

T = TypeVar('T')

class Box(Generic[T]):
    def __init__(self, item: T):
        self.item = item

    def get(self) -> T:
        return self.item

print(type(Box[int](1024).get()))
print(type(Box[str]('foo').get()))
print(type(Box[list[int]]([1,2,3]).get()))

# Od Pythona 3.12 nie ma potrzeby definiowania TypeVars  i importowania Generic, TypeVar.
# Można po prostu to samo zapisac tak:
# class Box[T]:
#     def __init__(self, item: T):
#         self.item = item

#     def get(self) -> T:
#         return self.item

### Ćwiczenie 1: Implementacja dekoratora do buforowania typowo-świadomego
Cel: Stworzyć uniwersalny dekorator do buforowania w Pythonie, który można zastosować do dowolnej funkcji, niezależnie od jej sygnatury, i który buforuje jej wyniki na podstawie argumentów, z którymi jest wywoływana. Bufor powinien być świadomy typów, co oznacza, że powinien przechowywać różne wpisy dla argumentów różnych typów, nawet jeśli mają tę samą wartość.

Wymagania:
- Użyj typów generycznych, tak aby dekorator był jak najbardziej elastyczny.
- Zapewnij bezpieczeństwo typów, tak aby bufor nie mieszał wartości między różnymi typami.
- Zaimplementuj mechanizm ograniczający rozmiar bufora, tak aby zapobiec problemom z pamięcią.

In [None]:
# Rozwiązanie


## 3. Pydantic - tworzenie modeli danych i walidacja danych

Biblioteka pydantic w języku Python służy do obsługi i walidacji danych przy użyciu modeli danych opartych na standardowych typach.

In [None]:
# install pydantic
%pip install pydantic
# pip install pydantic==2.10

Model to klasa dziedzicząca po klasie `BaseModel` z biblioteki pydantic. Kiedy tworzysz nowy obiekt z tej klasy, pydantic gwarantuje, że pola wynikowej instancji modelu będą zgodne z typami pól zdefiniowanymi w modelu. Pydantic używa wbudowanych typów do określenia typu danych dla każdego atrybutu.

In [1]:
from pydantic import BaseModel

class User(BaseModel):
    id: int
    name: str
    age: int
    is_active: bool

user = User(id=123, name="Jan Kowalski", age=30, is_active=True)
print(str(user))
print(repr(user))
print(user.name)

id=123 name='Jan Kowalski' age=30 is_active=True
User(id=123, name='Jan Kowalski', age=30, is_active=True)
Jan Kowalski


W przypadku podania niepoprawnych danych (tu wartość rzeczywista dla wieku) pydantic zweryfikuje to i zwróci błąd. Aby uzyskać więcej szczegółów na temat błędu, zaleca się owinięcie go wewnątrz bloku try-catch.

In [2]:
from pydantic import ValidationError
# inny sposób przekazywania danych
data = {'id': 123, 'name': "Jan Kowalski", 'age': 30.3, 'is_active': True}
try:
    user = User(**data)
except ValidationError as e:
    print(e)

1 validation error for User
age
  Input should be a valid integer, got a number with a fractional part [type=int_from_float, input_value=30.3, input_type=float]
    For further information visit https://errors.pydantic.dev/2.10/v/int_from_float


A co zrobić w przypadku bardziej złożonej walidacji? Wtedy należy stworzyć własne walidatory używając dekoratora *field_validator*  dla pola modelu (atrybutu) lub *model_validator* dla wszystkich danych modelu wewnątrz dziedziczonej klasy. Przykład walidacji pola danych przy użyciu modelu, np. sprawdzanie czy wiek jest nieujemny:

In [3]:
from pydantic import field_validator

class User(BaseModel):
    id: int
    name: str
    age: int
    is_active: bool = True
    
    @field_validator('age')
    def age_must_be_positive(cls, value):
        if value < 0:
            raise ValueError('age must be positive')
        return value

# Przykład użycia
try:
    user = User(id=123, name="Jan Kowalski", age=-30, is_active=True)
except Exception as e:
    print(e)

1 validation error for User
age
  Value error, age must be positive [type=value_error, input_value=-30, input_type=int]
    For further information visit https://errors.pydantic.dev/2.10/v/value_error


W tym przypadku można było też użyć typu `NonNegativeInt` (`from pydantic import NonNegativeInt`), ale w przypadkach bardziej złożonych trzeba użyć walidatora (np. PESEL).

Pydantic zapewnia wsparcie dla:
- popularnych typów z biblioteki standardowej Pythona (np. `bool`, `int`, `float`, `str`, `list`, `tuple`, `dict`, `set`), 
- własnych typów specjalnych (np. `NonNegativeInt`, `PositiveInt`, `StrictInt`, `StrictBool`)
- oraz typów *constrained* (np. `conint(ge=0, lt=200)`, `constr(min_length=1, max_length=10)`, `conlist(float, min_items=5, max_items=10)`), które zostaną usunięte z kolejnej wersji pydantic. W zamian jest funkcja Field, która umożliwia dodawanie różnych ograniczeń i metadanych do pól modelu. Jest używana w definicjach pól w klasach dziedziczących po BaseModel. Dzięki Field można ustawić takie właściwości jak: minimalna i maksymalna długość, wartości domyślne, regex, limity liczbowe, oraz inne opcje walidacyjne. Spójrz na przykład 3.2.

Dodatkowym atutem pydantic jest **serializacja** gdyż biblioteka ta dostarcza wbudowanych metod do serializaji i deserializacji danych. 

Obiekty utworzone przy użyciu Pydantic BaseModel można serializować do słownika lub formatu JSON odpowiednio za pomocą `model_dump()` i `model_dump_json()`. Po więcej szczegółów, zobacz dokumentację [https://docs.pydantic.dev/latest/concepts/serialization/](https://docs.pydantic.dev/latest/concepts/serialization/).

In [None]:
# Serializacja do słownika
user_dict = user.model_dump()
print(user_dict)
# Serializacja do JSON
user_json = user.model_dump_json(indent=2)
print(user_json)

Następnie można dokonać deserializacji, czyli ponownego utworzenia obiektów ze słownika lub JSON za pomocą `model_validate()` i `model_validate_json()`.

In [None]:
# Deserializacja ze słownika
user_from_dict = User.model_validate(user_dict)
print(user_from_dict)
# Deserializacja z JSON
user_from_json = User.model_validate_json(user_json)
print(user_from_json)

### Przykład 1. (wartości opcjonalne i domyślne)

Model *DynamicVehicle* ma pola make, model, is_electric, battery_capacity i fuel_capacity. Pola battery_capacity i fuel_capacity są opcjonalne, ale ich wymagania są dynamicznie walidowane w zależności od wartości pola is_electric. Walidatory sprawdzają, czy odpowiednie pola są uzupełnione w zależności od tego, czy pojazd jest elektryczny, czy nie.

Dodatkowo, zachowanie pydantic można kontrolować za pomocą `BaseModel.model_config`. Tu, konfiguracja modelu zakazuje dodatkowych pól, co zwiększa ścisłość modelu, oraz ogranicza długość napisów do 20 znaków.

*Uwaga*: Walidatory nie działają kiedy używane są wartości domyślne atrybutów. Możne je do tego zmusić korzystając z `Field(validate_default=True)`. W Pydantic V1, wystarczyło użyć parametru always=True w dekoratorze @validator.

In [None]:
from pydantic import BaseModel, ConfigDict, Field, field_validator, ValidationInfo
from typing import Optional, Annotated

class DynamicVehicle(BaseModel):
    model_config = ConfigDict(extra='forbid', str_max_length=20)

    make: str
    model: str
    is_electric: bool
    battery_capacity: Annotated[Optional[int], Field(validate_default=True)] = None  # None to domyślna wartość tego pola
    fuel_capacity: Annotated[Optional[int], Field(default=None, validate_default=True)]  # Ewentualnie można użyć opcji 'default'
 
    # Walidacja pól za pomocą dekoratorów validator
    @field_validator('battery_capacity')
    def validate_battery_capacity(cls, v: int, info: ValidationInfo) -> int:
        if info.data.get('is_electric') and v is None:
            raise ValueError('Battery capacity is required for electric vehicles')
        return v

    @field_validator('fuel_capacity')
    def validate_fuel_capacity(cls, v: int, info: ValidationInfo) -> int:
        if not info.data.get('is_electric') and v is None:
            raise ValueError('Fuel capacity is required for non-electric vehicles')
        return v

# Test the model with different configurations
electric_car = DynamicVehicle(make='Tesla', model='Model S', is_electric=True, battery_capacity=100)
gas_car = DynamicVehicle(make='Ford', model='Fiesta', is_electric=False, fuel_capacity=45)

Poniższy kod powinien zwrócić błąd walidacyjny z powodu niepelnych danych i zadziałania jednego z walidatorów.

In [None]:
DynamicVehicle(make='Ford', model='Fiesta', is_electric=False)

### Przykład 2. (dziedziczenie)

W poniższym przykładzie mamy trzy klasy: Vehicle, Car i Bicycle, które dziedziczą po sobie. Klasa Vehicle ma dwa wymagane pola: make i model, które muszą być łańcuchami znaków o minimalnej długości 2 znaków, a dodatkowo pole make jest walidowane, aby zawierało tylko litery. Klasa Car dziedziczy po Vehicle i dodaje pole engine_type, które musi pasować do jednej z dozwolonych wartości: "diesel", "petrol", "electric" lub "hybrid". Klasa Bicycle również dziedziczy po Vehicle, ale dodaje pole number_of_gears, które musi być liczbą większą niż 0, co zapewnia, że rower będzie miał co najmniej jeden bieg.

*Uwaga*: W pydantic V1 były typy constrained, których można było używać do ograniczania wartości typu int, flost, str, itd. Od wersji V3 już nie będą dostępne, a teraz już nie są zalecane. Obecnie do tego celu służy `Field`. 

In [None]:
from pydantic import BaseModel, field_validator

class Vehicle(BaseModel):
    
    make: str = Field(min_length=2)  # W V1: constr(min_length=2)
    model: str = Field(min_length=2) 

    @field_validator('make')
    def check_names(cls, v):
        if not v.isalpha():
            raise ValueError('Must contain only letters')  # W V1: constr(regex='^(diesel|petrol|electric|hybrid)$')
        return v.title()

class Car(Vehicle):
    engine_type: str = Field(pattern='^(diesel|petrol|electric|hybrid)$')


class Bicycle(Vehicle):
    number_of_gears: int = Field(gt=0)  # W V1: conint(gt=0)

# Test the models
car = Car(make='Toyota', model='Corolla', engine_type='petrol')
bicycle = Bicycle(make='Giant', model='Escape', number_of_gears=21)

In [None]:
# Błąd: za krótka nazwa marki samochodu
car = Car(make='N', model='Corolla', engine_type='petrol')

## 4. Testy z pytest

W Pythonie mamy do wyboru dwie najpopularniejsze biblioteki do testowania kodu: wbudowaną bibliotekę *unittest* i
oraz bardzo popularną bibliotekę *pytest*, na której się tu skupimy. Zacznijmy od jej zainstalowania:

In [None]:
%pip install pytest

Teraz stwórz plik o nazwie *test_first.py* oraz umieść w nim następujący kod:

In [None]:
# plik test_first.py

def int_div(a, b):
    # błędnie wpisane dzielenie zmiennoprzecinkowe zamiast całkowitoliczbowego (//)
    return a / b

def test_int_div():
    assert int_div(4, 2) == 2

def test_int_div_fail():
    assert int_div(4, 3) == 1

A następnie w terminalu uruchom testy za pomocą komendy:

W wyniku powinniśmy otrzymać informację, że jeden test przeszedł pomyślnie a drugi nie, czyli tak jak oczekiwaliśmy.

Generalnie, pytest sam rozpoznaje wszystkie pliki z testami (ich nazwy muszą zaczynać się od 'test_' lub kończyć na '_test'), w których wywołuje funkcje, których nazwy zaczynają się od 'test\_'. 

Ponadto, jeżeli korzystasz z IDE możesz uruchamiać testy z jego poziomu, gdyż można go skonfigurować, tak aby korzystał z pytest. 

### Przykład 3.

W poniższym przykładzie mamy klasę Stack, która implementuje podstawowe operacje na stosie: dodawanie elementów (push), usuwanie elementów (pop), sprawdzanie, czy stos jest pusty (is_empty), podgląd elementu na wierzchu stosu (peek), oraz zwracanie rozmiaru stosu (size). Funkcja testująca test_stack sprawdza wszystkie te operacje.

Przykład ten możemy skopiować do pliku .py i przetestowac z pomocą pytest lub skorzystać jedo integracji z IDE (pycharm lub vscode). 

In [4]:
import pytest

# Definiuje klasę Stack do reprezentowania stosu
class Stack:
    # Inicjalizuje stos jako pustą listę (poniższe operacje są więc wykonywane na liście)
    def __init__(self):
        self._items: list[int] = []

    def push(self, item: int):
        self._items.append(item)

    def pop(self) -> int:
        return self._items.pop()

    def is_empty(self) -> bool:
        return len(self._items) == 0

    # Zwraca element na wierzchu stosu, ale nie usuwa go
    def peek(self) -> int:
        return self._items[-1]

    def size(self) -> int:
        return len(self._items)

# Definiuje zestaw testów dla klasy Stack
def test_stack():
    stack = Stack()
    assert stack.is_empty()
    stack.push(1)
    stack.push(2)
    stack.push(3)
    assert stack.size() == 3
    assert stack.peek() == 3
    assert stack.pop() == 3
    assert stack.pop() == 2
    assert stack.pop() == 1
    assert stack.is_empty()
    # Sprawdza wyjątek przy próbie usuwania z pustego stosu
    with pytest.raises(IndexError):
        stack.pop()

### Testy parametryzowane

Testy parametryzowane to testy, które są uruchamiane wielokrotnie z różnymi zestawami danych. W tym przypadku testy parametryzowane są używane do przetestowania różnych kombinacji danych wejściowych i oczekiwanych wyników. Co ważne, w przypadku błędnego zestawu danych proces testowy nie zostanie przerwany.

Parametryzację rozpoczyna dekorator `@pytest.mark.parametrize`, a następnie w cudzysłowie umieszczamy parametry `a, b, expected` oraz listę krotek zawierających konkretne zestawy testów. Funkcja *test_dodaj* zostanie wywołana dla każdego kolejnego zestawu testów.

In [None]:
import pytest

def dodaj(a, b):
    return a + b

@pytest.mark.parametrize("a, b, expected", [(12, 13, 25), (1, 2, 3), (1, 1, 2)])
def test_dodaj(a, b, expected):
    assert dodaj(a, b) == expected

### Fixture

Fixture to funkcja, która jest wywoływana przez pytest przed uruchomieniem każdego testu. Fixture może być używana do przygotowania zasobów dla naszych testów, które są współdzielone przez wiele testów. Fixture może również być używana do uruchamiania kodu po zakończeniu testu, np. do czyszczenia danych testowych.

Fixture możemy stworzyć przy pomocy dekoratora `@pytest.fixture`. Jej nazwę możemy później przekazać jako argument funkcji, która jest testem.

In [None]:
import pytest

@pytest.fixture
def numbers():
    return [1, 2, 3]

def test_sum_numbers(numbers):
    assert sum(numbers) == 6

def test_min_numbers(numbers):
    assert sum(numbers) == 1

### Mockowanie

Mockowanie to technika, która pozwala na tworzenie obiektów, które zachowują się jak prawdziwe obiekty, ale w rzeczywistości tylko imitują ich działanie. Mocki są bardzo przydatne w testowaniu jednostkowym (wybiórczym), ponieważ pozwalają na symulowanie zależności, które są trudne do kontrolowania. Przykładowo, jeśli chcemy przetestować działanie funkcji, która pobiera dane z jakiegoś serwera lub bardzo dużego pliku i je przetwarza, to możemy przetestować tylko fragment odpowiedzialny za przetwarzanie danych korzystając z mockowania bez konieczności wczytywania orginalnych danych.

Z modułu Mock możemy skorzystać importując go z biblioteki unittest.mock. W przykładzie poniżej, Klasa FileReader reprezentuje prostą klasę do odczytu zawartości pliku. W testach chcemy sprawdzić działanie klasy FileReader, ale bez otwierania i czytania pliku. Test test_read_file sprawdza czy klasa FileReader zachowuje się poprawnie w przypadku braku pliku i poprawnego odczytu. `unittest.mock.mock_open` symuluje działanie funkcji open, a`MonkeyPatch` pozwala tymczasowo podmienić obiekty w trakcie testów.

In [None]:
import pytest
from unittest.mock import mock_open

# Klasa do czytania plików, którą chcemy mockować
class FileReader: 
    def __init__(self, filename):
        self.filename = filename

    def read(self):
        with open(self.filename, 'r') as file:
            return file.read()

# Test 1
def test_read_file():
    # Symuluje plik z danymi 'testowe dane'
    mock_data = 'testowe dane'
    m = mock_open(read_data=mock_data)

    # Sprawdza, czy FileNotFoundError jest zgłaszany, gdy plik nie istnieje
    with pytest.raises(FileNotFoundError):
        FileReader("nieistniejacy_plik.txt").read()

    # Symuluje otwieranie pliku przy użyciu mocka
    with pytest.MonkeyPatch.context() as mpatch:
        mpatch.setattr("builtins.open", m)  # podmienia wbudowaną funkcję open w Pythonie na mock m
        reader = FileReader("dummy.txt")    # nazwa pliku nie ma to znaczenia
        result = reader.read()

    # Sprawdza, czy otwarcie pliku zostało wykonane poprawnie
    m.assert_called_once_with("dummy.txt", 'r')
    # Sprawdza, czy zwrócone dane są zgodne z oczekiwanymi danymi
    assert result == mock_data


### Przykład 4. Fixture i mockowanie

Poniższy przykład przedstawia  implementację klasy WeatherService, która pobiera dane pogodowe z API oraz jej testowanie za pomocą frameworku pytest i technik fixture i mockowania. Pokazuje, jak izolować kod od zewnętrznych zależności (API). Poniższy test skutecznie symuluje wywołanie zewnętrznego API i pozwala nam przetestować klasę WeatherService bez polegania na dostępności zewnętrznej usługi czy sieci poprzez
- Mockowanie requests.get: Używamy patch, aby zastąpić requests.get obiektem MagicMock. Oznacza to, że podczas testu nie będą wykonywane żadne prawdziwe żądania HTTP.
- Ustawianie zwracanych wartości: Obiekt mock jest skonfigurowany do zwracania MagicMock jako odpowiedzi, a metoda json tej odpowiedzi mock jest ustawiona na zwracanie naszych wcześniej zdefiniowanych danych JSON (fixture).
- Asercje: Sprawdzamy, czy zwrócone dane pogodowe pasują do naszych danych mock i czy requests.get zostało wywołane z poprawnym adresem URL.

In [None]:
# Kod przykładowej klasy obsługującej zapytania do API pogodowego
# Załóżmy, że znajduje się w pliku weather.py
import requests

class WeatherService:
    def __init__(self, api_key):
        self.api_key = api_key

    def get_current_weather(self, city):
        url = f"http://example.com/weather?city={city}&key={self.api_key}"
        response = requests.get(url)
        print("\nPobrano informacje.")
        return response.json()


In [None]:
import pytest
from unittest.mock import MagicMock, patch
from weather import WeatherService # ładujemy WeatherService z odpowiedniego modułu

# Fixture, który zwraca przykładową odpowiedź API pogodowego
# Pozwala to na wielokrotne użycie tych samych danych w różnych testach.
@pytest.fixture
def mock_weather_api_response():
    return {
        "city": "London",
        "temperature": "15°C",
        "condition": "Cloudy"
    }

# Test poprawnego działania metody `get_current_weather`
def test_get_current_weather(mock_weather_api_response):
    # patch('requests.get') zastępuje rzeczywistą funkcję requests.get jej mockowaną wersją.
    with patch('requests.get') as mock_get:
        # Konfiguruje zachowanie obiektu MagicMock
        # Użycie mock_get.return_value pozwala symulować zwrot danych JSON w odpowiedzi API
        mock_get.return_value = MagicMock(status_code=200)
        mock_get.return_value.json.return_value = mock_weather_api_response

        # Tworzy obiekt WeatherService i wywołuje metodę get_current_weather
        service = WeatherService(api_key="dummy_key")
        weather = service.get_current_weather("London")

        # Sprawdza, czy dane pogodowe są zgodne z oczekiwanymi danymi
        assert weather == mock_weather_api_response

        # Sprawdza, czy requests.get zostało wywołane z odpowiednim adresem URL
        mock_get.assert_called_once_with("http://example.com/weather?city=London&key=dummy_key")

## 5\*. Przegląd innych użytecznych narzędzi i zagadnień

Python oferuje szeroką gamę narzędzi, które mogą znacząco usprawnić pracę programistów, zarówno początkujących, jak i zaawansowanych. Wybór odpowiednich narzędzi jest często subiektywny i zależy od indywidualnych potrzeb czy specyfiki projektu. Poniżej przedstawiamy pewien przekrój dostępnych możliwości wraz z krótkim opisem i czasem przykładem. Każde z tych narzędzi ma swoje unikalne zastosowania i może stać się nieocenionym wsparciem w codziennej pracy z kodem. Zachęcam do własnej eksploracji tych i innych rozwiązań, by odkryć, które najlepiej odpowiadają waszym potrzebom i stylowi pracy.

### Statyczna analiza typów (mypy)

**Mypy** to narzędzie do statycznej analizy typów w Pythonie, które pomaga weryfikować poprawność typów w kodzie, bazując na adnotacjach typów wprowadzonych od Pythona 3.5. Dzięki Mypy można wcześnie wykrywać błędy typów, takie jak niezgodność typów w funkcjach czy zmiennych, jeszcze przed uruchomieniem programu. Narzędzie wspiera zarówno adnotacje wbudowane (np. int, str) jak i zaawansowane typy z modułu typing, takie jak Union, Optional czy TypedDict. Jest szczególnie przydatne w dużych projektach, gdzie ręczne śledzenie typów jest trudne i podatne na błędy. Chociaż Mypy wykonuje statyczną analizę, nie wpływa na wydajność programu w trakcie działania, ponieważ typy są sprawdzane wyłącznie podczas analizy kodu.

Mypy pozwala sprawdzić, czy adnotacje typów w kodzie są zgodne z faktycznym użyciem. Uruchomienie Mypy na tym kodzie (np. `mypy file.py`) wykryje niezgodność typów w drugim wywołaniu poniższej funkcji:

In [None]:
from typing import List

def average(numbers: List[int]) -> float:
    return sum(numbers) / len(numbers)

print(average([1, 2, 3, 4]))  # Poprawne
print(average(["a", "b", "c"]))  # Mypy zgłosi błąd: "List[str]" is not compatible with "List[int]"

### Poprawa jakości kodu (flake8)

*Linter* lub *code linter* to narzędzie programistyczne analizujące kod źródłowy w celu wykrycia błędów, luk w zabezpieczeniach i problemów stylistycznych w celu poprawy jakości kodu. Pozwala też zidentyfikować i poprawić subtelne błędy programistyczne lub niekonwencjonalne praktyki kodowania, które mogą prowadzić do błędów. Jako przykład omówimy krótko **flake8** oraz wspomnimy inne narzędzia.

**Flake8** to narzędzie do sprawdzania jakości kodu Pythona. Sprawdza ono kod pod kątem zgodności z wybranym zestawem reguł, takich jak PEP 8, a także wykrywa błędy logiczne, takie jak nieużywane zmienne czy nieużywane importy. Narzędzie to jest szczególnie przydatne w dużych projektach, w których trudno jest ręcznie sprawdzać kod pod kątem zgodności z wybranymi regułami. Flake8 można zainstalować za pomocą `pip install flake8`. Aby uruchomić flake8, należy przejść do katalogu z kodem i wykonać polecenie `flake8 .`, gdzie `.` oznacza bieżący katalog. Po uruchomieniu flake8 wyświetli on listę ostrzeżeń i błędów, które znalazł w kodzie. Plik `.flake8` zawiera konfigurację flake8. Można w nim określić, które reguły mają być sprawdzane, a które nie. Można również określić, które reguły mają być uznawane za błędy, a które za ostrzeżenia. Więcej informacji na temat konfiguracji flake8 można znaleźć w dokumentacji na stronie https://flake8.pycqa.org/en/latest/user/configuration.html.

Instnieje wiele narzędzi do sprawdzania i poprawiania jakości kodu Pythona, np. pylint, który posiada możliwość aprawdzania typów (w przeciwieństwie fo flake8). Zalecamy zapoznanie się różnymi narzędziami w wolnym czasie i wybrania najlepszego. Narzędzia te często można również zintegrować z waszym IDE (jak np. PyCharm, VSCode), co bardzo usprawnia korzystanie z nich. Więcej informacji na temat tych narzędzi można znaleźć w dokumentacji oraz w artykułach:
- https://www.pylint.org/
- https://medium.com/@huzaifazahoor654/improving-code-quality-with-flake8-and-black-a-guide-for-python-developers-c374168d5884
- https://pythonspeed.com/articles/pylint-flake8-ruff/.

### Narzędzie do formatowania kodu Pythona (black)


**Black** to nowoczesne narzędzie do automatycznego formatowania kodu Python, które zapewnia spójny styl programowania. Black minimalizuje możliwość dostosowywania ustawień, co sprawia, że kod sformatowany przez to narzędzie wygląda zawsze tak samo, niezależnie od autora. Jego głównym celem jest poprawa czytelności i zgodność ze standardami PEP8, choć wprowadza pewne odstępstwa, np. pozwalając na dłuższe linie kodu. Narzędzie działa deterministycznie, co oznacza, że wielokrotne jego zastosowanie na tym samym pliku zawsze prowadzi do identycznego wyniku. Dzięki temu eliminuje niepotrzebne dyskusje o stylu kodu w zespołach programistycznych. Black pomaga utrzymać czytelny kod i zautomatyzowane przestrzeganie standardów. Więcej o black można znaleźć w dokumentacji: https://black.readthedocs.io/en/stable/.

### Generowanie dokumentacji (docstring, pydoc, doxygen)

**Docstring** to specjalny rodzaj komentarza w Pythonie, używany do dokumentowania modułów, klas, funkcji i metod. Umieszczany jest bezpośrednio na początku elementu, który opisuje, i otaczany potrójnymi cudzysłowami ("""). Docstringi są kluczowe dla utrzymania czytelności i zrozumiałości kodu, ponieważ dostarczają informacji o tym, co dana część kodu robi, jakie parametry przyjmuje i co zwraca. Pythonowe narzędzia takie jak pydoc lub IDE mogą automatycznie generować dokumentację na podstawie docstringów. Możesz także używać standardów takich jak Google Style czy reStructuredText do ujednolicenia dokumentacji.

**Pydoc** to wbudowane narzędzie w Pythonie, które służy do generowania dokumentacji na podstawie docstringów znajdujących się w kodzie (t.j. \_\_doc\_\_ lub komentarzy). Umożliwia przeglądanie dokumentacji dla modułów, klas, funkcji i metod w terminalu, a także może uruchomić serwer HTTP do wyświetlania dokumentacji w przeglądarce. Pydoc pozwala na szybki podgląd informacji za pomocą funkcji `help()` w interpreterze lub polecenia `python -m pydoc <prompt>` w wierszu poleceń. Narzędzie to jest szczególnie przydatne podczas eksplorowania istniejących modułów lub sprawdzania składni funkcji bez konieczności korzystania z zewnętrznych źródeł. Można także użyć Pydoc do wygenerowania plików HTML z pełną dokumentacją projektu.

**Doxygen** to narzędzie do generowania dokumentacji dla wielu języków programowania, w tym Python, więc wiele osób może je już znać. W Pythonie wykorzystuje komentarze i docstringi w kodzie, aby automatycznie tworzyć dokumentację w formatach takich jak HTML, PDF czy LaTeX. Jest szczególnie przydatne w projektach wielojęzycznych lub takich, które wymagają dokumentacji technicznej z diagramami klas i relacji między nimi. Doxygen wspiera komentarze w specyficznym formacie (np. /// lub /** */) oraz integruje się z narzędziami takimi jak Graphviz, aby generować wizualne diagramy kodu. Chociaż nie jest specyficznie zaprojektowane dla Pythona, może być używane do wygenerowania spójnej dokumentacji w większych projektach, które korzystają z wielu technologii.

In [None]:
# Przykład (z wykorzystaniem stylu Doxygen)

class Calculator:
    """
    Calculator class performs basic arithmetic operations.
    """

    def add(self, a: int, b: int) -> int:
        """
        Adds two numbers together.

        Args:
            a (int): The first number.
            b (int): The second number.

        Returns:
            int: The sum of the two numbers.

        Example:
            >>> add_numbers(2, 3)
            5
        """
        return a + b

### Narzędzia takie jak help() z pydoc wyświetlą dokumentację w terminalu
#help(Calculator)
help(Calculator.add)

# Można też skonfigurować plik Doxyfile, a następnie uruchomić doxygen w terminalu, 
# aby wygenerować dokumentację w HTML lub PDF.

###  Analiza wydajności - Profiler

**Profiler** to narzędzie służące do analizy wydajności kodu Python, pomagające identyfikować fragmenty programu, które są najbardziej zasobożerne. Wbudowany moduł cProfile umożliwia zbieranie danych o czasie wykonania funkcji, liczbie ich wywołań oraz innych aspektach wpływających na wydajność. Narzędzia do profilowania mogą być używane do optymalizacji kodu, np. poprzez identyfikację wąskich gardeł w programie. Wyniki profilowania można przeglądać w formie tabeli, sortować według czasu wykonania czy liczby wywołań, co ułatwia analizę. Istnieją także graficzne narzędzia, takie jak SnakeViz lub py-spy, które wizualizują dane zebrane przez profiler, co czyni analizę bardziej intuicyjną.

In [None]:
# Przykład użycia cProfile

import cProfile

def cum_sum(N):
    cal = Calculator()
    total = 0
    for i in range(1, N):
        total = cal.add(total, i)
    return total

def run_twice():
    cum_sum(10000)
    cum_sum(50)

cProfile.run('run_twice()')

# Po uruchomieniu programu otrzymasz szczegółowy raport, 
# np. ile razy każda funkcja została wywołana i ile czasu zajęło jej wykonanie.

### Debugger

**Debugger** to narzędzie służące do analizy i naprawiania błędów w kodzie Python poprzez umożliwienie śledzenia jego wykonania krok po kroku. W Pythonie wbudowany moduł pdb pozwala na zatrzymanie działania programu w dowolnym miejscu, podgląd zmiennych, ustawianie punktów przerwania (breakpoints) i wykonywanie kodu linia po linii. Debugger pozwala również na modyfikowanie wartości zmiennych podczas działania programu, co ułatwia diagnozowanie problemów. Zintegrowane środowiska programistyczne (IDE), takie jak PyCharm czy Visual Studio Code, oferują zaawansowane debugowanie z interfejsem graficznym, pozwalając na łatwiejsze śledzenie stosu wywołań i punktów przerwania. Debugger jest nieoceniony podczas pracy nad złożonymi aplikacjami, gdzie błędy mogą być trudne do wykrycia jedynie za pomocą logowania.

In [None]:
# Przykład z użyciem pdb

import pdb

def divide(a, b):
    pdb.set_trace()  # Uruchamia debugger w tej linii
    return a / b

print(divide(10, 2))  # Poprawne
print(divide(10, 0))  # W debuggerze możesz sprawdzić problem, zanim pojawi się błąd

Uruchamiając ten kod, debugger pozwoli na zatrzymanie programu, podgląd zmiennych (komenda: a(rgs)) oraz wykonanie kodu krok po kroku (n(ext)), co ułatwia analizę błędu dzielenia przez zero; wyjście (q(uit)). Jednak zdecydowanie polecamy korzystanie ze środowisk programistycznych (IDE).

### Własny pakiet Pythona

Pakiet Python to kolekcja modułów umieszczonych w strukturze katalogów zawierających plik \_\_init\_\_.py. Tworzenie pakietów pozwala na lepszą organizację kodu i możliwość ponownego użycia funkcji oraz klas w różnych projektach. Pakiety mogą być publikowane w repozytorium PyPI (https://pypi.org/), aby umożliwić ich instalację za pomocą pip. Podstawowy pakiet składa się z folderów, modułów oraz pliku konfiguracyjnego setup.py; warto też pamiętać o wszelkiej dokumentacji pakietu i funkcji.

Struktura katalogów pakietu powinna zawierać:
- **my_package/** zawiera moduły pakietu oraz plik inicjalizacyjny pakietu (oczywiście pod własną nazwą pakietu), 
- **tests/** zawiera testy,
- **setup.py** to skrypt do budowania i dystrybucji pakietu,
- **README.md** to czytelne i praktyczne wprowadzenie dla użytkowników pakietu napisane w markdown,
- **LICENSE** określa licencję, na podstawie której pakiet jest dystrybuowany, więc nie należy o nim zapominać.

A poniżej znajduje się przykładowa struktura katalogów:

A teraz przyjrzyjmy się poszczególnym elementom trochę dokładniej:
1. Przykładowy moduł: my_package/math_utils.py

In [None]:
"""
math_utils.py
--------------
Moduł oferuje funkcje do podstawowych operacji matematycznych.

Funkcje:
- add: Dodaje dwie liczby.
- subtract: Odejmuje drugą liczbę od pierwszej.
"""

def add(a: int, b: int) -> int:
    """
    Dodaje dwie liczby całkowite.

    Args:
        a (int): Pierwsza liczba.
        b (int): Druga liczba.

    Returns:
        int: Suma dwóch liczb.

    Example:
        >>> add(2, 3)
        5
    """
    return a + b

def subtract(a: int, b: int) -> int:
    """
    Odejmuje drugą liczbę od pierwszej.

    Args:
        a (int): Pierwsza liczba.
        b (int): Druga liczba.

    Returns:
        int: Różnica dwóch liczb.

    Example:
        >>> subtract(5, 3)
        2
    """
    return a - b


2. Przykładowy moduł: my_package/string_utils.py

In [None]:
"""
string_utils.py
----------------
Moduł oferuje funkcje do pracy z ciągami znaków.

Funkcje:
- reverse_string: Odwraca podany ciąg znaków.
"""

def reverse_string(s: str) -> str:
    """
    Odwraca podany ciąg znaków.

    Args:
        s (str): Ciąg znaków do odwrócenia.

    Returns:
        str: Odwrócony ciąg znaków.

    Example:
        >>> reverse_string("Python")
        'nohtyP'
    """
    return s[::-1]

3. Plik my_package/\_\_init\_\_.py jest potrzebny aby Python wiedział, że ten katalog to pakiet.

In [None]:
"""
my_package
----------
Pakiet `my_package` zawiera funkcje do operacji matematycznych i manipulacji ciągami znaków.

Moduły:
- math_utils: Operacje matematyczne.
- string_utils: Operacje na ciągach znaków.

Funkcje eksportowane:
- add: Dodaje dwie liczby.
- subtract: Odejmuje jedną liczbę od drugiej.
- reverse_string: Odwraca podany ciąg znaków.
"""

# Użycie "from .math_utils import add" pozwala korzystać z funkcji "add" bezpośrednio, 
# importując ją z pakietu ("from my_package import add"), zamiast odwoływać się do 
# modułu wewnątrz pakietu ("from my_package.math_utils import add").
# '.' oznacza tu bieżący katalog
from .math_utils import add, subtract
from .string_utils import reverse_string

# Lista nazw funkcji, klas, czy zmiennych, które będą eksportowane podczas importowania 
# modułu lub pakietu przy użyciu składni "from my_package import *"
# Czyli __all__ pozwala kontrolować to co jest publiczne w pakiecie.
__all__ = ["add", "subtract", "reverse_string"]

4. Plik setup.py składa się ze skryptu Pythona, w którym można ustawić deklaratywnie wiele właściwości, które są rozpoznawane przez menedżery pakietów, takie jak pip oraz IDE, jak PyCharm, co oznacza, że jest to obowiązkowy element każdego pakietu.


In [None]:
"""
setup.py
--------
Skrypt instalacyjny dla pakietu `my_package`.
"""

# Setuptools to pakiet, który udostępnia narzędzia do budowania i dystrybucji pakietów Python
from setuptools import setup, find_packages 

setup(
    name="my_package",
    version="0.1.0",
    author="Your Name",
    description="A sample Python package for math and string utilities",
    long_description=open("README.md").read(),
    long_description_content_type="text/markdown",
    packages=find_packages(),
    python_requires='>=3.6',
    install_requires=[],  # Add dependencies here
)


5. Przykładowy test: tests/test_modules.py. Plik tests/\_\_init\_\_.py może być pusty.

In [None]:
"""
Testy dla modułów math_utils.py i string_utils.py.
"""

import pytest
from my_package import add, subtract, reverse_string

def test_add():
    """Testuje funkcję add()."""
    assert add(2, 3) == 5
    assert add(-1, 1) == 0
    assert add(0, 0) == 0


def test_subtract():
    """Testuje funkcję subtract()."""
    assert subtract(10, 5) == 5
    assert subtract(0, 0) == 0
    assert subtract(-5, -2) == -3

def test_reverse_string():
    """Testuje funkcję reverse_string()."""
    assert reverse_string("Python") == "nohtyP"
    assert reverse_string("12345") == "54321"
    assert reverse_string("") == ""


6. Instalacja pakietu lokalnie

In [None]:
# W katalogu głównym pakietu uruchom
%pip install .

Po zainstalowaniu pakietu możesz go importować i używać w innych projektach:

In [None]:
from my_package import add, subtract, reverse_string

# Przykład użycia funkcji add
print(add(4, 5))  # Wynik: 9

# Przykład użycia funkcji reverse_string
print(reverse_string("hello"))  # Wynik: 'olleh'

# Sprawdzenie dokumentacji funkcji w terminalu
help(add)