# Podstawy programowania w analizie danych

## Tomasz Rodak

2017/2018, semestr letni

Wykład VI

# Klasy

## Tworzenie klas

* Klasy tworzymy za pomocą zarezerwowanego słowa `class`.
* Ciało klasy znajduje się we wcięciu, po dwukropku, tak samo jak ciało funkcji czy instrukcji sterującej.
* Zaleca się, aby nazwy klas pisać w stylu `TitleCase`.

## Przykład

Oto najprostsza klasa w Pythonie. Jej nazwą jest `NajprostszaKlasa`.  Klasa ta nic nie robi (choć może przechowywać dane).

In [4]:
class NajprostszaKlasa:
    pass

## Operacje na klasach

Jedyne operacje jakie można wykonywać na klasach to:
* tworzenie **instancji**;
* odwoływanie się do atrybutów klasy.


## Instancja klasy

* Klasy są obiektami **wywoływalnymi**, tzn. można je wywoływać stosując notację taką jak dla funkcji.
* Wywołanie klasy zwraca instancję tej klasy.
* Każde wywołanie zwraca nową instancję o innej tożsamości.

Możesz myśleć, że klasa jest **fabryką instancji**.

`a` jest instancją klasy `NajprostszaKlasa`

In [5]:
a = NajprostszaKlasa()

`b` jest inną instancją.

In [6]:
b = NajprostszaKlasa()

In [7]:
a is b

False

Instancje przedstawiają się nazwą klasy od której pochodzą i adresem, pod którym żyją. Różne adresy wskazują, że są to różne obiekty.

In [8]:
a

<__main__.NajprostszaKlasa at 0x7fd7b06e9588>

In [9]:
b

<__main__.NajprostszaKlasa at 0x7fd7b06e96d8>

## Przykład: `Punkt`

* Wyobrażamy sobie, że instancje klasy `Punkt` będą punktami płaszczyzny.
* Klasa `Punkt` również nic nie robi -- jedynie nazwa wskazuje na jej przeznaczenie.

In [1]:
class Punkt:
    pass

Tworzymy punkty `p` i `q`.

In [2]:
p = Punkt()
q = Punkt()

## Atrybuty instancji

* Instrukcja przypisania i **notacja z kropką** pozwalają na stowarzyszanie z instancjami nowych nazw.
* Jest to jeden ze sposobów na tworzenie **atrybutów instancji**.

Współrzędne punktów przechowamy **w instancji** jako nazwy `x`, `y`.

In [3]:
p.x, p.y = 0, 1

In [10]:
q.x, q.y = 345, -123

In [11]:
p.x, p.y, q.x, q.y

(0, 1, 345, -123)

## Modyfikacja atrybutów instancji

Atrybuty można zmieniać. Względem instancji jest to operacja "w miejscu".

In [12]:
p.x, p.y = 5, 100

In [14]:
p.x, p.y

(5, 100)

`q.x`, `q.y` nie uległy zmianie.

In [15]:
q.x, q.y

(345, -123)

## Metody

* Funkcje zdefiniowane wewnątrz klasy nazywamy **metodami**.
* Metody są **atrybutami klasy**.

## `Punkt`: dodajemy zachowanie

Dodajemy metodę `centruj()`, która będzie ustawiać punkt w środku układu współrzędnych.

In [70]:
class Punkt:
    
    def centruj(instancja):
        instancja.x = 0
        instancja.y = 0

`centruj` jest atrybutem klasy `Punkt`.

In [71]:
Punkt.centruj

<function __main__.Punkt.centruj>

Próba wywołania skończy sie niepowodzeniem jeśli nie dostarczymy argumentu.

In [72]:
Punkt.centruj()

TypeError: centruj() missing 1 required positional argument: 'instancja'

Tworzymy więc instancję

In [73]:
p = Punkt()

i wywołujemy na niej metodę

In [74]:
Punkt.centruj(p)

Po tej operacji instancja `p` posiada atrybuty `x`, `y`.

In [75]:
p.x, p.y

(0, 0)

Przesunięcie do nowego położenia...

In [76]:
p.x, p.y = 123, 543

p.x, p.y

(123, 543)

... i powrót do początku.

In [77]:
Punkt.centruj(p)

p.x, p.y

(0, 0)

## Wiązanie metody z instancją

* Metoda klasy **wiąże** się z instancją zwracaną przez klasę.
* Metoda związana z instancją jest atrybutem tej instancji.
* Metoda związana z instancją po wywołaniu odwołuje się do metody z klasy.
* Domyślnym pierwszym argumentem metody związanej z daną instancją jest ta właśnie instancja.

## `Punkt`: testujemy wiązanie metody `centruj()`

W samej klasie nic nie zmieniamy.

In [70]:
class Punkt:
    
    def centruj(instancja):
        instancja.x = 0
        instancja.y = 0

Tworzymy instancję.

In [78]:
p = Punkt()

`p` ma atrybut `centruj` przedstawiający się jako **bound method** instancji.

In [79]:
p.centruj

<bound method Punkt.centruj of <__main__.Punkt object at 0x7fd7b054c358>>

Próba wywołania metody `centruj` związanej z instancją `p` na instancji `p` kończy się błędem.

In [80]:
p.centruj(p)

p.x, p.y

TypeError: centruj() takes 1 positional argument but 2 were given

Zwróć uwagę na komunikat -- Python zdaje się twierdzić, że podaliśmy dwa argumenty.

Oto wyjaśnienie: 
* metoda związana z instancją automatycznie wstawia tę właśnie instancję jako pierwszy argument.


In [81]:
p.centruj()

p.x, p.y

(0, 0)

Przesunięcie do innego położenia

In [59]:
p.x, p.y = 123, 456

p.x, p.y

(123, 456)

i powrót do początku

In [60]:
p.centruj()

p.x, p.y

(0, 0)

## Parametr `self`

* Powtórzmy -- pierwszym argumentem metody związanej z instancją jest ta instancja.
* Z tego powodu metody klas, poza pewnymi wyjątkami, posiadają zawsze co najmniej jeden parametr i co więcej, argument akceptowany przez pierwszy parametr metody będzie instancją.
* Nazwa tego pierwszego parametru jest dowolna, ale istnieje bardzo silna konwencja, aby nazywać go **`self`**.

Przepiszmy klasę `Punkt` używając ortodoksyjnego nazewnictwa.

In [70]:
class Punkt:
    
    def centruj(self):
        self.x = 0
        self.y = 0

## Przykład

Co się stanie, gdy zapomnimy o szczególnej roli pierwszego parametru metody?

Łatwo to sprawdzić.

In [1]:
class Klasa:
    
    def komunikat():
        print('Monty Python')
    
    def sześcian(x):
        return x ** 3

Klasa zawiera dwie metody:
* `komunikat()` -- nic nie zwraca, nie ma parametrów, wyświetla komunikat;
* `sześcian(x)` -- jeden parametr `x`, zwraca jego trzecią potęgę.

Jako atrybuty klasy `Klasa` funkcje działają w zwykły sposób.

In [2]:
Klasa.komunikat()

Monty Python


In [3]:
Klasa.sześcian(5)

125

Kłopoty zaczynają się wtedy, gdy próbujemy wywołać powyższe metody po związaniu z instancją -- liczba argumentów przestaje się zgadzać, gdyż interpreter jako pierwszy próbuje podać instancję.

In [5]:
a = Klasa()

a.komunikat()

TypeError: komunikat() takes 0 positional arguments but 1 was given

In [6]:
a.sześcian(5)

TypeError: sześcian() takes 1 positional argument but 2 were given

Jeszcze jedno wywołanie. Tym razem liczba zmiennych się zgadza, ale operacja nie jest możliwa do przeprowadzenia. Nie podaliśmy argumentu `x`, więc interpreter mógł wstawić za niego instancję. Nie powiodła się próba podniesienia instancji do sześcianu -- ta operacja, przynajmniej w tym przypadku, nie ma sensu.

In [7]:
a.sześcian()

TypeError: unsupported operand type(s) for ** or pow(): 'Klasa' and 'int'

## Atrybuty klasy vs atrybuty instancji

Gdy interpreter widzi odwołanie do atrybutu instancji, poszukuje tego atrybutu najpierw w instancji, a następnie w klasie.

In [138]:
class Klasa:
    
    napis = 'ala ma kota'
    
i1 = Klasa()
i2 = Klasa()

Przypisanie do atrybutu w instancji tworzy referencję do nowego obiektu i nadpisuje ten atrybut. Nie ma to wpływu na pozostałe instancje ani na klasę.

In [139]:
i1.napis = 'Monty Python'

Klasa.napis, i1.napis, i2.napis

('ala ma kota', 'Monty Python', 'ala ma kota')

Atrybut `i2.napis` nie został w instancji przypisany, więc będzie poszukiwany w klasie. Efekt jest dosyć niespodziewany.

In [140]:
Klasa.napis = 'Żywot Briana'

Klasa.napis, i1.napis, i2.napis

('Żywot Briana', 'Monty Python', 'Żywot Briana')

## Średnia krocząca

Przypomnijmy implementację średniej kroczącej z poprzednich wykładów. Działa dzięki domknięciom.

In [3]:
def średnia_krocząca():
    
    suma, liczba = 0, 0
    
    def średnia(wartość):
        nonlocal suma, liczba
        suma += wartość
        liczba += 1
        return suma / liczba
    
    return średnia

Przykładowe wywołanie.

In [4]:
avg = średnia_krocząca()

avg(5)

5.0

In [5]:
avg(10)

7.5

In [6]:
avg(15)

10.0

## Średnia krocząca za pomocą klas -- wersja 1.0

In [15]:
class ŚredniaKrocząca:
    
    liczba = 0
    suma = 0
    
    def dodaj_wartość(self, a):
        self.liczba += 1
        self.suma += a
        return self.suma / self.liczba

Działa podobnie. Różnica jest taka, że teraz odwołujemy się do metody `dodaj_wartość()`.

In [16]:
avg = ŚredniaKrocząca()

avg.dodaj_wartość(5)

5.0

In [17]:
avg.dodaj_wartość(10)

7.5

In [18]:
avg.dodaj_wartość(15)

10.0

Wadą tej implementacji jest to, że atrybuty `liczba` i `suma` w instancjach odwołują się do tych samych atrybutów w klasie.

In [20]:
ŚredniaKrocząca.suma = 10 ** 4

avg = ŚredniaKrocząca()

avg.dodaj_wartość(5)

10005.0

In [21]:
avg.suma, avg.liczba

(10005, 1)

## Średnia krocząca za pomocą klas -- wersja 1.1

* Dodajemy metodę `inicjalizuj()` ustawiającą atrybuty instancji `liczba` i `suma`.
* `inicjalizuj()` należy wywołać przed pierwszym `dodaj_wartość()`. 

In [27]:
class ŚredniaKrocząca:
    
    def inicjalizuj(self):
        self.liczba = 0
        self.suma = 0

    def dodaj_wartość(self, a):
        self.liczba += 1
        self.suma += a
        return self.suma / self.liczba

In [30]:
avg = ŚredniaKrocząca()

avg.inicjalizuj()

avg.liczba, avg.suma

(0, 0)

In [31]:
avg.dodaj_wartość(5)

5.0

In [32]:
avg.dodaj_wartość(4)

4.5

In [33]:
avg.dodaj_wartość(5)

4.666666666666667

## Metoda `__init__()`

* Cechy metody `inicjalizuj()`:
  * dodaje do instancji atrybuty `suma` i `liczba`;
  * musi być wywołana jako pierwsza.

Bardzo często zachodzi potrzeba dodania atrybutów do instancji zaraz po jej utworzeniu. Dlatego Python dostarcza metodę magiczną (lub specjalną) `__init__()`, która jest wykonywana automatycznie przez interpreter natychmiast po utworzeniu instancji.

## Średnia krocząca za pomocą klas -- wersja 1.2

Zastępujemy `inicjalizuj()` przez `__init__()`.

In [34]:
class ŚredniaKrocząca:
    
    def __init__(self):
        self.liczba = 0
        self.suma = 0

    def dodaj_wartość(self, a):
        self.liczba += 1
        self.suma += a
        return self.suma / self.liczba

Atrybuty instancji `liczba` i `suma` są od razu gotowe do użycia.

In [41]:
avg = ŚredniaKrocząca()

avg.liczba, avg.suma

(0, 0)

In [42]:
avg.dodaj_wartość(5)

5.0

In [43]:
avg.dodaj_wartość(4)

4.5

In [44]:
avg.dodaj_wartość(5)

4.666666666666667

## Konwencje nazewnicze w klasach

* Nazwa atrybutu rozpoczynająca się pojedynczym podkreśleniem oznacza jednostkę wewnętrzną (prywatną).
* Python nie blokuje dostępu do jednostek wewnętrznych.
* Korzystanie z jednostek wewnętrznych, a już zwłaszcza ich modyfikacja, uznawane jest za złą praktykę.
* Wprowadzanie jednostek wewnętrznych pozwala na <a href="https://pl.wikipedia.org/wiki/Hermetyzacja_(informatyka)"><b>hermetyzację</b></a> danych i budowę eleganckiego interfejsu.

### Podwójny podkreślnik

Nazwy atrybutów rozpoczynające się od podwójnego podkreślenia i kończące co najwyżej jednym podkreśleniem ozdabiane są nazwą klasy.

In [48]:
class A:
    
    __atr = 'Bardzo prywatny atrybut.'

In [50]:
inst = A()

inst.__atr # Tego atrybutu nie ma!

AttributeError: 'A' object has no attribute '__atr'

In [52]:
inst._A__atr # __atr zdefiniowany w klasie A.

'Bardzo prywatny atrybut.'

* Atrybuty zaczynające i kończące się podwójnym podkreśleniem mają w Pythonie znaczenie specjalne. 
* Jeden z nich -- `__init__()` -- zdążyliśmy już poznać.
* Oto kilka innych:
  * `__str__()`
  * `__add__()`
  * `__eq__()`
  * `__call__()`
  * `...`

## Średnia krocząca za pomocą klas -- wersja 1.3

Hermetyzujemy (ukrywamy) atrybuty `liczba` i `suma`.

In [45]:
class ŚredniaKrocząca:
    
    def __init__(self):
        self._liczba = 0
        self._suma = 0

    def dodaj_wartość(self, a):
        self._liczba += 1
        self._suma += a
        return self._suma / self._liczba

Teraz po wywołaniu

In [47]:
avg = ŚredniaKrocząca()

jedynym bezpośrednio dostępnym atrybutem `avg` jest `dodaj_wartość()`. Atrybut ten składa się na cały interfejs naszej aplikacji.

## Średnia krocząca za pomocą klas -- wersja 2.0

Modyfikacja interfejsu -- oddzielamy dodawanie wartości od liczenia średniej.

In [59]:
class ŚredniaKrocząca:
    
    def __init__(self):
        self._liczba = 0
        self._suma = 0

    def dodaj_wartość(self, a):
        self._liczba += 1
        self._suma += a

    def średnia(self):
        return self._suma / self._liczba

In [60]:
avg = ŚredniaKrocząca()

avg.dodaj_wartość(4)
avg.dodaj_wartość(6)
avg.dodaj_wartość(11)

In [61]:
avg.średnia()

7.0

## Średnia krocząca za pomocą klas -- wersja 2.1

Usuwamy błąd z wersji 2.0 -- nie można zwrócić średniej z pustego zbioru wartości.

In [62]:
class ŚredniaKrocząca:
    
    def __init__(self):
        self._liczba = 0
        self._suma = 0

    def dodaj_wartość(self, a):
        self._liczba += 1
        self._suma += a

    def średnia(self):
        
        if self._liczba == 0:
            raise ArithmeticError('Nie podałeś żadnych wartości.')

        return self._suma / self._liczba

In [64]:
avg = ŚredniaKrocząca()

avg.średnia()

ArithmeticError: Nie podałeś żadnych wartości.

In [65]:
avg.dodaj_wartość(4)
avg.dodaj_wartość(6)
avg.dodaj_wartość(11)

In [66]:
avg.średnia()

7.0

## Średnia krocząca za pomocą klas -- wersja 2.2

Dopuszczamy dodawanie dowolnie wielu wartości na raz.

In [67]:
class ŚredniaKrocząca:
    
    def __init__(self):
        self._liczba = 0
        self._suma = 0

    def dodaj_wartość(self, *wartości):
        self._liczba += len(wartości)
        self._suma += sum(wartości)

    def średnia(self):
        
        if self._liczba == 0:
            raise ArithmeticError('Nie podałeś żadnych wartości.')

        return self._suma / self._liczba

In [69]:
avg = ŚredniaKrocząca()

avg.dodaj_wartość(4, -4, 10, 10)

avg.średnia()

5.0

## Średnia krocząca za pomocą klas -- wersja 2.3

Dopuszczamy dodawanie wartości już podczas tworzenia instancji.

In [76]:
class ŚredniaKrocząca:
    
    def __init__(self, *wartości):
        self._liczba = len(wartości)
        self._suma = sum(wartości)

    def dodaj_wartość(self, *wartości):
        self._liczba += len(wartości)
        self._suma += sum(wartości)

    def średnia(self):
        
        if self._liczba == 0:
            raise ArithmeticError('Nie podałeś żadnych wartości.')

        return self._suma / self._liczba

In [74]:
avg = ŚredniaKrocząca(4, -4, 10, 10)

avg.średnia()

5.0

In [75]:
avg.dodaj_wartość(10, 24)

avg.średnia()

9.0