# Podstawy programowania w analizie danych

## Tomasz Rodak

2017/2018, semestr letni

Wykład VII

# Klasy
## Przegląd metod specjalnych, cz. 1

## `__str__(self)`

* Zwraca łańcuch.
* Przedstawia nieformalną i wygodną dla człowieka reprezentację `self`.
* Metodę `__str__()` wywołują funkcje:
  * `print()`,
  * `format()`,
  * `str()`.

Daty implementowane w module [`datetime`](https://pymotw.com/3/datetime/index.html) posiadają metodę `__str__()`.

In [1]:
import datetime

dzisiaj = datetime.datetime.today()

dzisiaj

datetime.datetime(2018, 4, 9, 9, 54, 17, 10377)

In [2]:
dzisiaj.__str__()

'2018-04-09 09:54:17.010377'

In [3]:
print(dzisiaj)

2018-04-09 09:54:17.010377


`format()` domyślnie wstawia wartość zwróconą przez `__str__()`.

In [4]:
'Data {} wskazuje na dzisiaj.'.format(dzisiaj)

'Data 2018-04-09 09:54:17.010377 wskazuje na dzisiaj.'

Tę samą wartość operator `%` wstawia za `%s`.

In [5]:
'Data %s wskazuje na dzisiaj.' % dzisiaj

'Data 2018-04-09 09:54:17.010377 wskazuje na dzisiaj.'

Funkcja `str()` również wywołuje `__str__()`.

In [6]:
str(dzisiaj)

'2018-04-09 09:54:17.010377'

## `__repr__(self)`

* Zwraca łańcuch.
* Prezentuje oficjalną i formalną reprezentację `self`.
* Wartość zwracana przez `__repr__()` powinna być, o ile to możliwe, poprawnym wyrażeniem Pythona.
* Metodę `__repr__()` wywołują funkcje:
  * `repr()`,
  * `print()` jeśli `self` nie posiada metody `__str__()`,
  * ogólnie, wiele funkcji wywołujących `__str__()` w drugiej kolejności wywołuje `__repr__()`, jeśli `__str__()` nie jest zaimplementowana.

Daty z `datetime` posiadają metodę `__repr__()`.

In [7]:
dzisiaj.__repr__()

'datetime.datetime(2018, 4, 9, 9, 54, 17, 10377)'

In [8]:
repr(dzisiaj)

'datetime.datetime(2018, 4, 9, 9, 54, 17, 10377)'

Zauważ, że notatnik Jupyter wyświetla `__repr__()` obiektu.

In [9]:
dzisiaj

datetime.datetime(2018, 4, 9, 9, 54, 17, 10377)

`__repr__()` z metodą `format()`.

In [10]:
'Data {!r} wskazuje na dzisiaj.'.format(dzisiaj)

'Data datetime.datetime(2018, 4, 9, 9, 54, 17, 10377) wskazuje na dzisiaj.'

Tę samą wartość operator `%` wstawia za `%r`.

In [11]:
'Data %r wskazuje na dzisiaj.' % dzisiaj

'Data datetime.datetime(2018, 4, 9, 9, 54, 17, 10377) wskazuje na dzisiaj.'

## Krótkie podsumowanie

Daty w `datetime` dobrze ilustrują różnicę między `__str__()` i `__repr__()`.

`__str__()` zwraca łańcuch czytelny dla odbiorcy, odpowiadający przyzwyczajeniom człowieka.

In [12]:
dzisiaj.__str__()

'2018-04-09 09:54:17.010377'

Łańcuch zwracany przez `__repr__()` nie jest tak miły dla oka, jest jednak precyzyjniejszy, gdyż prezentuje jednoznacznie nie tylko datę, ale i jej definicję w module `datetime`.

In [13]:
dzisiaj.__repr__()

'datetime.datetime(2018, 4, 9, 9, 54, 17, 10377)'

## `FunkcjaLiniowa` -- wersja 1.0

Klasa `FunkcjaLiniowa` ma reprezentować znaną ze szkoły funkcję liniową
$$
y=ax+b.
$$
Wartości $a$ i $b$ definiują tę funkcję w pełni.

In [14]:
class FunkcjaLiniowa:
    
    def __init__(self, a, b):
        self.a, self.b = a, b
    
    def __str__(self):
        if self.b >= 0:
            return 'y = {}*x + {}'.format(self.a, self.b)
        return 'y = {}*x - {}'.format(self.a, -self.b)
    
    def __repr__(self):
        return 'FunkcjaLiniowa({}, {})'.format(self.a, self.b)
    
    def wartość(self, x):
        return self.a*x + self.b

Przykład użycia.

In [15]:
f, g = FunkcjaLiniowa(2, 4), FunkcjaLiniowa(-3, -7)

f, g

(FunkcjaLiniowa(2, 4), FunkcjaLiniowa(-3, -7))

In [16]:
print(f, g)

y = 2*x + 4 y = -3*x - 7


In [17]:
print('f: {}, g: {}'.format(f, g))

f: y = 2*x + 4, g: y = -3*x - 7


In [18]:
f.wartość(3), g.wartość(3)

(10, -16)

## Obiekt wywoływalny

* Obiekt **wywoływalny** to taki, który może zostać **wywołany**, czyli taki, który akceptuje operator **wywołania** `()`.
* Wbudowana funkcja `callable(obiekt)` zwraca `True / False` w zależnosci od tego, czy `obiekt` jest wywoływalny.
* Poznane dotąd obiekty wywoływalne:
  * funkcje wbudowane, np. `len()`;
  * funkcje zdefiniowane przez użytkownika z pomocą `def` lub `lambda`;
  * metody wbudowane np. metoda łancuchów `upper()`;
  * klasy;
  * metody klasy zdefiniowane przez użytkownika.
  
W Pythonie istnieją jeszcze dwa rodzaje obiektów wywoływalnych -- jeden poznamy za chwilę, drugi trochę później.

### Przykłady

In [19]:
callable(len), callable('abc'.upper)

(True, True)

In [20]:
def f():
    pass

callable(f)

True

In [21]:
class A:
    
    def metoda(self):
        pass

a = A()

callable(A), callable(a.metoda), callable(a)

(True, True, False)

## `__call__(self [, arg1, arg2, ...])`

Instancje z tą metodą mogą być wywoływane tak jak funkcje.



In [22]:
class A:
    
    def __call__(self, x):
        return x * x

class B:
    
    def metoda(self, x):
        return x * x
    
a = A()
b = B()

callable(a), callable(b)

(True, False)

In [23]:
a(5), a.__call__(6), b.metoda(7)

(25, 36, 49)

## `FunkcjaLiniowa` -- wersja 1.1

Podmieniamy metodę `wartość()` na `__call__()`.

In [24]:
class FunkcjaLiniowa:
    
    def __init__(self, a, b):
        self.a, self.b = a, b
    
    def __str__(self):
        if self.b >= 0:
            return 'y = {}*x + {}'.format(self.a, self.b)
        return 'y = {}*x - {}'.format(self.a, -self.b)
    
    def __repr__(self):
        return 'FunkcjaLiniowa({}, {})'.format(self.a, self.b)
    
    def __call__(self, x):
        return self.a*x + self.b

Przykład użycia.

In [25]:
f = FunkcjaLiniowa(1, 2)

f

FunkcjaLiniowa(1, 2)

In [26]:
print(f)

y = 1*x + 2


In [27]:
f.__call__(3)

5

In [28]:
f(3)

5

## Przykład: różniczkowanie numeryczne

Pochodną funkcji $f\colon (a, b)\to\mathbb{R}$ w punkcie $x_0\in (a, b)$ nazywamy granicę ilorazu różnicowego

$$
f'(x_0)=\lim_{h\to 0}\frac{f(x_0+h) - f(x_0)}{h}.
$$

Jeżeli granica ta istnieje, to mówimy, że $f$ jest różniczkowalna w $x_0$.

Nasze podejście do różniczkowania numerycznego będzie polegało na tym, że zamiast liczyć powyższą granicę, obliczymy sam iloraz różnicowy dla $h$ konkretnego i bardzo bliskiego zera.

### Pochodna numeryczna

Klasa `Pochodna` przyjmuje parametry:
* `f` -- obiekt wywoływalny zwracający liczby. Z punktu widzenia użytkownika jest to funkcja rzeczywista.
* `h` -- "dostatecznie bliska zeru" wartość liczbowa. Może być ujemna lub dodatnia. Domyślnie `1e-7` czyli $10^{-7}$.

Na podstawie tych parametrów klasa tworzy obiekt wywoływalny przybliżający pochodną `f`.

In [29]:
class Pochodna:
    
    def __init__(self, f, h=1e-7):
        self.f = f
        self.h = h
    
    def __call__(self, x):
        f, h = self.f, self.h
        return (f(x + h) - f(x)) / h

Różniczkujemy instancje klasy `FunkcjaLiniowa`.

In [30]:
f = FunkcjaLiniowa(2, 3)
print(f)

y = 2*x + 3


In [31]:
df = Pochodna(f)

df(0)

2.0000000011677344

In [32]:
df = Pochodna(f, h=-1e-10)

df(0)

2.000000165480742

Rożniczkujemy funkcję kwadratową ...

In [33]:
def kwadratowa(x):
    return x * x

dkwadratowa = Pochodna(kwadratowa)

print('{:>3}|{:>7}|{:>18}'.format('x', '2*x', 'obliczona pochodna'))
print('{:-<32}'.format('-'))

for x in range(-3, 4):
    print('{:>3}|{:>7}|{:>18.5f}'.format(x, 2 * x, dkwadratowa(x)))

  x|    2*x|obliczona pochodna
--------------------------------
 -3|     -6|          -6.00000
 -2|     -4|          -4.00000
 -1|     -2|          -2.00000
  0|      0|           0.00000
  1|      2|           2.00000
  2|      4|           4.00000
  3|      6|           6.00000


... i funkcje trygonometryczne.

In [34]:
from math import sin, cos, pi

dsin = Pochodna(sin)

print('{:>7}|{:>7}|{:>18}'.format('x', 'cos(x)', 'obliczona pochodna'))
print('{:-<35}'.format('-'))

for x in [0, pi / 2, pi, 3*pi / 2]:
    print('{:>7.3f}|{:>7.3f}|{:>18.3f}'.format(x, cos(x), dsin(x)))

      x| cos(x)|obliczona pochodna
-----------------------------------
  0.000|  1.000|             1.000
  1.571|  0.000|            -0.000
  3.142| -1.000|            -1.000
  4.712| -0.000|             0.000


Zrobimy trochę rysunków.

In [35]:
from matplotlib import pyplot as plt
import numpy as np
%matplotlib inline

In [36]:
# Reset ustawień
import matplotlib as mpl
mpl.rcParams.update(mpl.rcParamsDefault)

Narysujemy wykres $y=x^3-2x$ i jej pochodnej na przedziale $\langle -2, 2\rangle$.

In [37]:
iksy = np.linspace(-2, 2, 100)

f = lambda x: x**3 - 2*x
df = Pochodna(f)

In [38]:
plt.close('all')
plt.style.use('seaborn-poster')
plt.figure(figsize=(5, 5))
plt.plot(iksy, f(iksy), label='f')
plt.plot(iksy, df(iksy), label='df')
plt.grid(ls=':'); plt.legend();

Wiemy, że wartość bezwzględna $y=|x|$ nie jest różniczkowalna w punkcie $x_0=0$.

Klasa `Pochodna` ułatwia zrozumienie dlaczego tak jest.

In [39]:
iksy = np.linspace(-2, 2, 100)

f = lambda x: abs(x)
df = Pochodna(f)

In [40]:
plt.close('all')
plt.style.use('seaborn-poster')
plt.figure(figsize=(5, 5))
plt.plot(iksy, f(iksy), label='f')
plt.plot(iksy, df(iksy), label='df')
plt.grid(ls=':'); plt.legend();

## Spis kontaktów

Chcemy napisać klasę `SpisKontaktów` tworzącą spisy znajomych z ich danymi kontaktowymi.
Przyjmujemy, że osoba w spisie musi deklarować się imieniem i nazwiskiem  i danymi opcjonalnymi:
* telefon stacjonarny,
* telefon komórkowy,
* adres email.

Dane opcjonalne mogą być później modyfikowane.

## Klasa `Osoba`
Krokiem pośrednim jest napisanie klasy `Osoba`. Obiekty tworzone przez tę klasę mają definiować pojedyncze osoby.

In [41]:
class Osoba:
    
    def __init__(self, imię_nazwisko, stacjonarny='', komórka='', email=''):
        self.imię_nazwisko = imię_nazwisko
        self.stacjonarny = stacjonarny
        self.komórka = komórka
        self.email = email
    
    def ustaw_stacjonarny(self, numer):
        self.stacjonarny = stacjonarny
    
    def ustaw_komórkowy(self, numer):
        self.komórka = numer
    
    def ustaw_email(self, adres):
        self.email = adres
        
    def __str__(self):
        s = '{}\n'.format(self.imię_nazwisko)
        s += 'Tel. stacjonarny: {}\n'.format(self.stacjonarny)
        s += 'Tel. komórkowy: {}\n'.format(self.komórka)
        s += 'email: {}'.format(self.email)
        return s

Przykład użycia.

In [42]:
jan_kowalski = Osoba(imię_nazwisko='Jan Kowalski',
                     stacjonarny='123456789',
                     email='abc@domena.pl')

In [43]:
print(jan_kowalski)

Jan Kowalski
Tel. stacjonarny: 123456789
Tel. komórkowy: 
email: abc@domena.pl


In [44]:
jan_kowalski.ustaw_komórkowy(700700700)
jan_kowalski.ustaw_email('monty_python@bbc.co.uk')
print(jan_kowalski)

Jan Kowalski
Tel. stacjonarny: 123456789
Tel. komórkowy: 700700700
email: monty_python@bbc.co.uk


## `SpisKontaktów` -- wersja 1.0
W klasie `SpisKontaktów` kontakty przechowujemy w słowniku `self._kontakty` jako pary 
```python
imię_nazwisko: osoba
```
Wartość `osoba` jest instancją klasy `Osoba`.

In [45]:
class SpisKontaktów:
    
    def __init__(self):
        self._kontakty = {}
        
    def __str__(self):
        s = '\n\n'.join(str(osoba) for _, osoba in self._kontakty.items())
        return s
    
    def __call__(self, imię_nazwisko):
        return self._kontakty[imię_nazwisko]
    
    def dodaj(self, imię_nazwisko, stacjonarny='', komórka='', email=''):
        osoba = Osoba(imię_nazwisko, stacjonarny, komórka, email)
        self._kontakty[imię_nazwisko] = osoba

Przykład użycia.

In [46]:
mój_spis = SpisKontaktów()

mój_spis.dodaj('John Cleese', stacjonarny=123456789, email='jc@bbc.co.uk')
mój_spis.dodaj('Michael Palin', komórka=500500500, email='mp@bbc.co.uk')

print(mój_spis)

John Cleese
Tel. stacjonarny: 123456789
Tel. komórkowy: 
email: jc@bbc.co.uk

Michael Palin
Tel. stacjonarny: 
Tel. komórkowy: 500500500
email: mp@bbc.co.uk


Modyfikacja kontaktu.

In [47]:
jc = mój_spis('John Cleese')
jc.ustaw_komórkowy(200200200)

In [48]:
print(mój_spis)

John Cleese
Tel. stacjonarny: 123456789
Tel. komórkowy: 200200200
email: jc@bbc.co.uk

Michael Palin
Tel. stacjonarny: 
Tel. komórkowy: 500500500
email: mp@bbc.co.uk


## `__len__(self)`

* Zwraca nieujemną liczbę całkowitą, która reprezentuje liczbę elementów w obiekcie.
* Metodę `__len__()` wywołują:
  * funkcja `len()`;
  * funkcja `bool()` jeśli obiekt nie implementuje metody `__bool__()`. Zwraca wówczas `True / False`, gdy `__len__()` zwraca wartość dodatnią / zero.

## `SpisKontaktów` -- wersja 1.1
Dopisujemy metodę `__len__()`. 

In [49]:
class SpisKontaktów:
    
    def __init__(self):
        self._kontakty = {}
        
    def __str__(self):
        s = '\n\n'.join(str(osoba) for _, osoba in self._kontakty.items())
        return s
    
    def __call__(self, imię_nazwisko):
        return self._kontakty[imię_nazwisko]
    
    def __len__(self):
        return len(self._kontakty)
    
    def dodaj(self, imię_nazwisko, stacjonarny='', komórka='', email=''):
        osoba = Osoba(imię_nazwisko, stacjonarny, komórka, email)
        self._kontakty[imię_nazwisko] = osoba

Przykład użycia.

In [50]:
mój_spis = SpisKontaktów()

mój_spis.dodaj('John Cleese', stacjonarny=123456789, email='jc@bbc.co.uk')
mój_spis.dodaj('Michael Palin', komórka=500500500, email='mp@bbc.co.uk')

print(mój_spis)

John Cleese
Tel. stacjonarny: 123456789
Tel. komórkowy: 
email: jc@bbc.co.uk

Michael Palin
Tel. stacjonarny: 
Tel. komórkowy: 500500500
email: mp@bbc.co.uk


In [51]:
len(mój_spis)

2

In [52]:
bool(mój_spis)

True

In [53]:
inny_spis = SpisKontaktów()

len(inny_spis)

0

In [54]:
bool(inny_spis)

False

In [55]:
if inny_spis:
    print('Jest niepusty.')
else:
    print('Jest pusty.')

Jest pusty.


In [56]:
if mój_spis:
    print('Jest niepusty.')
else:
    print('Jest pusty.')

Jest niepusty.


## `__contains__(self, element)`

* Zwraca `True / False` w zależności od tego, czy `element` jest elementem `self`.
* Metoda `__contains__()` [**przeładowuje**](https://pl.wikipedia.org/wiki/Przeci%C4%85%C5%BCanie_operator%C3%B3w) operator [**infiksowy**](https://pl.wikipedia.org/wiki/Notacja_infiksowa) `in`.

## `SpisKontaktów` -- wersja 1.2
Dopisujemy metodę `__contains__()`. 

In [57]:
class SpisKontaktów:
    
    def __init__(self):
        self._kontakty = {}
        
    def __str__(self):
        s = '\n\n'.join(str(osoba) for _, osoba in self._kontakty.items())
        return s
    
    def __call__(self, imię_nazwisko):
        return self._kontakty[imię_nazwisko]
    
    def __len__(self):
        return len(self._kontakty)
    
    def __contains__(self, element):
        return element in self._kontakty
    
    def dodaj(self, imię_nazwisko, stacjonarny='', komórka='', email=''):
        osoba = Osoba(imię_nazwisko, stacjonarny, komórka, email)
        self._kontakty[imię_nazwisko] = osoba

Przykład użycia.

In [58]:
mój_spis = SpisKontaktów()

mój_spis.dodaj('John Cleese', stacjonarny=123456789, email='jc@bbc.co.uk')
mój_spis.dodaj('Michael Palin', komórka=500500500, email='mp@bbc.co.uk')

print(mój_spis)

John Cleese
Tel. stacjonarny: 123456789
Tel. komórkowy: 
email: jc@bbc.co.uk

Michael Palin
Tel. stacjonarny: 
Tel. komórkowy: 500500500
email: mp@bbc.co.uk


In [59]:
'John Cleese' in mój_spis

True

In [60]:
'Terry Gilliam' in mój_spis

False

## Do poczytania

[http://www.diveintopython3.net/special-method-names.html](http://www.diveintopython3.net/special-method-names.html)

[https://docs.python.org/3/reference/datamodel.html#special-method-names](https://docs.python.org/3/reference/datamodel.html#special-method-names)

[https://stackoverflow.com/questions/1436703/difference-between-str-and-repr-in-python](https://stackoverflow.com/questions/1436703/difference-between-str-and-repr-in-python)