# Podstawy Pythona dla Data Science

Dokument Google:
https://docs.google.com/document/d/1yIMsPvdwMJz_AzbmUM6wEQqOTB56oWLMzw2Tj6vAyBk/edit?usp=sharing

Folder na korpusy:
https://drive.google.com/drive/folders/1izfbjGyRKOCn55oewkktmCWcIN-85f-u?usp=sharing

## Listy
Listy to kolekcje elementów. Tymi elementami mogą być liczby całkowite, liczby zmiennoprzecinkowe, łańcuchy znaków i ogólnie obiekty. Możesz też łączyć elementy różnych typów.

Aby utworzyć listę, możesz zastosować nawiasy kwadratowe `[]` albo konstruktor `list()`

In [ ]:
a_list = [1, 2.3, 'a', True]
an_empty_list = list()

In [ ]:
print(a_list)

[1, 2.3, 'a', True]


In [ ]:
an_empty_list

[]

W celu uzyskania dostępu do _i_-tego elementu zastosuj notacje `[]`

__Uwaga__: Pamiętaj, że listy są indeksowane od zera. Pierwszy element znajduje się na pozycji zerowej.

In [ ]:
a_list

[1, 2.5, 'a', True]

In [ ]:
a_list[1] = 2.5
a_list

[1, 2.5, 'a', True]

Wycinki list można pobierać, podając punkty początkowy i końcowy. Punkt końcowy nie jest dodawany do wynikowego wycinka.

In [ ]:
a_list[::2]

[1, 'a']

Możesz też pobierać wycinki z lukami. Służy do tego notacja `początek:koniec:skok`. W ten sposób pobierzesz elementy z pozycji będących wielokrotnością wartości `skok`.

In [ ]:
a_list[::2]

[1, 'a']

In [ ]:
a_list[::-1]

[True, 'a', 2.5, 1]

W celu dodania elementu na koniec listy możesz posłużyć się metodą `append()`.

In [ ]:
a_list.append('inny_tekst')
a_list

[1, 2.5, 'a', True, 5, 'inny_tekst']

Aby pobrać długość listy, wywołaj funkcję `len()`.

In [ ]:
len(a_list)

6

In [ ]:
len("niech to będzie inny tekst")

26

W celu usunięcia elementu zastosuj instrukcję `del`

In [ ]:
del a_list[0]

In [ ]:
a_list

[2.5, 'a', True, 5, 'inny_tekst']

Aby scalić dwie listy, zastosuj operator `+`.

In [ ]:
a_list += [1, 'b']

In [ ]:
a_list = a_list + ['2', True]

In [ ]:
a_list += ['i', 'a']

In [ ]:
len(a_list)

9

Możesz też "wypakować" zawartość listy, przypisując ją do listy (lub sekwencji) zmiennych zamiast do jednej zmiennej.

In [ ]:
a, b, c, d, e, f, g, h, i = [2.5, 'a', True, 5, 'inny_tekst', '2', True, 'i', 'a']

In [ ]:
a_list

[2.5, 'a', True, 5, 'inny_tekst', '2', True, 'i', 'a']

In [ ]:
h

'i'

In [ ]:
len("tekst")

5

In [ ]:
"tekst drugie słowo trzecie".split()

['tekst', 'drugie', 'słowo', 'trzecie']

Pamiętaj, że listy to modyfikowalne struktury danych. Możesz w dowolnym momencie dodawać, usuwać i modyfikować elementy. Listy niemodyfikowalne do krotki, które są zapisywane za pomocą zwykłych nawiasów `()` (dla list używane są nawiasy kwadratowe `[]`).

In [ ]:
tuple(a_list)

(2.5, 'a', True, 5, 'inny_tekst', '2', True, 'i', 'a')

In [ ]:
tuple([3, 4, 5])

(3, 4, 5)

## Słowniki
Słowniki to tablice, w których za pomocą __kluczy__ powiązanych z __wartościami__ można bardzo szybko wyszukiwać dane. Posługiwanie się słownikami przypomina używanie indeksu książki w celu przejścia bezpośrednio do szukanych informacji. Klucze i wartości mogą należeć do różnych typów danych. Jedynym wymogiem dotyczącym kluczy jest możliwość i haszowania. Jest to dość skomplikowane zagadnienie. Zapamiętaj tylko, aby stosować możliwie proste klucze - nie używaj jako kluczy słowników lub list.

W celu stworzenia słownika stosujemy nawiasy klamrowe `{}`:

In [ ]:
b_dict = {1: 1, '2': '2', 3.0: 30}

In [ ]:
b_dict

{1: 1, '2': '2', 3.0: 30}

Aby uzyskać dostęp do wartości, której indeksem jest klucz `k`, zastosuj notację `[]`

In [ ]:
b_dict['2']

'2'

W celu wstawienia lub zmiany wartości danego klucza też posłuż się notacją `[]`

In [ ]:
b_dict['2'] = '2.0'

In [ ]:
b_dict['a'] = 'ab'

W celu pobrania liczby elementów słownika zastosuj funkcję `len()`

In [ ]:
len(b_dict)

4

Do usuwania elementów służy funkcja `del`, po której należy podać kasowany element.

In [ ]:
del b_dict[3.0]

Pamiętaj, że słowniki (podobnie jak listy) są modyfikowalnymi strukturami danych. Pamiętaj też, że jeśli spróbujesz uzyskać dostęp do elementu, którego klucz nie istnieje, zgłoszony zostanie wyjątek `KeyError`:

In [ ]:
b_dict['a_key']

KeyError: 'a_key'

Oczywistym rozwiązaniem jest każdorazowe sprawdzanie, czy w słowniku znajduje się element o określonym kluczu:

In [ ]:
if 'a_key' in b_dict:
    print(b_dict['a_key'])
else:
    print('Klucz nie występuje w słowniku')

Klucz nie występuje w słowniku


Inną możliwością jest użycie metody `.get()`. Jeśli podany klucz znajduje się w słowniku, zwraca ona powiązaną wartość. W przeciwnym razie zwracana jest wartość `None`.

Możesz też zastosować strukturę danych `defaultdict` z modułu `collections`, która nigdy nie zgłasza wyjątku `KeyError`, ponieważ jej instancja jest tworzona za pomocą funkcji bezargumentowej. Jeśli zażądasz wartości dla nieistniejącego klucza, struktura ta zwróci wartość domyślną.

In [ ]:
from collections import defaultdict
c_dict = defaultdict(lambda: 'empty')
c_dict['c_key']

'empty'

Funkcję domyślną używaną przez strukturę `defaultdict` można zdefiniować za pomocą instrukcji `def` lub `lambda`. Instrukcje te omawiamy w następnym rozdziale.

## Funkcje

Funkcje to zbiory instrukcji, które zwykle przyjmują określone dane wejściowe i na ich podstawie zwracają zbiór danych wyjściowych.

Możesz definiować proste funkcje o następującej postaci:

In [ ]:
def half(x):
    return x / 2.0

In [ ]:
half(4)

2.0

Funkcje pozwalają łączyć zbiory powtarzalnych procedur i formalnie zapisywać dane wejściowe oraz wyjściowe. Dzięki temu obliczenia z funkcji nie zakłócają w żaden sposób przebiegu głównego programu. Jeśli zmienne używane w funkcji nie są zadeklarowane jako globalne, zostają usunięte po zakłóceniu jej działania, a program otrzymuje tylko dane zwracane w poleceniu return.

## Wyjątki
Wyjątki i błędy są ściśle powiązanymi, ale jednak różnymi rzeczami. Wyjątek można płynnie obsłużyć. Oto przykłady ilustrujące wyjątki:

In [ ]:
0/0

ZeroDivisionError: division by zero

In [ ]:
len(1, 2)

TypeError: len() takes exactly one argument (2 given)

In [ ]:
pi * 2

NameError: name 'pi' is not defined

W tych fragmentach zgłaszane są trzy różne wyjątki (widoczne w ostatnim wierszu każdego bloku). Na potrzeby obsługi wyjątków możesz zastosować blok `try-except` w pokazany poniżej sposób:

In [ ]:
try:
    a = 10/0
except ZeroDivisionError:
    a = 0

## Iteratory i generatory
Przetwarzanie kolejnych elementów list i słowników jest bardzo łatwe. Zauważ, że w przypadku słowników iteracja odbywa się na podstawie kluczy. Ilustruje to następujący przykład:

In [ ]:
for entry in ['alpha', 'bravo', 'charlie', 'delta']:
    print(entry)

alpha
bravo
charlie
delta


In [ ]:
a_dict = {
    1: 'alpha',
    2: 'bravo',
    3: 'charlie',
    4: 'delta'
}

In [ ]:
for key in a_dict:
    print(key, a_dict[key])

1 alpha
2 bravo
3 charlie
4 delta


Jeśli natomiast chcesz iteracyjnie przetwarzać sekwencje lub generować obikety "w locie", możesz zastosować generator. Zaletą tego podejścia jest to, że nie musisz wcześniej tworzyć i zapisywać kompletnych sekwencji. Zamiast tego obikety są tworozne przy każdym wywołaniu generatora. W ramach przykładu utworzymy generator sekwencji liczb, który nie wymaga wcześniejszego zapisywania kompletnej liczby:

In [ ]:
def incrementor():
    i = 0
    while i < 5:
        yield i
        i += 1

In [ ]:
for i in incrementor():
    print(i)

0
1
2
3
4


## Instrukcje warunkowe
Instrukcje warunkowe są często stosowane w nauce o danych, ponieważ pozwalają rozgałęziać program. Najczęściej używana z nich jest instrukcja `if`. Działa ona podobnie jak w innych językach programowania. Oto przykład:

In [ ]:
def is_positive(val):
    if val < 0:
        print('Wartość jest ujemna')
    elif val > 0:
        print('Wartość jest dodatnia')
    else:
        print('Wartość wynosi dokładnie zero!')

In [ ]:
is_positive(-1)

Wartość jest ujemna


Pierwszy warunek jest sprawdzany za pomocą instrukcji `if`. Jeśli występują inne warunki, są sprawdzane za pomocą instrukcji `elif` (to skrót od "else if"). Domyślne działanie kodu można podać w w bloku `else`.