# Python: Pętle zagnieżdżone - Zadania

## Loop Nested Mean

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Odseparuj nagłówek od danych
1. Wylicz średnią wartość `Sepal length`

Output:
```python
result: float
# 5.911111111111111
```

In [1]:
DATA = [
    ('Sepal length', 'Sepal width', 'Petal length', 'Petal width', 'Species'),
    (5.8, 2.7, 5.1, 1.9, 'virginica'),
    (5.1, 3.5, 1.4, 0.2, 'setosa'),
    (5.7, 2.8, 4.1, 1.3, 'versicolor'),
    (6.3, 2.9, 5.6, 1.8, 'virginica'),
    (6.4, 3.2, 4.5, 1.5, 'versicolor'),
    (4.7, 3.2, 1.3, 0.2, 'setosa'),
    (7.0, 3.2, 4.7, 1.4, 'versicolor'),
    (7.6, 3.0, 6.6, 2.1, 'virginica'),
    (4.6, 3.1, 1.5, 0.2, 'setosa'),
]

In [5]:
header, *data = DATA

result = []

for sepal_length, *_ in data:
    result.append(sepal_length)
    
result = sum(result) / len(result)
result

5.911111111111111

## Loop Nested Unique Keys

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Zbierz klucze z wszystkich wierszy w jednej sekwencji ``result``
1. Posortuj ``result``
1. Wypisz unikalne klucze
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)

Output:
```python
Petal length
Petal width
Sepal length
Sepal width
Species
```

Podpowiedź:
* ``row.keys()``

In [6]:
DATA = [
    {'Sepal length': 5.1, 'Sepal width': 3.5, 'Species': 'setosa'},
    {'Petal length': 4.1, 'Petal width': 1.3, 'Species': 'versicolor'},
    {'Sepal length': 6.3, 'Petal width': 1.8, 'Species': 'virginica'},
    {'Sepal length': 5.0, 'Petal width': 0.2, 'Species': 'setosa'},
    {'Sepal width': 2.8, 'Petal length': 4.1, 'Species': 'versicolor'},
    {'Sepal width': 2.9, 'Petal width': 1.8, 'Species': 'virginica'},
]

In [12]:
%%timeit -r 10 -n 100_000

result = set()

for row in DATA:
    result.update(row.keys())
    
result

5.68 µs ± 219 ns per loop (mean ± std. dev. of 10 runs, 100000 loops each)


In [13]:
%%timeit -r 10 -n 100_000

result = set()

for row in DATA:
    for key in row.keys():
        result.add(key)
    
result

5.76 µs ± 216 ns per loop (mean ± std. dev. of 10 runs, 100000 loops each)


In [14]:
%%timeit -r 10 -n 100_000

result = list()


for row in DATA:
    for key in row.keys():
        if key not in result:
            result.append(key)
            
result

6.05 µs ± 66.6 ns per loop (mean ± std. dev. of 10 runs, 100000 loops each)


In [15]:
%%timeit -r 10 -n 100_000

result = list()


for row in DATA:
    for key in row.keys():
        result.append(key)
            
set(result)

6.74 µs ± 125 ns per loop (mean ± std. dev. of 10 runs, 100000 loops each)


## Loop Unpacking Endswith

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Odseparuj nagłówek od danych
1. Iterując po danych rozpakuj wiersz do ``*features`` oraz ``label``
1. Wypisz nazwy gatunków kończące się na "ca" lub "osa"

Podpowiedź:
* ``str.endswith()``
* ``set.pop()``
* ``isinstance`` or ``type``

In [17]:
DATA = [
    ('Sepal length', 'Sepal width', 'Petal length', 'Petal width', 'Species'),
    (5.8, 2.7, 5.1, 1.9, {'virginica'}),
    (5.1, 3.5, 1.4, 0.2, {'setosa'}),
    (5.7, 2.8, 4.1, 1.3, {'versicolor'}),
    (6.3, 2.9, 5.6, 1.8, {'virginica'}),
    (6.4, 3.2, 4.5, 1.5, {'versicolor'}),
    (4.7, 3.2, 1.3, 0.2, {'setosa'}),
    (7.0, 3.2, 4.7, 1.4, {'versicolor'}),
    (7.6, 3.0, 6.6, 2.1, {'virginica'}),
    (4.6, 3.1, 1.5, 0.2, {'setosa'}),
]

In [18]:
header, *data = DATA

for *features, label in data:
    gatunek = label.pop()
    
    if gatunek.endswith(('ca', 'osa')):
        print(gatunek)

virginica
setosa
virginica
setosa
virginica
setosa


## Loop Dict from Dict to Dict

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Przekonwertuj do ``result: Dict[str, str]``
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)

Output:
```python
result: Dict[str, str]
# {'Doctorate': '6',
#  'Prof-school': '6',
#  'Masters': '5',
#  'Bachelor': '5',
#  'Engineer': '5',
#  'HS-grad': '4',
#  'Junior High': '3',
#  'Primary School': '2',
#  'Kindergarten': '1'}
```

In [24]:
DATA = {
    6: ['Doctorate', 'Prof-school'],
    5: ['Masters', 'Bachelor', 'Engineer'],
    4: ['HS-grad'],
    3: ['Junior High'],
    2: ['Primary School'],
    1: ['Kindergarten'],
}

In [26]:
result = {}

for idx, titles in DATA.items():
    for title in titles:
        result[title] = str(idx)
        
result

{'Doctorate': '6',
 'Prof-school': '6',
 'Masters': '5',
 'Bachelor': '5',
 'Engineer': '5',
 'HS-grad': '4',
 'Junior High': '3',
 'Primary School': '2',
 'Kindergarten': '1'}

## Loop Dict from List to Dict

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Odseparuj nagłówek od danych
1. Wypisz ``List[dict]``:

    * klucz: nazwa z nagłówka
    * wartość: wyniki pomiarów lub gatunek

1. Porównaj wyniki z sekcją "Output" (patrz poniżej)

Output:
```python
result: List[dict]
# [{'Sepal length': 5.8,
#   'Sepal width': 2.7,
#   'Petal length': 5.1,
#   'Petal width': 1.9,
#   'Species': 'virginica'},
#  {'Sepal length': 5.1,
#   'Sepal width': 3.5,
#   'Petal length': 1.4,
#   'Petal width': 0.2,
#   'Species': 'setosa'},
#  ...]
```

In [27]:
DATA = [
    ('Sepal length', 'Sepal width', 'Petal length', 'Petal width', 'Species'),
    (5.8, 2.7, 5.1, 1.9, 'virginica'),
    (5.1, 3.5, 1.4, 0.2, 'setosa'),
    (5.7, 2.8, 4.1, 1.3, 'versicolor'),
    (6.3, 2.9, 5.6, 1.8, 'virginica'),
    (6.4, 3.2, 4.5, 1.5, 'versicolor'),
    (4.7, 3.2, 1.3, 0.2, 'setosa'),
    (7.0, 3.2, 4.7, 1.4, 'versicolor'),
    (7.6, 3.0, 6.6, 2.1, 'virginica'),
    (4.9, 3.0, 1.4, 0.2, 'setosa'),
    (4.9, 2.5, 4.5, 1.7, 'virginica'),
    (7.1, 3.0, 5.9, 2.1, 'virginica'),
    (4.6, 3.4, 1.4, 0.3, 'setosa'),
    (5.4, 3.9, 1.7, 0.4, 'setosa'),
    (5.7, 2.8, 4.5, 1.3, 'versicolor'),
    (5.0, 3.6, 1.4, 0.3, 'setosa'),
    (5.5, 2.3, 4.0, 1.3, 'versicolor'),
    (6.5, 3.0, 5.8, 2.2, 'virginica'),
    (6.5, 2.8, 4.6, 1.5, 'versicolor'),
    (6.3, 3.3, 6.0, 2.5, 'virginica'),
    (6.9, 3.1, 4.9, 1.5, 'versicolor'),
    (4.6, 3.1, 1.5, 0.2, 'setosa'),
]

In [29]:
header, *data = DATA
result = []

for row in data:
    pary = zip(header, row)
    result.append(dict(pary))
    
result

[{'Sepal length': 5.8,
  'Sepal width': 2.7,
  'Petal length': 5.1,
  'Petal width': 1.9,
  'Species': 'virginica'},
 {'Sepal length': 5.1,
  'Sepal width': 3.5,
  'Petal length': 1.4,
  'Petal width': 0.2,
  'Species': 'setosa'},
 {'Sepal length': 5.7,
  'Sepal width': 2.8,
  'Petal length': 4.1,
  'Petal width': 1.3,
  'Species': 'versicolor'},
 {'Sepal length': 6.3,
  'Sepal width': 2.9,
  'Petal length': 5.6,
  'Petal width': 1.8,
  'Species': 'virginica'},
 {'Sepal length': 6.4,
  'Sepal width': 3.2,
  'Petal length': 4.5,
  'Petal width': 1.5,
  'Species': 'versicolor'},
 {'Sepal length': 4.7,
  'Sepal width': 3.2,
  'Petal length': 1.3,
  'Petal width': 0.2,
  'Species': 'setosa'},
 {'Sepal length': 7.0,
  'Sepal width': 3.2,
  'Petal length': 4.7,
  'Petal width': 1.4,
  'Species': 'versicolor'},
 {'Sepal length': 7.6,
  'Sepal width': 3.0,
  'Petal length': 6.6,
  'Petal width': 2.1,
  'Species': 'virginica'},
 {'Sepal length': 4.9,
  'Sepal width': 3.0,
  'Petal length': 1.4,

## Loop Dict Label Encoder

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Zdefiniuj:

    * ``features: List[tuple]`` - pomiary
    * ``labels: List[int]`` - gatunki
    * ``label_encoder: Dict[int, str]`` - słownik zakodowanych (jako cyfry) nazw gatunków

1. Odseparuj nagłówek od danych
1. Aby móc zakodować i odkodować ``labels`` (gatunki) potrzebny jest ``label_encoder: Dict[int, str]``:

    * key - identyfikator (kolejna liczba rzeczywista)
    * value - nazwa gatunku

1. ``label_encoder`` musi być wygenerowany z ``DATA``
1. Dla każdego wiersza dodawaj odpowiednie dane do ``feature``, ``labels`` i ``label_encoder``
1. Wypisz ``feature``, ``labels`` i ``label_encoder``
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)

Output:
```python
features: List[tuple]
# [(5.8, 2.7, 5.1, 1.9),
#  (5.1, 3.5, 1.4, 0.2),
#  (5.7, 2.8, 4.1, 1.3),
#  (6.3, 2.9, 5.6, 1.8),
#  (6.4, 3.2, 4.5, 1.5),
#  (4.7, 3.2, 1.3, 0.2), ...]

labels: List[int]
# [0, 1, 2, 0, 2, 1, 2, 0, 1, 0, 0, 1, 1, 2, 1, 2, 0, 2, 0, 2, 1]

label_encoder: Dict[int, str]
# {0: 'virginica',
#  1: 'setosa',
#  2: 'versicolor'}
```

In [30]:
DATA = [
    ('Sepal length', 'Sepal width', 'Petal length', 'Petal width', 'Species'),
    (5.8, 2.7, 5.1, 1.9, 'virginica'),
    (5.1, 3.5, 1.4, 0.2, 'setosa'),
    (5.7, 2.8, 4.1, 1.3, 'versicolor'),
    (6.3, 2.9, 5.6, 1.8, 'virginica'),
    (6.4, 3.2, 4.5, 1.5, 'versicolor'),
    (4.7, 3.2, 1.3, 0.2, 'setosa'),
    (7.0, 3.2, 4.7, 1.4, 'versicolor'),
    (7.6, 3.0, 6.6, 2.1, 'virginica'),
    (4.9, 3.0, 1.4, 0.2, 'setosa'),
    (4.9, 2.5, 4.5, 1.7, 'virginica'),
    (7.1, 3.0, 5.9, 2.1, 'virginica'),
    (4.6, 3.4, 1.4, 0.3, 'setosa'),
    (5.4, 3.9, 1.7, 0.4, 'setosa'),
    (5.7, 2.8, 4.5, 1.3, 'versicolor'),
    (5.0, 3.6, 1.4, 0.3, 'setosa'),
    (5.5, 2.3, 4.0, 1.3, 'versicolor'),
    (6.5, 3.0, 5.8, 2.2, 'virginica'),
    (6.5, 2.8, 4.6, 1.5, 'versicolor'),
    (6.3, 3.3, 6.0, 2.5, 'virginica'),
    (6.9, 3.1, 4.9, 1.5, 'versicolor'),
    (4.6, 3.1, 1.5, 0.2, 'setosa'),
]

In [53]:
header, *data = DATA

features = []
labels = []
label_encoder = {}
tmp = {}
i = 0

for *X,y in data:
    if y not in tmp:
        tmp[y] = i
        i += 1
    
    labels.append(tmp[y])
    features.append(tuple(X))

    
for key, value in tmp.items():
    label_encoder[value] = key

[0, 1, 2, 0, 2, 1, 2, 0, 1, 0, 0, 1, 1, 2, 1, 2, 0, 2, 0, 2, 1]

In [61]:
header, *data = DATA

features = []
labels = []
label_encoder = {}


for *X,y in data:
    if y not in label_encoder:
        label_encoder[y] = len(label_encoder)
    
    labels.append(label_encoder[y])
    features.append(tuple(X))

    
label_encoder = {v:k for k,v in label_encoder.items()}

In [62]:
features

[(5.8, 2.7, 5.1, 1.9),
 (5.1, 3.5, 1.4, 0.2),
 (5.7, 2.8, 4.1, 1.3),
 (6.3, 2.9, 5.6, 1.8),
 (6.4, 3.2, 4.5, 1.5),
 (4.7, 3.2, 1.3, 0.2),
 (7.0, 3.2, 4.7, 1.4),
 (7.6, 3.0, 6.6, 2.1),
 (4.9, 3.0, 1.4, 0.2),
 (4.9, 2.5, 4.5, 1.7),
 (7.1, 3.0, 5.9, 2.1),
 (4.6, 3.4, 1.4, 0.3),
 (5.4, 3.9, 1.7, 0.4),
 (5.7, 2.8, 4.5, 1.3),
 (5.0, 3.6, 1.4, 0.3),
 (5.5, 2.3, 4.0, 1.3),
 (6.5, 3.0, 5.8, 2.2),
 (6.5, 2.8, 4.6, 1.5),
 (6.3, 3.3, 6.0, 2.5),
 (6.9, 3.1, 4.9, 1.5),
 (4.6, 3.1, 1.5, 0.2)]

In [63]:
labels

[0, 1, 2, 0, 2, 1, 2, 0, 1, 0, 0, 1, 1, 2, 1, 2, 0, 2, 0, 2, 1]

In [64]:
label_encoder

{0: 'virginica', 1: 'setosa', 2: 'versicolor'}