# Analiza, inżynieria i wizualizacja danych z NumPy, Pandas i Matplotlib
W tym notatnku znajdują się zadania części praktycznej prezentacji. Wykonanie zadań jest możliwe w Google Colab. Wszelkie potrzebne materiały można pobrać z repozytorium GitHub: https://github.com/bingoobongoo/jpwp_projekt. Odpowiedzi do niektórych zadań należy przesłać na platformę **UPEL**. Zadanie te będą specjalnie oznaczone, wystarczy skopiować wynik i przesłać w odpowiedniej zakładce. Rozwiązania zadań można znaleźć w pliku ***answers.py*** znajdującym się w folderze *notebooks*.

Linki do dokumentacji modułów:

* **Pandas**: https://pandas.pydata.org/docs/
* **NumPy**: https://numpy.org/doc/stable/reference/index.html#reference
* **Matplotlib**: https://matplotlib.org/stable/api/index

## Skróty klawiszowe
Do sprawnej pracy w Google Colab warto korzystać z ułatwiających życie skrótów klawiszowych, najważniejsze z nich wymieniono poniżej:

* `Ctrl + M + B` - dodanie nowej komórki poniżej aktualnie zaznaczonej
* `Ctrl + M + A` - dodanie nowej komórki powyżej aktualnie zaznaczonej
* `Ctrl + M + D` - usunięcie aktualnie zaznaczonej komórki
* `Ctrl + Enter` - uruchomienie aktualnie zaznaczonej komórki
* `Shift + Enter` - uruchomienie aktualnie zaznaczonej komórki i przejście do kolejnej
* `Ctrl + M + M` - zmienienie aktualnie zaznaczonej komórki na komórkę tekstową (markdown)
* `Ctrl + M + Y` - zmienienie aktualnie zaznaczonej komórki na komórkę kodu
* `Ctrl + M + .` - ponowne uruchomienie sesji Google Colab

## Możliwe do napotkania problemy
Google Colab oferuje darmowe korzystanie z chmury, czyli mocy obliczeniowej zdalnego serwera. Czasem z różnych powodów połączenie z serwerem może zostać przerwane. W takim wypadku należy ponownie nawiązać połączenie z serwerem poprzez przycisk **połącz** albo **połącz ponownie**. Niezbędne będzie także ponowne przesłanie plików z danymi i odpowiedziami znajdującymi się w folderze *data*. Zmiany wprowadzone w notebooku zostaną niezmienione, trzeba będzie jedynie uruchomić od początku wszystkie komórki aż do tej, gdzie ostatnio skończyliśmy.

## Sprawdzanie poprawności odpowiedzi
Pod każdym zadaniem (z wyjątkiem zadań na UPEL) będzie funkcja sprawdzająca poprawność odpowiedzi. Obiekt zawierający odpowiedź do zadania należy zapisać do odpowiednio nazwanej zmiennej, a następnie uruchomić komórkę sprawdzającą. Opcjonalnie, jako drugi argument funkcji sprawdzającej można wpisać `True`, jeśli chcemy uzyskać podpowiedź do zadania.

# Zadania praktyczne
Zacznijmy od zaimportowania odpowienich bibliotek oraz pierwszego zestawu danych. W przypadku błędu przy importowaniu plików **.csv** sprawdź, czy są one przesłane do odpowieniego folderu w Google Colab.

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import answers as ans

In [2]:
pokemon_df = pd.read_csv('../data/pokemon.csv', index_col=0)

### I.
Zacznijmy od przyjrzenia się naszemu zestawowi danych. Wyświetl **10** pierwszych rzędów `pokemon_df` i zapisz je w zmiennej `first_ten`.

In [3]:
first_ten = pokemon_df.head(10)
first_ten

Unnamed: 0,Name,Type 1,Type 2,Total,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
0,Bulbasaur,Grass,Poison,318,45,49,49,65,65,45,1,False
1,Ivysaur,Grass,Poison,405,60,62,63,80,80,60,1,False
2,Charmander,Fire,,309,39,52,43,60,50,65,1,False
3,Charmeleon,Fire,,405,58,64,58,80,65,80,1,False
4,Squirtle,Water,,314,44,48,65,50,64,43,1,False
5,Wartortle,Water,,405,59,63,80,65,80,58,1,False
6,Caterpie,Bug,,195,45,30,35,20,20,45,1,False
7,Metapod,Bug,,205,50,20,55,25,25,30,1,False
8,Butterfree,Bug,Flying,395,60,45,50,90,80,70,1,False
9,Weedle,Bug,Poison,195,40,35,30,20,20,50,1,False


In [4]:
ans.zad_1(first_ten, True)

💡 Spróbuj użyć funckji head().
✓ Wynik poprawny!


### II.
Teraz wyświetl **5** ostatnich rzędów `pokemon_df` i zapisz je w zmiennej `last_five`.

In [5]:
last_five = pokemon_df.tail()
last_five

Unnamed: 0,Name,Type 1,Type 2,Total,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
650,Noibat,Flying,Dragon,245,40,30,35,45,40,55,6,False
651,Noivern,Flying,Dragon,535,85,70,80,97,80,123,6,False
652,Xerneas,Fairy,,680,126,131,95,131,98,99,6,True
653,Yveltal,Dark,Flying,680,126,131,95,131,98,99,6,True
654,Volcanion,Fire,Water,600,80,110,120,130,90,70,6,True


In [None]:
ans.zad_2(last_five, True)

### III.
Sprawdź, ile **wierszy** (rzędów) posiada `pokemon_df`, wyświetl tą liczbę i zapisz ją w zmiennej `rows_count`.

In [7]:
rows_count = pokemon_df.shape[0]
rows_count

655

In [None]:
ans.zad_3(rows_count, True)

### IV.
Teraz sprawdź liczbę **kolumn** w `pokemon_df`, wyświetl ją i zapisz w zmiennej `columns_count`.

In [8]:
columns_count = pokemon_df.shape[1]
columns_count

12

In [None]:
ans.zad_4(columns_count, True)

### V.
Wybierz kolumnę `Speed` w `pokemon_df`, zapisz ją w zmiennej `speed_col` i wyświetl wynik.

In [9]:
speed_col = pokemon_df['Speed']
speed_col

0       45
1       60
2       65
3       80
4       43
      ... 
650     55
651    123
652     99
653     99
654     70
Name: Speed, Length: 655, dtype: int64

In [None]:
ans.zad_5(speed_col, True)

### VI.
Wykorzystaj zmienną `speed_col` z poprzedniego zadania, znajdź jakiego **typu** jest ta zmienna i zapisz odpowiedż w nowej zmiennej `speed_dtype`.

***UWAGA***: Nie użwyaj funkcji `type()` z biblioteki standardowej Python, tylko wykorzystaj narzędzia bibliotek Pandas lub Numpy.

In [14]:
speed_dtype = speed_col.dtype
speed_dtype

dtype('int64')

In [None]:
name = speed_dtype.name
ans.zad_6(name, True)

### VII. (UPEL - Zadanie 1)
Ile kolumn w `pokemon_df` posiada typ `object`? Wykorzystaj dostępne narzędzia i funkcje, a w razie potrzeby skorzystaj z internetu żeby znaleźć odpowiedź. W UPEL w zakładce `Zadanie 1` prześlij **liczbę kolumn**, które posiadają wspomniany wcześniej typ danych.

In [18]:
(pokemon_df.dtypes == 'object').sum()

3

### VIII.
Znajdź, jaka jest maksymalna wartość w kolumnie `HP` w `pokemon_df`. Zapisz ją w zmiennej `max_hp` i wyświetl.

In [24]:
max_hp = pokemon_df['HP'].max()
max_hp

255

In [None]:
ans.zad_8(max_hp, True)

### IX.
Wyświetl rekord (wiersz) z `pokemon_df` odpowiadający pokemonowi, który posiada największą wartość `HP`, a także zapisz ten rekord w zmiennej `max_hp_pokemon`. Wykorzystaj wynik z poprzedniego zadania.

In [28]:
max_hp_pokemon = pokemon_df[pokemon_df['HP'] == max_hp]
max_hp_pokemon

Unnamed: 0,Name,Type 1,Type 2,Total,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
222,Blissey,Normal,,540,255,10,10,75,135,55,2,False


In [None]:
ans.zad_9(max_hp_pokemon, True)

### X.