# Krótkie wprowadzenie do wybranych elementów języka Python oraz bibliotek obliczeń inżynierskich

## Wstęp
Ten plik jest de facto plikiem `html`. Możecie otworzy go w notatniku i zobaczycie zwykłą, statyczną stronę. To, że
jego poszczególne sekcje możemy interpretowa jako kod, jest zasługą IPythona. Jupyter Notebook pozwala na 
**połączenie kodów źródłowych, ich opisów oraz wyników ich działania w jeden dokument**. Jest to jedno z najbardziej 
popularnych narzędzi w dziedzinie nauki o danych (ang. *data science*). Niemniej, polecam zapoznac się z przykładową
[ściągą](https://www.edureka.co/blog/wp-content/uploads/2018/10/Jupyter_Notebook_CheatSheet_Edureka.pdf) ze skrótami 
klawiaturowymi.

## Typy komórek
Każda komórka notatnika stanowi osobny edytor z kodem, który może zostać wykonany na żądanie. Wszystkie komórki w 
obrębie notatnika współdzielą przestrzeń nazw i pamięć. Ma to swoje wady i zalety. Mamy dwa typy komórek: 
- z kodem
- z tekstem

### Komórki z tekstem
Komórki z tekstem formatujemy według składni Markdown [tu szybka ściąga](https://enterprise.github.com/downloads/en/markdown-cheatsheet.pdf).
Ta komórka jest właśnie typu tekstowego.

### Komórki z kodem
Kod interpretowany jest według wybranego kernela. Jupyter pod względem podpowiadania składni zachowuje się podobnie jak 
terminal, tj. aby uzyska podpowiedź musimy nacisną tabulator. Mamy także dwa specjalne znaki, które zmianiają sposób
interpretowania linijki, w której są użyte, lub też całej komórki:

#### Funkcje magiczne
IPytnon, a zatem i bazujący na nim Jupyter Notebook posiada w swojej składni tzw. magiczne funkcje (nie mylic z 
magicznymi metodami języka Python, np. `self.__call__`). Aby z nich skorzystac musimy uży prefiksu `%` lub `%%`:
- użycie `%` powoduje zinterpretowanie całej lini jako funkcji magicznej,
- użycie `%%` powoduje zinterpretowanie całej komórki jako funkcji magicznej.
  
[Tutaj](https://ipython.readthedocs.io/en/stable/interactive/magics.html) mamy pełny wykaz funkcji magicznych. Dla Was
nie są one najistotniejsze, jednakże czasami przydają się bardzo - np do pomiaru czasu obliczeń albo konfiguracji
zachowania biblioteki `matplotlib`.

#### Dostęp do shella
W notebooku mamy także dostęp do shella. Uzyskujemy go dzięki użyciu prefiksa `!`.

## Uwagi końcowe
Zakłada się, że student potrafi już programować i pewne absolutne podstawy da radę wywieść z przedstawionych kodów.
To nie jest samodzielny kurs języka Python, a jedynie przedstawienie elementów istotnych dla zajęć laboratoryjnych.

Przy korzystaniu z notatnika nie należy obawiać się **eksperymentowania z kodem** we własnych komórkach. **Pamiętaj** 
korzystać z notatnika w sposób aktywny, tzn. uczysz się przez eksperymentowanie z zaproponowanym kodem. Nie licz 
wyłącznie na opisy, które z założenia są na ogół zdawkowe.

In [7]:
print("Hello world!")  # wykonujemy zwyczajne polecenia Pythona

%time  # wykonujemy funkcję magiczną

!cd # changed !pwd to !cd

Hello world!
CPU times: total: 0 ns
Wall time: 0 ns
d:\Programming Projects\WUST-CompSci-BSc\Semester 4\Systems Analysis and Decision Support Methods\lab1


## Struktury danych języka Python, które omówione są w notatniku:
* **lista**,
* krotka,
* **słownik**,
* zbiór.

**Lista** <br>
Jest to uporządkowana kolekcja obiektów dowolnego typu.

In [10]:
miasta_lista = ["Wrocław", "Opole", "Kraków", "Poznań"]
powierzchnia_lista = [292.8, 149, 147.9, 7.29]
populacja_lista = [643782, 128140, 1200, 350]

print(miasta_lista[1:3]) # wypisuje listę od elem 1 do 3 (wyłączając 3)

['Opole', 'Kraków']


In [11]:
miasta_lista.count("Wrocław")

1

In [12]:
"Opole" in miasta_lista

True

In [13]:
miasta_lista + miasta_lista

['Wrocław',
 'Opole',
 'Kraków',
 'Poznań',
 'Wrocław',
 'Opole',
 'Kraków',
 'Poznań']

Iteracja po liście w stylu języka Java:

In [14]:
for i in range(len(miasta_lista)):
    print(miasta_lista[i].upper())

WROCŁAW
OPOLE
KRAKÓW
POZNAŃ


Iteracja po liście w stylu języka Python:

In [15]:
for elem in miasta_lista:
    print(elem.upper()) # upper przekazuje w CAPS

WROCŁAW
OPOLE
KRAKÓW
POZNAŃ


Lista składana (ang. *list comprehension*) - jeden z elementów pythonicznego kodu.

In [16]:
lista_skladana = [elem.upper() for elem in miasta_lista]
print(lista_skladana)

['WROCŁAW', 'OPOLE', 'KRAKÓW', 'POZNAŃ']


In [17]:
lista_skladana = [elem.upper() for elem in miasta_lista if elem.endswith("w")]
print(lista_skladana)

['WROCŁAW', 'KRAKÓW']


In [18]:
pusta_lista = []

Listy zagniezdzone - elementami danej listy są listy.

In [None]:
arr = [
    ["Wrocław", "Kłodzko", "Wałbrzych"],
    ["Białystok", "Suwałki", "Augustów"],
    ["Kraków", "Wieliczka", "Wadowice"],
]

**Ćwiczenie 1: Wypisz wszystkie miasta z tablicy `arr` korzystając z zagnieżdżonych pętli**

In [24]:
arr = [
    ["Wrocław", "Kłodzko", "Wałbrzych"],
    ["Białystok", "Suwałki", "Augustów"],
    ["Kraków", "Wieliczka", "Wadowice"],
]

for list in arr:
    for elem in list:
        print(elem)
        
# testy
for list in arr:
    print(list)
    
for list in arr:
    print(list[0] + " " + list[1] + " " + list[2])

Wrocław
Kłodzko
Wałbrzych
Białystok
Suwałki
Augustów
Kraków
Wieliczka
Wadowice
['Wrocław', 'Kłodzko', 'Wałbrzych']
['Białystok', 'Suwałki', 'Augustów']
['Kraków', 'Wieliczka', 'Wadowice']
Wrocław Kłodzko Wałbrzych
Białystok Suwałki Augustów
Kraków Wieliczka Wadowice


Korzystając z funkcji `zip()` jesteśmy w stanie iterowac np. po dwóch tablicach na raz!

In [None]:
panstwa_lista = ["Polska", "Czechy", "USA", "Korea Południowa"]

for m, p in zip(miasta_lista, panstwa_lista):
    print(m, p)

Pamiętaj wykonać własne eksperymenty z listą. Zbadaj przy okazji, jakie są konsekwencje współdzielenia pamięci przez komórki notatnika.

**Ćwiczenie 2: Sprawdź co się dzieje w przypadku iterowania przy uzyciu funkcji `zip()` po obiektach nierównej długości. Czy wiesz moze dlaczego?**

In [28]:
# Cwiczenie 2
miasta_lista = ["Wrocław", "Opole", "Kraków", "Poznań", "Taka o sobie nierówność"]
panstwa_lista = ["Polska", "Czechy", "USA", "Korea Południowa"]

for m, p in zip(miasta_lista, panstwa_lista):
    print(m, p)
    
# pomijany jest ostatni element z listy miasta_lista, czyli zip działa tylko do momentu w którym skończy się lista krótsza
# prawdoopodobnie jest to kwestia przypisywania wartości do null, nie byłaby ona pożądana

Wrocław Polska
Opole Czechy
Kraków USA
Poznań Korea Południowa


**Krotka** <br>
Można o niej mysleć jak o niemutowalnej (czyli niezmienialnej) liście.

In [None]:
wymiary = (90, 60, 90)

In [None]:
wymiary[0] = 40

Wprawdzie elementów składowych krotki nie da się zmienić, ale można zrobić to:

In [None]:
wymiary = (1024, 768)

**Zapamiętaj**: <br>

1.   Python realizuje **dynamiczne typowanie**.
2.   Nazwa w języku Python to pusty wskaźnik do obiektu (faktycznie implementowany jako ```void*``` w języku C). Jednak używając nazwy działasz na wskazywanym przez nią obiekcie. Zarządzaniem pamięcią zajmuje się Python.



Tym co tworzy krotkę, jest nie tyle nawias ```()```, co przecinek:

In [None]:
osoba = "Bożydar", 180, 92

In [None]:
osoba[2] = 88

In [None]:
szer, wys = 1024, 768

In [None]:
wys, szer = szer, wys
print(f"Szerokosć: {szer}\nWysokość: {wys}")

Rozpakowanie krotki

In [None]:
kolor = 122, 16, 196
r, g, b = kolor
print(f"r = {r}, g = {g}, b = {b}")

**Słownik**  (ang. *dictionary*) <br>
Jest to nieuporządkowana kolekcja par <font color='blue'>*klucz*</font>-<font color='green'>*wartość*</font>.

In [None]:
populacja_dict = {
    "Wrocław": 643782,
    "Opole": 128140,
    "Złe Mięso": 195,
    "Radom": 210532,
    "Paryż": 134,
    "Paryż": 2148000,
    "Biłgoraj": 27106,
}

powierzchnia_dict = {
    "Wrocław": 292.8,
    "Opole": 149,
    "Złe Mięso": 4.38,
    "Radom": 111.8,
    "Paryż": 9.13,
    "Paryż": 105.4,
    "Biłgoraj": 21.1,
}

In [None]:
populacja_dict["Paryż"]

In [None]:
populacja_dict.keys()

In [None]:
populacja_dict.values()

In [None]:
populacja_dict.items()

Iteracja po słowniku

In [None]:
for klucz, wartosc in populacja_dict.items():
    print(f"miasto: {klucz} | ludność: {wartosc}")

In [None]:
"Radom" in populacja_dict

In [None]:
pusty_slownik = {}
pusty_slownik = dict()

**Zbiór** to coś na kształt słownika z samymi kluczami. <br>
Możliwe, że przez cały kurs go nie użyjesz, ale warto znać. <br>
Zamiast tłumaczenia przykład zastosowania.

In [None]:
commiters_ordered = ["Bolek", "ADU", "ADU", "Manny", "Bolek", "Manny", "Bolek", "ADU"]
commiters_unique = set(commiters_ordered)
print(commiters_unique)

In [None]:
pusty_zbior = set()

## Biblioteczne struktury danych:
* macierz ```numpy.ndarray```,
* ramka danych  ```pandas.dataframe```,
* seria danych ```pandas.series```.

**Macierz** (ang. *array*) <br>
Jest to uporządkowana kolekcja obiektów tego samego typu (niekoniecznie liczby). <br>
Biblioteka ```Numpy``` <br>
Kluczowa dla obliczeń na macierzach.

In [8]:
# jeśli nie działa
!pip install numpy

import numpy as np


[notice] A new release of pip is available: 23.2.1 -> 24.0
[notice] To update, run: C:\Python312\python.exe -m pip install --upgrade pip


Collecting numpy
  Obtaining dependency information for numpy from https://files.pythonhosted.org/packages/16/2e/86f24451c2d530c88daf997cb8d6ac622c1d40d19f5a031ed68a4b73a374/numpy-1.26.4-cp312-cp312-win_amd64.whl.metadata
  Downloading numpy-1.26.4-cp312-cp312-win_amd64.whl.metadata (61 kB)
     ---------------------------------------- 0.0/61.0 kB ? eta -:--:--
     ------ --------------------------------- 10.2/61.0 kB ? eta -:--:--
     ------------ ------------------------- 20.5/61.0 kB 217.9 kB/s eta 0:00:01
     ------------------- ------------------ 30.7/61.0 kB 262.6 kB/s eta 0:00:01
     ------------------------------- ------ 51.2/61.0 kB 372.4 kB/s eta 0:00:01
     -------------------------------------- 61.0/61.0 kB 406.4 kB/s eta 0:00:00
Downloading numpy-1.26.4-cp312-cp312-win_amd64.whl (15.5 MB)
   ---------------------------------------- 0.0/15.5 MB ? eta -:--:--
   ---------------------------------------- 0.0/15.5 MB 960.0 kB/s eta 0:00:17
   ------------------------------

ModuleNotFoundError: No module named 'numpy'

In [None]:
tab = np.array([1, 1, 2, 3, 5, 8, 13])

In [None]:
tab + tab

In [None]:
powierzchnia_tab = np.array(list(powierzchnia_dict.values()))
print(list(powierzchnia_dict.values()))
print(powierzchnia_tab)

In [None]:
dane_ustandaryzowane = (powierzchnia_tab - powierzchnia_tab.mean()) / powierzchnia_tab.std()
dane_ustandaryzowane = np.round(dane_ustandaryzowane, 2)
print(dane_ustandaryzowane)

In [None]:
tab[-1]

Wycinki (ang. *slices*), czyli wybieranie z tabeli spójnych fragmentów.

In [None]:
tab = dane_ustandaryzowane.copy()
print(tab)

In [None]:
tab[1:6:2]

In [None]:
tab[:3]

In [None]:
tab[5:]

In [None]:
tab[5:2:-1]

In [None]:
tab[::-1]

In [None]:
list(tab)

**Ćwiczenie 3: Opierając się na dokumentacji numpy zwiększ wartość każdego elementu `tab` o 3.14**

In [None]:
# Cwiczenie 3

Filtrowanie, czyli wybieranie elementów spełniających określone kryteria.

In [None]:
tab > 0

In [None]:
tab[tab > 0]

**Seria** (ang. *series*) <br>
Biblioteka ```Pandas``` <br>
O serii można mysleć na dwa pożyteczne sposoby:

*   jak o uporządkowanym słowniku,
*   jak o tabeli, której indeks można dowolnie określać.



In [None]:
# jeśli nie działa
!pip install pandas

import pandas as pd

In [None]:
seria = pd.Series([1, 2, 3, 4], index=["a", "b", "c", "d"])
seria

In [None]:
seria["b":"d"]

In [None]:
seria_ind = pd.Series([1, 2, 3, 4], index=[4, 3, 2, 1])
seria_ind

Jak w sposób jawny odwoływać się do indeksów zdefiniowanych lub domyślnych?

In [None]:
print(seria_ind[3])
print(seria_ind.loc[3])
print(seria_ind.iloc[3])

Konstruktor serii - jak pożytecznie indeksować.

In [None]:
powierzchnia_series = pd.Series(powierzchnia_lista, index=miasta_lista)
powierzchnia_series

In [None]:
print(powierzchnia_series.index, powierzchnia_series.values, sep="\n")

In [None]:
pusta_seria = pd.Series(dtype="int")

## Ramka danych (ang. *Data Frame*)
Biblioteka ```Pandas``` <br>
Ramka danych to kolekcja serii współdzielących indeks. <br>
Przy wyświetlaniu zawartości ramki poleceniem ```display``` poszczególne serie znajdują się w kolumnach o odpowiednich nazwach. <br>
Ramka danych jest najważniejszą strukturą z punktu widzenia nauki o danych. 

In [None]:
df = pd.DataFrame({"populacja": populacja_dict, "powierzchnia": powierzchnia_dict})
display(df)

In [None]:
print(df.index, df.columns, sep="\n")

In [None]:
df.loc["Radom", "powierzchnia"] = 112

In [None]:
df[["populacja"]]

Transpozycja ramki

In [None]:
df.T

**Cwiczenie 4:** Zbadaj jaka jest różnica między `df.T[['Wrocław']]`, a `df.T['Wrocław']`.
Jakiego typu są obydwa obiekty?

In [None]:
# Cwiczenie 4

In [None]:
df.rename(columns={"populacja": "pop", "powierzchnia": "pow"})

In [None]:
df.replace(48, "zadziurze")

In [None]:
df.rename(index={"Wrocław": "W-w"})

In [None]:
pusta_ramka = pd.DataFrame(dtype="float64")

### Rysowanie prostych wykresów
Biblioteka ```Matplotlib```

In [None]:
# jeśli nie działa
!pip install matplotlib

import matplotlib.pyplot as plt

Na początek prosty wykres bez typowych ozdobników.

In [None]:
x = np.linspace(start=-2, stop=2, num=100)
y = x**2
plt.plot(x, y)

A teraz z ozdobnikami, których obecność jest bardzo wskazana w sprawozdaniach, publikacjach, pracach dyplomowych itp.

In [None]:
fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(10, 4))

x = np.arange(start=0, stop=2, step=0.1)
y = x**2
ax[0].plot(x, y, marker=".")
ax[0].set_xlabel("x", fontsize=14)
ax[0].set_ylabel("y", fontsize=14)

x = np.linspace(start=0, stop=6, num=100)
y = np.sin(x) + np.sin(3 * x)
ax[1].plot(x, np.sin(x), label="składnik 1", alpha=0.8, linestyle="dashed")
ax[1].plot(x, np.sin(3 * x), label="składnik 2", alpha=0.8, linestyle="dotted")
ax[1].plot(x, y, label="suma", linewidth=3)
ax[1].set_xlabel("x", fontsize=14)
ax[1].set_ylabel("y", fontsize=14)
ax[1].legend()
fig.tight_layout()
plt.show()

Laboratorium fal

In [None]:
t = np.linspace(0, 2 * np.pi, 600)
x = np.sin(3 * t)
y = np.cos(5 * t)

fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(11, 4))

ax[0].plot(t, x, label="x")
ax[0].plot(t, y, label="y")
ax[0].set_xlabel("t", fontsize=14)
ax[0].set_ylabel("wartość", fontsize=14)
ax[0].legend(fontsize=12)
ax[0].set_title("wykres na osi czasu")

ax[1].plot(x, y)
ax[1].set_xlabel("x", fontsize=14)
ax[1].set_ylabel("y", fontsize=14)
ax[1].axis("square")
ax[1].set_title("przestrzeń zmiennych stanu")

fig.tight_layout()
plt.show()

In [None]:
x = np.linspace(0, 20, 1001)
y = np.zeros_like(x)

N = 12100
for i in range(1, N + 1, 2):
    y += np.sin(i * x) / i

plt.plot(x, y)
plt.show()