# Wprowadzenie do Python 2: numpy, matplotlib, ...

* moduły, import
* math - moduł funkcji matematycznych
* numpy - operacje macierzowe (_a la_ Matlab)
* matplotlib - wykresy (_a la_ Matlab)


## Moduły i pakiety

Lista wbudowanych funkcji: https://docs.python.org/3.8/library/functions.html

Lista wbudowanych pakietów: https://docs.python.org/3.8/library/

Przykład: 
* **math** https://docs.python.org/3.8/library/math.html
* **random** https://docs.python.org/3.8/library/random.html
* **time** https://docs.python.org/3.8/library/time.html

## Importowanie modułów


In [None]:
import math

x = math.sqrt(2)
print(x)

Importowanie z nadaniem aliasu (własnej nazwy)

In [None]:
import random as r

for i in range(10):
    print(r.rand())

Importowanie pojedynczej funkcji z pakietu

In [None]:
from time import sleep

for i in range(10, 1, -1):
    print(i)
    sleep(1)

print('Start!')

## math - funkcje matematyczne

https://docs.python.org/3/library/math.html

In [None]:
import math

x = 4
print(math.sqrt(x))      # sqrt(4) = 2
print(math.pow(x,2))     # 4**2 = 16
print(math.exp(x))       # exp(4) = 54.6
print(math.log(x))       # ln(x)
print(math.log(x,10))    # log_10(x)
print(math.fabs(-4))     # wartość bezwzględna
print(math.factorial(x)) # 4! 

In [None]:
z = 0.2
print(math.ceil(z))      # najmniejszy float z wartością dziesiętną 0 nie mniejszy niż z (1.0)
print(math.floor(z))     # największy float z wartością dziesiętną 0 nie większy niż z (0.0)
print(math.trunc(z))     # najbliższy integer nie większy niż z (0)

z = math.pi              # 3.141592653589793 
print(math.sin(z))       # sinus kąta z (miara łukowa)
print(math.tanh(z))      # tangens hiperboliczny kąta z (miara łukowa)

x = math.nan             # wartość specjalna NaN (not a number)
print(math.isnan(x))

x = math.inf             # nieskończoność
print(math.isinf(x))

## NumPy - bibloteka do obliczeń numerycznych

NumPy tutorial: <https://numpy.org/devdocs/user/quickstart.html>

In [None]:
import numpy as np

In [None]:
a = np.array([1, 2, 3])     # tablica numpy (ndarray), 1-wymiarowa (wektor)
print(a)
print(type(a))

In [None]:
print(a.ndim)       # liczba wymiarów
print(a.shape)      # wymiary (kształt) macierzy
print(a.dtype)      # typ danych
print(a.size)       # liczba elementów

In [None]:
b = np.array([[1.1, 2, 3], [3, 5, 6]])   # tablica 2-wymiarowa
print(b)

In [None]:
print(b.ndim)       # liczba wymiarów
print(b.shape)      # wymiary (kształt) macierzy
print(b.dtype)      # typ danych
print(b.size)       # liczba elementów

### Funkcje do generowania tablic

In [None]:
np.random.rand(4)           # liczby losowe z rozkładu jednostajnego [0,1]

In [None]:
np.random.randn(5)          # rozkład normalny

In [None]:
np.arange(-10,10,2)         # wartości od -10 do 10 z krokiem 2

In [None]:
np.arange(12).reshape(3,4)  # reshape to a matrix

In [None]:
np.linspace(0,1,10)         # 10 kolejnych wartości z odcinka [0,1]

In [None]:
np.zeros((3,5))             # macierz zerowa

In [None]:
np.eye(5)                   # macierz jednostkowa (diagonalna)

In [None]:
np.ones((5,1))              # macierz jedynek

### Zmiana kształtu mcierzy

In [None]:
x = np.arange(12)
print(x.shape)
print(x)

In [None]:
y = x.reshape([3,4])
print(y.shape)
print(y)

### Operacje na macierzach

In [None]:
x = np.array([1,2,3,4,5])

Macierz i skalar

In [None]:
print(x + 1)      # addition 
print(x - 1)      # subtraction
print(x * 2)      # multiplication
print(x // 2)     # integer division
print(x ** 2)     # square
print(x % 2)      # modulo  
print(1 / x)      # division

Dwie macierze o tych samych wymiarach

In [None]:
x = np.array([0,2,4,6,8,10]).reshape([2,3])
y = np.array([1,2,3,4,5,6]).reshape([2,3])

print(x + y)
print(x - y)
print(x * y)    # mnożenie element po elemencie
print(x / y)    # 
print(x // y)
print(x ** y)

### Transpozycja, mnożenie macierzowe

In [None]:
# transpozycja 
a = x.T
print(a)

In [None]:
# mnożenie macierzy
b = np.dot(x.T, y)
print(b)

### Indeksowanie elementów macierzy

In [None]:
x = np.array([11 ,22 ,33, 44, 55, 66])
print(x)

y = x[3:5]     # y jest przekrojem (slice) macierzy x elementów od 3 do 4, macierz y wskazuje wybrane dane z x
print(y)

In [None]:
y[:] = 1000    # zmiana elementów y, zmieni się też x (obie macierze to widok na te same dane w pamięci)
print(y)
print(x)

In [None]:
z = x[3:5].copy()   # utworzenie kopii macierzy, elementy z leżą w innej przestrzeni pamięci niż x i y
print(z)

In [None]:
z[:] = 500          # zmiana z nie zmieni x
print(z)
print(x)

In [None]:
x = np.arange(12).reshape((3,4))

print(x)
print(x[2,:])       # trzeci wiersz
print(x[:, 2])       # trzecia kolumna 
print(x[:2, 2:])     # dwa pierwsze wiersze i dwie ostatnie kolumny

### Indeksowanie warunkowe 

In [None]:
x = np.arange(12).reshape(3,4)

print(x > 5)

x[ x > 5 ] = 0   # wyzerowanie el. większych od 5
print(x)

In [None]:
ind = x == 0        # zapamietanie indeksów spełniających warunek x == 0 
print(ind)          # ndarray typu bool
print(x[ind])       # elementy x[] spełniające warunek
print(x[~ind])      # negacja 

### Przydatne funkcje

In [None]:
y = np.random.rand(10) - 0.5
print(y)

print(np.abs(y))          # wartośc bezwzględna elementów
print(np.exp(y))          # exponent elementów

In [None]:
print(np.sort(y))                     # sortowanie
print("Min =", np.min(y))             # minimalny element 
print("Max =", np.max(y))             # maksymalny welement
print("Average =", np.mean(y))        # średnia wartość wszystkich elementów
print("Std deviation =", np.std(y))   # odchylenie standardowe  
print("Sum =", np.sum(y))             # suma wszystkich elementów 

In [None]:
x = np.random.rand(5, 2)

print(x)

print('Min axis=0: ', np.min(x, axis=0))     # min. wzgl. wymiaru 0 (w kolumnach)
print('Min axis=1: ', np.min(x, axis=1))     # min. wzgl. wymiaru 1 (w wierszach)

### Optymalizacja czasu wykonywania operacji macierzowych

In [None]:
n = 1000
x = np.random.rand(n)
y = np.random.rand(n)
z = np.zeros(x.shape)    # pre-alokacja macierzy z

In [None]:
%%timeit 
# mnożenie za pomoca operatora *
z = x * y

In [None]:
%%timeit 
# mnożenie za pomoca funkcji multiply()
z = np.multiply(x, y)

In [None]:
%%timeit
# mnożenie w pętli
for i in range(n):
    z[i] = x[i] * y[i]

## MatPlotLib - wykresy

Tutorial: <https://matplotlib.org/tutorials/index.html>

In [None]:
import matplotlib.pyplot as plt

### Wykres liniowy

Narysujmy przebieg funkcji sigmoidalnej $f(x) = \frac{1}{1+e^{-\alpha x}}$ na odcinku [-5, 5]



In [None]:
x = np.linspace(-5, 5, 100)
y = 1.0 / (1.0 + np.exp(-x))

plt.plot(x, y)

Funkcji sigmoidalna ze współczynnikiem nachylenia $\alpha=0.5, 1, 2, 100$

In [None]:
for a in [0.5, 1.0, 2.0, 100]:
    y = 1.0 / (1.0 + np.exp(-x * a))
    plt.plot(x, y, label='a=' + str(a))

plt.title('Funkcja sigmoidalna')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.legend()


## Wykres punktowy (wykres rozrzutu)

In [None]:
x1 = np.random.randn(100, 2)
x2 = np.random.randn(100, 2) * 3 + 2

plt.plot(x1[:,0], x1[:,1], 'ro')   # red circle (o)
plt.plot(x2[:,0], x2[:,1], 'bx')   # blue cross (x)

### Wykres słupkowy i kołowy

In [None]:
x = ['a', 'b', 'c']
y = [3, 5, 12]

plt.bar(x, y)

In [None]:
plt.pie(y, labels=x)

### Histogram

In [None]:
x = np.random.randn(10000, 1) * 3 + 2
plt.hist(x)

In [None]:
import matplotlib.pyplot as plt
data = np.loadtxt('dane/iris.data', delimiter=',')

plt.hist(data[:, 2], bins=20)

In [None]:
plt.hist(data[data[:,4] == 0, 2], label='Setosa')
plt.hist(data[data[:,4] != 0, 2], label='Not Setosa')
plt.legend()


In [None]:
plt.figure(figsize=(10,10))
for i in (0, 1, 2):
    plt.plot(data[data[:,4]==i, 2], data[data[:,4]==i, 3], 'o')
plt.xlabel("Długośc płatka")
plt.ylabel('Szerokość płatka')
plt.show()

## Zadanie: Włoskie wina

Wykonaj analizę danych Wine zgodnie z poniższymi punktami.  
Zbiór danych znajduje się w katalogu repizytorium ''dane/wine.data'' oraz pod adresem http://www.fizyka.umk.pl/~grochu/wdm/files/wine.data  

Plik ''wine.data'' zawiera pomiary własności chemicznych 3 odmian Włoskich win.  
Format danych:  
```
  1,14.23,1.71,2.43,15.6,127,2.8,3.06,.28,2.29,5.64,1.04,3.92,1065
  2,13.2,1.78,2.14,11.2,100,2.65,2.76,.26,1.28,4.38,1.05,3.4,1050
  3,13.16,2.36,2.67,18.6,101,2.8,3.24,.3,2.81,5.68,1.03,3.17,1185
   ...
```
Każda linia zawiera 14 liczb oddzielonych przecinkami określających wartości pomiaru dla pojedynczego wina.  
Pierwsza zmienna to odmiana wina (wartość 1, 2 lub 3) pozostałe to zmienne ciągłe (wyniki pomiarów):
```
  1 Odmiana (1,2,3),  
  2 Alcohol,  
  3 Malic acid,  
  4 Ash,  
  5 Alcalinity of ash,  
  6 Magnesium,  
  7 Total phenols, 
  8 Flavanoids,  
  9 Nonflavanoid phenols,  
  10 Proanthocyanins,  
  11 Color intensity,  
  12 Hue,  
  13 OD280/OD315 of diluted wines, 
  14 Proline 
```
---

1. Wczytaj do macierzy ''numpy'' dane liczbowe umieszczone w pliku  ''wine.data'' (http://www.fizyka.umk.pl/~grochu/wdm/files/wine.data)    

2. Dla każdej zmiennej wyznacz wartość:   

* minimalną 
* maksymalną, 
* średnią, 
* medianę 
* odchylenie standardowe  

3. Wyznacz wartości średnie stężenia alkoholu (zmienna `Alcohol`) osobno dla każdego z 3 rodzajów win.

4. Wyrysuj histogram dla zmiennejokreslającej stężenie alkoholu (`Alcohol`). Postaraj się wykonac histogram, który zapresentuje rozkład danych w każdej z 3 odmian win. Wykresy mogą być zrobione osobno dla kazdej grupy lub w postaci pojedynczego histogramu, gdzie każda odmiana wina oznaczona jest innym kolorem.

5. Jezeli pewne wino podiada stężenie alkoholu mniejsze od 13.0 to do której grupy możemy je zaliczyć?
Spróbuj wyznaczyć prawdopodobieństwo przynalezenia takiego wina do kazdej z 3 grup. Wynik przedstaw za pomocą wykresu słupkowego.    
Podpowiedź: wyznacz liczebnośc win, każdego rodzaju dla ktorych spełnione jest `Alcohol` < 13

6. Sprawdź, czy istnieje relacja między wartościami stężenia alkoholu (``Alcohol``) a zawartością proliny (``Proline``) ?     
Sporządź wykres punktowy (rozrzutu) obrazujący zależność tych zmiennych.  

7. Sporządź wykres punktowy (rozrzutu) prezentujący rozklad danych w grupach win dla zmiennych ``Alcohol`` i ``Flavonoids`` - odmiany win na wykresie powinnybyć oznaczone róznymi kolorami.    
Na podstawie wykresu sprubuj odpowiedzeić, do jakiej grupy win najprawdopodobniej bedzie należało wino posiadające stężenie alkoholu 12.5 oraz zawartość flawanoidów równą 2.0 ? 