# PSO - Wprowadzenie

Przedmiot Przetwarzanie Sygnałów i Obrazów (ang. Image and Signal Processing) dotyczy teorii syntezy, analizy i obróbki sygnałów jedno- (n.p. dźwięk) i dwu-wymiarowych (n.p. obraz). Na laboratoriach z przedmiotu będziemy wykonywać praktyczne ćwiczenia związane z tematyką omawianą na wykładach (obecność na wykładach jest obowiązkowa, żeby rozumieć ćwiczenia). Do wykonywania ćwiczeń będziemy korzystać z języka programistycznego Python i szeregu dostępnych bibliotek, m.in.:

* numpy - biblioteka do szybkich obliczeń numerycznych
* scipy - bilioteka zawierająca szereg algorytmów do zastosowań naukowych (m.in. przetwarzania sygnałów)
* scikit-image - biblioteka do obróbki obrazów
* matplotlib - biblioteka do rysowania wykresów

Jeśli instalujesz środowiski Python od nowa, zaleca się korzystać z prostych poleceń:

> pip install [pakiet]

albo

> easy_install [pakiet]

Oprócz wyżej wymienionych bibliotek do wykonywania ćwiczeń będziemy korzystać ze środowiska Jupyter Notebook. Umożliwy to łatwy dostęp do wykonywania zadań bezpośrednio w dokumencie gdzie będzie znajdował się ich opis. Narzędzie to wykorzystuje interfejs webowy do edycji i wykonania skryptów zapisanych w plikach z rozszerzenien \*.ipynb. Na każdych kolejnych ćwiczeniach dostaniecie taki plik z zadaniami jakie należy wykonać podczas zajęć i/lub w domu. Narzędzie Jupyter Notebook też można zainstalować za pomocą w/w poleceń "pip" lub "easy_install".

# Podstawy języka Python

Tak jak zwykle bywa w językach skryptowych, Python nie wymaga deklaracji typów i wykonuje polecenia natychmiast po ich wpisaniu do wiersza poleceń (tak jak przykładowo Javascript). W dodatku, Python nie wymaga żadnego znaku końca linii (czyli nie potrzebuje średnika). Jedyna nietypowa rzecz w Pythonie to wykorzystanie "wcieć" (czyli znaków tabulacyjnych) jako części składni języka, ale o tym póżniej (w części dotyczącej pętle).

Czyli, bardzo łatwo można wykonać następujące polecenie (uruchom następującą linię):

In [1]:
1+1

2

W każdym bloku kodu, którego wynikiem jest jakiś output, wpisze automatycznie tylko ostatnią linię tego outputu. Jeśli chcemy przekazać więcej niż jedną linię informacji do outputu, powinniśmy korzystać z polecenia "print":

In [2]:
print(1+1)
x=1
print(x+x)

2
2


Do zmiennych tekstowych możemy używać zarówno z pojedyńczych, jak i podwójnych cudzysłów:

In [3]:
a='Hello'
b='world'
print(a+' '+b+'!')

Hello world!


Tak jak już wspomniano, typy są generowane dynamicznie, ale można je sprawdzić lub skonwertować w dosyć intuicyjny sposób:

In [4]:
x=1
print(type(x))
x=1.2
print(type(x))
x='a'
print(type(x))
x=str(1)
print(x)
print(type(x))
x=int(x)
print(type(x))
print(x)

<class 'int'>
<class 'float'>
<class 'str'>
1
<class 'str'>
<class 'int'>
1


W dosyć prosty sposób można również sprawdzić metody dowolnego objektu:

In [5]:
x=open('test','w') #otwórz plik o nazwie test
print(dir(x))
x.close()
print(dir(x))
s='erfes'
print(dir(s))

['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'writelines']
['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '_

Tak jak widać wyżej, komentarze w Pythonie piszemy od znaku '#'

Wieloliniowe komentarze zaczynamy i kończymy potrójnym cudzysłowem:

In [6]:
'''
To jest wieloliniowy komentarz.
Te linie nie robią nic.
Jest to szczególnie przydatne do pisania dokumentacji do klas/metod/funkcji.
'''

'\nTo jest wieloliniowy komentarz.\nTe linie nie robią nic.\nJest to szczególnie przydatne do pisania dokumentacji do klas/metod/funkcji.\n'

Podczas pisania w Jupyter Notebook, mamy do dyspozycji kilka pomocniczych funkcji pomocniczych, szczególnie dla osób początkujących.

Wciskając TAB na klawiaturze włączamy "code-completion", czyli system proponuje kilka nazw kończących to co zaczęliśmy pisać (w tym zarówno nazwy metod/funkcji jak i zmiennych użytych wcześniej w kodzie). Proszę spróbować tego w następującej 

In [7]:
dict

dict

Wpisując znak zapytania po nazwie metody otwieramy system pomocy:

In [8]:
dir?

Wszelkie inne skróty i dokumentację możecie sprawdzić w menu "Help" na samej górze. Szczególnie zalecane jest zapoznanie się z listą "Keyboard Shortcuts"!

## Tablice i pętle

W Pythonie podstawową strukturą danych do przechowywania sekwencji danych jest lista. Liste tworzymy i przeglądamy za pomocą nawiasów kwadratowych:

In [9]:
a=[] #tworzy pustą listę
print(type(a))

a=[1,2,3]
print(a)

print(a[1])

print(a[0:2]) #wypisz od elementu 0 (włącznie) do 2 (wyłącznie)

<class 'list'>
[1, 2, 3]
2
[1, 2]


Dwuwymiarowe listy (macierze) można zdefiniować w analogiczny sposób:

In [10]:
a=[[1,2,3],[4,5,6],[7,8,9]]
print(a)

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]


Do listy łatwo można dodać lub usunąć dowolny element:

In [11]:
a=[0,1,2,3,2]
print (a)
a.append(4)
print (a)
a.remove(2)
print (a)
a.pop(1)
print (a)

[0, 1, 2, 3, 2]
[0, 1, 2, 3, 2, 4]
[0, 1, 3, 2, 4]
[0, 3, 2, 4]


Zdanie warunkowe IF piszemy w następujący sposób. Proszę zwrócić uwagę na obowiązkowy odstęp (TAB) w linii występującej po poleceniu. Brak wcięcia spowoduje zwrócenie błędu (proszę spróbować):

In [12]:
a=[[1,2,3],[4,5,6],[7,8,997]]
if a[1][1]<5:
    print ('<5')
else:
    print ('>=5')
print(a[1][0])

>=5
4


Iteracja w pętli for działa w podobny sposób:

In [13]:
for x in range(0,3):
    for y in range(0,3):
        print (a[x][y])

1
2
3
4
5
6
7
8
997


## Klasy i funkcje

Prostą funkcję definujemy słowem kluczowym **def** w następującyt sposób:

In [14]:
def funkcja(x,y,z):
    x=x/y+z
    return x**2

print (funkcja(1,2,3))

12.25


Klasy definujemy bardzo podobnie, z tym że dynamiczna natura języka pozwala na o wiele więcej manipulacji niż w przypadku języków kompilowanych. Użycie klas nie jest niezbędne i nie będzie wymagane w tym kursie:

In [15]:
class klasa:
    
    zmienna_klasowa=1
    
    def __init__(self):#opcjonalny konstruktor
        print ('konstruktor')
    
    def metoda(self, arg):#metody klasowe zawsze pierwszy argument mają "self"
        return arg+self.zmienna_klasowa
    
x=klasa()
print (x.metoda(1))

x.dowolna_zmienna=2 #ponieważ typ jest dynamiczny, możemy to zrobić i Python nam tego nie zabroni

print (dir(x))

konstruktor
2
['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'dowolna_zmienna', 'metoda', 'zmienna_klasowa']


## Numpy

Bibilioteki dołączamy do programu poleceniem **import**. Numpy jest bardzo istotną biblioteką do obliczeń numerycznych. Pozwala nam w szybki sposób wykonywać wiele skomplikowanych algorytmów na wektorach, macierzach i innych typach danych.

W poleceniu **import** można użyć dodatku **as** żeby zmienić nazwę biblioteki na coś innego (zwykle krótszego).

In [16]:
import numpy as np

x=np.array([[1,2,3],[4,5,6],[7,8,9]])

print (x)

print (x.sum())

print (x.mean(axis=0))
print (x.mean())

print (x.dtype)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
45
[ 4.  5.  6.]
5.0
int64


Czasami warto zdefiniować inny typ danych dla macierzy:

In [17]:
x=np.array([[1,2,3],[4,5,6],[7,8,9]])

print(x//2)

x=np.array([[1,2,3],[4,5,6],[7,8,9]],dtype='float')

print(x)

[[0 1 1]
 [2 2 3]
 [3 4 4]]
[[ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]]


W Numpy możemy odczytywać elementy macierzy na dwa sposoby:

In [18]:
#print(x)
print (x[1][1])
print (x[1,1])

5.0
5.0


Drugi sposób wynika z tego, że można z macierzy wyciągnąć dowolną pod-macierz:

In [19]:
print (x[1:2,0:2])
print (x[:1,2:])
print (x[:,0])

[[ 4.  5.]]
[[ 3.]]
[ 1.  4.  7.]


Macierze można łączyć ze sobą:

In [20]:
print (np.vstack([x,x,x]))
print (np.hstack([x,x,x,x,x]))

[[ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]
 [ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]
 [ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]]
[[ 1.  2.  3.  1.  2.  3.  1.  2.  3.  1.  2.  3.  1.  2.  3.]
 [ 4.  5.  6.  4.  5.  6.  4.  5.  6.  4.  5.  6.  4.  5.  6.]
 [ 7.  8.  9.  7.  8.  9.  7.  8.  9.  7.  8.  9.  7.  8.  9.]]


Można też zmieniać ich kształt:

In [21]:
print (x.reshape([1,9]))
print (x.flatten())

[[ 1.  2.  3.  4.  5.  6.  7.  8.  9.]]
[ 1.  2.  3.  4.  5.  6.  7.  8.  9.]


# Sztuczki Jupyter Notebook

Jest kilka wbudowanych poleceń nazwyaych **magics**. Zaczynają się od znaku % i wykonywują różne ciekawe rzeczy, np:

In [22]:
%ls

file  test  Wprowadzenie.ipynb


In [23]:
x=np.random.rand(10,10)
y=np.random.rand(100,100)
print(x)
#%timeit -n 1000 z=x+y

[[ 0.06057958  0.20822457  0.3394392   0.76203762  0.78567941  0.75463831
   0.59626529  0.81412419  0.0447361   0.61641488]
 [ 0.02377092  0.89214204  0.03322653  0.95738658  0.47277257  0.76462382
   0.87727376  0.704119    0.70645927  0.43221706]
 [ 0.34223903  0.92066266  0.5919245   0.67479629  0.45557577  0.95054593
   0.7197521   0.12574212  0.22437979  0.89850553]
 [ 0.96803581  0.46726564  0.8889685   0.3865965   0.65247622  0.73820705
   0.76699882  0.25167763  0.50997997  0.29454213]
 [ 0.59329846  0.68818532  0.57948444  0.01465276  0.8665366   0.36499608
   0.16555592  0.23631704  0.21493254  0.64971718]
 [ 0.77937117  0.61474838  0.43908196  0.00362231  0.39175298  0.93640104
   0.58859563  0.05265119  0.32355125  0.33982076]
 [ 0.25744016  0.76802191  0.87254076  0.55231959  0.5341116   0.56824863
   0.65558629  0.64945867  0.25347325  0.33243451]
 [ 0.9114287   0.41766572  0.07538252  0.99613633  0.8785702   0.40699272
   0.5227664   0.93194806  0.20533636  0.99660091]


Żeby zobaczyć pełną listę takich poleceń wystarczy uruchomić polecenie %magic, tak jak niżej:

In [24]:
%magic

## HTML5

Notebooki pozwalają generować i wyświetlać treści napisane w HTML. W bibliotece *ipywidgets* można też znaleźć wiele innych potencjalnie przydatnych elementów interfejsu użytkownika. Bibilioteka też pozwala na interakcję poprzez obsługę wydarzeń.

In [25]:
from ipywidgets import HTML
from IPython.display import display

HTML('<p>test</p>')

W kolejnym przykładzie generujemy sygnał audio i odtwarzamy go w kontrolce HTML5.

In [26]:
import numpy as np


data=np.sin(4.0*np.pi*500.0*np.linspace(0,3,3*16000.0))

#display(HTML('<style>audio{width:640px}</style>')) #CSS żeby trochę zwiększyć rozmiar kontrolki odtwarzacza
display(Audio(data,rate=8000))

  


# Wykresy

Do rysowania wykresów użyjemy biblioteki Matplotlib. Z całej biblioteki, najbardziej nam będzie potrzebna klasa **matplotlib.pyplot**. W dodatku, użyjemy deklaracji *magics* umożliwiające automatyczne rysowanie wykresów (czyli nie będzie wymagane wywoływanie polecenia *draw*):

In [35]:
import matplotlib.pyplot as P
%matplotlib notebook

data=np.random.rand(10)

P.bar(range(0,10),data)

<IPython.core.display.Javascript object>

<Container object of 10 artists>

Dla nas najbardziej istotny wykres będzie dotyczył wykresu linii. W następującym przykładzie widać jak można dodać kilka wykresów i ich legendę:

In [36]:
P.figure(); #stwórz nowy wykres
P.plot(data,'r')
P.plot(-data,'g')
P.legend(('data','-data'),loc='upper right')
P.title('Wykresy liniowe')

<IPython.core.display.Javascript object>

<matplotlib.text.Text at 0x7fc139189390>

Biblioteki tej również używamy do wyświetlania obrazów. W poniższym przykładzie wczytamy przykładowy obraz z biblioteki *scipy* i wyświetlimy go na wykresie o niestandardowym rozmiarze. Żeby zmienić sposób wyświetlania wykresu, musimy najpierw zdefiniować nowy obraz (figure), a wszystkie kolejne wywołania poleceń do rysowania będą robione w jego kontekście:

In [37]:
import scipy.misc

img=scipy.misc.face()

P.figure(figsize=[6,6])
P.imshow(img,cmap='gray',interpolation='none',origin='upper')

<IPython.core.display.Javascript object>

<matplotlib.image.AxesImage at 0x7fc1392347f0>

Funkcja subplots wygeneruje wiele wykresów naraz. Wynikiem funkcji jest macierz objektów figure i axis, z których można korzystać w celu wyświetlania wykresów:

In [38]:
x=np.arange(-3,3,0.1)

f,ax=P.subplots(5,5,sharex='col', sharey='row',figsize=(10,10))

for i in range(0,5):
    for j in range(0,5):
        ax[i,j].plot(i*x)
        ax[i,j].plot(j*x**2)

<IPython.core.display.Javascript object>

Można też znaleźć inne biblioteki do rysowania wykresów takie jak BokehJS pokazaną w przykładzie poniżej. Decyzję korzystania z tej (lub innych) bibliotek pozostawiam czytelnikowi:

In [31]:
import bokeh
import bokeh.plotting as B

bokeh.io.output_notebook()

x=np.arange(-1,1,0.1)
y=x**2

p = B.figure(title="linia", x_axis_label='x', y_axis_label='y')

p.line(x, y, legend="wykres", line_width=2)

B.show(p)

# Zadania

## 1. Oblicz iloczyn dwóch macierzy na dwa sposoby

Najpierw za pomocą pętli napisanych w czystym Pythonie, a potem za pomocą biblioteki Numpy. Oszacuj wydajność tych metod przy pomocy mierzenia czasu wykonania (magics time lub timeit).

In [32]:
import numpy as np
import random as rnd

#naive matrix product
#m1 - n x m matrix
#m2 - m x p matrix
#ret - n x p product matrix
def naiveProduct(m1, m2):
    n = len(m1)
    m = len(m1[0])
    p = len(m2[0])
    ret = [[None]*p]*n
    for i in range(0, n):
        for j in range(0, p):
            cell = 0
            for k in range(0, m):
                cell += m1[i][k]*m2[k][j]
            ret[i][j] = cell
    return ret

#gen matrices
def genMat(n,m):
    ret = [[None]*m]*n
    for i in range (0, n):
        for j in range (0, m):
            ret[i][j] = rnd.uniform(0, 1)
    return ret

#benchmark 1
x = 10
%timeit -n 1000 naiveProduct(genMat(x,x), genMat(x,x))

#benchmark 2
%timeit -n 1000 np.matmul(np.random.rand(x,x), np.random.rand(x,x))

245 µs ± 18.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
5.51 µs ± 148 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


## 2. Narysuj wykres funkcji

Dla zakresu wartości od $-\pi$ do $\pi$, narysuj wykresy liniowe dla następujących funkcji:

* $f(x)=\sin(x)*\sin(100x)$
* $f(x)=x$
* $f(x)=-x$

In [41]:
import numpy as np
import matplotlib.pyplot as plt

def f1(x):
    return np.sin(x)*np.sin(100*x)

x1 = np.arange(-np.pi, np.pi, 0.01)

plt.figure()
plt.subplot(311) #numrows numcols fignums
plt.plot(x1, f1(x1))
plt.legend(("sin(x)*sin(100x)",""))

plt.subplot(312)
plt.plot(x1, x1)
plt.legend("x")

plt.subplot(313)
plt.plot(x1, -x1)
plt.legend(("-x",""))
plt.show()

<IPython.core.display.Javascript object>

## 3. Zrób analizę pliku w internecie

Ściągnij na dysk plik z podanego adresu:

http://www.openfst.org/twiki/pub/FST/FstExamples/wotw.txt

Policz częstotliwość występowania poszczególnych wyrazów w tekście i zrób wykres częstości (zaczynając od najbardziej częstych, w kierunku najmniej).

Do rozwiązania tego zadania użyj internetu żeby znaleźć metody i dokumentację poszczgólnych funckji i bibliotek, np:

http://lmgtfy.com/?q=python+download+file+from+url

http://lmgtfy.com/?q=python+file

http://lmgtfy.com/?q=python+strings

http://lmgtfy.com/?q=python+lists

In [42]:
%matplotlib notebook

import matplotlib.pyplot as plt
import numpy as np
import operator
import re
import urllib.request as url

url.urlretrieve("http://www.openfst.org/twiki/pub/FST/FstExamples/wotw.txt", "file")

file = open("file", "r")
content = re.split('[^a-zA-Z]', file.read()) #ensure that all splits contain letters only

#empty dict for word occurencies
words = {}

for word in content:
    if not word == "": #throw away empty string (idk why it's there in the firs place)
        if word in words:
            words[word] += 1
        else:
            words[word] = 1

sorted_words = sorted(words.items(), key=operator.itemgetter(1), reverse=True) #sorted list of 2-elem tuples created from dict

x_pos = np.arange(len(sorted_words))
labels = list(zip(*sorted_words))[0]
score = list(zip(*sorted_words))[1]

plt.figure() 
plt.bar(x_pos, score)
plt.xticks(x_pos, labels)
plt.show()

print("done")

<IPython.core.display.Javascript object>

done
