## **WARSZTAT NR 1**

## **GIT**

https://git-scm.com/download/ // download

https://github.com/

- Różnice pomiędzy Gitem a innymi systemami kontroli wersji

---

Trzy stany plików:
- modified
- staged
- committed

---

Projekt w Gicie dzieli się na:
- working directory
- "index"
- .git directory

---

- Workflow

modify -> **working directory** -> stage -> **index** -> commit -> **.git repository**

---

Git config:
```
$ git config [--global] user.name "X Y"
$ git config [--global] user.email xy@xy.com
$ git config --list
```

---

Tworzenie  i używanie repozytorium:
```
$ cd *
$ git init
$ git add *
$ git status
$ git diff
$ git commit -m "tell everyone why do you want to commit these files"
```

Kopiowanie repozytorium z serwera:
```
$ git clone https://* new_dir
```
lub
```
git clone user@server:/pathtorepo.git
```

Omówienie najważniejszych komend (**spróbuj przećwiczyć je w ramach zadania domowego!**)
```
$ git branch nazwa_brancha
$ git checkout nazwa_brancha
$ git merge nazwa_brancha
$ git branch -a

$ git branch --move nazwa_brancha nowa_nazwa_brancha
$ git push --set-upstream origin nowa_nazwa_brancha
$ git push origin --delete nazwa_brancha

$ git pull [origin master]
$ git fetch
$ git remote show origin

$ git diff > *.patch

$ git log
```


sourcetree

## **Jupyter Notebook**

Projekt open source, interfejs do tworzenia notatnika z obliczeniami, wizualizacją wyników, fragmentami kodu itp.

https://jupyter.org/

Python może być jednym z wielu jąder obliczeniowych Jupytera.

```
$ pip install jupyter
$ cd *
$ jupyter notebook
```

---

Prezentacja działania

## **Kaggle**

https://www.kaggle.com/competitions //zadania i zawody

https://www.kaggle.com/learn/intro-to-machine-learning //podstawy ML

https://www.kaggle.com/kernels //notebooks

https://www.kaggle.com/datasets //zbiory danych

https://www.kaggle.com/learn/overview //kursy - także Python

https://www.kaggle.com/dansbecker/getting-started-with-sql-and-bigquery //jak połączyć się z bazą danych na podstawie Big Query Google (więcej na ten temat tu: https://googleapis.dev/python/bigquery/latest/magics.html)

**Nasz zbiór danych - Beijing PM2.5:**
https://www.kaggle.com/sid321axn/beijing-multisite-airquality-data-set?select=PRSA_Data_Gucheng_20130301-20170228.csv

**Oryginalne źródło danych i opis:**
https://archive.ics.uci.edu/ml/datasets/Beijing+Multi-Site+Air-Quality+Data

## **Markdown**
Jak formatować komórki z tekstem?
https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet

## **Biblioteki**

Biblioteki znacząco usprawniają proces programowania i poprawiają jakość kodu.

Python oferuje wiele bibliotek dla specjalistów z dziedziny Data Science i ML.
Wiele z nich to "must have" dla programisty Pythona. Wśród nich można wymienić:

- TensorFlow: biblioteka do ML rozwijana przez Google, https://www.tensorflow.org/
- Scikit-Learn: jedna z najlepszych bibliotek do pracy ze złożonymi danymi, powiązana z Numpy i Scipy, https://scikit-learn.org/stable/
- Numpy: biblioteka do analizy danych, z interfejsem macierzowym, https://numpy.org/
- Keras: modele sieci neuronowych, https://keras.io/
- PyTorch: biblioteka ML, https://pytorch.org/
- SciPy: biblioteka ML, wykorzystywana przez inżynierów i developerów, zawiera moduły do optymalizacji, algebry liniowej, statystyki, https://www.scipy.org/
- Pandas: biblioteka do grupowania i filtrowania danych, upraszcza proces analizy danych, https://pandas.pydata.org/


## **Podstawy programowania w Pythonie**

Python jest językiem interpretowanym, nie kompilowanym.

Wcięcia w kodzie są bardzo ważne. Musi to być min. 1 spacja, aby uniknąć błędów.

Uruchamianie kodu: linia po linii w konsoli lub program w pliku *.py
```
$ python
$ >>> linia kodu...
$ >>> exit()
```
Lub:
```
$ python plik.py
```

Komentowanie kodu: <code># komentarz</code>

---

**Typy danych - przykłady**

- Text: <code>str</code>
- Numeric: <code>int, float, complex</code>
- Sequence: <code>list, tuple, range</code>
- Mapping: <code>dict</code>
- Set: <code>set</code>
- Boolean: <code>bool</code>
- Binary: <code>bytes</code>

Casting: np. <code>x = str(100)</code>


In [1]:
x = "hello world"
print(x, type(x))
x = 2
print(x, type(x))
x = 2.0
print(x, type(x))
x = 10j
print(x, type(x))
x = [1, 2, 3]
print(x, type(x))
x = ("x", "y")
print(x, type(x))
x = range(5) # from 0 to n-1
print(x, type(x))
x = {"users": 20}
print(x, type(x))
x = {"set1", "set2"}
print(x, type(x))
x = True
print(x, type(x))
x = b"Bytes"
print(x, type(x))

hello world <class 'str'>
2 <class 'int'>
2.0 <class 'float'>
10j <class 'complex'>
[1, 2, 3] <class 'list'>
('x', 'y') <class 'tuple'>
range(0, 5) <class 'range'>
{'users': 20} <class 'dict'>
{'set2', 'set1'} <class 'set'>
True <class 'bool'>
b'Bytes' <class 'bytes'>


**Nazwy zmiennych**

- Początek nazw zmiennych: zawsze litera lub _

- Camel/Pascal/Snake Case: myName, MyName, my_name

**Wczytywanie danych z plików**

https://docs.python.org/3/library/functions.html#open

Używamy wbudowanej funkcji <code>open</code>, w której wymaganym argumentem jest <code>path</code>, a opcjonalnym <code>mode</code>.

```
f = open(path, mode)
```

<code>mode</code> to tryb, w którym otwarty jest plik, np. 
- <code>r</code> - open for reading,
```
f.read()
```
- <code>w</code> - open for writing. 
```
f.write(something)
```

Obowiązkiem programującego jest dopilnować późniejszego zamknięcia pliku. Można to zrobić na 2 sposoby: za pomocą <code>try/finally</code> lub za pomocą <code>with</code>. Druga z tych opcji jest bardziej eleganckim rozwiązaniem i pozwala uzyskać lepszą kontrolę nad obsługą wyjątków.

- metoda z <code>try/finally</code>

```
f = open(path)
try:
    # dalsze przetwarzanie danych z pliku
finally:
    f.close()
```

- metoda z <code>with</code>

```
with open(path, mode) as f:
    # dalsze przetwarzanie danych z pliku
```








In [3]:
with open('helloworld.txt', 'r') as f:
    # dalsze przetwarzanie danych z pliku
    print(f.readline())
    #print(f.read())
    #print(f.readlines())

Hello world!


In [4]:
print(f.readline())

ValueError: I/O operation on closed file.

**Podstawowe funkcje i rekurencja**

Definicję funkcji zaczyna się od słowa kluczowego <code>def</code>.

Ważne, aby pamiętać o wcięciach. W przypadku Pythona jest to nie tylko kwestia 'kosmetyczna', ale też konieczna, aby kod nie zwrócił błędu.

In [5]:
def funkcja():
    pass # statement używany w celu uniknięcia błędu, gdy nie mamy jeszcze zdefiniowanej treści funkcji

funkcja()

**Argumenty i parametry**

Parametry to zmienne wewnątrz nawiasów w definicji funkcji.
Argumenty to wartości zmiennych przesyłane w momencie wywoływania funkcji.

In [6]:
def funkcja(arg1, arg2): # parametry
    return(arg1 + arg2)

funkcja(1, 5) # argumenty

6

Jeżeli liczba argumentów nie jest zdefiniowana z góry, należy użyć * przed nazwą parametru.

In [7]:
def funkcja(*args): # parametry
    return(sum(args))

funkcja(1, 5, 8, 9) # argumenty

23

In [8]:
funkcja(1, 3) # argumenty

4

Jeżeli liczba nazwanych argumentów nie jest zdefiniowana z góry, należy użyć ** przed nazwą parametru.

In [9]:
def funkcja(**args): # parametry
    return(print(args))

funkcja(no1=1, no2=5, no3=8, no4=9) # argumenty

{'no1': 1, 'no2': 5, 'no3': 8, 'no4': 9}


In [10]:
funkcja(no1=1, no2=0, no3=4, no4=5, no5=20) # argumenty

{'no1': 1, 'no2': 0, 'no3': 4, 'no4': 5, 'no5': 20}


**Rekurencja**

Rekurencja jest powszechnie stosowana w matematyce i programowaniu. 

Zdefiniowana funkcja wywołuje samą siebie, więc należy uważać na to, by nie zaprogramować funkcji 'nigdy nie kończącej się' lub obciążającej nadmiernie procesor.

Aby zdefiniować funkcję rekurencyjnie, należy znać przypadek bazowy/początkowy oraz regułę.

Jednym z popularnych przykładów funkcji zdefiniowanych rekurencyjnie jest silnia.

- przypadek bazowy: 0! = 1
- reguła: n! = (n - 1)! * n, dla n > 1


In [11]:
def factorial(n):
   if n == 0:
       return 1
   else:
       return n*factorial(n-1)

factorial(3)

6

In [12]:
factorial(0)

1

In [13]:
factorial(1)

1

**Zadanie do realizacji w domu**

http://algorytmy.ency.pl/artykul/quicksort


In [24]:
# Tutaj zaimplementuj rekurencyjnie algorytm sortowania Quicksort.

list = [8,3,6,2,7,9,0,2]

def sort(array):
    """Sort the array by using quicksort."""

    less = []
    equal = []
    greater = []

    if len(array) > 1:
        pivot = array[0]
        for x in array:
            if x < pivot:
                less.append(x)
            elif x == pivot:
                equal.append(x)
            elif x > pivot:
                greater.append(x)
        return sort(less)+equal+sort(greater)  
    else:  
        return array

print(sort(list))

[0, 2, 2, 3, 6, 7, 8, 9]


**Klasy i obiekty**

Python jest językiem zorientowanym obiektowo. Tego rodzaju języki programowania bazują na obiektach w przeciwieństwie do programowania proceduralnego, gdzie nacisk kładziony jest na funkcje.

Klasa stanowi 'projekt' obiektu. Obiekt jest instancją klasy. Na bazie jednej klasy można utworzyć wiele obiektów.

Definicję klasy zaczyna się od słowa kluczowego <code>class</code>. Jednocześnie zostaje utworzony obiekt danej klasy o tej samej nazwie. Atrybutami klasy mogą być dane lub funkcje.

In [29]:
class NowaKlasa:
    "Docstring"
    def __init__(self, attr = 0):
        self.atrybut = attr # atrybuty klasy

    def przedstaw_atrybut(self): # metody wewnątrz klasy
        print("Wartosc atrybutu wynosi: " + str(self.atrybut))

print(NowaKlasa.__doc__)
print(NowaKlasa.przedstaw_atrybut)

Instancja = NowaKlasa(0)
Instancja.przedstaw_atrybut()

Instancja2 = NowaKlasa(5)
Instancja2.attr2 = 28
Instancja2.przedstaw_atrybut()
print(Instancja2)
print(Instancja2.attr2)

Docstring
<function NowaKlasa.przedstaw_atrybut at 0x000001D40C3B40D8>
Wartosc atrybutu wynosi: 0
Wartosc atrybutu wynosi: 5
<__main__.NowaKlasa object at 0x000001D40C2FAC88>
28


Usuwanie atrybutu:

In [30]:
print(Instancja2.attr2)
del Instancja2.attr2


28


Usuwanie instancji:

In [31]:
del Instancja2
print(Instancja2)

NameError: name 'Instancja2' is not defined