# Pakiety i moduły

In [2]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Wyszukiwanie lokalizacji interpretera

Korzystając z języków skryptowych (takich jak Python) niejednokrotnie będziemy musieli skorzystać z programu powłoki (terminal, konsola). W systemie Windows będzie to cmd, w systemie Linux - bash, w systemie macOS - zsh. Jeżeli interpreter Pythona jest poprawnie zainstalowany w systemie operacyjnym, możemy sprawdzić jego wersję korzystając z polecenia powłoki: python -V. Jeżeli polecenie python -V zwróci wersję Pythona, to znaczy, że ścieżka do programu interpretera jest dołączona do zmiennej środowiskowej Path. W takim wypadku możemy sprawdzić gdzie znajduje się instalacja interpretera z poziomu Pythona za pomocą instrukcji: 

<pre>import sys
locate_python = sys.exec_prefix
print(locate_python)</pre>

Interpreter wskaże ścieżkę do aktualnie uruchomionej instancji Pythona (jeżeli interpreter został uruchomiony w środowisku izolowanym, polecenie sys.exec_prefix wskaże miejsce w którym znajduje się środowisko izolowane).

Instrukcje interpretera można wykonywać również z linii poleceń powłoki, korzystając ze składni:
- w Windows: python -c "import nazwa_modulu; instrukcje" 
- w macOS: python3 -c "import nazwa_modulu; instrukcje"

Warto pamiętać, że wykonując dowolne polecenie w powłoce systemu, możemy zapoznać się z jego składnią i opcjonalnymi argumentami korzystając z polecenia: komenda -h, lub --help. Wyświetlą one dokument "pomocy".

### Sprawdzanie ścieżki do aktualnego katalogu roboczego

Aby sprawdzić ścieżkę do aktualnego katalogu roboczego (Current Working Directory) możemy skorzystać z modułu os:

<pre>import os
cwd = os.getcwd()
print(cwd)</pre>

Aby zmienić aktualną lokalizację katalogu roboczego, możemy skorzystać z polecenia z modułu os: os.chdir(sciezka). Należy pamiętać, że w przypadku pracy z systemem operacyjnym możemy natrafić okoliczności, w ramach których niemożliwa będzie zmiana ścieżki katalogu roboczego (katalog wskazywany przez ścieżkę nie istnieje, nie posiadamy uprawnień do pracy w katalogu wskazywanym przez ścieżkę, ścieżka wzkazuje na obiekt, który nie jest katalogiem). Obsługa wymienionych sytuacji jest możliwa dzięki zdefiniowanym wyjątkom Pythona:
- katalog pod wskazaną nie istnieje: FileNotFoundError
- obiekt pod wskazaną ścieżką nie jest katalogiem: NotADirectoryError
- brak uprawnień: PermissionError
Poniższy przykład prezentuje sposób zmiany lokalizacji aktualnego katalogu roboczego:

<pre>import os

path = '/projekt/app'

try:
    os.chdir(path)
    print(f"Aktualny katalog roboczy: {os.getcwd()}")
except FileNotFoundError:
    print(f"Katalog: {path} nie istnieje")
except NotADirectoryError:
    print(f"{path} nie jest katalogiem")
except PermissionError:
    print(f"Nie masz uprawnień do zmian w {path}")</pre>

### Ścieżki w Pythonie

Przez ścieżkę rozumiemy łańcuch znaków, który reprezentuje lokalizację danego zasobu w drzewie katalogów systemu. W zależności od systemu operacyjnego (Windows, macOS, Linux) ścieżki te mają różną strukturę oraz korzystają z różnych symboli (np. do rozdzielania ścieżek w systemach macOS i Linux służy symbol "/", tymczasem w systemach Windows jest to "\"). Aby skrypty w Pythonie były niezależne od systemu, na którym zostaną uruchomione, korzystamy z biblioteki pathlib, a w szczególności z jej klasy Path. Jeżeli ścieżkę umieścimy w konstruktorze klasy Path() zostatnie utworzony obiekt ścieżki. Co ciekawe, do tak powstałego obiektu możemy dostawiać kolejne elementy ścieżki za pomocą ukośników i łańcuchów znaków, a dopóki skrajny lewy element instrukcji będzie obiektem typu ścieżki - wynik całej linii będzie obiektem typu ścieżki. 

Przykład:
<pre>
from pathlib import Path

print(Path('app'))
print(type(Path('app')))

print(Path('app')/'dir')
print(type(Path('app')/'dir'))

print(Path('app', 'dir'))
print(type(Path('app', 'dir')))
</pre>

Klasa Path umośliwia również na oczytanie lokalizacji bieżącego katalogu roboczego (cwd) oraz na jago zmianę. 

Przykład:
<pre>
from pathlib import Path
import os

print(Path.cwd())
os.chdir('/Users')
print(Path.cwd())

</pre>

### Instalacja i lokalizacja pakietów i modułów

Instalacja bibliotek - biblioteki instalujemy za pomocą managerów pakietów. Najczęściej za pomocą mamagerów:
- pip
- conda

Powyższe managery uruchamiamy z poziomu wiersza poleceń powłoki, za pomocą komend:

Windows:
- py -m pip install nazwa_pakietu 
- conda install nazwa_pakietu

macOS:
- pip install nazwa_pakietu 
- conda install nazwa_pakietu

Manager pakietów pip:
Maganer pip jest podstawowym instalatorem pakietów w Pythonie. Pozwala na instalację pakietów z repozytorium Python Package Index oraz z innych repozytoriów. Więcej na temat pip i PyPI (instalacja, szczegóły techniczne) można znaleźć pod adresem https://pypi.org/project/pip/. Dokumentację pip można znaleźć pod adresem: https://pip.pypa.io/en/stable/cli/pip_install/.

Ze szczegółami obsługi managera pip można zapoznać się pod adresem: https://pip.pypa.io/en/stable/cli/
W szczególności warto zwrócić uwagę na najczęściej wykorzystywane polecenia:
- wyświetlanie pomocy managera pip: <pre>pip -h</pre> lub <pre>pip --help</pre>
- wyświetlanie listy zainstalowanych pakietów: <pre>pip list</pre>
- instalacja pakietu: <pre>pip install nazwa_pakietu</pre>
- deinstalacja pakietu: <pre>pip uninstall nazwa_pakietu</pre>
- instalacja listy pakietów z pliku tekstowego: <pre>pip install -r lista_pakietow.txt</pre>
- aktualizacja managera pip: <pre>pip install --upgrade pip</pre>

Pakiet a moduł:
- moduł - w praktyce oznacza plik z rozszerzeniem .py, który zawiera/wystawia zmienne, funkcje, klasy itd.
- pakiet - folder z modułami

Aby znaleźć ścieżkę, w której znajduje się pakiet lub moduł można skorzystać z instrukcji z poziomu interpretera:
- dla pakietów: korzystając z pola nazwa_pakietu.__path__
- dla konkretnego modułu: korzystając z pola nazwa_pakietu__file__

lub z poziomu linii poleceń powłoki:
- pip show nazwa_pakietu

Moduły i pakiety, które doinstalowujemy za pomocą managera pip najczęściej są instalowane w katalogu site-packages.

Kiedy importujemy biblioteki, interpreter Pythona najpierw sprawdza, czy dany zasób znajduje się w katalogu projektu. Jeżeli nie, wówczas przeszukuje katalog bibliotek zainstalowanych w środowisku interpretera. W związku z tym tworzone przez nas moduły lub pakiety możemy umieszczać w:
- katalogu projektu
- katalogu lib/PythonXX.XX/site-packages

### Zadanie 4.1 
Utwórz moduł statystyka zawierający następujące funkcje:
- suma (funkcja zwracająca sumę z listy)
- srednia (funkcja zwracająca średnią z listy)
- min (funkcja zwracająca wartość minimalną z listy)
- max (funkcja zwracająca wartość maksymalną z listy)

Następnie zapisz plik pod dwiema nazwami:
- stats_local.py, który umieścisz w aktualnym katalogu roboczym
- stats_global.py, który umieścisz w katalogu site-packages (najpierw trzeba znaleźć jego położenie)

Utwórz program, w którym zaimportujesz oba moduły i zaprezentujesz ich działanie.

### Przykładowe rozwiązanie:

In [None]:
def suma(lista):
    suma = 0
    for i in lista:
        suma = suma+i
    return suma

def srednia(lista):
    wynik = suma(lista)/len(lista)
    return wynik

def max_value(lista):
    wynik = max(lista)
    return wynik

def min_value(lista):
    wynik = min(lista)
    return wynik

# Środowisko izolowane

Tworząc projekt w Pythonie możemy natknąć się na problem związany z wersjami bibliotek lib środowiska. Przykładowo - na jednym komputerze projekt działa, na drugim nie ze względu na różnice w wersjach bibliotek i środowiska. W związku z tym dobrym pomysłem jest dołączenie do skryptu środowiska, w którym projekt będzie działać poprawnie. Takie środowisko nazywamy środowiskiem izolowanym, a najpopularniejszymni rozwiązaniami dla Pythona są:
- Veritual Env (venv)
- Conda Create

### Virtual Env

MacOS:
1. instalacja: <pre>pip3 -m install venv</pre> lub <pre>pip3 install virtualenv</pre>
2. Tworzenie środowiska: <pre>python3 -m venv nazwa_srodowiska</pre>
3. Aktywacja środowiska: <pre>source nazwa_srodowiska/bin/activate</pre>
4. Dezaktywacja środowiska: <pre>deactivate</pre>

Windows:
1. instalacja: <pre>pip -m install virtualenv</pre> lub <pre>pip install venv</pre>
2. Tworzenie środowiska: <pre>python -m venv nazwa_srodowiska</pre>
3. Aktywacja środowiska: <pre>.\nazwa_srodowiska\Scripts\activate</pre>
4. Dezaktywacja środowiska: <pre>deactivate</pre>

### Conda Create

Alternatywnym sposobem tworzenia środowiska izolowanego jest skorzystanie z polecenia conda create. Warunkiem koniecznym jest posiadanie managera conda.

Windows/macOS
1. Tworzenie środowiska: <pre>conda create -n nazwa_srodowiska python=wersja_pythona</pre>
2. Aktywacja środowiska: <pre>conda activate nazwa_srodowiska</pre>
3. Dezaktywacja środowiska: <pre>deactivate</pre>

### Zadanie 4.2

Utwórz katalog projektu, w którym założysz środowisko izolowane, a następie aktywuj je i zainstaluj w nim (za pomocą maganera pakietów pip) wybrane biblioteki (np. numpy, jupyter, matplotlib, pandas). Następnie utwórz skrypt Pythona i zademonstruj (za pomocą polecenia sys.exec_prefix) w jakim środowisku pracuje. 

# Zaawansowane edytory kodu

Tworzenie kodu programu nieuchronnie wiąże się z popełnianiem błędów. Z kolei - kiedy tworzymy większy projekt lub aplikację, w jej skład zaczyna wchodzić więcej niż jeden plik. Nasza aplikacja dodatkowo może odnosić się lub korzystać z zasobów komputera, na której jest uruchamiana i wymaga od nas częstej pracy w programie powłoki systemowej (bash, cmd, zsh). W takiej sytuacji coraz większe znaczenie przy wytwarzaniu oprogramowania ma środowisko programistyczne. Na obecnym etapie nauki najważniejszymi cechami/funkcjonalnościami środowiska są:
- uzupełnianie składni (wpisując nazwy instrukcji z przestrzeni nazw, po naciśnięciu klawisza tab uzupełniana jest wprowadzana instrukcja lub pojawia się lista dostępnych instrukcji)
- linter (aplikacja analizująca cały nasz kod i wskazująca potencjalne błędy)
- połączenie z powłoką systemową
- podgląd zasobów w katalogu projektu

Do takich środowisk należą:
- Spyder: https://www.spyder-ide.org
- PyCharm: https://www.jetbrains.com/pycharm/
- Visual Studio Code: https://code.visualstudio.com

# Operacje na plikach

Pliki służą do trwałego przechowywania danych. W trakcie działania programu możemy otwierać i odczytywać lub zapisywać informacje w plikach tekstowych korzystająć m. in. z funkcji open("nazwa_pliku.txt", "tryb").

Aby przeprowadzić odczyt pliku tworzymy zmienną, do której przypisujemy wynik działania fukcji open(). Poniżej przegląd najważniejszych instrukcji:

- plik = open("plik.txt", "r") - otwarcie pliku
- plik.close() - zamknięcie pliku
- linia = plik.readline() - odczytywanie pojedynczo linii zapisanych w pliku
- linie = plik.readlines() - odczytanie wszystkich linii zapisanych w pliku
- plik.write("Wiadomość testowa\n") - zapis do pliku zwykłej wiadomości.
- plik.writelines(linie) - zapis do pliku listy 

### Tryby dostępu do pliku tekstowego

Instrukcja open() posiada kilka trybów dostępu do pliku. Dla przypomnienia, aby dokonać odczytu zawartości pliku, warto wynik działania funckji open() przypisać do zmiennej. Funkcja open() ma składnię: <br>

plik = open("nazwa_plik.rozszerzenie", "tryb") - otwarcie pliku

Poniżej opis najważniejszych trybów funkcji open():
- „r” - tryb odczytu danych. Jeśli plik nie istnieje, zostaje zasygnalizowany błąd.
- „w” - tryb zapisu danych. Wybrany plik zostaje nadpisany nowymi danymi. Jeśli plik nie istnieje, zostanie utworzony.
- „a” - tryb zapisu danych. Do wybranego pliku zostają dopisane nowe dane. Jeśli plik nie istnieje, zostanie utworzony.

### Zadanie 4.3

Stwórz plik tekstowy z kilkoma wierszami danych, a następnie napisz program, który wypisze zawartość utworzonego pliku do konsoli.

### Przykładowe rozwiązanie:

In [23]:
plik = open("przykladowy_plik.txt", "r")
dane = plik.readlines()
for i in dane:
    print(i)
plik.close()

1

2

3

5

4

3

2

2


### Zadanie 4.4

Napisz program, który tworzy plik i wpisuje liczby od 0-10, każdą w następnej linii, następnie zamyka i otwiera ponownie plik i dopisuje litery alfabetu, każdą następną w nowej linii.

### Przykładowe rozwiązanie:

In [26]:
import string

alfabet = string.ascii_uppercase

dane = []

for i in range(11):
    dane.append(i)
    
plik = open("dane.txt", "w")
for i in range(0, len(dane)):
    plik.write(str(dane[i]) + "\n")

plik.close()

alfabet = "abcdefghijklkmn"

plik = open("dane.txt", "a")
for i in range(0, len(alfabet)):
    plik.write(alfabet[i] + "\n")
plik.close()

### Zadanie 4.5

Napisz program, który umożliwia zapisywanie do pliku .txt danych takich jak: imię, nazwisko, stanowisko i wynagrodzenie. Użytkownik ma mieć możliwość dodawania, usuwania i wypisywania listy osób. Usuwanie pozycji powinno działać po podaniu samego nazwiska osoby. Program powinien posiadać interaktywne menu: D-dodaj, U-usuń, W-wypisz i Q-wyjście.
Podpowiedź: Utwórz funkcje: dodaj, usuń, pokaż zawartość pliku


### Przykładowe rozwiązanie:

In [29]:
def dodaj(imie, nazwisko, stanowisko, wynagrodzenie):
    plik = open("dane_firmy.txt", "a")
    plik.write(f"{imie};{nazwisko};{stanowisko};{wynagrodzenie}\n")
    plik.close()
    
def usun(nazwisko):
    plik = open("dane_firmy.txt", "r")
    bufor = []
    for i in plik:
        row = i.strip()
        tab = row.split(";")
        if(tab[1]!=nazwisko):
            bufor.append(i)
    plik.close()
    
    plik = open("dane_firmy.txt", "w")
    for i in range(len(bufor)):
        plik.write(bufor[i])
    plik.close()
    
    
def pokaz():
    plik = open("dane_firmy.txt", "r")
    lista = plik.readlines()
    for i in lista:
        daneList = i.split(";")
        print(f"Imię: {daneList[0]}, Nazwisko: {daneList[1]}, Stanowisko: {daneList[2]}, Wynagrodzenie: {daneList[3]}")
    plik.close()
    
while(True):
    menu = input("D-dodaj, U-usuń, P-pokaż, K-koniec: ").upper()
    if(menu == "D"):
        imie = input("Podaj imię: ")
        nazwisko = input("Podaj nazwisko: ")
        stanowisko = input("Podaj stanowisko: ")
        wynagrodzenie = float(input("Podaj wynagrodzenie: "))
        dodaj(imie, nazwisko, stanowisko, wynagrodzenie)
    elif(menu == "U"):
        nazwisko = input("Podaj nazwisko: ")
        usun(nazwisko)
    elif(menu == "P"):
        pokaz()
    elif(menu == "K"):
        print("Koniec programu")
        break
    else:
        print("Nierozpoznana opcja menu")
        
        
#----------------------        
def dodaj(imie, nazwisko, stanowisko, wynagrodzenie):
    plik = open("dane_firmy.txt", "a")
    plik.write(f"{imie};{nazwisko};{stanowisko};{wynagrodzenie}\n")
    plik.close()
    
def pokaz():
    plik = open("dane_firmy.txt", "r")
    linie = plik.readlines()
    for item in linie:
        fragmenty = item.split(";")
        print(f"Imię: {fragmenty[0]}, Nazwisko: {fragmenty[1]}, \
        Stanowisko: {fragmenty[2]}, Wynagrodzenie: {fragmenty[3]}")
    plik.close()

def usun(nazwisko):
    plik = open("dane_firmy.txt", "r")
    linie = plik.readlines()
    bufor = []
    for item in linie:
        fragmenty = item.split(";")
        if (fragmenty[1]!=nazwisko):
            bufor.append(item)
    plik.close()
    
    plik = open("dane_firmy.txt", "w")
    for item in bufor:
        plik.write(item)
    plik.close()
    
while(True):
    menu = input("D-dodaj, U-usuń, P-pokaż, Q-koniec").upper()
    if(menu == "D"):
        imie = input("Podaj imię: ")
        nazwisko = input("Podaj nazwisko: ")
        stanowisko = input("Podaj stanowisko: ")
        wynagrodzenie = input("Podaj wynagrodzenie: ")
        dodaj(imie, nazwisko, stanowisko, wynagrodzenie)
    elif(menu == "U"):
        nazwisko = input("Podaj nazwisko")
        usun(nazwisko)
    elif(menu == "P"):
        pokaz()
    elif(menu == "Q"):
        print("Koniec programu")
        break
    else:
        print("Nieznana opcja menu")

D-dodaj, U-usuń, P-pokaż, K-koniec: k
Koniec programu


### Zadanie 4.6

Napisz program, który pobierze od użytkownika nazwę pliku z danymi, wczyta plik o wskazanej nazwie i wypisze jego zawartość w konsoli. Przed wyświetleniem pliku, program pyta użytkownika, czy jego dane posiadają nagłówek oraz jaki symbol stanowi separator danych. Jeżeli dane posiadają nagłówek - zadbaj, aby również został wyświetlony. Program ma informować użytkownika ile wierszy zawiera plik z danymi oraz przyjmować od użytkownika zakres wierszy, które chce przejrzeć. Następnie użytkownik podejmuje decyzję, czy chce powtórzyć działanie programu, czy zakończyć pracę z programem.

### Zadanie 4.7
Korzystając ze znanych Ci zagadnień (struktury danych, listy, łańcuchy znaków, konkatenacja łańcuchów znaków, f-stringi, pętle, funkcje, klasy, generatory liczb losowych, wczytywanie plików z danymi) zaproponuj program do generowania danych kadrowych przedsiębiorstwa. Pojedyńcza encja danych powinna zawierać następujące dane: 
- numer porządkowy
- nazwisko
- imię
- płeć
- stanowisko
- data zatrudnienia
- wynagrodzenie
- niewykorzystane dni urlopu

Aby maksymalnie zbliżyć dane do rzeczywistości, skorzystaj z bazy danych dotyczących nazwisk i imion wystepujących w Polsce. Znajdziesz je na stronach:
- baza imion: https://dane.gov.pl/pl/dataset/1501,lista-imion-wystepujacych-w-rejestrze-pesel
- baza nazwisk: https://dane.gov.pl/pl/dataset/568,nazwiska-wystepujace-w-rejestrze-pesel

Program powinien wczytać dane dot. imion i nazwisk i na tej podstawie generować dane osobowe. Wygenerowane dane zapisz do pliku w postaci wyrażeń rozdzielonych średnikami i nazwij go dane_kadrowe.csv. Plik powinien zawierać min. 1000 rekordów.

### Przykładowe rozwiązanie:

In [74]:
from datetime import datetime
from random import randint, randrange

class Pracownik:
    def __init__(self, ID, plec, nazwisko, imie, stanowisko, data_zatrudnienia, wynagrodzenie, dni_urlopu):
        self.ID = ID
        self.plec = plec
        self.nazwisko = nazwisko
        self.imie = imie
        self.stanowisko = stanowisko
        self.data_zatrudnienia = data_zatrudnienia
        self.wynagrodzenie = wynagrodzenie
        self.dni_urlopu = dni_urlopu
    
    def drukuj(self):
        return f"{self.ID};{self.nazwisko};{self.imie};{self.plec};{self.stanowisko};{self.data_zatrudnienia};{self.wynagrodzenie};{self.dni_urlopu}\n"

def lista_danych(nazwa_pliku, separator):
    plik = open(nazwa_pliku, "r")
    linie = plik.readlines()
    wynik = []
    zakres = int(0.75*len(linie))
    for i in range(1, zakres):
        wynik.append(linie[i].strip().split(separator)[0])
    plik.close()
    return wynik

lista_nazwisk_meskich = lista_danych("nazwiska_meskie.csv", ",")
lista_nazwisk_zenskich = lista_danych("nazwiska_zenskie.csv", ",")
lista_imion_meskich = lista_danych("imiona_meskie.csv", ",")
lista_imion_zenskich = lista_danych("imiona_zenskie.csv", ",")

stanowiska_m = ["księgowy", "kadrowy", "kucharz", "sprzątacz", "dyrektor", "nauczyciel"]
stanowiska_z = ["księgowa", "kadrowa", "kucharka", "sprzątaczka", "dyrektorka", "nauczycielka"]

lista_plci = ["M", "K"]

dane = []

for i in range(1000):
    plec = lista_plci[randint(0,1)]
    
    if (plec == "M"):
        nazwisko = lista_nazwisk_meskich[randint(0, len(lista_nazwisk_meskich)-1)]
        imie = lista_imion_meskich[randint(0, len(lista_imion_meskich)-1)]
        stanowisko = stanowiska_m[randint(0, len(stanowiska_m)-1)]
    
    elif (plec == "K"):
        nazwisko = lista_nazwisk_zenskich[randint(0, len(lista_nazwisk_zenskich)-1)]
        imie = lista_imion_zenskich[randint(0, len(lista_imion_zenskich)-1)]
        stanowisko = stanowiska_z[randint(0, len(stanowiska_z)-1)]
        
    wynagrodzenie = randrange(3200, 6400, 200)
    data = datetime(randint(1950, 2020), randint(1, 12), 1).strftime("%Y-%m-%d")
    urlop = randint(0, 52)
    ID = i+1
    
    pracownik = Pracownik(ID, plec, nazwisko, imie, stanowisko, data, wynagrodzenie, urlop)
    dane.append(pracownik.drukuj())

plik = open("dane_firmy.csv", "w")
plik.write("ID;Nazwisko;Imię;Płeć;Stanowisko;Data zatrudnienia;Wynagrodzenie;Dni urlopu\n")
for item in dane:
    plik.write(item)
plik.close()

In [80]:
def wczytaj_plik(nazwa_pliku, top):
    plik = open(nazwa_pliku, "r")
    linie = plik.readlines()
    wynik = []
    zakres = len(linie)
    for i in range(top, zakres):
        wynik.append(linie[i].strip())
    plik.close()
    return wynik

decyzja = "T"

while(decyzja == "T"):
    nazwa_pliku = input("Podaj nazwę pliku do odczytu: ")
    top = input("Od którego wiersza wczytać dane? (Jeśli dane mają nagłówek wpisz 1): ")

    dane = wczytaj_plik("dane_firmy.csv", 1)

    print(f"Plik posiada {len(dane)} wierszy. Podaj zakres wyświetlania.")

    start = int(input("Wiersz początkowy: "))
    end = int(input("Wiersz końcowy: "))

    for i in range(start, end):
        print(f"{dane[i]}")
    
    decyzja = input("Czy chcesz powtórzyć działanie programu? t-tak, n-nie: ").upper()
    


Podaj nazwę pliku do odczytu: dane_firmy.csv
Od którego wiersza wczytać dane? (Jeśli dane mają nagłówek wpisz 1): 1
Plik posiada 999 wierszy. Podaj zakres wyświetlania.
Wiersz początkowy: 300
Wiersz końcowy: 320
301;RACHOWSKI;LAXMI;M;dyrektor;1954-04-01;5800;21
302;JAŚNIACH;FAMKE;K;księgowa;1952-04-01;6000;29
303;KOWALESKA;KARMELINA;K;nauczycielka;1994-05-01;6200;44
304;TSIMASHKOU;PETRE;M;sprzątacz;1953-06-01;5200;24
305;KIK;FACUNDO;M;kucharz;1971-05-01;4800;9
306;SZEPTAK;ZDZISŁAW    KAZIMIERZ;M;dyrektor;1971-10-01;3600;30
307;DOENING;ROSELY;K;księgowa;1978-04-01;5000;11
308;SŁUSZNIK;THANH TUYEN;M;dyrektor;1967-08-01;5600;34
309;SWIERSZCZEWSKA;INASS;K;kucharka;1964-05-01;5400;10
310;MAKOMASKI;DORYAN;M;kucharz;1975-12-01;3400;11
311;NIZOŁĘCKA;HE;K;kucharka;1962-02-01;3200;26
312;DOBI;DEVRAJ;M;sprzątacz;1968-05-01;4200;31
313;DAROCH;HARNIK;M;nauczyciel;1994-08-01;5200;17
314;CZWIKLIŃSKI;REINHART;M;sprzątacz;1966-11-01;5600;41
315;MARYNCZAK;KATALIN;K;nauczycielka;2010-05-01;4200;25
316;CI

In [77]:
dane = wczytaj_plik("dane_firmy.csv", 1)

In [79]:
dane[0]

'1;PORWOLL;NOREEN;K;dyrektorka;1968-07-01;3600;9'

In [6]:
from random import randint

class Pracownik:
    def __init__(self):
        plec = ["m", "k"]
        imiona_meskie = ["Adam", "Błażej", "Cezary", "Daniel", "Ernest", "Feliks", "Grzegorz", "Henryk", "Ignacy", "Jan", "Karol", "Leon", "Maciej", "Sławomir", "Szymon"]
        imiona_zenskie = ["Anna", "Beata", "Cecylia", "Dominika", "Eliza", "Gabriela", "Hanna", "Iwona", "Joanna", "Karolina", "Adrianna", "Lucyna", "Malwina", "Weronika", "Katarzyna"]
        korpusy_nazwisk = ["Maćkow", "Now", "Kowal", "Witk", "Niewiadom", "Podlew", "Kramar", "Gryl", "Bryl", "Rogal", "Teodor", "Wasil", "Czochral", "Lulkiew", "Kolon", "Góral", "Pigłow", "Wojciech", "Matus"]
        koncowki_nazwisk_meskie = ["iak", "ik", "ski", "owicz"]
        koncowki_nazwisk_zenskie = ["iak", "ik", "ska", "owicz"]
        stanowiska = ["inżynier procesu", "inżynier produkcji", "inżynier oprogramowania", "specjalista HR", "administrator sieciowy", "administrator infrastruktury sprzętowej", "inspektor ochrony BHP", "główny księgowy"]
        self.plec = plec[randint(0, len(plec)-1)]
        if self.plec == "m":
            self.imie = imiona_meskie[randint(0, len(imiona_meskie)-1)]
            self.nazwisko = korpusy_nazwisk[randint(0, len(korpusy_nazwisk)-1)] + koncowki_nazwisk_meskie[randint(0, len(koncowki_nazwisk_meskie)-1)]
        elif self.plec == "k":
            self.imie = imiona_zenskie[randint(0, len(imiona_zenskie)-1)]
            self.nazwisko = korpusy_nazwisk[randint(0, len(korpusy_nazwisk)-1)] + koncowki_nazwisk_zenskie[randint(0, len(koncowki_nazwisk_zenskie)-1)]
        self.data_zatrudnienia = str(randint(2010, 2022))+"-"+str(randint(1, 12))+"-"+str(randint(1, 15))
        self.stanowisko = stanowiska[randint(0, len(stanowiska)-1)] 
        self.wynagrodzenie = 100*randint(35, 150)   
        self.urlop = randint(0, 35)
        
    def __str__(self):
        return f"Nazwisko: {self.nazwisko}, Imię: {self.imie}, Płeć: {self.plec}, Stanowisko: {self.stanowisko}, Data zatrudnienia: {self.data_zatrudnienia}, Wynagrodzenie: {self.wynagrodzenie}, Urlop do wykorzystania: {self.urlop}"
        
ob = Pracownik()
print(ob)

plik = open("dane_kadrowe_przedsiebiorstwa.txt", "w", encoding='windows-1250')

plik.write(f"Lp.;Nazwisko;Imię;Płeć;Stanowisko;Data Zatrudnienia;Wynagrodzenie;Urlop do wykorzystania\n")

liczba_pracownikow = 1000
usterki = []

for i in range(3):
    usterki.append(randint(0, liczba_pracownikow-1))
usterki.sort()


for i in range(liczba_pracownikow):
    p = Pracownik()
    if(i==usterki[0]):
        p.plec="NULL"
    if(i==usterki[1]):
        p.data_zatrudnienia="NULL"
    if(i==usterki[2]):
        p.urlop="NULL"
        
    plik.write(f"{i+1};{p.imie};{p.nazwisko};{p.plec};{p.stanowisko};{p.data_zatrudnienia};{p.wynagrodzenie};{p.urlop}\n")
plik.close()

Nazwisko: Maćkowowicz, Imię: Weronika, Płeć: k, Stanowisko: administrator infrastruktury sprzętowej, Data zatrudnienia: 2020-6-9, Wynagrodzenie: 9100, Urlop do wykorzystania: 0


### Zadanie 4.8
Korzystając ze znanych Ci zagadnień (struktury danych, listy, łańcuchy znaków, konkatenacja łańcuchów znaków, f-stringi, pętle, funkcje, klasy, generatory liczb losowych) zaproponuj program do generowania sztucznych danych dot. cen nieruchomości (mieszkań) w Warszawie. Pojedyncza encja danych powinna zawierać:
- numer porządkowy nieruchomości
- adres
- kod pocztowy
- liczbę pokoi
- numer piętra
- powierzchnię w metrach kwadratowych
- cenę

Dane dot. adresów w mieście Warszawa możesz pobrać korzystając ze strony:
https://dane.gov.pl/pl/dataset/469/resource/27518,adresy-mst-warszawy-format-csv-adres-uniwersalny/table?page=1&per_page=20&q=&sort=

Załóż, że cena nieruchomości zależy tylko od jej powierzchni zgodnie z uproszczonym równaniem: $cena = cena_{m^2} \cdot powierzchnia \pm odchylenie$. Odchylenie to pewna losowa liczba. Wygenerowane dane zapisz do pliku z rozszerzeniem csv. Plik powinien zawierać conajmniej 1000 rekordów.

### Zadanie 4.9
Korzystając z bibliotek math oraz numpy utwórz plik zawierający tablice trygonometryczną. Plik powinien zawierać następujące dane:
- numer rekordu
- wartość kąta w stopniach
- odpowiadającą wartość kąta w radianach
- wartość funkcji sinus
- wartość funkcji cosinus
- wartość funckji tangens
- wartość funkcji cotangens

Dane należy wygenerować dla kolenych kątów w stopniach, co pół stopnia, w zakresie od 0 do 360 stopni. 


### Zadanie 4.10
Załóż, że średni wzrost kobiet w Polsce wynosi 165 cm, a średni wzrost mężczyzn to 175 cm. Załóż również, że średnia waga kobiety to 55 kg, a mężczyzny to 70 kg. W oparciu o powyższe założenia, oraz korzystając z generatorów liczb losowych (skorzystaj z tzw. rozkładu normalnego Gaussa) wynegeruj dane dotyczące wzrostu i wagi dla 1000 osób (zarówno kobiet i mężczyzn). Jeden rekord powinien zawierać następujące dane:
- numer porządkowy
- płeć
- wzrost
- wagę

Dane zapisz do pliku z rozszerzeniem csv.

### Zadanie 4.11
Maksymalne tętno człowieka można oszacować korzystając z przybliżonego wyrażenia: $HR_{max} = 208 - (0.7 \cdot A)$
gdzie: 
- $HR_{max}$ - maksymalne tętno w uderzeniach na minutę
- $A$ - wiek w latach

(na podstawie: http://www.shapesense.com/fitness-exercise/calculators/heart-rate-based-calorie-burn-calculator.shtml)

Na podstawie powyższego równania wygeneruj dane wartości maksymalnego tętna w zależności od wieku. Pojedyńczy rekord powinien zawierać:
- numer porządkowy
- wiek
- tętno maksymalne

Dane zapisz do pliku z rozszerzeniem csv.

### Zadanie 4.12
Aby określić ilość spalonych kalorii (czyli wydzielone ciepło) w trakcie wysiłku fizycznego, można skorzystać z następujących, przybliżonych równań, które w sytuacji, kiedy pułap tlenowy (V02 max) nie jest znany:
 - dla kobiet: Q = ((-20.4022 + (0.4472 x HR) - (0.1263 x W) + (0.074 x A))/4.184) x 60 x T
 - dla mężczyzn: Q = ((-55.0969 + (0.6309 x HR) + (0.1988 x W) + (0.2017 x A))/4.184) x 60 x T

gdzie:
HR - tętno (w uderzeniach na minutę)
W = waga (w kilogramach)
A = wiek (w latach)
T = czas ćwiczeń (w godzinach)
(na podstawie: http://www.shapesense.com/fitness-exercise/calculators/heart-rate-based-calorie-burn-calculator.shtml)

Na podstawie powyższych danych wygeneruj plik z danymi dotyczącymi spalonych kalorii przez próbę 1000 osób. Jeden rekord powinien zawierać następujące dane:
- numer porządkowy
- płeć
- wiek
- wagę
- czas ćwiczeń w godzinach
- średnie tętno
- ilość wydzielonego ciepła

Dane zapisz do pliku z rozszerzeniem csv.

### Zadanie 4.13

Decyzję o tym, czy kierowca samochodu terenowego może jechać w terenie szybko czy wolno można podjąć (w uproszczonym wariancie) na podstawie nachylenia i wyboistości terenu. Załóżmy, że wyboistość, nachylenie oraz niepewność decyzji reprezentujemy w postaci liczb w przedziale od 0 do 1 (takie liczby możemy generować korzystając z funkcji random() z modułu random). Załózmy również, że decyzja kierowcy może być opisana uproszczonym równaniem: $decyzja = round(nachylenie \cdot wyboistosc + 0.1 \cdot niepewnosc + 0.25)$ Dodatkowo przyjmijmy, że jeżeli nachylenie lub wyboistość będą większe niż 0.75, to $decyzja = 1$. W takim przypadku wartość decyzji równa 0 oznacza jazdę szybką, a wartość równa 1 oznacza jazdę wolną. 

W oparciu o powyższe założenia, wygeneruj dane dotyczące decyzji kierowcy samochodu terenowego. Pojedyńczy rekord powinien zawierać dane:
- numer porządkowy (liczba całkowita)
- nachylenie (liczba rzeczywista w przedziale 0-1, gdzie 0 to teren płaski, a 1 to stromy)
- wyboistosc (liczba rzeczywista w przedziale 0-1, gdzie 0 to teren gładki, a 1 to bardzo nierówny)
- niepewnosc (liczba rzeczywista w przedziale 0-1)
- decyzja (liczba całkowita - 0 lub 1, gdzie 0 to jazda szybka, a 1 to jazda wolna)

Dane zapisz do pliku z rozszerzeniem csv.

### Przykładowe rozwiązanie

In [7]:
n_points = 100

random.seed(42)
grade = [random.random() for ii in range(0,n_points)]
bumpy = [random.random() for ii in range(0,n_points)]
error = [random.random() for ii in range(0,n_points)]
y = [round(grade[ii]*bumpy[ii]+0.1*error[ii]+0.25) for ii in range(0,n_points)]
for ii in range(0, len(y)):
    if grade[ii]>0.8 or bumpy[ii]>0.8:
        y[ii] = 1.0

# Zapis złożonych struktur danych

Aby przechowywać bardziej złożone informacje w Pythonie używany jest moduł „pickle”. Proces ten jest nazywany również marynowaniem.

Marynować można: liczby, łańcuchy znaków, krotki, listy, słowniki, zbiory i obiekty.
<pre>
import pickle # dodanie modułu do projektu
</pre>
Tryby dostępu do plików ze złożonymi strukturami

- plik = open("dane.dat", "wb") - otwarcie pliku.
- „rb” - tryb odczytu danych z pliku binarnego. Jeśli plik nie istnieje, zostaje zasygnalizowany błąd.
- „wb” - tryb zapisu danych do pliku binarnego. Wybrany plik zostaje nadpisany nowymi danymi. Jeśli plik nie istnieje, zostanie utworzony.
- „ab” - tryb zapisu danych do pliku binarnego. Do wybranego pliku zostają dopisane nowe dane. Jeśli plik nie istnieje, zostanie utworzony.

Zapisywanie i odczytywanie danych w pliku

- pickle.dump(lista, plik) - do otwartego pliku „plik” zostaje dopisana struktura listy „lista”.
- obiekt = pickle.load(plik) - z otwartego pliku „plik” zostaje odczytana struktura obiektu i przypisana do obiektu „obiekt”.

Metody dump i load mogą być wykonywanie wielokrotnie, przy użyciu różnych typów danych!

In [86]:
import pickle

class Kontakt:
    def __init__(self, imie, nazwisko, komunikatory):
        self.imie = imie
        self.nazwisko = nazwisko
        self.komunikatory = komunikatory

ob1 = Kontakt("Adam", "Nowak", {"skype": "adam", "tweeter": "@an"})
ob2 = Kontakt("Filip", "Zalewski", {"skype": "fil", "tweeter": "@fil"})
ob3 = Kontakt("Anna", "Barańska", {"skype": "an", "tweeter": "@baranska"})

lista = [ob1, ob2, ob3]

plik = open("obiekty.dat", "wb") 
pickle.dump(lista, plik)
plik.close()
    

In [87]:
plik = open("obiekty.dat", "rb") 
obiekt = pickle.load(plik)

In [90]:
obiekt[0].komunikatory

{'skype': 'adam', 'tweeter': '@an'}

### Zadanie 4.14

Napisz program do organizowania kontaktów w bazie, która zawiera informacje w postaci: imię, nazwisko i nick w komunikatorze sieciowym (użytkownić może posiadać ich kilka, każdy stanowi parę komunikator - nick). Dane przechowywane są w obiektach, a potem marynowane i zapisane w pliku .dat. Program powinien posiadać interaktywny interfejs w postaci tekstowego menu (CLI). Najpierw użytkownik wybiera, czy chce wprowadzać dane, czy przeglądać dane w bazie. Część do wprowadzania danych powinna mieć menu: W - wyświetlanie, DK - dodaj kontakt, UK - usuń kontakt, DT - dodaj komunikator, UT - usuń komunikator, Q - wyjście i zapis. Część umożliwiająca przegląd danych tylko wyświetla zawartość pliku .dat, a następnie przechodzi do pytania, czy użytkownik życzy sobie powtórzyć wykonanie całego programu.

### Zadanie 4.15
Napisz program generujący bestiariusz - bazę legendarnych stworzeń z wybranego uniwersum (mitologia, powieść fantasy, wybrana gra komputerowa). Każda postać powinna posiadać atrybyty: nazwa (tekst), zdolnosci (lista), ekwipunek (lista). Dane przechowywane są w obiektach, a potem marynowane i zapisane w pliku .dat. Program powinien posiadać interaktywny interfejs w postaci tekstowego menu (CLI). Najpierw użytkownik wybiera, czy chce wprowadzać bazę, czy przeglądać bazę. Część do wprowadzania danych powinna mieć menu: W - wyświetlanie, DP - dodaj postać, UP - usuń postać, Q - wyjście i zapis. Część umożliwiająca przegląd danych tylko wyświetla zawartość pliku .dat, a następnie przechodzi do pytania, czy użytkownik życzy sobie powtórzyć wykonanie całego programu.