# Skryptowy Python

przekazywanie argumentów (funkcji, wywołania skryptu), przetwarzanie plików, biblioteki os, csv, json, pathlib, argparse

## 0. Notebook in PyCharm

Projekt w PyCharm najlepiej stworzyć `File->New Project` i wybrać:

`Interpreter Type: "Project venv"`

Potem możemy do naszego virtualnego środowiska doinstalowywać pakiety za pomocą:

komendy terminalu - `pip install <nazwa pakietu>` 

wyboru w opcjach - `File->Settings(Ctrl+Alt+S) => Project>Python Interpreter 
klikamy "+"; wpisujemy "jupyter"; klikamy "Install package";`  

## 1 Przekazywanie argumentów funkcji

W Pythonie, funkcje definiuje się za pomocą słowa kluczowego def, a następnie przekazuje się do nich argumenty w nawiasach.




In [1]:
def moja_funkcja(parametr1, parametr2):
    print(parametr1 * (parametr2 + 1) )


**Przekazywanie argumentów pozycyjnych**

Argumenty przekazuje się do funkcji w kolejności, w jakiej zostały zdefiniowane.

In [2]:
moja_funkcja("Ala", 7)


AlaAlaAlaAlaAlaAlaAlaAla


W powyższym kodzie, napis `Ala` zostanie przypisany do parametr1, a `7` do parametr2.

In [12]:
moja_funkcja(7, "Ala")

TypeError: can only concatenate str (not "int") to str

Kolejność ma znaczenie. Niezgodność z parametrami w definicji funkcji prowadzi do `TypeError`.

**Przekazywanie argumentów słów kluczowych (nazwanych)**

Można również przekazywać argumenty do funkcji, używając nazw parametrów.

In [16]:
moja_funkcja(parametr1="Ela", parametr2=7)

ElaElaElaElaElaElaElaEla


Dzięki temu kolejność argumentów nie ma znaczenia:

In [15]:
moja_funkcja(parametr2=7, parametr1="Ola")

OlaOlaOlaOlaOlaOlaOlaOla


Uwaga na poniższe przykłady.

In [18]:
moja_funkcja("Ula", parametr1="Ola")

TypeError: moja_funkcja() got multiple values for argument 'parametr1'

In [19]:
moja_funkcja(7, parametr1="Ola")

TypeError: moja_funkcja() got multiple values for argument 'parametr1'

### Wartości domyślne

Możemy również określić wartości domyślne dla parametrów, co pozwala na ich pominięcie podczas wywoływania funkcji.


Uwaga ! Parametr z funkcją domyślną i następujące po nim są opcjonalne.

In [17]:
def funkcja_z_domyslnymi(a="domyślna wartość a", b="domyślna wartość b"):
    print(a, b)

funkcja_z_domyslnymi()
funkcja_z_domyslnymi("nowa wartość a")
funkcja_z_domyslnymi(b="nowa wartość b")


domyślna wartość a domyślna wartość b
nowa wartość a domyślna wartość b
domyślna wartość a nowa wartość b


### args i kwargs

Jeżeli chcesz przekazać dowolną liczbę argumentów pozycyjnych lub nazwanych, możesz użyć *args dla argumentów pozycyjnych i **kwargs dla argumentów nazwanych.

Gdy, nie wiemy ile argumentów chcemy przekazać.

In [24]:
def wypisz_zwierzaki(kto, *co):
    print(kto + " ma:")
    for i in co:
        print(" groźnego " + i)
    

In [25]:
zm = "Ula"
l = ["psa", "kota", "jeża", "nietoperza"]
wypisz_zwierzaki(zm, *l)

Ula ma:
 groźnego psa
 groźnego kota
 groźnego jeża
 groźnego nietoperza


Podobna sytuacja, ale dla słów kluczowych. Np. chcemy mieć dużo opcji konfiguracyjnych.
Jeśli ostatni argument poprzedzony jest `**` to wszystkie argumenty słów kluczowych umieszczane są w słowniku i przekazywane.

In [30]:
def przetwarzanie_pliku(nazwa, **opcje):
    print("Otwieram " + nazwa)
    if 'tryb' in opcje:
        print("Tryb " + opcje['tryb'])
    if 'wybór' in opcje:
        for i in opcje['wybór']:
            print("Będę przetwarzał linię " + str(i))

In [31]:
przetwarzanie_pliku("elementarz", tryb="Do odczytu", wybór=[1,7,17], nieobsługiwany="jeszcze")

Otwieram elementarz
Tryb Do odczytu
Będę przetwarzał linię 1
Będę przetwarzał linię 7
Będę przetwarzał linię 17


Razem args i kwargs

In [6]:
def funkcja_z_args_kwargs(*args, **kwargs):
    for arg in args:
        print(arg)
    for key, value in kwargs.items():
        print(f"{key} = {value}")

funkcja_z_args_kwargs(1, 2, 3, a="A", b="B")


1
2
3
a = A
b = B


I jeszcze

In [7]:
def suma(*args):
    return sum(args)

print(suma(1, 2, 3, 4, 5))  # Wynik: 15


15


## 2. Argumenty wywołania skryptu

Przykładowo w PyCharm, prawy górny róg, mamy `main`. Możemy go rozwinąć strzałką w dół. Wybrać `Edit configurations`. W wybranym oknie możemy w części `Parameters` wpisać: ```2 Ala```

Aby uzyskać dostęp do argumentów importujemy bibliotekę `sys`, tam mamy `argv`

In [33]:
import sys
print(sys.argv)

['/home/voronwe/anaconda3/lib/python3.7/site-packages/ipykernel_launcher.py', '-f', '/run/user/1000/jupyter/kernel-4c6ef338-e749-4319-8051-fe0ca89b15d1.json']


W PyCharmie mamy ```['ścieżka/main.py', '2', 'Ala']```

W terminalu sprawdźmy jeszcze: `python main.py 7 Ela`

## 3. Przetwarzanie plików w Pythonie

### A. Podstawy operacji na plikach

Aby otworzyć plik w Pythonie, użyj wbudowanej funkcji `open()`. Funkcja ta zwraca obiekt pliku, który umożliwia czytanie, pisanie lub modyfikowanie pliku.

#### Otwieranie pliku:


In [None]:
plik = open('nazwa_pliku.txt', 'r')  # 'r' oznacza tryb czytania


Możliwe tryby:

- `'r'`: Czytanie
- `'w'`: Pisanie (kasuje zawartość pliku lub tworzy nowy, jeśli nie istnieje)
- `'a'`: Dopisywanie (dodawanie zawartości na końcu pliku)
- `'b'`: Tryb binarny (np. do obrazów, muzyki)

#### Zamykanie pliku:

```python
plik.close()
```

### B. Czytanie plików

```python
plik = open('nazwa_pliku.txt', 'r')
zawartosc = plik.read()
print(zawartosc)
plik.close()
```

Aby przeczytać pojedynczą linię:

```python
linia = plik.readline()
print(linia)
```

Aby przeczytać wszystkie linie do listy:

```python
linie = plik.readlines()
for linia in linie:
    print(linia)
```

### C. Pisanie do plików

```python
plik = open('nazwa_pliku.txt', 'w')
plik.write("Pierwsza linia\n")
plik.write("Druga linia\n")
plik.close()
```

### D. Używanie `with` przy pracy z plikami

Aby uniknąć potrzeby ręcznego zamykania plików, możesz użyć instrukcji `with`:

```python
with open('nazwa_pliku.txt', 'r') as plik:
    zawartosc = plik.read()
    print(zawartosc)
```

Po wyjściu z bloku `with`, plik zostanie automatycznie zamknięty.

### E. Przykład: Kopiowanie obrazka (tryb binarny)

```python
with open('zrodlo.jpg', 'rb') as plik_wejsciowy:
    data = plik_wejsciowy.read()
    with open('kopia.jpg', 'wb') as plik_wyjsciowy:
        plik_wyjsciowy.write(data)
```

Mam nadzieję, że ten tutorial pomógł Ci zrozumieć podstawy przetwarzania plików w Pythonie! Jeśli masz więcej pytań lub potrzebujesz dalszych wyjaśnień, daj znać!

Pliki binarne to pliki, które mogą zawierać dowolne dane w formie binarnej, w tym obrazy, dźwięki, skompilowane programy itp. Poniżej przedstawiam kilka operacji, które można wykonywać na plikach binarnych w Pythonie.

### F. Otwieranie i zamykanie plików binarnych:

Otwieranie pliku w trybie binarnym wymaga dodania litery 'b' do trybu otwierania:

```python
plik = open('plik.bin', 'rb')  # Otwieranie do czytania
plik.close()
```

### G. Czytanie plików binarnych:

Czytanie całego pliku:

```python
with open('plik.bin', 'rb') as plik:
    dane = plik.read()
```

Czytanie pewnej liczby bajtów:

```python
with open('plik.bin', 'rb') as plik:
    pierwsze_10_bajtow = plik.read(10)
```

### H. Pisanie do plików binarnych:

```python
with open('plik.bin', 'wb') as plik:
    dane = b'Przykladowe dane binarne'  # bajty, nie tekst
    plik.write(dane)
```

### I. Dopisywanie do plików binarnych:

```python
with open('plik.bin', 'ab') as plik:
    dodatkowe_dane = b'Dodatkowe dane binarne'
    plik.write(dodatkowe_dane)
```

### J. Przesunięcie wskaźnika w pliku:

Aby przesunąć wskaźnik w pliku binarnym, można użyć metody `seek()`:

```python
with open('plik.bin', 'rb+') as plik:  # 'rb+' pozwala na czytanie i pisanie
    plik.seek(5)  # Przesunięcie wskaźnika 5 bajtów od początku pliku
    plik.write(b'Hello')
```

### K. Czytanie i zapisywanie liczb binarnych:

Aby przekształcić liczby na bajty i odwrotnie, można użyć modułu `struct`:

```python
import struct

liczba = 12345
dane = struct.pack('I', liczba)  # Konwersja liczby na bajty (format 'I' to bez znakowy int)

with open('plik.bin', 'wb') as plik:
    plik.write(dane)

with open('plik.bin', 'rb') as plik:
    dane = plik.read(4)  # Odczytanie 4 bajtów
    odczytana_liczba = struct.unpack('I', dane)[0]
    print(odczytana_liczba)  # Wydrukuje 12345
```


## 4. Biblioteki

Oczywiście! Zarówno biblioteki `csv` jak i `json` są często używane w Pythonie do pracy z danymi. Oto krótki przegląd każdej z nich:

### A. Biblioteka `csv`

Biblioteka `csv` pozwala na czytanie oraz zapis danych w formacie CSV (Comma-Separated Values).

#### Czytanie plików CSV:

```python
import csv

with open('plik.csv', 'r') as plik:
    czytelnik = csv.reader(plik)
    for wiersz in czytelnik:
        print(wiersz)  # wiersz to lista zawierająca dane z pojedynczego wiersza pliku
```

#### Zapisywanie do plików CSV:

```python
import csv

dane = [['imie', 'nazwisko'], ['Jan', 'Kowalski'], ['Anna', 'Nowak']]

with open('plik.csv', 'w', newline='') as plik:
    pisarz = csv.writer(plik)
    for wiersz in dane:
        pisarz.writerow(wiersz)
```

Można także używać `DictReader` i `DictWriter` do pracy z plikami CSV w formie słowników.

### B. Biblioteka `json`

Biblioteka `json` umożliwia kodowanie i dekodowanie formatu JSON (JavaScript Object Notation). Jest to format wymiany danych, który jest czytelny dla człowieka i łatwy do analizy oraz generowania.

#### Kodowanie (zapisywanie) danych JSON:

```python
import json

dane = {
    'imie': 'Jan',
    'nazwisko': 'Kowalski',
    'wiek': 30
}

with open('dane.json', 'w') as plik:
    json.dump(dane, plik)
```

Można również użyć funkcji `dumps()` do konwersji struktury danych na łańcuch JSON:

```python
tekst_json = json.dumps(dane)
```

#### Dekodowanie (czytanie) danych JSON:

```python
import json

with open('dane.json', 'r') as plik:
    odczytane_dane = json.load(plik)
    print(odczytane_dane['imie'])  # Wydrukuje 'Jan'
```

Funkcję `loads()` można użyć do przekształcenia łańcucha JSON z powrotem w strukturę danych:

```python
struktura_danych = json.loads(tekst_json)
```

Zarówno `csv` jak i `json` są wbudowanymi bibliotekami w Pythonie, więc nie musisz ich instalować oddzielnie. Ułatwiają one pracę z popularnymi formatami danych, które są często używane w różnych aplikacjach i usługach internetowych.

### C. Biblioteka `pathlib`

Biblioteka `pathlib` w Pythonie wprowadza obiektowy sposób zarządzania ścieżkami, co jest bardziej intuicyjne i wygodne niż klasyczne operacje na łańcuchach znaków i funkcje z modułu `os.path`. Biblioteka ta została dodana w Pythonie 3.4 i jest zalecanym podejściem do operacji na ścieżkach.

Oto przegląd najważniejszych funkcji i klas z biblioteki `pathlib`:

#### C1. Klasy reprezentujące ścieżki:

- **Path**: podstawowa klasa do tworzenia ścieżek. Jej dokładne zachowanie zależy od systemu operacyjnego.
- **PurePath**: bazowa klasa dla czystych ścieżek, które nie zawierają operacji systemowych.
- **PurePosixPath**: klasa dla czystych ścieżek w stylu POSIX.
- **PureWindowsPath**: klasa dla czystych ścieżek w stylu Windows.

#### C2. Tworzenie ścieżek:

```python
from pathlib import Path

sciezka = Path('katalog/podkatalog/plik.txt')
```

#### C3. Operacje na ścieżkach:

- **exists()**: sprawdza, czy ścieżka istnieje.
- **is_file()**: sprawdza, czy ścieżka wskazuje na plik.
- **is_dir()**: sprawdza, czy ścieżka wskazuje na katalog.
- **mkdir()**: tworzy katalog.
- **rename()**: zmienia nazwę pliku lub katalogu.
- **glob()**: wyszukuje pliki według wzoru.

Przykłady:

```python
if sciezka.exists():
    print(f"Ścieżka {sciezka} istnieje!")

if sciezka.is_file():
    print(f"Ścieżka {sciezka} wskazuje na plik!")

for plik in sciezka.parent.glob('*.txt'):
    print(plik)
```

#### C4. Właściwości ścieżek:

- **name**: nazwa pliku lub katalogu.
- **parent**: katalog nadrzędny.
- **stem**: nazwa pliku bez rozszerzenia.
- **suffix**: rozszerzenie pliku.

Przykłady:

```python
print(sciezka.name)     # plik.txt
print(sciezka.stem)     # plik
print(sciezka.suffix)   # .txt
```

#### C5. Czytanie i pisanie plików:

Za pomocą `pathlib` można również łatwo czytać i zapisywać pliki:

```python
sciezka.write_text("Treść pliku")
zawartosc = sciezka.read_text()
```

#### C6. Łączenie ścieżek:

Można łączyć ścieżki za pomocą operatora `/`:

```python
glowny_katalog = Path('/katalog')
podkatalog = glowny_katalog / 'podkatalog'
```



### D. Biblioteka `os`

#### D1. Przydatene uwagi do zadania

Gdzie jesteśmy - `current working directory`

In [2]:
import os
os.getcwd()

'/home/voronwe/Desktop/Python materiały'

Wypisać elementy ... `os.listdir(path_to_dir)`

In [3]:
path_to_dir = os.getcwd()
os.listdir(path_to_dir)

['.ipynb_checkpoints',
 'Zaj4_zadanie.ipynb',
 'zaj1',
 'zaj4.ipynb',
 'zaj23',
 'new']

#### D2. Dobra praktyka - stosujemy path.join

Zamiast skomplikowanych łączeń, które w zależności od systemu operacyjnego mogą przestać działać...

In [4]:
list_m = ["January", "February", "March"]
m = list_m[1]
d = "Tuesday"
path = os.path.join(os.getcwd(),m,d,"Ranek")
print(path)

/home/voronwe/Desktop/Python materiały/February/Tuesday/Ranek


## 5. Biblioteka argparse

In [None]:
import argparse

parser = argparse.ArgumentParser()
parser.add_argument("input_file", help="file to be read")
parser.add_argument("result_file", help="file to save result")
parser.add_argument(
   "count_lines", type=int, default=10, nargs="?", help="Number of lines to be copied, default 10"
)
parser.add_argument(
   "--append", action="store_const", const="a", default="w", help="append result to `result_file`", dest="append"
)

args = parser.parse_args()

def copy_lines(input_file, result_file, count_lines, write_mode):
    # funkcja, z zadania powyżej

copy_lines(args.input_file, args.result_file, args.count_lines, args.append)

### Zacznijmy od działania

Stwórzmy plik `in.txt` np o treści "Ala\n ma\n kota\n"

Jeśli uruchomimy w/w kod z argumentami `in.txt out.txt`. Pojawi się nam plik `out.txt`.

Jeśli uruchomimy w/w kod z argumentami `in.txt out.txt a`, otrzymamy automatycznie wygenerowaną pomoc 
```
usage: main.py [-h] [--append] input_file result_file [count_lines]
main.py: error: argument count_lines: invalid int value: 'a'```

Tymczasem jeśli użyjemy tylko `-h`, mamy:
```
usage: main.py [-h] [--append] input_file result_file [count_lines]

positional arguments:
  input_file   file to be read
  result_file  file to save result
  count_lines  Number of lines to be copied, default 10

optional arguments:
  -h, --help   show this help message and exit
  --append     append result to `result_file`
```

### A teraz trochę wytłumaczenia

Korzystając z wiedzy z początku zajęć widzimy, że `input_file` i `result_file` trzeba podać.

Liczby linii nie trzeba podawać, co już przetestowaliśmy. 

Spróbujmy teraz zestaw `in.txt out.txt 1` - w `out.txt` jest teraz tylko napis "Ala".

Sprawdźmy teraz kilkukrotne uruchomienie `in.txt out.txt --append`.

### Jak działa nasz kod? 

Tworzymy obiekt parser `parser = argparse.ArgumentParser()`

Następnie dodajemy do parsera elementy, jedną z opcji jest eleganckie `add_argument`.

Wreszcie możemy wyciągnąc elementy z parsera za pomocą `args = parser.parse_args()`. Teraz `args` to obiekt `argparse.Namespace` bardzo podobny do słownika. `print(args)` zwraca: 
```
Namespace(input_file='in.txt', result_file='out.txt', count_lines=1, append='w')
```

Aby odwołać się do wartości danego atrybutu piszemy w wywołaniu `copy_lines`:
```
args.input_file
```
I do funkcji przekazywana jest wartość `in.txt`.


### add_argument

Nazwa i `help` są intuicyjne.

`type=int, default=10, nargs="?"`

Możemy podać typ. Wartość domyślną. Oraz zaznaczyć ilu argumentów się spodziewamy. `nargs`, czyli number of arguments, działa podobnie do wyrażeń regularnych, tzn:
```
7: 7 wartości
?: pojedyncza wartość, która może być opcjonalna (może jej nie być) 
*: dowolna liczba wartości, która będzie zebrana w listę 
+: podobnie jak *, ale wymagamy co najmniej jednej wartości
```

`"--append", action="store_const", const="a", default="w"` - tutaj mamy przykład flagi. Jeśli wybierzemy opcję `--append` to do naszej funkcji przekażemy `write_mode` równe `a`. Domyślnie przekazujemy `w`.