### **Wprowadzenie do `threading`**

Moduł `threading` pozwala na tworzenie wątków, które mogą być używane do wykonywania zadań równolegle. 

Wątki działają w tej samej przestrzeni pamięci, co pozwala na szybkie dzielenie się danymi, ale są ograniczone przez Global Interpreter Lock (GIL). 

Wątki są szczególnie przydatne w zadaniach I/O-bound.

---

## **Przykład 1: Prosty przykład z wątkami**

Poniższy kod uruchamia kilka wątków równocześnie, które symulują długie zadania za pomocą `time.sleep`.

### Kod


In [3]:
%%writefile threading_example_1.py
import threading
import time

def worker(name, delay):
    print(f"Wątek {name} rozpoczął działanie.")
    time.sleep(delay)
    print(f"Wątek {name} zakończył działanie.")

if __name__ == "__main__":
    t1 = time.time()
    threads = []
    for i in range(5):
        t = threading.Thread(target=worker, args=(f"W{i+1}", 1))
        threads.append(t)
        t.start()

    for t in threads:
        t.join()

    print(f"Wszystkie wątki zakończyły działanie w {time.time() - t1:.2f} sekund.")


Overwriting threading_example_1.py


In [4]:
!python threading_example_1.py

Wątek W1 rozpoczął działanie.
Wątek W2 rozpoczął działanie.Wątek W3 rozpoczął działanie.

Wątek W4 rozpoczął działanie.
Wątek W5 rozpoczął działanie.
Wątek W1 zakończył działanie.
Wątek W4 zakończył działanie.Wątek W2 zakończył działanie.
Wątek W5 zakończył działanie.
Wątek W3 zakończył działanie.

Wszystkie wątki zakończyły działanie w 1.00 sekund.




### Wyjaśnienie:
1. **Funkcja `worker`**:
   - Symuluje długie zadanie (np. pobieranie danych) z opóźnieniem zależnym od `delay`.
2. **Tworzenie wątków**:
   - Tworzymy 5 wątków i uruchamiamy je równolegle za pomocą `t.start()`.
3. **Oczekiwanie na zakończenie**:
   - `t.join()` zapewnia, że główny wątek poczeka na zakończenie wszystkich wątków.

---

## **Przykład 2: Pobieranie danych z wielu URL-i**

Ten przykład wykorzystuje wątki do równoległego pobierania danych z kilku URL-i.

### Kod


In [5]:
%%writefile threading_example_2.py

import threading
import requests
import time

def fetch_url(url):
    print(f"Rozpoczęto pobieranie: {url}")
    response = requests.get(url)
    print(f"Pobrano dane z: {url} ({len(response.content)} bajtów)")

if __name__ == "__main__":
    urls = [
        "https://www.python.org",
        "https://www.wikipedia.org",
        "https://www.github.com",
        "https://www.stackoverflow.com",
        "https://www.google.com"
    ]

    start_time = time.time()

    threads = [threading.Thread(target=fetch_url, args=(url,)) for url in urls]
    for t in threads:
        t.start()

    for t in threads:
        t.join()

    print(f"Wszystkie żądania zakończone w {time.time() - start_time:.2f} sekund.")


Writing threading_example_2.py


In [6]:

!python threading_example_2.py

Rozpoczęto pobieranie: https://www.python.org
Rozpoczęto pobieranie: https://www.wikipedia.orgRozpoczęto pobieranie: https://www.github.com
Rozpoczęto pobieranie: https://www.stackoverflow.comRozpoczęto pobieranie: https://www.google.com


Pobrano dane z: https://www.python.org (51224 bajtów)
Pobrano dane z: https://www.wikipedia.org (100591 bajtów)
Pobrano dane z: https://www.github.com (264979 bajtów)
Pobrano dane z: https://www.google.com (19356 bajtów)
Pobrano dane z: https://www.stackoverflow.com (132720 bajtów)
Wszystkie żądania zakończone w 0.51 sekund.




### Wyjaśnienie:
1. **Funkcja `fetch_url`**:
   - Pobiera dane z podanego URL za pomocą `requests.get`.
2. **Tworzenie wątków**:
   - Dla każdej strony w `urls` tworzony jest oddzielny wątek.
3. **Pomiar czasu**:
   - Wątki działają równolegle, co przyspiesza wykonanie w porównaniu z sekwencyjnym pobieraniem.

---

## **Porównanie z sekwencyjnym wykonywaniem**
Dla przykładu z URL-ami, sekwencyjne wykonywanie zajmie więcej czasu:


In [8]:
import time
import requests


urls = [
    "https://www.python.org",
    "https://www.wikipedia.org",
    "https://www.github.com",
    "https://www.stackoverflow.com",
    "https://www.google.com"
]

def fetch_url(url):
    print(f"Rozpoczęto pobieranie: {url}")
    response = requests.get(url)
    print(f"Pobrano dane z: {url} ({len(response.content)} bajtów)")

start_time = time.time()
for url in urls:
    fetch_url(url)

print(f"Żądania sekwencyjne zakończone w {time.time() - start_time:.2f} sekund.")


Rozpoczęto pobieranie: https://www.python.org
Pobrano dane z: https://www.python.org (51224 bajtów)
Rozpoczęto pobieranie: https://www.wikipedia.org
Pobrano dane z: https://www.wikipedia.org (100591 bajtów)
Rozpoczęto pobieranie: https://www.github.com
Pobrano dane z: https://www.github.com (263493 bajtów)
Rozpoczęto pobieranie: https://www.stackoverflow.com
Pobrano dane z: https://www.stackoverflow.com (132720 bajtów)
Rozpoczęto pobieranie: https://www.google.com
Pobrano dane z: https://www.google.com (19405 bajtów)
Żądania sekwencyjne zakończone w 5.17 sekund.




---

## **Kiedy używać `threading`?**
- Zastosowanie: Zadania I/O-bound (np. pobieranie danych z sieci, odczyt/zapis plików).
- Ograniczenia: Wątki są ograniczone przez GIL, co sprawia, że nie są odpowiednie dla zadań CPU-bound (np. przetwarzanie liczb pierwszych).

Czy takie przykłady wystarczą? 😊