## Chiamate http in serie, con thread e process


La libreria Python requests è comunemente utilizzata per inviare richieste a server web e per ricevere le relative risposte.


## Panoramica delle caratteristiche principali di requests:


* **Semplicità d'uso**: requests offre un'API molto intuitiva, che permette di effettuare richieste HTTP con poche linee di codice.

* **Supporto per i metodi HTTP**: Puoi utilizzare i vari metodi HTTP come GET, POST, PUT, DELETE, etc. per interagire con risorse web.

* **Gestione automatica delle sessioni**: requests gestisce automaticamente le sessioni HTTP, mantenendo i cookie e le informazioni di autenticazione tra le richieste, se necessario.

* **Gestione dei parametri**: Puoi includere parametri nelle tue richieste, come ad esempio i parametri di query string per le richieste GET.

* **Gestione degli header**: È possibile personalizzare gli header HTTP delle richieste, inclusi header comuni come User-Agent, Content-Type, etc.

* **Gestione delle risposte**: requests facilita l'accesso ai dati della risposta HTTP, come il contenuto della risposta, i codici di stato, gli header e molto altro.

* **Supporto per HTTPS e autenticazione:** La libreria supporta HTTPS in modo nativo e offre metodi per l'autenticazione, come l'autenticazione di base e l'uso di token.

In [None]:
import requests

def effettua_request(url):
    try:
        response = requests.get(url)  # Effettua la richiesta GET all'URL specificato
        response.raise_for_status()  # Solleva un'eccezione in caso di errore nella risposta
        #print("Risposta:", response.text)  # Stampa il contenuto della risposta
        print("OK ",url)

    except requests.exceptions.RequestException as e:
        print("Errore durante la richiesta:", e)
        #serve come meccanismo di sicurezza per evitare che errori
        #durante la richiesta HTTP facciano crashare il programma.

# Esempio di utilizzo
url = "https://www.example.com"  # URL di esempio
effettua_request(url)


OK  https://www.example.com



### Eccezioni nel codice:
1. **`requests.exceptions.RequestException`**:
   - Questa è la classe base per tutte le eccezioni sollevate dal modulo `requests`. `RequestException` cattura qualsiasi tipo di errore che possa verificarsi durante la richiesta HTTP (sia in fase di connessione che nella risposta ricevuta).
   
2. **Cosa succede nel `try`?**
   - La funzione `requests.get(url)` invia la richiesta GET all'URL specificato.
   - Se la richiesta ha successo e ricevi una risposta, `response.raise_for_status()` è una chiamata che verifica se lo status code della risposta è un errore (ad esempio, 404 per "Not Found" o 500 per "Internal Server Error"). Se lo status code non è di successo (compreso tra 200 e 299), viene sollevata un'eccezione `HTTPError`.
   
3. **Cosa succede nel `except`?**
   - Se si verifica un errore durante la richiesta (ad esempio, se non c'è connessione a Internet, l'URL è errato, o c'è un errore HTTP), l'eccezione `RequestException` verrà catturata dal blocco `except`.
   - L'errore specifico che ha causato il fallimento della richiesta viene passato alla variabile `e`, e stampato il messaggio di errore con `print("Errore durante la richiesta:", e)`.

### Tipi di errori che possono essere sollevati e catturati:
1. **`requests.exceptions.Timeout`**: L'errore si verifica quando il server impiega troppo tempo per rispondere (timeout).
2. **`requests.exceptions.TooManyRedirects`**: L'errore si verifica quando ci sono troppe redirezioni (più di quanto consentito).
3. **`requests.exceptions.ConnectionError`**: L'errore si verifica quando non è possibile stabilire una connessione al server.
4. **`requests.exceptions.HTTPError`**: L'errore si verifica quando la risposta HTTP è un errore (ad esempio, status 404 o 500).
5. **`requests.exceptions.RequestException`**: La classe base di tutte le eccezioni `requests`, che cattura tutte le altre.


In [None]:
siti_web = [
    'https://envato.com',
    'http://amazon.com',
    'http://facebook.com',
    'http://google.com',
    'http://google.fr',
    'http://google.es',
    'http://internet.org',
    'http://gmail.com',
    'http://stackoverflow.com',
    'http://github.com',
    'http://heroku.com',
    'http://really-cool-available-domain.com',
    'http://djangoproject.com',
    'http://rubyonrails.org',
    'http://basecamp.com',
    'http://trello.com',
    'http://yiiframework.com',
    'http://shopify.com',
    'http://another-really-interesting-domain.co',
    'http://airbnb.com',
    'http://instagram.com',
    'http://snapchat.com',
    'http://youtube.com',
    'http://baidu.com',
    'http://yahoo.com',
    'http://live.com',
    'http://linkedin.com',
    'http://yandex.ru',
    'http://netflix.com',
    'http://wordpress.com',
    'http://bing.com',
]

Combina i frammenti di codice sopra per effettuare le chiamate ai vari siti nella lista e confrontare i tempi di esecuzioni nella modalità seriale, con i thread e i process. Aiutati utilizzando[l'esercizio 3: dormi e macina della risorsa](https://www.elexpo.net/archivio/tps/parallelismo/La-programmazione-concorrente-parallela.pdf).
Procedi per gradi prima effettua una semplice chiamata ad un url, poi più chiamate utilizzando la modalità seriale, e solo alla fine implementa le chiamate utilizzando un thread per ogni url.  

In [None]:
# codice da sviluppare CON FOR
import requests
import time
import os
import threading
from threading import Thread
import multiprocessing
from multiprocessing import Process

siti_web = [
    'https://envato.com',
    'http://amazon.com',
    'http://facebook.com',
    'http://google.com',
    'http://google.fr',
    'http://google.es',
    'http://internet.org',
    'http://gmail.com',
    'http://stackoverflow.com',
    'http://github.com',
    'http://heroku.com',
    'http://really-cool-available-domain.com',
    'http://djangoproject.com',
    'http://rubyonrails.org',
    'http://basecamp.com',
    'http://trello.com',
    'http://yiiframework.com',
    'http://shopify.com',
    'http://another-really-interesting-domain.co',
    'http://airbnb.com',
    'http://instagram.com',
    'http://snapchat.com',
    'http://youtube.com',
    'http://baidu.com',
    'http://yahoo.com',
    'http://live.com',
    'http://linkedin.com',
    'http://yandex.ru',
    'http://netflix.com',
    'http://wordpress.com',
    'http://bing.com',
]

def effettua_request(url):
    try:
        response = requests.get(url)  # Effettua la richiesta GET all'URL specificato
        response.raise_for_status()  # Solleva un'eccezione in caso di errore nella risposta
        #print("Risposta:", response.text)  # Stampa il contenuto della risposta
        print("OK ",url)

    except requests.exceptions.RequestException as e:
        print("Errore durante la richiesta:", e)
        #serve come meccanismo di sicurezza per evitare che errori
        #durante la richiesta HTTP facciano crashare il programma.

i=0
if __name__ == "__main__":
    start_time = time.time()
    for _ in range(0,len(siti_web)):
         url=siti_web[i]
         effettua_request(url)
         i+=1

    end_time=time.time()
    print("tempo impiegato utilizzando for:" ,end_time-start_time)

    start_time = time.time()
    threads=[]
    for url in siti_web:
        threads.append(Thread(target=effettua_request, args=(url,)))
    for t in threads:
        t.start()
    for t in threads:
        t.join()


    end_time=time.time()
    print("tempo impiegato utilizzando i thread:" ,(end_time- start_time))


    
   
   




Errore durante la richiesta: 403 Client Error: Forbidden for url: https://elements.envato.com/
Errore durante la richiesta: 503 Server Error: Service Unavailable for url: https://www.amazon.com/
Errore durante la richiesta: 403 Client Error: Forbidden for url: http://192.168.8.1/cgi-bin/nethserver-block.cgi?clientaddr=192.168.9.232&clientname=info5-pc13.iisvittuone.it&clientident=unknown&srcclass=default&targetgroup=blog&url=http%3A%2F%2Ffacebook.com%2F
OK  http://google.com
OK  http://google.fr
OK  http://google.es
Errore durante la richiesta: Exceeded 30 redirects.
OK  http://gmail.com
OK  http://stackoverflow.com
OK  http://github.com
OK  http://heroku.com
Errore durante la richiesta: HTTPConnectionPool(host='really-cool-available-domain.com', port=80): Max retries exceeded with url: / (Caused by NameResolutionError("<urllib3.connection.HTTPConnection object at 0x0000026366B5DBE0>: Failed to resolve 'really-cool-available-domain.com' ([Errno 11001] getaddrinfo failed)"))
OK  http://