# Requests

Biblioteka Requests to narzędzie w Pythonie, które umożliwia łatwe wysyłanie żądań HTTP. Została wprowadzona w 2011 roku przez Kennetha Reitza jako odpowiedź na potrzebę uproszczenia obsługi protokołu HTTP w Pythonie. Zastąpiła bardziej złożone moduły standardowej biblioteki, takie jak **urllib** czy **http.client**.

In [1]:
%pip install requests

Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.2 -> 24.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [2]:
import requests
print(requests.__version__)

2.32.3


### Główne cechy biblioteki

1. **Łatwość użycia**:
   - Prosta i czytelna składnia do wysyłania żądań HTTP.
   - Intuicyjny interfejs API.

2. **Obsługa różnych metod HTTP**:
   - Wsparcie dla metod takich jak GET, POST, PUT, DELETE, HEAD, OPTIONS, PATCH.

3. **Obsługa parametrów i nagłówków**:
   - Możliwość dodawania parametrów do żądań oraz nagłówków HTTP.

4. **Obsługa sesji**:
   - Utrzymywanie sesji za pomocą obiektu `requests.Session()` dla zarządzania cookies i sesjami.

5. **Obsługa JSON**:
   - Automatyczna obsługa danych w formacie JSON z metodami `json()` i `data`.

6. **Obsługa przekierowań**:
   - Automatyczne śledzenie przekierowań.

7. **Obsługa błędów i wyjątków**:
   - Wbudowana obsługa wyjątków dla różnych typów błędów HTTP i problemów z połączeniem.

8. **Konfigurowalne timeouty**:
   - Możliwość ustawiania limitów czasu dla żądań.

9. **Obsługa plików**:
   - Wsparcie dla przesyłania plików za pomocą POST.

10. **Streaming**:
    - Obsługa strumieniowego pobierania danych, przydatne dla dużych plików.

11. **Wsparcie dla proxy i uwierzytelniania**:
    - Obsługa proxy i różnych metod uwierzytelniania, w tym Basic Auth, Digest Auth, i Token Auth.

12. **Kompatybilność**:
    - Wsparcie dla różnych wersji Pythona (Python 2.7 i 3.x).

### Żądania

### 1. **GET** – Pobieranie danych z serwera

- **Podstawowe użycie**:
  
  ```python
  response = requests.get(url, params=None, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `params`: Słownik, lista krotek, lub str zawierający dane, które mają zostać dołączone do URL jako parametry zapytania.
  - `headers`: Nagłówki HTTP, które chcesz dodać do żądania.
  - `cookies`: Ciastka, które chcesz wysłać.
  - `auth`: Krotka z nazwą użytkownika i hasłem (np. `('user', 'password')`).
  - `timeout`: Określa czas (w sekundach) na oczekiwanie na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania (domyślnie `True`).

In [3]:
response = requests.get('https://jsonplaceholder.typicode.com/posts', params={'userId': 1}, timeout=5)

### 2. **POST** – Wysyłanie danych do serwera

- **Podstawowe użycie**:

  ```python
  response = requests.post(url, data=None, json=None, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `data`: Dane do wysłania w żądaniu (np. formularz, słownik).
  - `json`: Dane w formacie JSON do wysłania.
  - `headers`: Nagłówki HTTP.
  - `files`: Pliki do wysłania, np. za pomocą formularza `multipart/form-data`.
  - `cookies`: Ciastka do wysłania.
  - `auth`: Uwierzytelnianie podstawowe.
  - `timeout`: Określa czas na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania.

In [4]:
response = requests.post('https://jsonplaceholder.typicode.com/posts', json={'title': 'foo', 'body': 'bar', 'userId': 1})

### 3. **PUT** – Aktualizowanie istniejącego zasobu

- **Podstawowe użycie**:

  ```python
  response = requests.put(url, data=None, json=None, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `data`: Dane do wysłania w żądaniu, np. słownik.
  - `json`: Dane w formacie JSON.
  - `headers`: Nagłówki HTTP.
  - `cookies`: Ciastka do wysłania.
  - `auth`: Uwierzytelnianie podstawowe.
  - `timeout`: Określa czas na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania.

In [5]:
response = requests.put('https://jsonplaceholder.typicode.com/posts/1', json={'id': 1, 'title': 'updated title', 'body': 'updated body'})

### 4. **DELETE** – Usuwanie zasobu z serwera

- **Podstawowe użycie**:

  ```python
  response = requests.delete(url, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `headers`: Nagłówki HTTP.
  - `cookies`: Ciastka do wysłania.
  - `auth`: Uwierzytelnianie podstawowe.
  - `timeout`: Określa czas na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania.

In [6]:
response = requests.delete('https://jsonplaceholder.typicode.com/posts/1')

### 5. **HEAD** – Pobieranie tylko nagłówków odpowiedzi

- **Podstawowe użycie**:

  ```python
  response = requests.head(url, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `headers`: Nagłówki HTTP.
  - `cookies`: Ciastka do wysłania.
  - `auth`: Uwierzytelnianie podstawowe.
  - `timeout`: Określa czas na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania.

In [7]:
response = requests.head('https://jsonplaceholder.typicode.com/posts')

### 6. **OPTIONS** – Pobieranie dostępnych metod HTTP dla zasobu

- **Podstawowe użycie**:

  ```python
  response = requests.options(url, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `headers`: Nagłówki HTTP.
  - `cookies`: Ciastka do wysłania.
  - `auth`: Uwierzytelnianie podstawowe.
  - `timeout`: Określa czas na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania.

In [9]:
response = requests.options('https://jsonplaceholder.typicode.com/posts')

### 7. **PATCH** – Częściowa aktualizacja zasobu

- **Podstawowe użycie**:

  ```python
  response = requests.patch(url, data=None, json=None, **kwargs)
  ```

- **Dodatkowe parametry**:
  - `data`: Dane do wysłania w żądaniu.
  - `json`: Dane w formacie JSON.
  - `headers`: Nagłówki HTTP.
  - `cookies`: Ciastka do wysłania.
  - `auth`: Uwierzytelnianie podstawowe.
  - `timeout`: Określa czas na odpowiedź.
  - `allow_redirects`: Określa, czy automatycznie śledzić przekierowania.

In [10]:
response = requests.patch('https://jsonplaceholder.typicode.com/posts/1', json={'title': 'patched title'})

### Obsługa błędów

#### 1. **`requests.RequestException`**
   - Bazowa klasa dla wszystkich wyjątków w Requests. Można jej użyć do ogólnej obsługi błędów związanych z żądaniami HTTP.

     ```python
     try:
         response = requests.get('https://example.com')
     except requests.RequestException as e:
         print(f"Błąd żądania: {e}")
     ```

#### 2. **`requests.ConnectionError`**
   - Występuje, gdy nie można nawiązać połączenia z serwerem.
   
     ```python
     try:
         response = requests.get('https://nonexistenturl.com')
     except requests.ConnectionError as e:
         print(f"Błąd połączenia: {e}")
     ```

#### 3. **`requests.HTTPError`**
   - Występuje w przypadku błędów HTTP, takich jak 4xx (np. 404 Not Found) i 5xx (np. 500 Internal Server Error). Wyjątek ten można podnieść ręcznie za pomocą metody `raise_for_status()`.
     ```python
     try:
         response = requests.get('https://example.com/notfound')
         response.raise_for_status()
     except requests.HTTPError as e:
         print(f"Błąd HTTP: {e}")
     ```

#### 4. **`requests.URLRequired`**
   - Występuje, gdy URL jest wymagany, ale nie został podany.

     ```python
     try:
         response = requests.get('')
     except requests.URLRequired as e:
         print(f"URL jest wymagany: {e}")
     ```

#### 5. **`requests.TooManyRedirects`**
   - Występuje, gdy nastąpiło zbyt wiele przekierowań w trakcie realizacji żądania.

     ```python
     try:
         response = requests.get('https://example.com/redirect', allow_redirects=True)
     except requests.TooManyRedirects as e:
         print(f"Zbyt wiele przekierowań: {e}")
     ```

#### 6. **`requests.Timeout`**
   - Występuje, gdy żądanie przekroczyło limit czasu.

     ```python
     try:
         response = requests.get('https://example.com', timeout=0.001)
     except requests.Timeout as e:
         print(f"Przekroczenie limitu czasu: {e}")
     ```

#### 7. **`requests.ConnectTimeout`**
   - Specjalny przypadek `requests.Timeout`, który występuje podczas przekroczenia limitu czasu nawiązania połączenia.
     ```python
     try:
         response = requests.get('https://example.com', timeout=0.001)
     except requests.ConnectTimeout as e:
         print(f"Przekroczenie limitu czasu połączenia: {e}")
     ```

#### 8. **`requests.ReadTimeout`**
   - Specjalny przypadek `requests.Timeout`, który występuje podczas przekroczenia limitu czasu na odczytanie odpowiedzi.
     ```python
     try:
         response = requests.get('https://example.com', timeout=0.001)
     except requests.ReadTimeout as e:
         print(f"Przekroczenie limitu czasu odczytu: {e}")
     ```

#### 9. **`requests.FileModeWarning`**
   - Ostrzeżenie generowane, gdy plik jest otwierany w trybie binarnym, ale dane są przesyłane jako tekstowe.

     ```python
     import warnings
     warnings.simplefilter('always', requests.FileModeWarning)
     ```

#### 10. **`requests.JSONDecodeError`**
   - Występuje, gdy nie uda się zdekodować odpowiedzi jako JSON.

     ```python
     try:
         response = requests.get('https://example.com')
         data = response.json()
     except requests.JSONDecodeError as e:
         print(f"Błąd dekodowania JSON: {e}")
     ```

### 1. **Metody i właściwości Response**

- **`status_code`** - Kod statusu HTTP odpowiedzi (np. 200, 404)
- **`text`** - Treść odpowiedzi jako tekst (string)
- **`json()`** - Przekształca odpowiedź w formacie JSON na obiekt Python (np. słownik)
- **`content`** - Treść odpowiedzi w postaci surowych bajtów (użyteczne przy pobieraniu plików)
- **`encoding`** - Kodowanie odpowiedzi. Zwykle automatycznie ustawiane przez Requests
- **`headers`** - Nagłówki odpowiedzi jako słownik
- **`cookies`** - Zwraca ciastka, które zostały wysłane z odpowiedzią. Wartość jest obiektem `RequestsCookieJar`
- **`url`** - URL, z którego pochodzi odpowiedź
- **`history`** - Lista odpowiedzi na poprzednie przekierowania (jeśli wystąpiły)
- **`iter_lines()`** - Umożliwia iterowanie przez odpowiedź po liniach (użyteczne przy pracy z dużymi plikami tekstowymi)
- **`iter_content()`** - Iteruje po zawartości odpowiedzi w surowych bajtach, przydatne przy strumieniowym pobieraniu danych
- **`close()`** - Zamknięcie połączenia, przydatne w przypadku pracy z plikami

In [11]:
def response_methods(response):
    print('status code:', response.status_code)
    print('text:', response.text)
    data = response.json()
    print('json:', data)
    print('content:', response.content)
    print('encoding:', response.encoding)
    print('headers:', response.headers)
    print('cookies:', response.cookies)
    print('url:', response.url)  
    print('history:', response.history)

    print('lines:')
    i = 1
    for line in response.iter_lines():
        print(i, line)
        i += 1

    print('chunks:')
    i = 1
    for chunk in response.iter_content(chunk_size=128):
        print(chunk)
        i += 1

In [12]:
url = 'https://jsonplaceholder.typicode.com/posts/1'
response = requests.get(url)
response_methods(response)

status code: 200
text: {
  "userId": 1,
  "id": 1,
  "title": "sunt aut facere repellat provident occaecati excepturi optio reprehenderit",
  "body": "quia et suscipit\nsuscipit recusandae consequuntur expedita et cum\nreprehenderit molestiae ut ut quas totam\nnostrum rerum est autem sunt rem eveniet architecto"
}
json: {'userId': 1, 'id': 1, 'title': 'sunt aut facere repellat provident occaecati excepturi optio reprehenderit', 'body': 'quia et suscipit\nsuscipit recusandae consequuntur expedita et cum\nreprehenderit molestiae ut ut quas totam\nnostrum rerum est autem sunt rem eveniet architecto'}
content: b'{\n  "userId": 1,\n  "id": 1,\n  "title": "sunt aut facere repellat provident occaecati excepturi optio reprehenderit",\n  "body": "quia et suscipit\\nsuscipit recusandae consequuntur expedita et cum\\nreprehenderit molestiae ut ut quas totam\\nnostrum rerum est autem sunt rem eveniet architecto"\n}'
encoding: utf-8
headers: {'Date': 'Tue, 07 Jan 2025 18:52:39 GMT', 'Content-Type':

### 2. **Właściwości Response**

- **`is_redirect`** - Zwraca `True`, jeśli odpowiedź jest przekierowaniem (kody 3xx)
- **`is_permanent_redirect`** - Zwraca `True`, jeśli odpowiedź jest trwałym przekierowaniem (np. kod 301)
- **`ok`** - Zwraca `True`, jeśli status code jest w zakresie 200-299
- **`links`** - Zwraca słownik linków z nagłówka `Link` odpowiedzi, jeśli są dostępne (często przy paginacji)

### 3. **Dodatkowe metody i właściwości**

- **`connection`** - Zwraca połączenie używane do wykonania żądania (np. socket)
- **`next`** - Jeśli odpowiedź była częścią przekierowania lub paginacji, zwraca następną odpowiedź

### Proxy

In [None]:
import requests

proxies = {
    'http': 'http://proxy.example.com:8080',
    'https': 'https://proxy.example.com:8080',
}

response = requests.get('http://example.com', proxies=proxies)

### Uwierzytelnianie Podstawowe (Basic Auth)

In [None]:
from requests.auth import HTTPBasicAuth

auth = HTTPBasicAuth('username', 'password')

response = requests.get('https://httpbin.org/basic-auth/username/password', auth=auth)

### Uwierzytelnianie za pomocą Tokena

In [None]:
headers = {
    'Authorization': 'ACCESS_TOKEN'
}

response = requests.get('https://api.example.com/protected', headers=headers)

### Sesje

In [18]:
session = requests.Session()
session.headers.update({'User-Agent': 'my-app'})

response = session.get('https://httpbin.org/headers')
print(response.json())

{'headers': {'Accept': '*/*', 'Accept-Encoding': 'gzip, deflate', 'Host': 'httpbin.org', 'User-Agent': 'my-app', 'X-Amzn-Trace-Id': 'Root=1-677d7853-73c895043468e51d34dd2d1e'}}


### Przekierowania

In [14]:
response = requests.get('http://github.com', allow_redirects=False)
print(response.status_code, response.headers['Location'])

301 https://github.com/


### Obsługa plików

In [15]:
files = {'file': open('example.txt', 'rb')}
response = requests.post('https://httpbin.org/post', files=files)
print(response.json())

response = requests.get('https://httpbin.org/image/jpeg')
with open('image.jpg', 'wb') as f:
    f.write(response.content)

{'args': {}, 'data': '', 'files': {'file': 'Lorem ipsum dolor sit amet, consectetur adipiscing elit. Fusce ex leo, faucibus ac purus in, lobortis egestas leo. Fusce rhoncus lacus in sem pellentesque, ut ultrices mauris vehicula. Etiam rutrum lacus at sem volutpat ullamcorper id vitae mi. Aliquam erat volutpat. Morbi a venenatis arcu. Integer quis mattis est. Mauris vel viverra velit. Suspendisse vitae sollicitudin dolor, at aliquet libero. Ut sed turpis ac magna imperdiet semper. Ut scelerisque, magna et laoreet sollicitudin, est nisi laoreet felis, nec convallis enim lectus vitae dolor. In non lectus ac urna fringilla accumsan. Quisque commodo, ligula a fringilla malesuada, libero nisl imperdiet arcu, venenatis sollicitudin sapien orci et risus. Proin volutpat ac felis id consequat.\r\n\r\nNam fermentum nibh et sem convallis, in viverra sapien rhoncus. Donec neque urna, tristique vel odio id, dictum lobortis libero. Pellentesque eu ipsum viverra, finibus justo id, pretium sem. Aliquam

### Adaptery transportowe

In [16]:
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.retry import Retry

session = requests.Session()
retry = Retry(connect=3, backoff_factor=0.5)
adapter = HTTPAdapter(max_retries=retry)
session.mount('http://', adapter)
session.mount('https://', adapter)

response = session.get('https://httpbin.org/delay/2')

### Middleware i hooki

In [17]:
def print_url(response, *args, **kwargs):
    print(response.url)
    
response = requests.get('https://httpbin.org/get', hooks={'response': print_url})

https://httpbin.org/get
