# Requests

#### Основы

In [1]:
import requests

In [2]:
response = requests.get(url='http://httpbin.org/')
print('ТИП ', type(response))
print('КОД ОТВЕТА ', response)

ТИП  <class 'requests.models.Response'>
КОД ОТВЕТА  <Response [200]>


In [3]:
print('ПОЛУЧЕНИЕ ТЕКУЩЕГО USER-AGENT')
response = requests.get(url='http://httpbin.org/'+"/user-agent")
print(type(response))
print(response.text)

ПОЛУЧЕНИЕ ТЕКУЩЕГО USER-AGENT
<class 'requests.models.Response'>
{
  "user-agent": "python-requests/2.31.0"
}



In [5]:
print("МАСКИРОВКА / СВОЙ СОБСТВЕННЫЙ USER-AGENT")
headers = {
  'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/117.0'
}
response = requests.get(url='http://httpbin.org/'+"/user-agent", headers=headers)
print(response.text)

МАСКИРОВКА / СВОЙ СОБСТВЕННЫЙ USER-AGENT
{
  "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/117.0"
}



##### Атрибуты ```.get()```



| Атрибут              | Значение                                                                          |
|----------------------|-----------------------------------------------------------------------------------|
| **url**              | Передать ссылку - цель, куда будет оправлен запрос                                |
| **params**           | Словарь или байты, которые будут отправлены в строке запроса.                     |
| **headers**          | Словарь HTTP-заголовков отправляемых с запросом                                   |
| **cookies**          | Объект **Dict** или **CookieJar** для отправки с запросом                         |
| **auth**             | **AuthObject** для включения базовой аутентификации **HTTP**.                     |
| **timeout**          | Число описывающий тайм-аут запроса                                                |
| **allow_redirects** | Логическое значение. Установить значение **True**, если разрешено перенаправление |
| **proxies**          | Протокол сопоставление словаря с URL-адресом прокси.                              |
| **stream**           | Удерживает соединение открытым, пока не получен весь ```Response.content```       |

##### Прокси

In [None]:
#Для socks4
proxy_socks4 = {
    'http':'socks4://103.177.45.3:80',
    'https':'socks4://103.177.45.3:80',

}
#--------------------------------------
#Для socks5
proxy_socks5 = {
    'http':'socks5://103.177.45.3:80',
    'https':'socks5://103.177.45.3:80',
}


#--------------------------------------
#Для всех, с авторизацией
proxy_all_auth = {
    'http':'socks5://login:password@103.177.45.3:80',
    'https':'socks5://login:password@103.177.45.3:80',
}

In [7]:
from random import choice
import requests

TIMEOUT = 20

ip_proxy = ["154.65.39.7:80"]

url = 'http://httpbin.org/ip'

for ip in ip_proxy:
  try:
    proxy = {'http': f'http://{ip}', 'https': f'https://{ip}'}
    response = requests.get(url=url, proxies=proxy, timeout=TIMEOUT)
    print(response.json(), 'Success connection')
  except Exception as _ex:
    print(f"NOT {ip}")
    continue
#>>> {'origin': 'httpbin.org, 47.74.152.29'} Success connection

NOT 154.65.39.7:80


In [11]:
ip = r"154.65.39.7:80"
proxy = {'http': f'http://{ip}', 'https': f'https://{ip}'}
response = requests.get(url='http://ipwho.is/', proxies=proxy)
print(response)
print(response.text)

<Response [200]>
{"ip":"154.65.39.7","success":true,"type":"IPv4","continent":"Africa","continent_code":"AF","country":"Senegal","country_code":"SN","region":"Dakar Region","region_code":"DK","city":"Dakar","latitude":14.7645042,"longitude":-17.3660286,"is_eu":false,"postal":"10000","calling_code":"221","capital":"Dakar","borders":"GM,GN,GW,ML,MR","flag":{"img":"https:\/\/cdn.ipwhois.io\/flags\/sn.svg","emoji":"\ud83c\uddf8\ud83c\uddf3","emoji_unicode":"U+1F1F8 U+1F1F3"},"connection":{"asn":37649,"org":"SAGA AFRICA HOLDINGS LIMITED","isp":"SAGA AFRICA HOLDINGS LIMITED","domain":"africatyresbendet.co.za"},"timezone":{"id":"Africa\/Dakar","abbr":"GMT","is_dst":false,"offset":0,"utc":"+00:00","current_time":"2023-09-21T16:12:21+00:00"}}


##### Param

In [10]:
param = {'key1': 'value1', 'key2': 'value2'}
r = requests.get(url = 'http://httpbin.org/' + '/get', params=param)
print(r.url)

http://httpbin.org//get?key1=value1&key2=value2


##### Скачивание файлов

```stream=True``` - Позволяет удерживать соединение  пока мы не получили весь требуемый контент. Этот параметр используется при скачивании тяжеловесных файлов.

In [None]:

import os

# Напрямую
with open('file.mp4','wb') as file:
  r = requests.get(url = r"https://parsinger.ru/video_downloads/videoplayback.mp4", stream=True)
  file.write(r.content)

size = os.path.getsize('file.mp4')
print("Размер файла в байтах :",size)

##### Коды ответа HTTP



[Коды ответа HTTP](https://developer.mozilla.org/ru/docs/Web/HTTP/Status)
- Информационные 100 - 199
- Успешные 200 - 299
- Перенаправления 300 - 399
- Клиентские ошибки 400 - 499
- Серверные ошибки 500 - 599
 


##### JSON

In [12]:
json_site = r"https://jsonplaceholder.typicode.com/todos"

r = requests.get(url=json_site)
print(r.json())

[{'userId': 1, 'id': 1, 'title': 'delectus aut autem', 'completed': False}, {'userId': 1, 'id': 2, 'title': 'quis ut nam facilis et officia qui', 'completed': False}, {'userId': 1, 'id': 3, 'title': 'fugiat veniam minus', 'completed': False}, {'userId': 1, 'id': 4, 'title': 'et porro tempora', 'completed': True}, {'userId': 1, 'id': 5, 'title': 'laboriosam mollitia et enim quasi adipisci quia provident illum', 'completed': False}, {'userId': 1, 'id': 6, 'title': 'qui ullam ratione quibusdam voluptatem quia omnis', 'completed': False}, {'userId': 1, 'id': 7, 'title': 'illo expedita consequatur quia in', 'completed': False}, {'userId': 1, 'id': 8, 'title': 'quo adipisci enim quam ut ab', 'completed': True}, {'userId': 1, 'id': 9, 'title': 'molestiae perspiciatis ipsa', 'completed': False}, {'userId': 1, 'id': 10, 'title': 'illo est ratione doloremque quia maiores aut', 'completed': True}, {'userId': 1, 'id': 11, 'title': 'vero rerum temporibus dolor', 'completed': True}, {'userId': 1, 'i

##### Сохранение картинки

In [14]:
r = requests.get(url='http://httpbin.org/image/jpeg')
file = open('eggs/t.jpeg', 'wb')
file.write(r.content)
file.close()

##### **Библиотека** ```fake_useragent```

[Documentation](https://pypi.org/project/fake-useragent/)

In [6]:
from fake_useragent import UserAgent

ua = UserAgent(os='linux', browsers=['firefox', 'chrome'])

for _ in range(10):
  print(ua.random)

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36
Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/115.0
Mozilla/5.0 (X11; Linux x86_64; rv:102.0) Gecko/20100101 Firefox/102.0
Mozilla/5.0 (X11; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/114.0
Mozilla/5.0 (X11; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/114.0
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36
Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/115.0
Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:109.0) Gecko/20100101 Firefox/115.0
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36


### Пробежка по 500 ссылкам

In [None]:
from re import findall
from requests import get
from fake_useragent import UserAgent

ua = UserAgent()
TIMEOUT = 0.3

main_url = 'http://parsinger.ru/task/1/'
main_response = requests.get(url = main_url, headers= {'user-agent': ua.random})

for url in findall(r"\w+\.html", main_response.text):
    response = requests.get(url=main_url+url, headers= {'user-agent': ua.random} , timeout=TIMEOUT)
    if response.status_code == 200:
        print(f"-- НАЙДЕНО -- \n ссылка: {response.url} \n {response.text}")
        break
else:
    print('-- НЕ НАЙДЕНО--')