# Модуль urllib.request

Официальная документация: [здесь](https://docs.python.org/3/library/urllib.request.html)

Модуль urllib.request определяет функции и классы, которые помогают открывать URL — адреса (в основном HTTP), перенаправлять файлы cookie и многое другое.

In [None]:
import urllib.request

## HTTP GET

Запустим свой http-сервер для выполнения демонстрационных запросов по [ссылке](http://localhost:8889/notebooks/http.server%20get%26post.ipynb)

### Метод urllib.request.urlopen

HTTPGET-операция является самым простым использованием данного модуля. Передайте URL-адрес в urlopen(), чтобы получить "файлоподобный" дескриптор удаленных данных.

Что такое дескриптор смотреть [здесь](https://ru.wikipedia.org/wiki/Файловый_дескриптор)

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

In [9]:
from urllib import request

response = request.urlopen('http://localhost:8080/')
print('RESPONSE:', response)
print('URL     :', response.geturl())

headers = response.info()
print('DATE    :', headers['date'])
print('HEADERS :')
print('---------')
print(headers)

data = response.read().decode('utf-8')
print('LENGTH  :', len(data))
print('DATA    :')
print('---------')
print(data)

RESPONSE: <http.client.HTTPResponse object at 0x00000229779335B0>
URL     : http://localhost:8080/
DATE    : Wed, 23 Dec 2020 14:47:21 GMT
HEADERS :
---------
Server: BaseHTTP/0.6 Python/3.8.5
Date: Wed, 23 Dec 2020 14:47:21 GMT
Content-Type: text/plain; charset=utf-8


LENGTH  : 349
DATA    :
---------
CLIENT VALUES:
client_address=('127.0.0.1', 55118) (127.0.0.1)
command=GET
path=/
real path=/
query=
request_version=HTTP/1.1

SERVER VALUES:
server_version=BaseHTTP/0.6
sys_version=Python/3.8.5
protocol_version=HTTP/1.0

HEADERS RECEIVED:
Accept-Encoding=identity
Connection=close
Host=localhost:8080
User-Agent=Python-urllib/3.8



Cервер принимает входящие значения и форматирует обычный текстовый ответ для отправки обратно. Возвращаемое значение из urlopen() дает доступ к заголовкам с HTTP-сервера через метод info(), и данные для удаленного ресурса через такие методы, как read() и readlines().

Файлоподобный объект, возвращаемый функцией urlopen(), является итеративным

In [10]:
from urllib import request

response = request.urlopen('http://localhost:8080/')
for line in response:
    print(line.decode('utf-8').rstrip())

CLIENT VALUES:
client_address=('127.0.0.1', 55121) (127.0.0.1)
command=GET
path=/
real path=/
query=
request_version=HTTP/1.1

SERVER VALUES:
server_version=BaseHTTP/0.6
sys_version=Python/3.8.5
protocol_version=HTTP/1.0

HEADERS RECEIVED:
Accept-Encoding=identity
Connection=close
Host=localhost:8080
User-Agent=Python-urllib/3.8


## Кодирование аргументов

Аргументы могут быть переданы серверу путем кодирования их с помощью функции urllib.parse.urlencode(), которую мы рассматривали, изучая модуль urllib.parse, и добавлены к URL-адресу

In [11]:
from urllib import parse
from urllib import request

query_args = {'q': 'query string', 'foo': 'bar2000'}
encoded_args = parse.urlencode(query_args)
print('Encoded:', encoded_args)

url = 'http://localhost:8080/?' + encoded_args
print(request.urlopen(url).read().decode('utf-8'))

Encoded: q=query+string&foo=bar2000
CLIENT VALUES:
client_address=('127.0.0.1', 55124) (127.0.0.1)
command=GET
path=/?q=query+string&foo=bar2000
real path=/
query=q=query+string&foo=bar2000
request_version=HTTP/1.1

SERVER VALUES:
server_version=BaseHTTP/0.6
sys_version=Python/3.8.5
protocol_version=HTTP/1.0

HEADERS RECEIVED:
Accept-Encoding=identity
Connection=close
Host=localhost:8080
User-Agent=Python-urllib/3.8



Список значений клиента, возвращаемых в выходных данных примера выше, содержит закодированные аргументы запроса.

## HTTP POST

Запустим свой http-сервер для выполнения демонстрационных запросов по [ссылке](http://localhost:8889/notebooks/http.server%20get%26post.ipynb)

Чтобы отправить данные в закодированной форме на удаленный сервер используйте POST вместо GET, передайте закодированные аргументы запроса в качестве данных в urlopen().

In [15]:
from urllib import parse
from urllib import request

query_args = {'q': 'query string', 'foo': 'bar2000'}
encoded_args = parse.urlencode(query_args).encode('utf-8')
url = 'http://localhost:8080/'
print(request.urlopen(url, encoded_args).read().decode('utf-8'))

Client: ('127.0.0.1', 55233)
User-agent: Python-urllib/3.8
Path: /
Form data:
	q=query string
	foo=bar2000



Как мы видим, сервер может декодировать данные формы и получать доступ к отдельным значениям по имени.

## Добавляем заголовки к исходящему запросу

urlopen() - удобная функция, которая скрывает некоторые детали того, как делается и обрабатывается запрос. Более точное управление возможно при непосредственном использовании экземпляра запроса. Например, пользовательские заголовки могут быть добавлены к исходящему запросу, чтобы управлять форматом возвращаемых данных, указать версию документа, кэшированного локально, и сообщить удаленному серверу имя программного клиента, взаимодействующего с ним.

In [17]:
from urllib import request

r = request.Request('http://localhost:8080/')
r.add_header(
    'Timofei-dvoechnik',
    'VK (https://vk.com/serikov.timofei)',
)

response = request.urlopen(r)
data = response.read().decode('utf-8')
print(data)

CLIENT VALUES:
client_address=('127.0.0.1', 55644) (127.0.0.1)
command=GET
path=/
real path=/
query=
request_version=HTTP/1.1

SERVER VALUES:
server_version=BaseHTTP/0.6
sys_version=Python/3.8.5
protocol_version=HTTP/1.0

HEADERS RECEIVED:
Accept-Encoding=identity
Connection=close
Host=localhost:8080
Timofei-Dvoechnik=VK (https://vk.com/serikov.timofei)
User-Agent=Python-urllib/3.8



После создания объекта запроса используйте add_header(), чтобы установить значение агента пользователя перед открытием запроса. В предпоследней строке вывода отображается пользовательское значение.

## Публикация данных формы из запроса

Исходящие данные можно указать при построении запроса перед отправкой на сервер.

In [22]:
from urllib import parse
from urllib import request

query_args = {'q': 'query string', 'foo': 'bar2000'}

r = request.Request(
    url='http://localhost:8080/',
    data=parse.urlencode(query_args).encode('utf-8'),
)
print('Request method :', r.get_method())
r.add_header(
    'Timofei-dvoechnik',
    'VK (https://vk.com/serikov.timofei)',
)

print()
print('OUTGOING DATA:')
print(r.data)

print()
print('SERVER RESPONSE:')
print(request.urlopen(r).read().decode('utf-8'))

Request method : POST

OUTGOING DATA:
b'q=query+string&foo=bar2000'

SERVER RESPONSE:
Client: ('127.0.0.1', 56062)
User-agent: Python-urllib/3.8
Path: /
Form data:
	foo=bar2000
	q=query string



Метод HTTP, используемый запросом, автоматически изменяется с GET на POST после добавления данных.

## Загружаем файл

Кодирование файлов для загрузки требует немного больше работы, чем простые формы. Полное MIME-сообщение должно быть построено в теле запроса, чтобы сервер мог отличать входящие поля формы от загруженных файлов.

Подробнее о MIME [здесь](https://ru.wikipedia.org/wiki/MIME)

In [28]:
import io
import mimetypes
from urllib import request
import uuid


class MultiPartForm:
    """Accumulate the data to be used when posting a form."""

    def __init__(self):
        self.form_fields = []
        self.files = []
        self.boundary = uuid.uuid4().hex.encode('utf-8')
        return

    def get_content_type(self):
        return 'multipart/form-data; boundary={}'.format(
            self.boundary.decode('utf-8'))

    def add_field(self, name, value):
        """Add a simple field to the form data."""
        self.form_fields.append((name, value))

    def add_file(self, fieldname, filename, fileHandle,
                 mimetype=None):
        """Add a file to be uploaded."""
        body = fileHandle.read()
        if mimetype is None:
            mimetype = (
                mimetypes.guess_type(filename)[0] or
                'application/octet-stream'
            )
        self.files.append((fieldname, filename, mimetype, body))
        return

    @staticmethod
    def _form_data(name):
        return ('Content-Disposition: form-data; '
                'name="{}"\r\n').format(name).encode('utf-8')

    @staticmethod
    def _attached_file(name, filename):
        return ('Content-Disposition: file; '
                'name="{}"; filename="{}"\r\n').format(
                    name, filename).encode('utf-8')

    @staticmethod
    def _content_type(ct):
        return 'Content-Type: {}\r\n'.format(ct).encode('utf-8')

    def __bytes__(self):
        """Return a byte-string representing the form data,
        including attached files.
        """
        buffer = io.BytesIO()
        boundary = b'--' + self.boundary + b'\r\n'

        
        for name, value in self.form_fields:
            buffer.write(boundary)
            buffer.write(self._form_data(name))
            buffer.write(b'\r\n')
            buffer.write(value.encode('utf-8'))
            buffer.write(b'\r\n')

        
        for f_name, filename, f_content_type, body in self.files:
            buffer.write(boundary)
            buffer.write(self._attached_file(f_name, filename))
            buffer.write(self._content_type(f_content_type))
            buffer.write(b'\r\n')
            buffer.write(body)
            buffer.write(b'\r\n')

        buffer.write(b'--' + self.boundary + b'--\r\n')
        return buffer.getvalue()


if __name__ == '__main__':
    
    form = MultiPartForm()
    form.add_field('firstname', 'TIMOFEI')
    form.add_field('lastname', 'SERIKOV')

    
    form.add_file(
        'course', 'course.txt',
        fileHandle=io.BytesIO(b'Student'))

    data = bytes(form)
    r = request.Request('http://localhost:8080/', data=data)
    r.add_header(
        'Timofei-dvoechnik',
        'VK (https://vk.com/serikov.timofei)',
    )
    r.add_header('Content-type', form.get_content_type())
    r.add_header('Content-length', len(data))

    print()
    print('OUTGOING DATA:')
    for name, value in r.header_items():
        print('{}: {}'.format(name, value))
    print()
    print(r.data.decode('utf-8'))

    print()
    print('SERVER RESPONSE:')
    print(request.urlopen(r).read().decode('utf-8'))


OUTGOING DATA:
Timofei-dvoechnik: VK (https://vk.com/serikov.timofei)
Content-type: multipart/form-data; boundary=68d511da7a904916b844b2bcf40d7563
Content-length: 369

--68d511da7a904916b844b2bcf40d7563
Content-Disposition: form-data; name="firstname"

TIMOFEI
--68d511da7a904916b844b2bcf40d7563
Content-Disposition: form-data; name="lastname"

SERIKOV
--68d511da7a904916b844b2bcf40d7563
Content-Disposition: file; name="course"; filename="course.txt"
Content-Type: text/plain

Student
--68d511da7a904916b844b2bcf40d7563--


SERVER RESPONSE:
Client: ('127.0.0.1', 56116)
User-agent: Python-urllib/3.8
Path: /
Form data:
	Uploaded course as 'course.txt' (7 bytes)
	lastname=SERIKOV
	firstname=TIMOFEI



# Задание

Создайте свой сервер(включающий методы get и post). Получите данные с сервера и загрузите на сервер файл.