Cookies (печеньки) — небольшой фрагмент данных, отправленный веб-сервером и сохраняемый на компьютере пользователя. Браузер всякий раз при попытке открыть страницу соответствующего сайта пересылает этот фрагмент данных веб-серверу в составе HTTP-запроса.
Собственно, cookies - хороший способ сохранить некоторые данные о пользователях.

In [12]:
#!/usr/bin/env python3
print("Set-cookie: name=value; expires=Wed May 18 03:33:20 2033; path=/cgi-bin/; httponly")

print("Content-type: text/html\n")
print("Cookies!!!")

Set-cookie: name=value; expires=Wed May 18 03:33:20 2033; path=/cgi-bin/; httponly
Content-type: text/html

Cookies!!!


Например, если сохранить этот скрипт в /cgi-bin/cookie.py и зайти на localhost:8000/cgi-bin/cookie.py, то вам поставится печенька с именем name и значением value. Срок её хранения до мая 2033 года, отправляется повторно на сервер только к скриптам, которые расположены в /cgi-bin/, и передается только http-запросами (её нельзя получить из браузера пользователя с помощью javascript).

In [19]:
#!/usr/bin/env python3
print("Set-cookie: name=value")

print("Content-type: text/html\n")
print("Cookies!!!")

Set-cookie: name=value
Content-type: text/html

Cookies!!!


Тогда храниться она будет до того момента, когда закроется браузер, будет отправляться на сервер для любых документов (и для /index.html тоже, в отличие от предыдущего случая). Также её можно будет получить средствами javascript (поскольку не был установлен флаг httponly).

Исключение могут проиходить из-за недействительность RFC 2109 : неверные атрибуты, неверный заголовок Set-Cookie и т.д.

При обнаружении недействительного файла cookie возникает CookieError, если ваши данные cookie поступают из браузера, вы всегда должны быть готовы к недопустимым данным и уловить их CookieError при синтаксическом анализе.

Этот класс - подобный словарю, ключи которого являются строками, а значения - Morsel экземплярами. Обратите внимание, что при установке ключа в значение, значение сначала преобразуется в Morsel, содержащий ключ и значение.

Этот класс является производным от BaseCookie и переопределяет value_decode() и value_encode(). SimpleCookie поддерживает строки как значения файлов cookie. При установке значения SimpleCookie вызывает встроенную функцию str() для преобразования значения в строку. Значения, полученные от HTTP, хранятся в виде строк.

In [20]:
import http.cookies
C = http.cookies.SimpleCookie()
C["twix"] = "none for you"
C["twix"].value
C = http.cookies.SimpleCookie()
C["number"] = 7 
C["string"] = "seven"
C["number"].value
C["string"].value
print(C)

Set-Cookie: number=7
Set-Cookie: string=seven


In [21]:
from http import cookies
C = cookies.SimpleCookie()
C["fig"] = "newton"
C["sugar"] = "wafer"
print(C) 

Set-Cookie: fig=newton
Set-Cookie: sugar=wafer


Объекты

Возвращает кортеж (real_value, coded_value) из строкового представления. real_value может быть любого типа. Этот метод не выполняет декодирования BaseCookie.

Возвращает кортеж (real_value, coded_value). val может быть любого типа, но coded_value всегда будет преобразован в строку. Этот метод не выполнения кодирования BaseCookie.

Возвращает строковое представление, подходящее для отправки в виде заголовков HTTP. attrs и header посылается к каждому Morsel's output() методе. sep используется для объединения заголовков и по умолчанию является комбинацией '\r\n'.

In [22]:
print(C.output()) 

Set-Cookie: fig=newton
Set-Cookie: sugar=wafer


In [23]:
C = cookies.SimpleCookie()
C["rocky"] = "road"
C["rocky"]["path"] = "/cookie"
print(C.output(header="Cookie:"))

Cookie: rocky=road; Path=/cookie


In [24]:
print(C.output(attrs=[], header="Cookie:"))

Cookie: rocky=road


Возвращает встраиваемый фрагмент кода JavaScript, который при запуске в браузере, поддерживающем JavaScript, будет действовать так же, как если бы были отправлены заголовки HTTP.

Если rawdata является строкой, анализирует ее как HTTP_COOKIE и добавляет найденные там значения как Morsels. Если это словарь, он эквивалентен:

In [25]:
C = cookies.SimpleCookie()
C.load("chips=ahoy; vienna=finger") # load from a string (HTTP header)
print(C)
C = cookies.SimpleCookie()
C.load('keebler="E=everybody; L=\\"Loves\\"; fudge=\\012;";')
print(C)

Set-Cookie: chips=ahoy
Set-Cookie: vienna=finger
Set-Cookie: keebler="E=everybody; L=\"Loves\"; fudge=\012;"


1) Morsel.value

2) Morsel.coded_value

3) Morsel.key

4) Morsel.set(key, value, coded_value)

5) Morsel.isReservedKey(K) 
(Является ли K членом набора ключей Morsel)

6) Morsel.output(attrs=None, header='Set-Cookie:')
Возвращает строковое представление Morsel, подходящее для отправки в качестве заголовка HTTP. По умолчанию включены все атрибуты, если не указано attrs , и в этом случае это должен быть список атрибутов для использования. header по умолчанию "Set-Cookie:".

7) Morsel.js_output(attrs=None)
Возвращает встраиваемый фрагмент кода JavaScript, который при запуске в браузере, поддерживающем JavaScript, будет действовать так же, как если бы был отправлен заголовок HTTP.

8) Morsel.OutputString(attrs=None)
Возвращает строку, представляющую Morsel, без каких-либо окружающих HTTP или JavaScript.

9) Morsel.update(values)
Обновляет значения в словаре Morsel значениями из значений словаря. Вызывает ошибку, если какой-либо из ключей в dict не является допустимым.

10) Morsel.copy(value)
Возвращает копию объекта Morsel.

In [26]:
from urllib.request import Request, build_opener, HTTPCookieProcessor, HTTPHandler
import http.cookiejar

#Создаём объект CookieJar для хранения файлов cookie
cj = http.cookiejar.CookieJar()

#Создаём средство открытия для открытия страниц с использованием протокола http и обработки файлов cookie
opener = build_opener(HTTPCookieProcessor(cj), HTTPHandler())

#Создаём объект запроса, который будет использоваться для получения страницы
req = Request("http://student.unecon.ru")
f = opener.open(req)

#смотрим первые несколько строк страницы
html = f.read()
print(html[:50])

#Проверяем куки
print("the cookies are: ")
for cookie in cj:
    print(cookie)


b'<!DOCTYPE html>\r\n<html lang="ru">\r\n<head>\r\n\t<title'
the cookies are: 
<Cookie PHPSESSID=30c402040c6fa8999c1284e3764a1f0e for student.unecon.ru/>


Получение куки-файла из HTTP-запроса, сохранение на жесткий диск:

In [10]:
from urllib.request import Request, build_opener, HTTPCookieProcessor, HTTPHandler, HTTPSHandler
import http.cookiejar

cookies = http.cookiejar.LWPCookieJar()
handlers = [
    HTTPHandler(),
    HTTPSHandler(),
    HTTPCookieProcessor(cookies)
    ]
opener = build_opener(*handlers)

def fetch(uri):
    req = Request(uri)
    return opener.open(req)

def dump():
    for cookie in cookies:
        print(cookie.name, cookie.value)

uri = 'http://www.google.com/'
res = fetch(uri)
dump()

res = fetch(uri)
dump()

# save cookies to disk. you can load them with cookies.load() as well.
cookies.save('mycookies.txt')

1P_JAR 2020-12-04-08
NID 204=hTReZuYgSrxDBowTfvuiwyTGSyhOcO5_P7HFP3--JjUdGsiRDdRLo_3karlUlOPR0dvTcYvcRzaTJrgYKhmDeh3fwowaCeUDGDSavth2LSSd5UMt0LR_p_RYIRtMNYiGG7BnSosnRHPsleZ60XSWSl38NPI7lrXxxs0oFNnWuHc
1P_JAR 2020-12-04-08
NID 204=hTReZuYgSrxDBowTfvuiwyTGSyhOcO5_P7HFP3--JjUdGsiRDdRLo_3karlUlOPR0dvTcYvcRzaTJrgYKhmDeh3fwowaCeUDGDSavth2LSSd5UMt0LR_p_RYIRtMNYiGG7BnSosnRHPsleZ60XSWSl38NPI7lrXxxs0oFNnWuHc


Еще больше примеров использования куки:

In [None]:
import webbrowser
webbrowser.open_new_tab('https://www.programcreek.com/python/example/4486/Cookie.Morsel')

Исключение возникает при неправильном управления браузером.

Отображает URL с использованием браузера по умолчанию. Если new=0, URL-адрес открывается в том же окне браузера, если это возможно. Если new=1, по возможности открывается новое окно браузера. Если new=2, по возможности открывается новая страница браузера («вкладка»). Если AutoRaise=True, окно появляется, если это возможно (обратите внимание , что при многих оконных менеджеров это будет происходить независимо от значения этой переменной).

2) webbrowser.open_new(url)
Открывается URL в новом окне браузера по умолчанию, если это возможно, в противном случае, откроет URL в единственном окне браузера

3) webbrowser.open_new_tab(url)
В этом случае URL-адрес откроется на новой странице (”tab") браузера по умолчанию, если это возможно, в противном случае эквивалентно open_new ().

Предположим, что вам не нужен браузер по умолчанию. Для выбора браузера существует классная команда .get()

In [None]:
webbrowser.get(using=None)

Грубо говоря, просто указываем какой браузер вам использовать.

Например, открытие новой вкладки в Google Chrome:

In [11]:
import webbrowser
webbrowser.get(using=None).open_new('https://vk.com')

True

Но не всегда получается обойтись одним только .get() и в этом случае на помощь приходит функция .register(), например:

In [28]:
import webbrowser
webbrowser.register('Chrome', None, webbrowser.BackgroundBrowser('C:\Program Files (x86)\Google\Chrome\Application\chrome.exe'))
webbrowser.get('Chrome').open_new_tab('vk.com')

True

Мы указали путь к Google Chrome, назвали его и теперь все ссылки открываются только в нём.

In [1]:
import webbrowser
webbrowser.open_new_tab('https://welcome.stepik.org/ru')
webbrowser.open_new_tab('яблоки')

True

Решение проблемы придумайте сами :)

Если будут еще нужны примеры, то стоит запустить код ниже:

In [30]:
webbrowser.open_new_tab('https://riptutorial.com/ru/python/topic/8676/%D0%BC%D0%BE%D0%B4%D1%83%D0%BB%D1%8C-webbrowser')

True

В основном используется для генерации уникальных последовательностей.

In [None]:
class uuid.SafeUUID

safe
UUID был сгенерирован платформой многопроцесснобезопасным способом.

unsafe
UUID не был создан многопроцесснобезопасным способом.

unknown
Платформа не предоставляет информацию о том, был ли UUID сгенерирован безопасно или нет.

In [35]:
import uuid
# создаём UUID из строки шестнадцатеричных цифр (фигурные скобки и дефисы игнорируются)
x = uuid.UUID('{00010203-0405-0607-0809-0a0b0c0d0e0f}')
uuid.UUID(bytes=x.bytes)

UUID('00010203-0405-0607-0809-0a0b0c0d0e0f')

UUID.bytes
UUID в виде 16-байтовой строки (содержащей шесть целочисленных полей в обратном порядке байтов).

UUID.bytes_le
UUID в виде 16-байтовой строки (с time_low , time_mid и time_hi_version в обратном порядке байтов).

time_low

32-битное целое число без знака

0-3

Нижнее поле отметки времени

time_mid

16-битное целое без знака

4-5

Среднее поле отметки времени

time_hi_and_version

16-битное целое без знака

6-7

Верхнее поле метки времени мультиплексируется с номером версии

clock_seq_hi_and_reserved

беззнаковое 8-битное целое число

8

Верхнее поле тактовой последовательности мультиплексируется с вариантом

clock_seq_low

беззнаковое 8-битное целое число

9

Нижнее поле тактовой последовательности

узел

беззнаковое 48-битное целое число

10-15

Пространственно уникальный идентификатор узла (сетевой MAC-адрес)

Пример: 4d2d6344-fb4a-11e5-ba94-005052f01cd4.

| Октет | 0 - 3 | 4 - 5 | 6 - 7 | 8 | 9 | 10 - 15 |
-------- | ---------- ± ------ ± ------ ± - ± --- ± ---------- ----
| 4d2d6344 | fb4a | 11e5 | ба | 94 | 005052f01cd4 |

UUID.fields
Кортеж из шести целочисленных полей UUID, которые также доступны как шесть отдельных атрибутов и два производных атрибута:

UUID.hex
UUID в виде 32-символьной шестнадцатеричной строки.

UUID.int
UUID как 128-битное целое число.

UUID.urn
UUID как URN, как указано в RFC 4122 .

UUID.variant
Вариант UUID, который определяет внутреннюю структуру UUID. Это будет одна из констант RESERVED_NCS, RFC_4122, RESERVED_MICROSOFT, или RESERVED_FUTURE.

UUID.version
Номер версии UUID (от 1 до 5, имеет значение, только если есть вариант RFC_4122).

UUID.is_safe
Перечисление, SafeUUIDкоторое указывает, сгенерировала ли платформа UUID безопасным для многопроцессорной обработки способом.

Функция getnode() модуля uuid возвращает аппаратный адрес (MAC-адрес) в виде 48-битного натурального числа.

При первом запуске функция uuid.getnode может запустить отдельную программу, которая может быть довольно медленной. Если все попытки получить аппаратный адрес не удаются, то выбирается случайное 48-битное число с многоадресным битом, младший значащий бит первого октета равным 1, как рекомендуется в RFC 4122.

"Аппаратный адрес" - означает MAC-адрес сетевого интерфейса. На машине с несколькими сетевыми интерфейсами универсально управляемые MAC-адреса (то есть, когда второй младший бит первого октета не установлен) будут предпочтительнее локально управляемых MAC-адресов, но без других гарантий упорядочения.

In [36]:
uuid.getnode()

242944914360652

In [37]:
hex(uuid.getnode())

'0xdcf50552094c'

In [38]:
# создать UUID на основе идентификатора хоста и текущего времени
uuid.uuid1(node=None, clock_seq=None)

UUID('7390e9fa-3592-11eb-823f-dcf50552094c')

Генерирует UUID из узла ID, порядкового номера и текущего времени
Если node не задан, getnode() используется чтобы получить аппаратный адрес. Если clock_seq дан, он используется в качестве порядкового номера; в противном случае выбирается случайный 14-битовый порядковый номер.

In [None]:
uuid.uuid3(namespace, name)

Генерирует  UUID на основе хэша MD5 идентификатора пространства имен (который является UUID) и имени (которое является строкой).

In [40]:
uuid.uuid4()

UUID('c0898f5e-3374-4b75-9b24-d69dafc7becb')

Создает случайный UUID

In [None]:
uuid.uuid5(namespace, name)

In [42]:
# сделать UUID используя хэш SHA-1 пространства имен UUID и имя
uuid.uuid5(uuid.NAMESPACE_DNS, 'python.org')

UUID('886313e1-3b8a-5372-9b90-0c9aee199e5d')

Создаёт UUID на основе хэша SHA-1 идентификатора пространства имен (который является UUID) и имени (который является строка).

Модуль uuid определяет следующие идентификаторы пространства имен для использования с uuid3() или uuid5().

In [43]:
uuid.NAMESPACE_DNS

UUID('6ba7b810-9dad-11d1-80b4-00c04fd430c8')

Если указано это пространство имен, name строка является полным доменным именем.

In [44]:
# создаем UUID, используя хеш MD5 для UUID пространства имен UUID и имени
uuid.uuid3(uuid.NAMESPACE_DNS, 'python.org')

UUID('6fa459ea-ee8a-3ca4-894e-db77e160355e')

In [45]:
uuid.NAMESPACE_URL

UUID('6ba7b811-9dad-11d1-80b4-00c04fd430c8')

Если указано это пространство имен, name строка является URL- адресом.

In [46]:
uuid.NAMESPACE_OID

UUID('6ba7b812-9dad-11d1-80b4-00c04fd430c8')

Если указано это пространство имен, name строка является OID ISO (стандартный индефикатор).

In [47]:
uuid.NAMESPACE_X500

UUID('6ba7b814-9dad-11d1-80b4-00c04fd430c8')

Если указано это пространство имен, то name строка является X.500 DN в формате DER или текстовом формате вывода.

In [48]:
uuid.RESERVED_NCS

'reserved for NCS compatibility'

Зарезервировано для совместимости с NCS.

In [49]:
uuid.RFC_4122

'specified in RFC 4122'

Задает макет UUID, указанный в RFC 4122 .

In [50]:
uuid.RESERVED_MICROSOFT

'reserved for Microsoft compatibility'

Зарезервировано для совместимости с Microsoft.

In [51]:
uuid.RESERVED_FUTURE

'reserved for future definition'

Зарезервировано для будущего определения.

JSON - простой формат обмена данными, основанный на подмножестве синтаксиса JavaScript. Модуль json позволяет кодировать и декодировать данные в удобном формате.

In [52]:
import json
print(json.dumps(['foo', {'bar': ('baz', None, 1.0, 2)}]))
print(json.dumps({"c": 0, "b": 0, "a": 0}, sort_keys=True))

["foo", {"bar": ["baz", null, 1.0, 2]}]
{"a": 0, "b": 0, "c": 0}


Еще парочка примеров

In [53]:
import json
json.dumps([1,2,3,{'4': 5, '6': 7}], separators=(',', ':'))

'[1,2,3,{"4":5,"6":7}]'

Вместо separators можно использовать indent (определяет размер отступа вложенных структур)

In [54]:
import json
print(json.dumps({'4': 5, '6': 7}, sort_keys=True, indent=4))

{
    "4": 5,
    "6": 7
}


In [None]:
json.dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

Если skipkeys = True, то ключи словаря не базового типа (str, unicode, int, long, float, bool, None) будут проигнорированы, вместо того, чтобы вызывать исключение TypeError.

Если ensure_ascii = True, все не-ASCII символы в выводе будут экранированы последовательностями \uXXXX, и результатом будет строка, содержащая только ASCII символы. Если ensure_ascii = False, строки запишутся как есть.

Если check_circular = False, то проверка циклических ссылок будет пропущена, а такие ссылки будут вызывать OverflowError.

Если allow_nan = False, при попытке сериализовать значение с запятой, выходящее за допустимые пределы, будет вызываться ValueError (nan, inf, -inf) в строгом соответствии со спецификацией JSON, вместо того, чтобы использовать эквиваленты из JavaScript (NaN, Infinity, -Infinity).

Если indent является неотрицательным числом, то массивы и объекты в JSON будут выводиться с этим уровнем отступа. Если уровень отступа 0, отрицательный или "", то вместо этого будут просто использоваться новые строки. Значение по умолчанию None отражает наиболее компактное представление. Если indent - строка, то она и будет использоваться в качестве отступа.

Если sort_keys = True, то ключи выводимого словаря будут отсортированы.

json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw) - сериализует obj в строку JSON-формата.

In [None]:
json.load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)

object_hook - опциональная функция, которая применяется к результату декодирования объекта (dict). Использоваться будет значение, возвращаемое этой функцией, а не полученный словарь.

object_pairs_hook - опциональная функция, которая применяется к результату декодирования объекта с определённой последовательностью пар ключ/значение. Будет использован результат, возвращаемый функцией, вместо исходного словаря. Если задан так же object_hook, то приоритет отдаётся object_pairs_hook.

parse_float, если определён, будет вызван для каждого значения JSON с плавающей точкой. По умолчанию, это эквивалентно float(num_str).

parse_int, если определён, будет вызван для строки JSON с числовым значением. По умолчанию эквивалентно int(num_str).

parse_constant, если определён, будет вызван для следующих строк: "-Infinity", "Infinity", "NaN". Может быть использовано для возбуждения исключений при обнаружении ошибочных чисел JSON.

Если не удастся десериализовать JSON, будет возбуждено исключение ValueError.

json.loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw) - десериализует s (экземпляр str, содержащий документ JSON) в объект Python.

Класс json.JSONDecoder(object_hook=None, parse_float=None, parse_int=None, parse_constant=None, strict=True, object_pairs_hook=None) - простой декодер JSON.

Класс json.JSONEncoder(skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, sort_keys=False, indent=None, separators=None, default=None)

1) Не используя библеотеку UUID создать уникальную 12-ти символьную строку, используя латиницу, цифры, а также сегодняшнюю дату и время.

2)Создайте функцию в которой пользователь вводит ссылку сайта и получает данные cookie по странице.

3)Решите проблему с webbrowser, так чтоб можно было несколько ссылок открывать в одном браузере, пример неправильного выполнения ниже.

In [None]:
import webbrowser
webbrowser.open_new_tab('https://vk.com')
webbrowser.open_new_tab('яблоки')