# Лекция 13: сетевое программирование и Python

## Компьютерные сети

Компьютерная сеть - множество связанных между собой компьютеров.

* Компьютеры объединяются в сети с помощью соединений (проводных, беспроводных) и вспомогательного передающего оборудования.
* Сети, в свою очередь, могут иметь различное устройство как на физическом, так и на логическом уровне.
* Устройство современных сетей и работа программ, работающих в таких сетях, основаны на базе сетевой модели OSI (open systems interconnection basic reference model).
* Учитывая роль компьютерный сетей (интернет и веб-программирование, клиент-серверные приложения, распределённые вычисления) в современном мире, хорошему программисту нужно иметь хотя бы базовое представление об устройстве и функционировании сетей.

### Модель OSI

* Сетевой протокол - набор соглашений о правилах определяющих интерфейс взаимодействия между участниками обмена сообщениями (программами).
* Сеть в модели OSI представлена в виде слоёв-уровней из протоколов вложенных друг в друга.
* Предполагается, что протокол на каждом уровне взаимодействует только с протоколами своего уровня либо на уровень ниже.

#### 7. Прикладной уровень (application layer)

* Тип данных: зависит от применения.
* Функции: доступ к сетевым службам.
* Примеры: HTTP, FTP, SMTP

#### 6. Уровень представления (presentation layer)

* Тип данных: зависит от применения.
* Функции: представление и шифрование данных.
* Примеры: ASCII, EBCDIC, JPEG

#### 5. Сеансовый уровень (session layer)

* Тип данных: зависит от применения.
* Функции: управление сеансом связи.
* Примеры: RPC, PAP.

#### 4. Транспортный уровень (transport layer)

* Тип данных: cегменты (segment), датаграммы (datagram).
* Функции: прямая связь между конечными пунктами и надежность.
* Примеры: TCP, UDP, SCTP.

#### 3. Сетевой уровень (network layer)

* Тип данных: пакеты (packet).
* Функции: определение маршрута и логическая адресация.
* Примеры: IPv4, IPv6, IPsec, AppleTalk.

#### 2. Канальный уровень (data link layer)

* Тип данных: биты (bit), кадры (frame).
* Функции: физическая адресация.
* Примеры: PPP, IEEE 802.2, Ethernet, DSL, L2TP, ARP.

#### 1. Физический уровень (physical layer)

* Тип данных: биты (bit).
* Функции: работа со средой передачи, сигналами и двоичными данными.
* Примеры: USB, витая пара, коаксиальный кабель, оптический кабель.

### Что почитать

* https://en.wikipedia.org/wiki/Computer_network
* James Kurose, Keith Ross, Computer networking: Top-Down Approach
* Ричард Стивенс, Unix: разработка сетевых приложений. Питер, 2003.
* http://www.computerhistory.org/timeline/networking-the-web/

## Сетевое программирование в Python

Сетевое программирование представлено в Python несколькими вариантами:
* Поддержка работы с низкоуровневым системным интерфейсом сокетов.
* Поддержка основных сетевых протоколов и форматов прикладного уровня (модули urllib для http запросов, smtplib для работы с почтой, модуль для ssl, библиотеки для работы с xml/html/json/бинарными данными и т.д., RPC клиент и сервер).
* Различные фреймворки для упрощения написания клиентского и серверного кода, в т.ч. распределенных сетевых вычислений (asyncoro, gevent, twisted, tornado, celery, tornado, flask, django).

### Сокеты

#### Сокеты как дескрипторы

* Сокет для программы - дескриптор, идентифицирующий некоторую точку для входа данных (в случае с TCP/IP это порт) в рамках используемого сетевого API.
* В Беркли стандарте сокеты представляют собой один из видов файловых дескрипторов (следуя одному из пунктов философии UNIX про everythin is a file). В таком случае сокеты идентифицируются целым числом.
* Сетевой сокет, в узком смысле, это некоторая конечная точка в компьютерной сети. На данный момент обычно под этим названием предполагают TCP/IP (интернет) сокеты (номер порта в паре ip:port, например 192.168.0.1:80, соответсвует сокету, который привязан (bind) к этому порту).


#### Сокеты как API

* Сокет (socket, от англ. разъем, гнездо) - название программного интерфейса для обеспечения обмена данными между процессами и программами, как в рамках одной машины, так и по сети.
* Обычно интерфейс предоставляется операционной системой, в зависимости от типа возможно использовать локальные или сетевые сокеты.
* Примером локальных сокетов являются unix domain sockets также известные как IPC-сокеты (от inter-process communication). Это локальные сокеты, которые используются для обмена сообщениями между процессами на одной машине.
* Сетевые сокеты - сокеты для коммуникации в рамках сети, под ними полагают Беркли сокеты (соответствующий стандарт).
* Сокеты разделяются на клиентские (посылка запросов) и серверные (обработка запросов).

#### Почитать

* [Про сокеты на викпедии](https://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%BA%D0%B5%D1%82_%28%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D1%84%D0%B5%D0%B9%D1%81%29)
* https://en.wikipedia.org/wiki/Network_socket
* https://docs.python.org/3/library/socket.html
* https://docs.python.org/3.5/howto/sockets.html
* https://pymotw.com/3/socket/
* https://www.ibm.com/developerworks/linux/tutorials/l-pysocks/ - python 2

### Работа с протоколами и форматами прикладного уровня

Python поддерживает:
* модули urllib для http запросов (также есть популярная сторонняя библиотека requests)
* smtplib для работы с почтой
* модуль для ssl
* библиотеки для работы с xml/html/json/бинарными данными и т.д.
* RPC клиент и сервер и многое другое
* подробнее в ссылках ниже

Простейший пример http-запроса:

In [1]:
import urllib.request
response = urllib.request.urlopen('http://python.org/')
html = response.read()
print(str(html, encoding='utf-8')[:1000])

<!doctype html>
<!--[if lt IE 7]>   <html class="no-js ie6 lt-ie7 lt-ie8 lt-ie9">   <![endif]-->
<!--[if IE 7]>      <html class="no-js ie7 lt-ie8 lt-ie9">          <![endif]-->
<!--[if IE 8]>      <html class="no-js ie8 lt-ie9">                 <![endif]-->
<!--[if gt IE 8]><!--><html class="no-js" lang="en" dir="ltr">  <!--<![endif]-->

<head>
    <meta charset="utf-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">

    <link rel="prefetch" href="//ajax.googleapis.com/ajax/libs/jquery/1.8.2/jquery.min.js">

    <meta name="application-name" content="Python.org">
    <meta name="msapplication-tooltip" content="The official home of the Python Programming Language">
    <meta name="apple-mobile-web-app-title" content="Python.org">
    <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black">

    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta name="HandheldFriendly" conte

Замечание: не устанавливаются доп. параметры, не настраивается ничего и т.п. - не забывайте добавлять (для этого надо разобраться в том, как работает и что когда нужно).

Подробный howto: https://docs.python.org/3/howto/urllib2.html

#### Почитать

* https://docs.python.org/3.5/howto/urllib2.html
* https://docs.python.org/3.5/library/internet.html
* https://docs.python.org/3.5/library/netdata.html
* https://docs.python.org/3.5/library/markup.html
* https://docs.python.org/3.5/library/struct.html

### Сетевые фреймворки

* asyncoro
* gevent
* twisted
* tornado
* celery
* и др.

#### Что почитать

* http://asyncoro.sourceforge.net/
* http://www.gevent.org/
* https://twistedmatrix.com/
* http://www.tornadoweb.org/en/stable/
* https://wiki.python.org/moin/UsefulModules#Networking

### Самостоятельно про web crawling и information retrieval

Пару слов про сбор и поиск информации.

* Web Crawling By Christopher Olston and Marc Najork
  * http://infolab.stanford.edu/~olston/publications/crawling_survey.pdf
* http://nlp.stanford.edu/IR-book/information-retrieval.html
* видео про bulding a search engine на Python
  * https://www.youtube.com/playlist?list=PL18yrUuMk-zlzpea3En7GRZLvFn7WNK0H