<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'> Modificado en 2019-1 al 2023-1 por Equipo Docente IIC2233. </font>
</p>

# Tabla de contenidos

1. [*Networking* con Python](#Networking-con-Python)
    1. [Arquitectura cliente-servidor](#Arquitectura-cliente-servidor)
    2. [`Sockets`](#Sockets)
        1. [Ejemplo: Sockets TCP](#Ejemplo:-Sockets-TCP)
            1. [Cliente TCP](#Cliente-TCP)
            2. [Servidor TCP](#Servidor-TCP)
        3. [Ejemplo: Sockets UDP](#Ejemplo:-Sockets-UDP)
            1. [Cliente UDP](#Cliente-UDP)
            2. [Servidor UDP](#Servidor-UDP)

# *Networking* con Python

**Recuerda que al leer este documento directamente desde GitHub, no estás aprovechando su contenido al 100%.
Editando el código puedes aprender más que leyéndolo. Te recomendamos descargarlo y ejecutarlo desde tu computador para que puedas hacer modificaciones e interactuar con el código.**

**IMPORTANTE: El siguiente material incluye ejemplos que deberían ser ejecutados en programas separados, donde uno actúa como el cliente, y otro actúa como el servidor. Para ello, copia los códigos correspondientes en archivos `.py` en tu computador y ejecútalo en consolas separadas. Si ejecutas los códigos directamente en este `jupyter-notebook` los programas se pueden quedar pegados esperando una conexión.**

En este material, veremos cómo implementar programas en Python para que puedan comunicarse con otro programa, el cual puede encontrarse en el mismo computador o en otro.

## Arquitectura cliente-servidor

Una **arquitectura** en computación es una manera de conectar o construir _hardware_ o _software_ para que cumpla ciertos estándares. La **arquitectura cliente-servidor** es una manera de conectar dos o más programas donde uno cumple el **rol de servidor**, el cual **ofrece servicios** a otros programos que poseen el **rol de cliente**. Los programas cliente **efectúan solicitudes al servidor** y **consumen sus servicios**.

En esta arquitectura el **cliente** es quien **inicia la conexión**, y establece una conexión con el **servidor** de acuerdo a algún protocolo. Por otro lado, el **servidor**, al iniciarse, se dedica a esperar y **escuchar conexiones entrantes** de clientes, y reacciona a cada una de ellas. Al recibir una solicitud de conexión, el servidor puede decidir si la acepta o no, efectúa una acción predefinida, y envía una respuesta al cliente según lo diga el protocolo de comunicación. La transmisión puede hacerse vía TCP ó UDP.

![Fuente: http://en.wikipedia.org/wiki/Client%E2%80%93server_model](imgs/client-server-model.png)
Fuente de la imagen: [Wikipedia](http://en.wikipedia.org/wiki/Client%E2%80%93server_model)

## *Sockets*

Un ***socket*** es un objeto del sistema operativo que permite a un programa transmitir y recibir datos desde y hacia otro programa corriendo en otra máquina, o en la misma máquina pero en otro puerto. Son nuestro "punto de entrada y salida a/desde la red" en nuestro código. Para obtener un *socket*, necesitamos (1) especificar qué tipo dirección IP usaremos (IPv4 o IPv6), y qué protocolo de transpote usaremos (TCP ó UDP).

En Python, los *sockets* son provistos por el módulo `socket`. Para crear un *socket*, debemos crear una instancia de la clase `socket(family, type)`, donde `family` es el tipo de dirección IP que usaremos, y `type` es el protocolo de transporte. Algunos de los valores permitidos son:

- `family`
    - `AF_INET` para direcciones IPv4
    - `AF_INET6` para direcciones IPv6
- `type`
    - `SOCK_STREAM` para TCP
    - `SOCK_DGRAM` para UDP

Por ejemplo, para crear un *socket* TCP con IPv4, lo hacemos de la siguiente manera.

In [None]:
import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

### Ejemplo: Sockets TCP

#### Cliente TCP

Para establecer una conexión TCP necesitamos (1) la dirección IP del *host* destinatario, y (2) el puerto del *host* destinatario. Para conectarse a un servidor TCP usamos el método `connect((host, port))` del *socket*. El método recibe una tupla, cuyo primer elemento debe ser una dirección IP acorde a lo que especificamos al momento de crear el *socket*, y el segundo elemento es el puerto al que nos queremos conectar. 

Opcionalmente, el primer elemento de la tupla puede ser un *string* con el *hostname*, como por ejemplo, `python.org`, `github.com` o `canvas.uc.cl`. En ese caso, el sistema utilizará el protocolo DNS para obtener la  dirección IP correspondiente a ese *hostname*.

Por ejemplo, hagamos un cliente que se conecte a `146.155.123.21` en el puerto 80 vía TCP.

In [None]:
import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(('146.155.123.21', 80))

Si nos queremos conectar a [canvas.uc.cl](http://canvas.uc.cl) también lo podemos hacer sin conocer su dirección IP.

In [None]:
import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect(('canvas.uc.cl', 80))

Llegó la hora de enviar algún mensaje. Los *sockets* sólo transmiten *bytes*, por lo que cualquier cosa que enviemos debemos codificarla. Para enviar un mensaje, se puede ocupar el método `sendall(bytes)` de socket. Estos *bytes* contienen un mensaje en el formato HTTP, y corresponde a una **solicitud HTTP** (*HTTP Request*) que puede ser comprendida por un servidor web.

In [None]:
solicitud = 'GET / HTTP/1.1\n\n\n'
sock.sendall(solicitud.encode('ascii'))

¿Qué nos habrá respondido el servidor? Para saberlo, debemos ocupar el método `recv(buffer)`, que nos retornará un objeto `bytes`. El parámetro que recibe este método es la cantidad __máxima__* de *bytes* que será leída. La documentación sugiere colocar una potencia de 2 pequeña, como 4096.

*Es la cantidad máxima, porque lo que hace es sacar los bytes que hayan llegado al socket en ese instante. Si es que en el socket habían llegado 20 bytes al momento de llamar a `sock.recv(4096)`, entonces el método me entregará solo 20 bytes.

In [None]:
data = sock.recv(4096)
print(data.decode('ascii'))

El último paso, pero no el menos importante: **debemos cerrar la conexión**; de lo contrario, si nuestro programa continúa, estará ocupando recursos que no utiliza.

In [None]:
sock.close()

Hagamos el ejercicio completo en una sola celda. Además, aprovechemos de manejar las excepciones pues, en *networking*, es muy probable que se produzcan errores. La clase `ConnectionError` es la clase base para distintos errores relacionados con problemas de conexión, por lo que capturando su excepción podremos responder a cualquier problema que ocurra en este sentido.

In [None]:
## Esta celda puede ser ejecutada desde aquí sin problemas

import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

host = "iic2333.ing.puc.cl"
port = 80

try:
    sock.connect((host, port))
    sock.sendall('GET / HTTP/1.1\nHost: iic2333.ing.puc.cl\n\n'.encode('utf-8'))
    data = sock.recv(4096)
    print(data.decode('utf-8'))
except ConnectionError as e:
    # ConnectionError es la clase base BrokenPipeError, ConnectionAbortedError,
    # ConnectionRefusedError y ConnectionResetError
    print("Ocurrió un error.")
finally:
    # ¡No olvidemos cerrar la conexión!
    sock.close()

La respuesta que obtenemos del servidor web ubicado en el puerto 80 del `iic2333.ing.puc.cl` es una **respuesta HTTP** (*HTTP Response*) que contiene 4096 *bytes*. La respuesta HTTP incluye el código HTML que describe el contenido de la página http://iic2333.ing.puc.cl (un **muy buen curso**).

El puerto 80 es usado por los servidores. Se trata un servicio de **texto plano**, esto es, sin encriptación. La mayoría de los servidores web modernos utilizan una versión de HTTP con encriptación, conocida como HTTPS y que funciona en el puerto 443. Conectarse a un servidor web con HTTPS requiere operaciones de encriptación sobre el *socket* que complicarían innecesariamente este ejemplo.

#### Servidor TCP

Un servidor debe escuchar las conexiones que le llegan a él en un puerto específico. Para ello, debemos "enlazar" o "asociar" un *socket* a ese puerto con el método `bind((host, port))`. El primer elemento de la tupla es el *hostname* del *host* en que estamos corriendo el servidor; el segundo elemento es el puerto donde queremos escuchar las conexiones.

Supongamos que queremos escuchar en el puerto 9000.

In [None]:
import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# Así podemos obtener el hostname de la máquina actual
host = socket.gethostname()
port = 9000

sock.bind((host, port))

En el cliente no es necesario hacer un *bind* entre el *host* y el puerto, ya que el sistema operativo lo hace implícitamente a través del método `connect`, asignando al cliente un puerto aleatorio. Si el servidor al cual nos conectamos exigiera que el puerto de cada cliente esté en un rango específico, tendríamos que "enlazar" el cliente a un puerto específico también.

Ahora, empecemos a escuchar conexiones con el método `listen()`.

In [None]:
sock.listen()

Ahora, empecemos a aceptar conexiones. Para ello, ocupamos el método `accept()`, que nos retornará un _socket_ con el que podremos comunicarnos con ese cliente en específico, y la dirección de ese cliente (en específico, una tupla con su dirección IP y su puerto). El método esperará hasta que haya una conexión entrante; por lo tanto, si nadie se conecta, el programa quedará congelado.

In [None]:
while True:
    socket_cliente, address = sock.accept()
    print("Conexión aceptada desde", address)
    socket_cliente.sendall("Gracias por conectarte\n".encode("utf-8"))
    socket_cliente.close()

Cuando queramos terminar el programa servidor, debemos cerrar el *socket* que estaba aceptando las conexiones.

In [None]:
sock.close()

Hagamos el ejercicio completo en una sola celda. Supondremos que queremos que el servidor se cierre después de aceptar cinco clientes.

In [None]:
## No ejecutar esto desde esta celda
## Cree un archivo servidor.py con este código

import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# Así podemos obtener el hostname de la máquina actual
host = socket.gethostname()
port = 9000

sock.bind((host, port))
sock.listen()

counter = 0
while counter < 5:
    try:
        socket_cliente, address = sock.accept()
        print("Conexión aceptada desde", address)
        socket_cliente.sendall("Gracias por conectarte\n".encode("utf-8"))
        socket_cliente.close()
        counter += 1
    except ConnectionError:
        print("Ocurrió un error.")

sock.close()

El siguiente código corresponde a un posible cliente para el servidor implementado en la celda anterior.

In [None]:
## No ejecutar esto desde esta celda
## Cree un archivo cliente.py con este código, en una 
##ventana/terminal distinta a aquella en que está el servidor

import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# Obtenemos el nombre de la máquina a la que nos queremos conectar
# En este caso, nos queremos conectar a esta misma máquina
host = socket.gethostname()
port = 9000

try:
    sock.connect((host, port))
    data = sock.recv(4096)
    print(data.decode("utf-8"))
except ConnectionError as e:
    print("[Cliente] Ocurrió un error")
finally:
    sock.close() 

### Ejemplo: Sockets UDP

#### Cliente UDP

Dado que el protocolo UDP no establece una conexión, la comunicación UDP es mucho más simple de implementar. No requiere solicitar una conexión previa (no hay un `connect`) con una dirección IP ni puerto específico antes de transmitir datos. Por lo mismo, cada vez que se envía un mensaje, mediante el método `sendto`, se debe especificar la dirección y puerto del servidor, a diferencia de `sendall` y `recv` de TCP.

Por ejemplo, para enviar un mensaje como cliente a un servidor ocupamos el método `sendto(mensaje, (host_destino, puerto_destino))` como se muestra a continuación.

In [None]:
import socket

server_host = socket.gethostname()
server_port = 15000

sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
mensaje = "Hola, simplemente te estoy enviando un mensaje.".encode('utf-8')
sock.sendto(mensaje, (server_host, server_port))

Opcionalmente, podemos recibir información enviada de vuelta. El metodo `recvfrom(buffer)` retorna, además de los datos, la dirección y puerto desde donde fueron enviados. El parámetro `buffer` es la cantidad máxima de *bytes* que será leída, que se recomienda que sea una potencia de 2 pequeña.

In [None]:
data, (host_origen, puerto_origen) = sock.recvfrom(4096)
print(data.decode('utf-8'))

Cuando terminemos de ocupar el *socket*, debemos cerrarlo.

In [None]:
sock.close()

#### Servidor UDP

Si de forma similar queremos implementar un servidor que envía mensajes usando el protocolo UDP, simplemente debemos preocuparnos de responder a la misma dirección desde donde se nos ha enviado algún mensaje. Dado que un _socket_ UDP no establece una conexión previa, cada vez que ejecutamos `recvfrom`, el método retorna los datos leídos y la información de dirección IP y puerto del emisor. 

Por ejemplo, el siguiente código podría representar al servidor que se comunica con el cliente implementado anteriormente.

In [None]:
## No ejecutar esto desde esta celda
## Cree un archivo servidor.py con este código

import socket

sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

# Con un string vacío como argumento del bind, indicamos que el socket es 
# alcanzable desde cualquier dirección que pueda tener el servidor
sock.bind(("", 15000))

while True:
    data, (host_cliente, puerto_cliente) = sock.recvfrom(4096)
    print(data.decode('ascii'))
    respuesta = f"Aquí va mi respuesta para {host_cliente}."
    sock.sendto(respuesta.encode('utf-8'), (host_cliente, puerto_cliente))

**NOTA: Junto a este archivo se encuentra la carpeta `codigo_base`, donde se encuentran los archivos para el cliente y el servidor utilizando UDP y TCP.**