# Introduction to networks.

## Brief introduction to the Internet.

The Internet is a global communications network based on [la familia de protocolos de internet](https://es.wikipedia.org/wiki/Familia_de_protocolos_de_internet), also known as the *TCP/IP* protocol suite. Through the Internet and its various protocols it is possible to access services as diverse as:

* Email.
* Instant messaging and chats.
* Electronic commerce.
* Telephony.
* Audio and video transmission.
* Access to the web.

The *TPC/IP* protocols were initially developed by [Vinton Cerf](https://es.wikipedia.org/wiki/Vinton_Cerf) and [Vinton Cerf](https://es.wikipedia.org/wiki/Vinton_Cerf) in the 1970s for the [Vinton Cerf](https://es.wikipedia.org/wiki/Vinton_Cerf) project, which later evolved into the Internet.


**Note:** This chapter will briefly mention the [*IP*](https://es.wikipedia.org/wiki/Protocolo_de_internet), [*IP*](https://es.wikipedia.org/wiki/Protocolo_de_internet), [*IP*](https://es.wikipedia.org/wiki/Protocolo_de_internet), and [*IP*](https://es.wikipedia.org/wiki/Protocolo_de_internet) protocols, while the [*IP*](https://es.wikipedia.org/wiki/Protocolo_de_internet) protocol will be the focus of the course.

### The *OSI* model.

The [modelo *OSI*](https://es.wikipedia.org/wiki/Modelo_OSI), for "open systems interconnection model" corresponding to the *ISO/IEC 7498-1* standard, is a reference model that facilitates communication and interaction between various components of a data communications network.

The *OSI* model consists of 7 layers:

1. Physical layer.
2. Link layer.
3. Network layer.
4. Transport layer.
5. Session layer.
6. Presentation layer.
7. Application layer.

Each of the protocols of the *TCP/IP* family is implemented in one of these layers.

For further reference on the *TCP/IP* protocols and their implementation in the layers of the *OSI* model, it is possible to consult the following link.

https://en.wikipedia.org/wiki/List_of_network_protocols_(OSI_model)

## Uniform Resource Locators (*URL*).

It is possible to access a resource available on the Internet through the "Uniform Resource Locators, or *URL* for its acronym in English.


### Structure of a *URL*.

A *URL* has the following general structure:

For a resource that requires authentication:

```
<esquema>://<usuario>:<contraseña>@<anfitrión>:<puerto>/<ruta>?<consultas>
```

For a resource that does not require authentication:

```
<esquema>://<anfitrión>:<puerto>/<ruta>?<consultas>
```

Where:

* ```<scheme>``` is the protocol or medium to be used to access a resource.
* Para *HTTP* se indica ```http```.
* Para *HTTPS* se indica ```https```.
* ```<username>``` is the name of the user with whom the resource will be accessed in the event that access requires authentication.
* ```<password>```is the password of the user with whom the resource will be accessed in the event that access requires authentication.
* ```<host>``` indicates the address of the host that you want to access.
* ```<port>``` is the port on which the service is enabled.
* *HTTP* uses port ```80``` by default.
* *HTTPS* uses port ```443``` by default.
* ```<path>``` is the path where the resource is located within the server.
* ```<query>``` is a sequence of parameters that can be processed by the host system.

### Structure of a query.

Queries are a sequence of ```<name>=<value>``` parameters separated by the ```&``` character as follows:

```
<nombre 1>=<valor 1>&<nombre 2>=<valor 2>&...&<nombre n>=<valor m>
```

Parameters are not used to locate a resource. The data parameters that can be processed by the host system.

**Example:**

* The following *URL* will do the following:
* It will make an *HTTPS* connection on port 443 with the host system located at ```www.google.com```.
* will search for the resource located in the ```search``` path.
* Will send the ```q=pythonista``` parameter.

https://www.google.com/search?q=pythonista

Entering the *URL* from a browser will result in a Google search for the term ```pythonist```.

<img src="img/20/google_py.png" width="500">

## Access to an host.

Host systems are computers or computer systems which are distributed throughout the world and whose services can be accessed in two ways:

* Using your *IP* address.
* Through your domain name.

## IP addresses*.

An [dirección *IP*](https://es.wikipedia.org/wiki/Direcci%C3%B3n_IP) is a unique number that identifies a specific server's network node. A server can have more than one network node, so each node would have a different and unique *IP* address.

The "Internet Assigned Numbers Authority" ([*IANA*](https://www.iana.org/)) is the organization in charge of assigning and distributing segments of *IP* addresses to various private and governmental organizations.

### *IP* version 4 (*IPv4*) addresses.

The specification of *IPv4* identifiers was defined by the "Internet Engineering Task Force" ([*IETF*](https://ietf.org/about/)) in [*IETF*](https://ietf.org/about/).

*IPv4* addresses are the most commonly used. They correspond to a 32-bit number expressed by 4 segments of numbers ranging from ```0``` to ```255``` (8 bits) separated by a period ```.```.


**Example:**

The *IPv4* address where the Pythonista® server is located is ```142.4.217.131```.

Due to the rise of the Internet, as of 2011 the reserve of *IPv4* addresses has been exhausted. However, even when the reserves are depleted, it is still possible to reuse and manage existing *IPv4* addresses.

### IPv4 network classes.

From the totality of available *IP* addresses, various networks of various kinds were distributed.


| Type | Rank | Maximum number of addresses |
| :---------: | :----: | :---: |
| Class A | ```1.0.0.1``` to ```126.255.255.254```| 16 million in 127 networks |
| Class B | ```128.1.0.1``` to ```191.255.255.254``` | 65,000 on 16,000 networks |
| C-Class | ```192.0.1.1``` to ```223.255.254.254``` | 254 on 2 million networks |
| Class D | ```224.0.0.0``` to ```239.255.255.255``` | Reserved |
| Class E | ```240.0.0.0``` to ```254.255.255.254``` | Reserved |

### "Intranets" and private *IP* address ranges..

An intranet is a private network based on the *TCP/IP* protocol suite, in which each network interface on local systems is assigned an *IP* address in a private range and the Internet is only accessible via means of a [ruteador](https://es.wikipedia.org/wiki/Router).

Private *IP* address ranges are a set of addresses that can be assigned to an intranet without collisions with public *IP* addresses.

The network segments for private *IP* addresses are:

* Class A ranging from ```10.0.0.0``` to ```10.255.255.255```.
* Class B ranging from ```172.16.0.0``` to ```172.31.255.255```.
* Class C going from ```192.168.0.0``` to ```192.168.255.255```.


### *CIDR*

*Classless Inter-Domain Routing* (*CIDR*) is a network standard for interpreting *IP* addresses. *CIDR* blocks share the same initial sequence of bits in the binary representation of their *IP* addresses.

*IPv4* CIDR blocks are identified using a syntax similar to *IPv4* addresses: four decimal numbers separated by periods, followed by a division bar and a number from 0 to 32.

The first four decimal numbers are the *IPv4* address, and the number after the slash is the prefix length, counting from the left, and represents the number of bits common to all addresses included in the *CIDR* block.

The number of *IPs* that defines the length of the prefix corresponds to $2^{32 - n} $.

**Example:**

The block: ```201.107.4.0/13``` defines the range of 524,288 *IP* addresses from ```201.104.0.0``` to ```201.111.255.255```

```

https://es.wikipedia.org/wiki/Classless_Inter-Domain_Routing

https://www.ipaddressguide.com/cidr

#### Direcciones *IP* versión 6 (*IPv6*).

A partir de la necesidad de contar con un mayor número de direcciones *IP* disponibles, fue publicada la especificación de los identificadores *IPv6*, la cual fue definida en el [*RFC 3513*](https://tools.ietf.org/html/rfc3513).

Las direcciones *IPv6* son un número de 128 bits expresado por 8 segmentos de números hexadecimales que van de ```0``` a ```FFFF``` (```65535```), separados por dos puntos ```:```. Los valores iguales a ```0``` pueden ser omitidos.

**Ejemplo:**

La dirección *IPv6* donde se encuentra el servidor de Pythonista® es ```fe80::a6bf:1ff:fe08:aee4```.

### *DNS*, dominios y subdominios.

Aún cuando las direcciones *IP* pueden identificar con precisión a un host, no son fáciles de memorizar por parte de los seres humanos. Es  por ello que fueron creados los "nombres de dominio" y el "sistema de nombres de dominio" o [*DNS*](https://es.wikipedia.org/wiki/Sistema_de_nombres_de_dominio) por sus siglas en inglés.

La "Corporación de Internet para la Asignación de Nombres y Números" o [*ICANN*](
https://www.icann.org/) por sus siglas en  inglés, es la organización encargada en definir y asignar y distribuir los nombres de dominos válidos de Internet.

Gracias al *DNS* es posible relacionar uno o más nombres de dominio a una dirección *IP* utilizando una estructura como la siguiente.

```
<subdomain>.<domain name>
```

Donde:

* ```<nombre de dominio>``` es un nombre de domino válido que apunta a una dirección IP.
* ```<subdominio>``` es una extensión del nombre de dominio que puede apuntar a una dirección *IP* distinta a la del dominio. Los subdominios permiten ofrecer servicios diferenciados dentro de un mismo dominio. 

**Ejemplos:**

* ```google.com``` es el dominio propiedad de la empresa Google.
* ```www.google.com``` apunta al servicio de búsqueda de Google.
* ```docs.google.com``` apunta al servicio de gestión de documentos de Google.
* ```mail.google.com``` apunta al servicio de correo electrónico de Google.

Los nombres de dominio pueden ser adquiridos mediante un "registrar" autorizado por *ICANN*, el cual por lo general también ofrece servicios de *DNS*.

Una vez adquirido un dominio es posible definir cualquier número de subdominios relacionados mediante el proveedor de servicios *DNS*.

#### Dominios de nivel superior (*TLD*).

Un nombre de dominio se compone de un nombre y un "dominio de nivel superior" o [*TLD*](https://en.wikipedia.org/wiki/Top-level_domain), por sus siglas en inglés,  de la siguiente forma.
```
<name>.<TLD>
```

Los TLD se utilizan primordialmente para:
* Definir la actividad de una organilzación, como es el caso de:
    * ```.com``` para organizaciones comerciales.
    * ```.edu``` para organizaciones educativas. 
    * ```.net``` para organizaciones especializadas en comunicaciones de red. 
    * ```.org``` para organizaciones sin fines de lucro.
    * ```.mil``` para organizaciones militares. 
* Definir la región o país al que pertence la organización, como es el caso de:
    * ```.mx``` para México.
    * ```.es``` para España.
    * ```.io``` para la región del Oceano Índico.
    * ```.lat``` para Latinoamérica.
* Definir el tipo de servicio que se ofrece, como es el caso de:
    * ```.info``` para servicios de información.
    * ```.xxx``` para servicios de entretenimiento para adultos.
    * ```mobi``` para aplicaciones móviles.

La gestión de cada *TLD* puede ser asignada a una organización en particular, la cual fija las reglas para poder adquirir un dominio con dicho *TLD*.

Los *TLD* pueden combinarse de tal forma que describan una actividad en una región.

**Ejemplos:**

* ```google.com``` es el dominio primario de Google.
* ```google.com.mx``` es el dominio de Google para México.
* ```google.com.es``` es el dominio de Google para España.

### *localhost*.

Es común que al desarrollar una aplicación web o diseñar un sitio web se haga desde una máquina de escritorio la cual ofrecería un servicio web local para consulta interna.

En la mayoría de los sistemas, el nombre ```localhost``` permite conectarse a un servicio que corre en el mismo equipo sin necesidad de contar con una interfaz de red. Este nombre por lo general está relacionado con la dirección *IP* ```127.0.0.1```.

Por seguridad, muchas herramientas de desarrollo de aplicaciones web están configuradas por defecto para conectarse exclusivamente a ```localhost```.

**Ejemplo:**

En caso de estar viendo este contenido desde una notebook de Jupyter corriendo desde un equipo propio, es muy probable que el navegador apunte a ```http://localhost:8888```.

## El protocolo *NAT*.

El protocolo de "Traducción de direcciones de red", o [*NAT*](https://es.wikipedia.org/wiki/Traducci%C3%B3n_de_direcciones_de_red) permite crear una interfaz que puede enrutar los mensajes entre una red local con Internet, de tal foma que los paquetes de datos lleguen a su destino de forma transparente para el cliente y el servidor.

## El protocolo *DHCP*.

El protocolo de configuración dinámica de anfitriones, o  [*DHCP*](https://es.wikipedia.org/wiki/Protocolo_de_configuraci%C3%B3n_din%C3%A1mica_de_host) es un protocolo que le permite a un servidor local asignar las direcciones *IP* a las diversas interfaces de una red local, así como configurar las rutas de los servidores *DNS* de la red.

## Dispositivos.

* Concentrador o [*hub*](https://es.wikipedia.org/wiki/Concentrador) es un dispositivo al que se conectan físicamente los cables de una red.
* Puente o [*bridge*](https://es.wikipedia.org/wiki/Puente_de_red) es un equipo que permite transmitir paquetes entre diversos segmentos de red.
* Ruteador o [*router*](https://es.wikipedia.org/wiki/Router) es un dispositivo que permite dirgir  los paquetes de datos entre redes.
* Pasarela de enlace o [*gateway*](https://es.wikipedia.org/wiki/Puerta_de_enlace) es un dispositivo que puede realizar las operaciones relacionadas con los protocolos *NAT*, *DHCP* e incluso enrutado de paquetes.
* Cortafuegos o [*firewall*](https://es.wikipedia.org/wiki/Cortafuegos_(inform%C3%A1tica)) es un dispositivo de seguridad que permite filtrar las comunicaciones dentro de una red a partir de ciertas reglas.

**Nota:** La operación de cada uno de estos dispositivos puede ser realizada por un equipo basado en *GNU/Linux* y también pueden ser virtualizados.

### Reglas para *firewalls* .

### Parámetro de acción.

* Permitir (*allow*).
* Denegar (*deny*).

### Parámetro de flujo de los datos.

* Entrada (*inbound*).
* Salida (*outbound*).

### Protocolos o puertos.
 
 * Se pueden definir reglas para los diversos protocolos de la familia *TCP/IP*.
 * Se pueden definir los números de puerto ya sean *TCP* o *UDP*, primordialmente.

### Direcciones específicas o rangos de direcciones *IP*.

* Mediante una dirección *IP*  específica.
* Mediante una máscara de direcciones *IP*.

## Archivos de configuración en *GNU/Linux*.

Estos archivos permiten realizar modificaciones básicas al sistema que permiten:

* Identificar al equipo.
* Habilitar las redes de comunicación. 

### El archivo ```/etc/hostname```.

Este archivo contiene el nombre del *host* o *anfitirón*.

* La siguiente celda mostrará el contenido del archivo ```/etc/hostname```.

In [None]:
cat /etc/hostname

### El archivo ```/etc/hosts```.

Este archivo identifica a otros equipos dentro del dominio por medio de su nombre o por su dirección *IP*.

El nombre ```localhost``` siempre se va a referir al equipo local y por lo general la direccion *IP* corresponde a ```127.0.0.1```.

* La siguiente celda mostrará el contenido del archivo ```/etc/hosts```.

In [None]:
cat /etc/hosts

### El archivo ```etc/resolv.conf```.

Este archivo contiene las configuraciones de los servidores *DNS* a los que consulta el *host* local.

* La siguiente celda mostrará el contenido del archivo ```/etc/resolv.conf```.

In [None]:
cat /etc/resolv.conf

## Interfaces de red.

Una interfaz de red o *NIC* es un dispositivo físico o virtual capaz de conectarse a una red.

### Los scripts de configuración de interfaces de red.

Es importante saber que en las distribuciones de *GNU/Linux* más modernas, la configuración de las *NIC* son automáticas. 

* Los scripts de configuracion de distribuciones basadas en *Red Hat* se encuentran en ```/etc/sysconfig/network-scripts/```.

* Los scripts de configuracion de distribuciones basadas en *Debian* se encuentran en ```/etc/network/```.

**Ejemplo:**

* Las siguiente celda mostrará la estrutctura de ```/etc/network```.

**Nota:** Estas celdas solo aplican a sistemas basados en *Debian* y *Ubuntu*.

In [None]:
tree /etc/network

### El comando ```ip```.

Este comando realiza las siguientes operaciones para las interfaces de red de un sistema:

* Crear.
* Configurar.
* Monitorear.

```
ip <interface> <arguments> <options>
```

Donde:

* ```<interfaz>``` es el nombre de una *NIC*.


El argumento ```a``` despliega la información de todos los *NIC*.

Trae un listado de todos los NIC del sistema con sus configuraciones.

La *NIC* con nombre ```lo``` ni es una interfaz de red física, sino un dispsitivo virtual por medio del cual es posible acceder a servicios específicos del *host*.

**Ejemplo:**

* La siguiente celda mostrará las configuraciones de los *NIC* físicos y virtuales del sistema actual.

In [None]:
ip a

#### La *man page* del comando ```ip```.

In [None]:
man ip

## Los *sockets* de *Unix* y *GNU/Linux*.

El estándar *POSIX* define medios que permiten a los procesos internos de un sistema *Unix* o *GNU/Linux* realizar comunicaciones con otros procesos del sistema mediante el uso de *sockets* pior meido de diversos puertos. 

Los [*sockets de dominio de UNIX*](https://en.wikipedia.org/wiki/Unix_domain_socket) son complatibles con diversos protocolos de la familia *TCP/IP*.

### El comando ```ss```.

Este es un comando avanzado de monitoreo de red por medio de sockets.

```
ss <arguments> <options>
```

**Ejemplo:**

* La siguiente celda mostrará la información general de los sockets del sistema.

In [None]:
ss -e

#### La *man page* de ```ss```

In [None]:
man ss

### La biblioteca ```net-tools```.

Esta biblioteca de comandos especializados en la gestión de redes contiene aplicaciones que se utilizan comunmente en sistemas *UNIX*. Sin embargo, las versiones más actuales del kernel de *Linux* han hecho incompatibles algunas funcionalidades de dicha biblioteca. 

* ```ifconfig```.
*  ```netstat```.
*  ```arp```.
* ```route```.

Es posible consultar una *cheat sheet* de comandos tanto de ```ip```como de ```ss``` equiparables a los comandos más comunes que previamente se realizaban con la biblioteca ```net-tools```.

https://access.redhat.com/sites/default/files/attachments/rh_ip_command_cheatsheet_1214_jcs_print.pdf

**Nota:** Algunas distribuciones de *GNU/Linux* aún incluyen esta biblioteca.

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">Contenido creado por: José Luis Chiquete Valdivieso. 2019.</p><p style="text-align: center">Contenido modificado por: Cristian Cardoso Arellano. 2023.</p>