[![imagenes](../imagenes/pythonista.png)](https://pythonista.io)

# Introducción a *HTTP* y *HTML*.

Es común referirse a *'Internet'*  y a la *'World Wide Web'*, o *'web'* como sinónimos aún cuando en realidad son conceptos distintos.

## Internet.

Internet es toda una red de infraestructura de comunicaciones que soporta la familia de Protocolos [*TCP/IP*](https://es.wikipedia.org/wiki/Modelo_TCP/IP). Uno de los protocolos que soporta es [*HTTP*](https://es.wikipedia.org/wiki/Protocolo_de_transferencia_de_hipertexto).

## El protocolo *HTTP* y la *World Wide Web* (*WWW*).

### *HTTP*.

Creado por [Tim Berners-Lee](https://es.wikipedia.org/wiki/Tim_Berners-Lee) en 1989, es el protocolo utilizado para acceder y publicar en la *web* y corresponde a las siglas en inglés de "*Protocolo de Transmisión de Hipertexto*".

Actualmente el [World Wide Web Consortium (*W3C*)] (https://www.w3.org) es la entidad encargada, entre otras cosas, de publicar la especificación del protocolo *HTTP*. La versión más reciente es *HTTP/2*, pero la mayoría de los servidores utilizan la versión *HTTP/1.1*.

En la siguiente liga pueden consultarse las diversas publicaciones de la *W3C*: https://www.w3.org/Protocols/http

*HTTP* está basado en  una arquitectura cliente-servidor en la que se intercambian peticiones (requests) por parte del cliente y respuestas (responses) por parte del servidor.

### *Uniform Resource Locator* (*URL*).

El protocolo *HTTP* permite localizar los diversos recursos disponibles en la web mediante los *Localizadores Uniformes de Recursos* o *URL* por sus siglas en inglés. La estructura de una *URL* es la siguiente:

```
http://<subdominio>.<dominio>:<puerto>/<ruta>?<parámetro 1>&<parámetro 2>&...&<parámetro n>
```
La sintaxis de los parámetros es:

```
<nombre>=<valor>
```
*HTTP* utiliza por defecto el puerto ```80```.

El protocolo *HTTPS* es una variación del *HTTP* que permite cifrar las comunicaciones entre el cliente y el servidor mediante el uso de certificados [*SSL/TLS*](https://es.wikipedia.org/wiki/Transport_Layer_Security). 

```
https://<subdominio>.<dominio>:<puerto>/<ruta>?<parámetro1>&<parámetro2>&...&<<parametro n>
```

*HTTPS* utiliza el puerto ```443```  por defecto.

**Ejemplos:**

* La *URL* [```https://amazon.com.mx/s?k=python```](https://amazon.com.mx/s?k=python) le indica los siguiente al navegador:
    * Realizar una conexión *HTTPS*. 
    * El puerto por defecto es ```443```.
    * El servidor se encuentra en el dominio ```amazon.com.mx```.
    * Se accederá al recurso localizado en la ruta ```/s```, el cual permite realizar búsquedas mediante ciertos parámetros.
    * El parámetro ```k=python``` le indica al servidor que busque los artículos que coincidan con el término ```python```. 

  * La *URL* [```https://www.google.com/search?&q=pythonista&lang=es&country=mexico```](https://www.google.com/search?&q=pythonista&lang=es&country=mexico) le indica los siguiente al navegador:
    * Realizar una conexión *HTTPS*.
    * El puerto por defecto es ```443```.
    * El servidor se encuentra en el dominio ```google.com```.
    * Se accederá al servicio disponible en el subdominio ```www```, el cual corresponde al buscador de *Google*.
    * Se accederá al recurso localizado en la ruta ```/search```, el cual permite realizar búsquedas mediante ciertos parámetros.
    * El parámetro ```q=pythonista``` le indica al servidor que busque el término ```pythonista```.
    * El parámetro ```lang=es``` le indica al servidor que la búsqueda le dará prioridad a los sitios en español (```es```). 
    * El parámetro ```country=mexico``` le indica al servidor la búsqueda le dará proridad a los sitios de México (```mexico```). 

**Nota:** La siguiente *URL* funcionará sólo si esta notebook se ejecuta desde alguna de las máquinas virtuales proporcionadas por Pythonista<sup>®</sup> o por Cloudevel<sup>®</sup>.

* La *URL* [```http://localhost:8999/edit/pycd101/README.md```](http://localhost:8888/edit/pycd101/README.md) le indica los siguiente al navegador:
    * Realizar una conexión *HTTP*.
    * El servidor se encuentra en ```localhost```, indicando que se trata del equipo local.
    * Se accederá al servicio transmitiendo desde el puerto ```8999```.
    * Se accederá al recurso en la ruta ```/edit/pycd101/README.md```.

### Peticiones, respuestas y sesiones.

Las comunicaciones entre el cliente y el servidor consisten en un serie de intercambios de datos.

*  Un cliente por lo general envía una petición (request) a un servidor que se encuentra atendiendo a una dirección específica. La petición incluye generalmente los datos del cliente, asi como la información necesaria para que el servidor pueda procesar correctamente el requerimiento.
* El servidor recibe la petición y procesa los datos. Dependiendo de la petición, el servidor puede enviar cualquier tipo de recurso, así como mensajes de estado.
* A este intercambio de peticiones y respuestas entre un cliente y un servidor se conocen como sesiones.

### Mensajes de estado.
Los mensajes de estado permiten informar al cliente sobre la manera en la que ha sido procesada la petición. Está conformado por un número entero de 3 dígitos. En caso de que la petición haya sido procesada exitosamente, el servidor regresa el número ```200```.

##### Tipos por el número inicial:
* ```1xx``` Información.
* ```2xx``` Éxito.
* ```3xx``` Redireccionamiento.
* ```4xx``` Error del cliente.
* ```5xx``` Error del servidor.

Los mensajes de estado de *HTTP* pueden ser consultados en la siguiente liga: http://www.restapitutorial.com/httpstatuscodes.html

### Métodos *HTTP*.

El protocolo *HTTP* define métodos o "verbos", los cuales permiten realizar peticiones específicas entre un cliente y un servidor. Algunos de los métodos más utilizados son:

* ```GET``` se utiliza para obtener los datos de un recurso a partir de una *URL*. La información enviada mediante ```GET``` puede ser añadida a marcadores y puede ser registrada en las bitácoras del servidor.
* ```POST``` se utiliza para cear un recurso. Los datos enviados no son expuestos en la *URL* sino que son enviados dentro de la estructura de la petición. 
* ```HEAD``` es similar al método ```GET```, pero sólo proporciona el encabezado de la petición y el mensaje de estado resultante.
* ```PUT``` se utiliza para sustituir un recurso existente y su estructura es similar a la de ```POST```.
* ```PATCH``` es un método que se utiliza para modificar parcialmente un recurso.
* ```DELETE``` es un método que se utiliza para eliminar un recurso. 

Existen algunos otros métodos como ```OPTIONS```, ```TRACE``` y ```CONNECT```, pero no están contemplados en el alcance de este taller. Puede consultar más al respecto puede acceder a https://developer.mozilla.org/es/docs/Web/HTTP/Methods.


**NOTA:** 
Al ingresar una URL en un navegador, dicho navegador utilizará el método ```GET```
. 
Más adelante se estudiará el uso de formularios en un documento *HTML* y se discutirá el uso de los métodos ```GET``` y ```POST```.

## *HTML*.

Aún cuando el protocolo *HTTP* puede transmitir y gestionar cualquier tipo de recurso (flujos de datos, imágenes, archivos, textos, etc.), lo más común son las llamadas "páginas web", las cuales son documentos escritos en *HTML*.

*HTML* es el acrónimo de "*Lenguaje de Marcadores de Hipertexto*" por sus siglas en inglés. 

*HTML* es un lenguaje declarativo, el cual se urtiliza para describir lo que un cliente puede desplegar, pero no le indica exactamente cómo hacerlo. Es decir, indica lo que conteniene un documento, pero es el cliente el que define cómo desplegarlo.

###  Evolución de *HTML*.

*HTML* es un estándar de la W3C que a lo largo del tiempo ha evolucionado. En un principio *HTML* se basó en el estándar [*SGML*](https://es.wikipedia.org/wiki/SGML), pero a partir de *HTML5*, es una especificación autónoma.

El objetivo de Tim Berners Lee al diseñar *HTML* era el de poder crear documentos que pudieran combinar texto, imágenes y *enlazar* a otros recursos en la web mediante "hipervínculos". Sin embargo, conforme la web fue creciendo, la necesidad de crear contenidos ricos en medios como sonido, video, gráficos, animaciones, flujos de datos, etc. hizo evolucionar a la especificación.

*HTML5* es la versión más reciente del estándar que ha publicacido la W3C y junto con las [hojas de estilo en cascada](https://es.wikipedia.org/wiki/Hoja_de_estilos_en_cascada) (*CSS*) y [Javascript](https://es.wikipedia.org/wiki/JavaScript) conforman la inmensa mayoría del contenido web.

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2019.</p>