# **RECOPILACIÓN Y ALMACENAMIENTO DE DATOS - SQL**

### **El navegador y las solicitudes**

Cuando accedes a un sitio web, tu navegador envía una solicitud HTTP al servidor. El servidor, a su vez, formula una respuesta: el código HTML de la página correspondiente.

**Formato de solicitud**

Una solicitud formada por un navegador puede contener lo siguiente:

- Método HTTP: determina la operación a realizar. Existen varios métodos. Los más populares son GET y POST. El primero solicita datos del servidor, mientras que el segundo los envía.
- Ruta: el segmento de la dirección que sigue al nombre del sitio example.com/hello la ruta es /hello).
- Versión HTTP: la versión del protocolo HTTP utilizado para enviar la solicitud (por ejemplo, HTTP/1.1).
- Encabezados de la solicitud: se utilizan para enviar información adicional al servidor.
- Cuerpo de la solicitud: por ejemplo, el cuerpo de una solicitud POST son los datos que se envían. No todas las solicitudes tienen cuerpo.

**Formato de respuesta**

La respuesta puede contener:

- La versión HTTP.
- El código y el mensaje de respuesta (por ejemplo, "200 OK" si todo va bien, o "404 Not Found" si no se encuentra la ruta solicitada).
- Encabezados que contienen información adicional para el navegador.
- Cuerpo de la respuesta (por ejemplo, cuando abres el sitio web, verás el código HTML de esta página en el cuerpo de la respuesta).

## **Primera solicitud GET**

Para obtener datos del servidor, usaremos el método get(), y para enviar solicitudes HTTP, necesitamos la librería Requests. Importamos la librería:

In [1]:
import requests

URL = "https://practicum-content.s3.us-west-1.amazonaws.com/new-markets/Data_sprint_6/web-sites/most_famous_shipwrecks_es_1.html?etag=87662559becdeb134637e5670502d6d6"

# El método get() de la librería Requests actúa como un navegador. Le pasaremos el enlace como argumento. El método enviará al servidor una solicitud GET, luego procesará la respuesta que reciba y devolverá una respuesta, un objeto que contiene la respuesta del servidor a la solicitud.

req = requests.get(URL)  # guardando el objeto de respuesta como variable requerida

print(req.text)  # el nombre del atributo se coloca después del objeto de respuesta y se divide por un punto

ModuleNotFoundError: No module named 'requests'

**El atributo status_code te dice si el servidor ha respondido o si ha ocurrido un error.
Vamos a generar el código de estado de la respuesta:**

In [None]:
print(req.status_code)

200



Desafortunadamente, no todas las solicitudes regresan con datos. A veces, las solicitudes devuelven errores; cada uno tiene un código especial dependiendo de su tipo. Estos son los errores más comunes:

| Codigo error | Nombre | Implicaciones |
|----------|----------|----------|
| 200    | OK   | Todo está bien   |
| 302    | Found    | La página ha sido movida   |
| 400    | Bad Request   | Error en la sintaxis de la solicitud   |
| 404    | Not Found   | No se puede encontrar la página   |
| 500    | Internal Server Error   | Error por parte del servidor   |
| 502    | Bad Gateway   | Error en el intercambio de datos entre servidores   |
| 503    | Server Unvailable   | El servidor no puede procesar solicitudes temporalmente   |



### Practicando

**Ejercicio 1**

Escribe una solicitud GET en la siguiente página: https://tripleten-com.github.io/simple-shop_es/. Guarda tu resultado en la variable req.

In [None]:
import requests

URL = "https://tripleten-com.github.io/simple-shop_es/"
req = requests.get(URL)

print(req.text)

<!DOCTYPE html>
<html lang="es">
  <head>
    <meta charset="UTF-8" />
    <meta http-equiv="X-UA-Compatible" content="IE=edge" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <link rel="stylesheet" href="./pages/index.css" />
    <title>Tierra de lácteos Tienda</title>
  </head>
  <body class="page">
    <div class="page__content">
      <header class="header page__section">
        <img src="./images/logo.png" alt="Tierra de lácteos." class="logo" />
      </header>
      <main class="content">
        <h1 class="content__title">Alta calidad, productores locales</h1>
        <section class="products page__section">
          <ul class="cards">
            <li class="card">
              <img
                src="https://cdn-icons-png.flaticon.com/512/684/684614.png"
                alt=""
                class="card__image"
              />
              <p class="t754__title t-name t-name_md js-product-name">Leche de vaca entera, 1 galón</p>
     

## Expresiones regulares

Una expresión regular (regex) es una regla para buscar subcadenas (fragmentos de texto dentro de cadenas). Por ejemplo, si estamos buscando la combinación de letras "tion" en la oración "Arrived at the station in total frustration", Python lo entenderá como si estuviera buscando la subcadena "tion" dentro de la cadena 'Arrived at the station in total frustration'. 

#### **Cómo funcionan las expresiones regulares**

Para empezar a trabajar con expresiones regulares en Python, necesitamos importar el módulo re (expresiones regulares). Siguen dos etapas.

- En la primera etapa, creamos el patrón de la expresión regular. Este es un algoritmo que describe lo que debe buscarse dentro del texto (por ejemplo, todas las letras mayúsculas).

- Luego, este patrón se pasa a los métodos específicos de re. Estos métodos buscan, reemplazan y eliminan símbolos. En otras palabras, el patrón identifica qué buscar y cómo, mientras que el método define qué hacer con las coincidencias que se encuentran.

| Expresión regular | Descripción | Ejemplo | Explicación |
|----------|----------|----------|----------|
| []    | Caracter único contenido entre paréntesis	   | [a-]	   |a o -
   |
| [^…]    | Negación   | [^a]	   |cualquier caracter excepto "a"
   |
| -    | Rango   | [0-9]	   |rango: cualquier dígito del 0 al 9
   |
| .	    | Cualquier caracter único excepto una nueva línea	   | a.	   |as, a1, a_
   |
| \d (see [0-9])	    | Cualquier dígito	   | a\d	   |a[0-9]	   |
| \w	    | Cualquier letra, dígito o _	   | a\w	   |a_, a1, ab
   |
| [A-z]	    | Cualquier letra   | a[A-z]	   |ab   |
| ?    | 0 o 1 instancia	   | a?	   |a o nada
   |
| +    | 1 o más instancias   | a+	   |a o aa, o aaa
   |
| *    | 0 o más instancias	   | a*   |nada o a, o aa
   |
| ^    | Comienzo de cadena	   | ^a	   |a1234, abcd
   |
| $    | Fin de cadena	   | a$   |1a, ba
   |


### Expresiones regulares en Python

Estas son algunas de las tareas más comunes para los analistas:

- encontrar una subcadena dentro de una cadena
- dividir cadenas en subcadenas
- reemplazar partes de una cadena con otras cadenas

Para completar estas tareas, necesitarás los siguientes métodos re:

1. search(patrón, cadena) busca un patrón en una cadena. Aunque search() recorre toda la cadena para encontrar el patrón, solo devuelve la primera subcadena que encuentra:

In [None]:
import re

string = '"General Slocum" 15 June 1904 East River human factor'
print(re.search("\w+", string))

<re.Match object; span=(1, 8), match='General'>


In [None]:
import re

string = '""General Slocum" 15 June 1904 East River human factor'
print(re.search("\w+", string).group())

General


¿Cómo identificamos las palabras que se encuentran entre caracteres particulares? Intentemos hacer coincidir una frase entre comillas dobles, asumiendo que solo contiene letras y espacios.

[A-z] : este patrón coincide con cualquier letra, ya sea mayúscula o minúscula. Este patrón coincide con cada letra de la cadena, pero como letras separadas, no como palabras.

[A-z ] : (¡ten en cuenta el espacio al final!): este patrón indica que los espacios también son bienvenidos, pero aún coincide con un solo caracter a la vez, ya sea una letra o un espacio.

[A-z ]+: este patrón coincide con una secuencia de estos caracteres hasta que se encuentra algún otro caracter o se alcanza el final de la cadena. Entonces, todos los caracteres que no están en la lista (como dígitos o signos de puntuación) se convierten esencialmente en separadores. Si aplicamos este patrón a nuestra cadena, obtendremos tres coincidencias: General Slocum, un espacio, June (observa los espacios que rodean la palabra) y ast River human factor.

"[A-z ]+": este patrón coincide con una comilla doble, seguida de una secuencia de letras y espacios (1 o más, sin límite superior), seguida de otra comilla doble. Eso nos deja con "General Slocum" (contando las comillas esta vez), justo lo que estábamos buscando.

In [None]:
import re

string = '"General Slocum" 15 June 1904 East River human factor'
print(re.search('"[A-z ]+"', string).group())

"General Slocum"


Observa que si el contenido de la cita contiene caracteres que no están en la lista, impedirán que la cita coincida con el patrón. Es por eso que hemos agregado el espacio. Las expresiones regulares son una ciencia exacta.

2. split(patrón, cadena) divide una cadena en los puntos donde aparece el patrón.

In [None]:
import re

string = '"General Slocum" 15 June 1904 East River human factor'
print(re.split("\d+", string))

['"General Slocum" ', ' June ', ' East River human factor']


Como puedes ver, la cadena se ha dividido en tres partes, divididas en lugares donde el método ha encontrado el patrón definido en el argumento. Aquí, el patrón '\d+' coincide con uno o más dígitos. Siempre que split() encuentra uno o más dígitos (en este caso, 15 y 1904), divide la cadena en subcadenas. Las subcadenas que coinciden con el patrón se excluyen y no están presentes en la salida.

El parámetro maxsplit del método split() limita el número de veces que se divide la cadena.

In [None]:
import re

string = '"General Slocum" 15 June 1904 East River human factor'
print(re.split("\d+", string, maxsplit=1))

['"General Slocum" ', ' June 1904 East River human factor']


Como puedes ver, la cadena solo se ha dividido una vez.

3. sub(patrón, repl, cadena) busca el patrón de subcadena dentro de una cadena y lo reemplaza con la subcadena repl (replace).

In [None]:
import re

string = '"General Slocum" 15 June 1904 East River human factor'
print(re.sub("\d+", "", string))  # buscamos secuencias de 1 o más dígitos
# y las eliminamos

"General Slocum"  June  East River human factor


Se han eliminado todas las subcadenas que consistían en dígitos (estrictamente hablando, se han reemplazado con una cadena vacía entre comillas simples: '').

4. findall(patrón, cadena) devuelve una lista de todas las subcadenas en una cadena que coinciden con el patrón. Compáralo con el método search() que solo devuelve la primera subcadena coincidente. Intentemos encontrar todas las palabras que terminen con "tion":

In [None]:
import re

tion = "Arrived at the station in total frustration"
print(re.findall("[A-z]+tion", tion))

['station', 'frustration']


... o palabras con guion:

In [None]:
import re

string = "sixty-seven drops of rain"
print(re.findall("\w+-\w+", string))

['sixty-seven']


El patrón coincide con las palabras con guion; en este caso, "sixty-seven" es la única coincidencia. El método findall() es realmente útil ya que, cuando se usa junto con la función len(), te permite determinar cuántas veces se repite una subcadena:

In [None]:
import re

string = "sixty-seven drops of rain"
print(len(re.findall("\w+", string)))

5


¿Esperabas que len() mostrara 4? Nos ha dado 5 porque "sixty-seven" se ha contado como dos palabras; el patrón '\w+' no captura el guion.

Agreguemos '-' a la expresión regular y contemos "sixty-seven" como una sola palabra

In [None]:
import re

string = "sixty-seven drops of rain"
print(len(re.findall("[\w-]+", string)))

4


### Ejercicios!

**Ejercicio 1**

Para obtener el contenido de texto de la solicitud, utiliza el método get() de la librería requests junto con el atributo text. Pasa la variable URL al método get().

La información entre las etiquetas <title> y </title> contiene tanto un espacio como letras. El símbolo + captura una o más instancias. Escribe tu patrón de expresión regular envuelto en las etiquetas <title> y </title>.

In [None]:
import requests
import re

URL = "https://tripleten-com.github.io/simple-shop_es/"  # el enlace al sitio web
req_text = requests.get(URL).text  # el contenido de texto de la solicitud

# Expresión regular para encontrar la etiqueta <title> y su contenido
pattern = r"<title>(.+?)<\/title>"
match = re.search(pattern, req_text)

if match:
    title_content = match.group(1)
    print(f"<title>{title_content}</title>")
else:
    print("No se encontró la etiqueta <title> en el contenido de la solicitud.")

<title>Tierra de lácteos Tienda</title>


**Ejercicio 2**

Escribe una expresión regular que genere todos los nombres de productos que incluyan la palabra "Mantequilla" (ten en cuenta la letra mayúscula). "Mantequilla" puede aparecer en medio del nombre. Así que podría haber 0 o más letras o espacios antes de "Mantequilla" y podría haber algunas letras o espacios después. No necesitamos incluir el peso neto en nuestros nombres, así que no incluyas una coma en tu expresión regular. Muestra lo que encuentres.

Ahora necesitamos múltiples ocurrencias, así que usaremos re.findall() .

In [None]:
import requests
import re

URL = "https://tripleten-com.github.io/simple-shop_es/"
req_text = requests.get(URL).text

# Expresión regular para encontrar todos los nombres de productos que incluyan la palabra "Mantequilla"
pattern = r"\b[\w\s]*Mantequilla[\w\s]*\b"

matches = re.findall(pattern, req_text)
print(matches)

['Kerrygold Mantequilla irlandesa con aceite de canola', 'Danish Creamery Mantequilla sin sal', 'Kelapo Ghee Mantequilla clarificada', 'Land O Lakes Mantequilla baja en sodio con aceite de canola']


**Ejercicio 3**

Escribe una expresión regular para encontrar todos los nombres de productos que contengan la palabra "Horizon" (una marca). Solo aparece al principio de un nombre. No incluyas el peso, solo el nombre del producto.

Los nombres de productos pueden contener letras, dígitos, espacios, guiones y signos de porcentaje. Guarda el resultado en la variable found_products. Muestra la longitud de esta lista (el número de productos) y la lista misma en una línea separada.

In [None]:
import requests
import re

URL = "https://tripleten-com.github.io/simple-shop_es/"
req_text = requests.get(URL).text

# Expresión regular para encontrar todos los nombres de productos que comienzan con "Horizon"
pattern = r"\bHorizon[\w\s\-%]*"

found_products = re.findall(pattern, req_text)

print(len(found_products))  # Muestra la longitud de la lista de productos encontrados
print(found_products)  # Muestra la lista de productos encontrados

4
['Horizon Organic Leche chocolatada baja en grasa enriquecida con omega-3 DHA', 'Horizon Organic Leche Entera', 'Horizon Organic Leche de vainilla baja en grasa enriquecida con omega-3 DHA', 'Horizon Organic Leche reducida en grasa al 2% enriquecida con omega-3 DHA']


<hr>

## Análisis sintáctico de HTML

Los métodos de BeautifulSoup convierten un archivo HTML en una estructura de árbol. Luego, el contenido necesario se puede encontrar por medio de etiquetas y atributos.

Importemos la librería y creemos un objeto BeautifulSoup:

```python
from bs4 import BeautifulSoup

soup=BeautifulSoup(req.text, 'lxml')
```

El primer argumento presenta datos que formarán la estructura de árbol. El segundo argumento es un analizador sintáctico. Define la forma en que la página web se convierte en un árbol. Hay numerosos analizadores sintácticos, y si les das el mismo documento HTML, todos generarán estructuras diferentes. 

### Navegar por el árbol

Ahora que hemos cambiado el código a un árbol, ¡comencemos a recuperar datos!

El primer método de búsqueda se llama find(). Recorre el árbol y encuentra el primer elemento cuyo nombre se pasa como argumento y lo devuelve junto con las etiquetas y el contenido del elemento. Intentemos encontrar el primer encabezado de segundo nivel:

```python
heading_2=soup.find("h2")
print(heading_2)

# <h2>Los Mayores naufragios del siglo XX </h2>**
```

Para mostrar el contenido sin etiquetas, necesitarás el método text. Devolverá una cadena:

```python
heading_2.text

#Los Mayores naufragios del siglo XX
```



### Algunos ejercicios

**Ejercicio 1**

Crea un objeto BeautifulSoup a partir de la página HTML. Guarda tus resultados en la variable soup.

In [None]:
import requests  # Importa la librería para enviar solicitudes al servidor
from bs4 import BeautifulSoup  # Importa la librería para analizar la página web

URL = "https://tripleten-com.github.io/simple-shop_es/"
req = requests.get(URL)  # GET-request
soup = BeautifulSoup(req.text, "html.parser")

**Ejercicio 2**

Obtén los nombres de los productos https://tripleten-com.github.io/simple-shop_es/ y agrégalos a la lista name_products.

Identifica los nombres de las etiquetas y sus atributos en la barra de herramientas para desarrolladores web. Obtén las etiquetas necesarias usando find_all() .

Muestra la lista resultante.

In [None]:
import requests  # Importa la librería para enviar solicitudes al servidor
from bs4 import BeautifulSoup  # Importa la librería para analizar la página web

URL = "https://tripleten-com.github.io/simple-shop_es/"
req = requests.get(URL)  # solicitud GET
soup = BeautifulSoup(req.text, "html.parser")
name_products = []  # Lista donde se almacenan los nombres de los productos
for row in soup.find_all(
    "p", attrs={"class": "t754__title t-name t-name_md js-product-name"}
):
    name_products.append(row.text.strip("\n "))
print(name_products)

['Leche de vaca entera, 1 galón', 'Fairlife Leche entera, 52 onzas', 'Nestle Nesquik Leche chocolatada baja en grasa, 16 pecks', 'Moo-Moo Leche desnatada con ingredientes seleccionados, 1 cuarto', 'Moo-Moo Leche desnatada con ingredientes seleccionados Moo-Moo, 1 galón', 'Silk Leche de coco sin azúcar, 1/2 galón', 'Fairlife Leche desnatada, 52 onzas', 'Horizon Organic Leche chocolatada baja en grasa enriquecida con omega-3 DHA, 12 pecks', 'Yoo-hoo Bebida de chocolate, 3 pecks', 'Moo-Moo Leche con ingredientes seleccionadosreducida al 2% en grasa, 1/2 galón', 'Borden Leche Entera, 1 galón', 'Caravelle Chaudoc Leche de Coco, 14 onzas', 'Horizon Organic Leche Entera, 1/2 galón', 'Nesquik Leche baja en grasa con sabor a fresa, 8 onzas', 'Nesquik Leche baja en grasa con sabor a vainilla, 14 onzas', 'Moo-Moo Leche con ingredientes seleccionados 1% baja en grasa, 1 galón', 'Polar Premium Leche de coco orgánica, 13.5 onzas', 'Borden Leche chocolatada holandesa, 1 pinta', 'Borden Leche chocolat

**Ejercicio 3**

Obtén los precios de los productos https://tripleten-com.github.io/simple-shop_es/ y agrégalos a la lista price .

Identifica los nombres de las etiquetas y sus atributos en la barra de herramientas para desarrolladores web. Obtén las etiquetas necesarias usando find_all() .

In [5]:
import requests
from bs4 import BeautifulSoup

URL = 'https://tripleten-com.github.io/simple-shop_es/'
req = requests.get(URL)  # solicitud GET
soup = BeautifulSoup(req.text, 'html.parser')



name_products = []  # Lista donde se almacenan los nombres de los productos
for row in soup.find_all('p', class_='t754__title t-name t-name_md js-product-name'):
    name_products.append(row.text)

price = []  # Lista donde se almacenan los precios de los productos
for row in soup.find_all('p', class_='t754__price-value js-product-price'):
    price.append(row.text)

print(price)


['$4.23', '$3.11', '$11.54', '$0.92', '$2.3', '$2.99', '$3.13', '$11.94', '$1', '$1.33', '$3.53', '$1.96', '$3.88', '$0.92', '$1.34', '$2.24', '$2.94', '$1.56', '$2.7', '$2.48', '$2.32', '$6.36', '$4.34', '$2.7', '$2.29', '$7.8', '$2.8', '$2.97', '$8.82', '$3.87', '$3.49', '$5.47']


**ejercicio 4**

Agrega los datos a un DataFrame vacío. Crea columnas 'name' y 'price' y rellénalas con los datos de las listas name_products y price. Muestra las primeras 5 filas del DataFrame. Las columnas deben aparecer en este orden: name, price.

In [6]:
import pandas as pd
import requests
from bs4 import BeautifulSoup

URL = 'https://tripleten-com.github.io/simple-shop_es/'
req = requests.get(URL)
soup = BeautifulSoup(req.text, 'html.parser')

name_products = []
for row in soup.find_all('p', class_='t754__title t-name t-name_md js-product-name'):
    name_products.append(row.text)

price = []
for row in soup.find_all('p', class_='t754__price-value js-product-price'):
    price.append(row.text)

# Crear un DataFrame vacío
products_data = pd.DataFrame()

# Agregar los datos a las columnas 'name' y 'price'
products_data['name'] = name_products
products_data['price'] = price

# Mostrar las primeras 5 filas del DataFrame
print(products_data.head())


                                                name   price
0                      Leche de vaca entera, 1 galón   $4.23
1                    Fairlife Leche entera, 52 onzas   $3.11
2  Nestle Nesquik Leche chocolatada baja en grasa...  $11.54
3  Moo-Moo Leche desnatada con ingredientes selec...   $0.92
4  Moo-Moo Leche desnatada con ingredientes selec...    $2.3


<hr>

## **API**

 Una API permite a los desarrolladores interactuar con los sistemas incluso sin comprender exactamente cómo funcionan. Para hacerlo, la API proporciona "instrucciones", un conjunto de métodos específicos.

Si no sabes cómo se produce y suministra la electricidad, tu API de electricidad es una toma de corriente. Para interactuar con esta API, necesitas un método: un enchufe.

**Solicitudes GET con parámetros**

La librería requests te permite pasar parámetros a una URL. Cuando buscas un cierto contenido en un sitio web de varias páginas, podrías querer pasar el diccionario PARAM a la palabra clave params (es decir, parámetros). Esto facilitará tu programación, ya que la alternativa sería crear una URL compleja con los parámetros embebidos en ella. Por ejemplo:

In [7]:
city = 'Lisbon'
URL = f'https://wttr.in/{city}'
PARAM={"format": 4, "M": ""}
req = requests.get(url = URL, params = PARAM)

Esta solicitud debería devolver el pronóstico del tiempo actual para Lisboa, Portugal, en uno de los formatos predeterminados abreviados (parámetro "format": 4) y el viento en metros por segundo (parámetro "M": "").

**Parámetros para solicitar un pronóstico meteorológico**

| Nombre del Parámetro | Descripción | Características | Valores |
|----------|----------|----------|----------|
| m    | mostrar resultados en metric (SI)	   | opcional   | “” |
| format	    | responder con la información del tiempo en diferentes formatos	    | opcional  | 	de 1 a 4 para versiones cortas |


In [10]:
import requests

city = 'Lima'

BASE_URL = f'https://wttr.in/{city}'
# URL para el método get()

PARAM={"format": 1, "m":""}

response = requests.get(BASE_URL, params = PARAM)
print(response.text)

⛅️  +22°C



## Ejercicios!

**Ejercicio 1**

Consigue un pronóstico para tres días completos del tiempo para Roma ("Rome" en inglés), Italia, utilizando el sistema métrico.

In [23]:
import requests

city = 'Rome'

base_url = f"https://wttr.in/{city}"

PARAM = {
  "u":"","T":""
}

response = requests.get(base_url,params=PARAM)

print(response.text)


Weather report: Rome

      \   /     Sunny
       .-.      53 °F          
    ― (   ) ―   ↓ 3 mph        
       `-’      6 mi           
      /   \     0.0 in         
                                                       ┌─────────────┐                                                       
┌──────────────────────────────┬───────────────────────┤  Wed 20 Mar ├───────────────────────┬──────────────────────────────┐
│            Morning           │             Noon      └──────┬──────┘     Evening           │             Night            │
├──────────────────────────────┼──────────────────────────────┼──────────────────────────────┼──────────────────────────────┤
│    \  /       Partly Cloudy  │     \   /     Sunny          │     \   /     Sunny          │     \   /     Clear          │
│  _ /"".-.     57 °F          │      .-.      66 °F          │      .-.      +59(57) °F     │      .-.      53 °F          │
│    \_(   ).   ↓ 3-4 mph      │   ― (   ) ―   → 2-3 mph      │   ― (   

In [13]:
import requests

city = 'Cusco'
base_url = f'https://wttr.in/{city}'

response = requests.get(base_url)

print(response.text)

Weather report: Cusco

  [38;5;226m   \  /[0m       Partly cloudy
  [38;5;226m _ /""[38;5;250m.-.    [0m [38;5;046m9[0m °C[0m           
  [38;5;226m   \_[38;5;250m(   ).  [0m [1m↑[0m [38;5;118m4[0m km/h[0m       
  [38;5;226m   /[38;5;250m(___(__) [0m 10 km[0m          
                0.0 mm[0m         
                                                       ┌─────────────┐                                                       
┌──────────────────────────────┬───────────────────────┤  Wed 20 Mar ├───────────────────────┬──────────────────────────────┐
│            Morning           │             Noon      └──────┬──────┘     Evening           │             Night            │
├──────────────────────────────┼──────────────────────────────┼──────────────────────────────┼──────────────────────────────┤
│ [38;5;226m _`/""[38;5;250m.-.    [0m Thundery outbr…│ [38;5;226m _`/""[38;5;250m.-.    [0m Patchy rain ne…│ [38;5;226m _`/""[38;5;250m.-.    [0m Patchy rain 

**Ejercicio 2**


Obtén el clima abreviado para Cancún, usando también el sistema métrico.

Muestra el contenido de texto de la solicitud en la pantalla.


In [24]:
import requests

city = 'Cancún'

BASE_URL = f'https://wttr.in/{city}'
# URL para el método get()

PARAM={"m":"", "format":3}


response = requests.get(BASE_URL, params = PARAM)
print(response.text)


Cancún: ⛅️  +25°C



<hr>

# **JSON**

La estructura bien definida de los objetos JSON facilita tomar información, convertirla en una cadena y pasarla en una solicitud HTTP. Esa es la esencia de JSON: recopilas datos dentro de un objeto (una lista de pares key : value) y luego creas una cadena para pasarla en una solicitud. El receptor vuelve a convertir esta cadena en un objeto.

### Módulo JSON

Su método json.loads() convierte cadenas que están en formato JSON:

In [25]:
import json

x = '{"name": "General Slocum", "date": "June 15, 1904"}'
y = json.loads(x)

print('Name : {0}, date : {1}'.format(y['name'], y['date']))

Name : General Slocum, date : June 15, 1904


En este caso, el JSON contenía información sobre un solo objeto. Más a menudo, se pasa una lista completa:

In [26]:
x = '[{"name": "General Slocum", "date": "June 15, 1904"}, {"name": "Camorta", "date": "May 6, 1902"}]'
y = json.loads(x)
for i in y:
    print('Name : {0}, date : {1}'.format(i['name'], i['date']))

Name : General Slocum, date : June 15, 1904
Name : Camorta, date : May 6, 1902


El método json.dumps(), por el contrario, convierte los datos de Python al formato JSON.

In [27]:
out = json.dumps(y)
print(out)

[{"name": "General Slocum", "date": "June 15, 1904"}, {"name": "Camorta", "date": "May 6, 1902"}]
