<a href="https://colab.research.google.com/github/IllyanaX/ExtraccionDeDatos/blob/main/Web_Scraping.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Como usar APIs**

## Uso de API de manera directa

Realizaremos un ejemplo sencillo con el método GET, para la extracción de datos de la página https://sunrise-sunset.org/api que ofrece el tiempo en el que salió o se pusó el solo dependiendo de una latitud y una longitud dadas.

Las APIs suelen tener dos tipos de parámetros para el requerimiento de datos: obligatorios y opcionales. En el caso de nuestro ejemplo los parámetros son:

* Latitud (lat): Parámentro es obligatorio y debe especificarse como un tipo de dato float.
* Longitud (lng): Parámentro es obligatorio y debe especificarse como un tipo de dato float.
* Fecha (date): Parámetro opcional, el formato debe ser: AAAA-MM-DD, aunque esta API acepta otros formatos, si no se ingresa ninguna fecha en específico, utiliza el día actual
* Función *callback*: Parámetro opcional, tipo de dato string.
* Identificador de zona horaria (tzld): Parámetro opcional, este parámetro nos permite establacer la zona horario, tipo de dato string.

La estructura de la consutla (*query*):

URL base con el respectivo dato de transmisión, en este caso JSON:

`https://api.sunrise-sunset.org/json?`

Los parámetros:

`lat = 19.437034782996776`

`lng = -99.15456376522646`

`date = 2023-01-01`


In [13]:
import requests
import json

In [None]:
# Definimos los parámetros de la query

latitude = 19.437034782996776
longitude = -99.15456376522646
date = "2023-01-01"

# Realizamos la consulta y la almacenamos en una variable nueva

sunset_answer = requests.get(f"https://api.sunrise-sunset.org/json?lat={latitude}&lng=*{longitude}&date={date}")

In [None]:
type(sunset_answer)

requests.models.Response

In [None]:
# Cargamos el objeto como JSON, porque hasta ahora es de tipo 'HHTPRESPONSE', a través de su des-seralización
sunset_data = sunset_answer.json()
print(sunset_data)

{'results': {'sunrise': '6:32:45 AM', 'sunset': '5:34:08 PM', 'solar_noon': '12:03:26 PM', 'day_length': '11:01:23', 'civil_twilight_begin': '6:10:10 AM', 'civil_twilight_end': '5:56:43 PM', 'nautical_twilight_begin': '5:42:51 AM', 'nautical_twilight_end': '6:24:02 PM', 'astronomical_twilight_begin': '5:15:50 AM', 'astronomical_twilight_end': '6:51:03 PM'}, 'status': 'OK', 'tzId': 'UTC'}


In [None]:
type(sunset_data)

dict

In [None]:
#Como nuestro objeto es un diccionario podemos usarlo como tal
sunset_data['results']['sunset']

'5:34:08 PM'

In [None]:
sunset_data["results"]

{'sunrise': '6:32:45 AM',
 'sunset': '5:34:08 PM',
 'solar_noon': '12:03:26 PM',
 'day_length': '11:01:23',
 'civil_twilight_begin': '6:10:10 AM',
 'civil_twilight_end': '5:56:43 PM',
 'nautical_twilight_begin': '5:42:51 AM',
 'nautical_twilight_end': '6:24:02 PM',
 'astronomical_twilight_begin': '5:15:50 AM',
 'astronomical_twilight_end': '6:51:03 PM'}

In [None]:
sunrise = sunset_data["results"]['sunrise']
print(f"En {date} el sol salió a las {sunrise} (UTC)")

En 2023-01-01 el sol salió a las 6:32:45 AM (UTC)


## Uso de API por medio de un libreria

A veces no es resulta posible utilizar APIs de manera directa, en estos casos utilizaremos una herramienta llamada *wrapper*. Un wrapper es un tipo de código que se utiliza para envolver la funcionalidad de una biblioteca o API, facilita el uso de una librería o servicio al proporcionar funciones y métodos más simples y comprensibles.

In [None]:
#Instalación de paquetes necesarios

!pip3 install --force-reinstall -v  "wikipedia-api==0.5.8"

In [7]:
#importamos la libreria y corrboramos la versión
import wikipediaapi

print(wikipediaapi.__version__)

(0, 5, 8)


In [6]:
#Instanciamos la clase wikipedia y el método Wikipedia con el parámetro idioma

IDIOMA = 'es'
wiki = wikipediaapi.Wikipedia(IDIOMA)

#Utilizamos el método page y hacemos un request con el parámetro key_word

key_word = 'Godel'
wikipedia_Godel = wiki.page(key_word)

In [11]:
#ahora podemos ver los diferentes atributos de Gödel usado diferentes métodos

print(wikipedia_Godel.title)
print(wikipedia_Godel.summary)

Kurt Gödel
Kurt Friedrich Gödel ([ˈkʊʁt ˈɡøːdəl]; Brünn, Imperio austrohúngaro, actual República Checa, 28 de abril de 1906-Princeton, Estados Unidos; 14 de enero de 1978), conocido como Kurt Gödel, fue un lógico, matemático y filósofo austríaco.[1]​
Se le considera uno de los lógicos más importantes de todos los tiempos. Su trabajo ha tenido un impacto inmenso en el pensamiento científico y filosófico del siglo XX. Al igual que otros pensadores —como Gottlob Frege, Bertrand Russell, A. N. Whitehead y David Hilbert—, Gödel intentó emplear la lógica y la teoría de conjuntos para comprender los fundamentos de la matemática.
Se le conoce sobre todo por sus dos teoremas de la incompletitud, publicados en 1931, un año después de finalizar su doctorado en la Universidad de Viena. El más célebre establece que para todo sistema axiomático recursivo autoconsistente lo suficientemente poderoso como para describir la aritmética de los números naturales (la aritmética de Peano), existen proposicio

In [12]:
print(wikipedia_Godel.fullurl)

https://es.wikipedia.org/wiki/Kurt_G%C3%B6del



# **BeautifulSoup**

Documentación de la librería https://beautiful-soup-4.readthedocs.io/en/latest/

En este proyecto estaremos utilizabndo una página desarrollada por [freecodecamp](https://www.freecodecamp.org/) y Gustavo Juantorena.



In [14]:
from bs4 import BeautifulSoup
import requests

In [15]:
# Versiones
import bs4
print("Versión de BeautifulSoup:",bs4.__version__)
print("Versión de requests:", requests.__version__)

Versión de BeautifulSoup: 4.11.2
Versión de requests: 2.31.0


In [16]:
#Scraping

# 1. Obtenemos el HTML

url_base ='https://scrapepark.org/courses/spanish/'
