**Ejercicio 2:** Obtener datos con Web Scraping.

Selecciona un sitio web y extrae datos utilizando Web Scraping con Python

Siguiendo la temática de la astronomía, utilizo una página que contiene un listado de los 100 objetos a mirar del astrónomo Charles A. Woods

In [11]:
import requests
from bs4 import BeautifulSoup

# URL del sitio web
url = 'http://www.bitacoradegalileo.com/lista-lunar-100/'

# Realizar la solicitud HTTP a la página web
response = requests.get(url)

# Comprobar que la solicitud fue exitosa (código 200), también creo un objeto BS para analizar el contenido del HTML
if response.status_code == 200:
    soup = BeautifulSoup(response.content, 'html.parser')

    lunar_objects = soup.find_all('div', class_='post-page')  

# Inspeccionaré la página donde se encuentran los datos para ver en dónde puedo encontrar las etiquetas que me interesa localizar
else:
    print(f'Error al acceder a la página. Código de estado: {response.status_code}')

lunar_objects




[<div class="post-page" id="post-12160">
 <h1>Lista Lunar 100</h1>
 <p>A continuación figura la lista completa de los <strong>Lunar 100</strong>, de <a href="http://www.lpod.org/cwm/">Charles A. Woods</a>. La primera columna es el número del accidente, en la segunda figura el nombre y la tercera contiene una breve descripción. A continuación están las coordenadas selenográficas (he preferido denotar el Oeste con la W anglosajona para evitar confusiones con el número cero), y la última es el diámetro del objeto, expresado en kilómetros. En su caso, he incluido enlaces a los artículos de <em>La bitácora de Galileo</em> donde han sido estudiados y en el futuro iré añadiendo los que se vayan publicando.</p>
 <p><a href="http://www.bitacoradegalileo.com/wordpress/wp-content/uploads/2011/08/lunar100b4ti-11.jpg"><img alt="" class="aligncenter size-full wp-image-12202" decoding="async" sizes="(max-width: 618px) 100vw, 618px" src="http://www.bitacoradegalileo.com/wordpress/wp-content/uploads/20

Observando el HTML observo que los valores que me interesan están dentro de las etiquetas <tr>(las filas) <td>, con una estructura como formato tabla, 
por lo que el proceso de extracción lo haré en el siguiente orden:

- Encontrar las filas de la tabla que me interesa.

- Hacer un recorrido por las filas, verificando que en cada fila haya al menos una celda y de ahí extraer el texto

In [10]:
import requests
from bs4 import BeautifulSoup

# URL del sitio web
url = 'http://www.bitacoradegalileo.com/lista-lunar-100/'

response = requests.get(url)

# Comprobación de la conexión
if response.status_code == 200:
    soup = BeautifulSoup(response.content, 'html.parser')

    # Buscar las filas que contienen la lista de objetos lunares
    filas = soup.find_all('tr')  

    # Se hace el recorrido de las filas y se extraen los datos de las celdas <td>
    for fila in filas:
        celdas = fila.find_all('td')  # Buscar todas las celdas de la fila
        if len(celdas) > 0:  # Asegurarse de que la fila tiene celdas
            # Se extrae el texto de cada celda
            l_id = celdas[0].text.strip()    
            nombre = celdas[1].text.strip()    
            descripcion = celdas[2].text.strip()  
            coordenadas = celdas[3].text.strip()  
            diametro = celdas[4].text.strip()  

            
            print(f'ID: {l_id}, Nombre: {nombre}, Descripción: {descripcion}, Coordenadas: {coordenadas}, Diámetro: {diametro}')
else:
    print(f'Error al acceder a la página. Código de estado: {response.status_code}')



ID: L1, Nombre: Luna, Descripción: Gran satélite, Campo vacío: , Diámetro: 3476
ID: L3, Nombre: Dicotomía mares/tierras altas, Descripción: Dos materiales con distinta composición, Campo vacío: , Diámetro: 
ID: L5, Nombre: Copérnico, Descripción: Arquetipo de grandes cráteres complejos, Campo vacío: 9.7N 20.1W, Diámetro: 93
ID: L7, Nombre: Rupes Altai, Descripción: Borde de la cuenca de Nectaris, Campo vacío: 24.3S 22.6E, Diámetro: 425
ID: L9, Nombre: Clavius, Descripción: Carece de las características de cuenca a pesar de su tamaño, Campo vacío: 58.8S 14.1W, Diámetro: 225
ID: L11, Nombre: Aristarco, Descripción: Cráter muy brillante con bandas oscuras en sus paredes, Campo vacío: 23.7N 47.4W, Diámetro: 40
ID: L13, Nombre: Gassendi, Descripción: Cráter de suelo fracturado, Campo vacío: 17.6S 40.1W, Diámetro: 101
ID: L15, Nombre: Rupes Recta, Descripción: El mejor ejemplo de falla lunar, Campo vacío: 21.8S 7.8W, Diámetro: 110
ID: L17, Nombre: Vallis Schröteri, Descripción: Rima gigante 