# Funcion para hacer el scraping

In [None]:
# BLOQUE 1: Importaciones y configuraci√≥n inicial

import requests # para hacer peticiones HTTP (descargar paginas web)
from bs4 import BeautifulSoup # para analizar el HTML descargado
import sqlite3 
import pandas as pd 
import time 
import re # para expresiones regulares (extraer numeros de texto)
from urllib.parse import urljoin, quote # urljoin: Construir URLs completas a partir de relativas 
import json # para trabajar con JSON 

print("‚úÖ Librer√≠as importadas correctamente")
print("üï∑Ô∏è Comenzando la infiltraci√≥n en Books To Scrape...") 


# BLOQUE 2: Funciones de Web Scraping 

def get_all_categories ():
    ''' OBTIENE TODAS LAS CATEGORIAS DEL SITIO'''
    url = "https://books.toscrape.com" 
    respuesta = requests.get(url) # se descarga la web 
    soup = BeautifulSoup(respuesta.content, 'html.parser')  
    # convierte texto HTML ilegible, en un objeto inteligente que se pueda navegar 
    
    categories = []
    nav_list = soup.find('ul', class_='nav nav-list')
    if nav_list:
        category_links = nav_list.find_all ('a') [1:] # Saltar "Books"
        for link in category_links:
            category_name = link.text.strip()  # Extrae el texto del enlace y quita espacios 
            category_url = urljoin(url, link['href'])  # Convierte la URL relativa a absoluta 
            categories.append({ 
                'name' : category_name,
                'url' : category_url 
            })
            
    print (f"üéØ Encontradas {len(categories)} categorias")
    return categories 


def book_quantity (book_url): 
    ''' OBTIENE LA CANTIDAD EN STOCK DE UN LIBRO DESDE SU PAGINA DE DETALLES  '''
    try:
        soup_quantity = BeautifulSoup(requests.get(book_url).content,'html.parser') # descarga y parsea la pagina individual del libro 
        quantity_text = soup_quantity.select_one('p.instock.availability').get_text(strip=True) 
        # Busca el <p> con clases "instock" y "availability", extrae su texto limpio
        match = re.search(r'\((\d+)\)', quantity_text) # busca un patron para extraer el numero entero 
        if match:
            return int (match.group(1)) # devuelve la cantidad encontrada 
        else:
            return 0 # si no se encuentra la cantidad, devuelve 0 
    except Exception as e :
        print (f"‚ùå Erorr obteniendo cantidad para {book_url}:{e}")
        return 0 # en caso de error, devuelve 0 
    


def scrape_books_from_page(page_url): 
    ''' SCRAPE LIBROS DE UNA PAGINA ESPECIFICA  '''
    response = requests.get(page_url) # Descarga la pagina 
    soup = BeautifulSoup(response.content,'html.parser' ) # Parsea el HTML 
    
    books = []
    book_containers = soup.find_all ('article', class_ ='product_pod') 
    # cada libro esta dentro de un <article class="product_pod"> 
    
    for book in book_containers: 
        try:
            # TITULO
            title_element = book.find('h3').find('a') # busca la a dentro del h3 
            title = title_element['title'] # el titulo completo esta en el atributo "title"

            # URL DEL LIBRO PARA MAS DETALLES 
            book_url = urljoin(page_url, title_element['href']) 
            # cosntruye la url absoluta del libro a partir de su href relativo
            
            
            # PRECIO
            price_element = book.find('p', class_= 'price_color') 
            price_text = price_element.text.strip() if price_element else "¬£0.00"
            price = float (price_text.lstrip('√Ç¬£')) # Elimina los caracteres "√Ç" y "¬£" del inicio y convierte a n√∫mero decimal
            
            # RATING 
            rating_element = book.find ('p', class_= 'star-rating')
            rating_class = rating_element['class'][1] if rating_element else 'Zero' 
            # La clase CSS indica el rating
            rating_map = {'One': 1, 'Two' : 2 , 'Three': 3, 'Four': 4, 'Five': 5, "Zero" : 0 } 
            rating = rating_map.get(rating_class, 0) 
            # Convierte la palabra en ingl√©s a n√∫mero 
            
            # STOCK 
            stock_element = book.find ('p', class_= 'instock availability')
            in_stock = 'In stock' in stock_element.text if stock_element else False 
            # Verifica si el texto contiene "In stock" ‚Üí True/False
            quantity = book_quantity(book_url)
            # Llama a la funci√≥n anterior para obtener la cantidad exacta en stock
            # ‚ö†Ô∏è NOTA: Esto hace una petici√≥n HTTP extra POR CADA LIBRO (lento)
            
            books.append({ # se agrega todos los datos del libro al diccionario 
                
                'title': title,
                'price': price,
                'rating' : rating,
                'in_stock' : in_stock,
                'quantity': quantity,
                'url': book_url
            })
            
        except Exception as e:
            print(f"‚ùå Error procesando libro: {e}") 
            continue
    return books 

def scrape_all_books (): 
    ''' SCRAPE TODOS LOS LIBROS DEL SITIO '''
    all_books = []
    categories = get_all_categories() # obtiene la lista de categorias
    for i, category in enumerate(categories): 
        print (f"Procesando categoria {i+1}/ {len(categories)}: {category['name']}")
        
        page_num = 1 
        current_url = category['url'] # URL de la primera pagina de la categoria 
        
        while current_url: # sigue el bucle mientras haya paginas
            print (f" Pagina {page_num}")
            books_on_page = scrape_books_from_page(current_url) 
            # Extare todos los libros de la pagina actual 
            
            for book in books_on_page:
                book['category'] = category['name']
                # agrega el nombre de la categoria a cada libro 
                
            all_books.extend(books_on_page) # se agrega los libros a la lista total 
            
            # BUSCAR SIGUIENTE PAGINA 
            response = requests.get(current_url)
            soup = BeautifulSoup(response.content, 'html.parser')
            next_button = soup.find('li', class_= 'next')
            # busca el boton next para ir a la siguiente pagina 
            
            if next_button and next_button.find('a'):
                next_url = next_button.find('a')['href']
                current_url = urljoin(current_url, next_url)
                # construye la URL a la siguiente pagina 
                page_num += 1 
            else:
                current_url = None # no hay mas paginas y sale del while 
                
            time.sleep (0.5) # ser amigables con el servidor, espera 0.5 entre peticiones 
        
    print (f" üéâ Scraping completado: {len(all_books)} libros encontrados")
    return all_books


# BLOQUE 3: EJECUTAR EL SCRAPING 
books_data = scrape_all_books

# Mostrar muestra de datos 
print ("\n Muestra de los primeros 3 libros: ")
for i, book in enumerate(books_data[:3]):
    print(f"{i+1}. {book['title']} - {book['price']} - ‚≠ê{book['rating']} - {book['category']} - {book['quantity']}")
    # se imprime los primeros 3 libros como muestra 

## Funciones para obtener autores con Google Books API

In [None]:
def get_author_from_google_books (title, max_retries):
    ''' Obtiene la informacion del autor usando Google Books API '''
    
    for attempt in range (max_retries):
        try:
            # Limpiar el t√≠tulo para mejor b√∫squeda
            clean_title = re.sub(r'[^\w\s]', '', title) 
            url = "https://www.googleapis.com/books/v1/volumes" # url de la base de Google Books API 
            params = {"q": f"intitle:{title}", "maxResults": 1} 
            # q: intitle:{title} ‚Äî busca libros cuyo t√≠tulo contenga el texto dado.
            # maxResults: 1 ‚Äî solo pide 1 resultado (el m√°s relevante).
            response = requests.get(url, params=params) 
            # hace la petici√≥n HTTP GET a la API. requests se encarga de construir la URL final con los par√°metros
            
            if response.status_code == 200: # verifica que la respuesta fue exitosa, y es 200 porque es un estandar del protocolo HTTP
                data = response.json() 
                # Convierte la respuesta (que viene en formato JSON) a un diccionario de Python.

                if 'items' in data and len(data['items']) > 0:
                    # Verifica que la API devolvi√≥ resultados. La clave 'items' contiene la lista de libros encontrados.
                    
                    volume_info = data['items'][0].get('volumeInfo', {}) 
                    #Toma el primer resultado ([0]) y extrae su informaci√≥n del volumen. Si no existe 'volumeInfo', devuelve un diccionario vac√≠o {} para evitar errores.
                    authors = volume_info.get('authors', ['Autor Desconocido']) # extrae la lista de autores 
                    description = volume_info.get('description', 'Sin descripci√≥n') # extrae la descripcion del libro 

                    return {
                        'authors': authors,
                        'description': description[:500] + '...' if len(description) > 500 else description
                        # Si la descripci√≥n tiene m√°s de 500 caracteres, la recorta y le agrega '...' al final.
                    }
                else:
                    return {
                        'authors': ['Autor Desconocido'],
                        'description': 'Sin descripci√≥n'
                        # si la API no encontro ningun libro, devuelve valores por defecto 
                    }

            else:
                time.sleep(1)  # espera y reintenta 
                continue
            
        except Exception as e:
            print(f"‚ùå Error consultando API para '{title}': {e}")
            if attempt < max_retries - 1:
                time.sleep(2)
                continue
            # si aun quedan reintentos, se espera 2 segundos y vuelve a intentar 
            else:
                
                return {
                    'authors': ['Autor Desconocido'],
                    'description': 'Sin descripci√≥n'
            # si se agotaron devuelve los valores por defecto 
                }
    
    # Si llegamos aqu√≠, todos los intentos fallaron
    return {
        'authors': ['Autor Desconocido'],
        'description': 'Sin descripci√≥n'
    }

def enrich_books_with_authors(books_list): # recibe la lista completa que se obtuvo del scraping 
    """Enriquece la lista de libros con informaci√≥n de autores"""
    print("üîç Consultando Google Books API para obtener autores...")
    
    enriched_books = []
    total_books = len(books_list) 
    # Crea una lista vac√≠a para los libros enriquecidos y guarda el total de libros para mostrar progreso.

    for i, book in enumerate(books_list):
        print(f"üìñ Procesando libro {i+1}/{total_books}: {book['title'][:50]}...")
        # imprime progreso actual y los primeros 50 caracteres del titulo 
        
        author_info = get_author_from_google_books(book['title']) 
        # se llama a la funcion de la API para buscar el autor del libro en Google Books API 
        
        enriched_book = book.copy() # se crea para no modificar la original 
        enriched_book.update(author_info) # Fusiona la info del autor (authors y description) dentro del diccionario del libro
        enriched_books.append(enriched_book) # y se agrega el libro enriquecido a la lista final  
        
        # Rate limiting - ser respetuosos con la API
        time.sleep(0.1) # para no saturar la API
        
        # Mostrar progreso cada 10 libros
        if (i + 1) % 10 == 0:
            print(f"  ‚úÖ Progreso: {i+1}/{total_books} libros procesados")
    
    print("üéä Enriquecimiento completado!")
    return enriched_books




# BLOQUE 5: Ejecutar enriquecimiento con API
print("üåü Enriqueciendo datos con informaci√≥n de autores...")
enriched_books = enrich_books_with_authors(books_data) # se le pasa los libros del scraping 

# Mostrar muestra de datos enriquecidos
print("\nüìä Muestra de libros enriquecidos:")
for i, book in enumerate(enriched_books[:3]):
    authors_str = ', '.join(book['authors']) 
    print(f"{i+1}. '{book['title']}' por {authors_str}")
    print(f"   Precio: {book['price']} | Rating: ‚≠ê{book['rating']} | Categor√≠a: {book['category']}")
    # Resumen de cada libro 
    print()

In [None]:

# BLOQUE 6: Dise√±o UML y Estructura de Base de Datos


print("""
üèóÔ∏è DIAGRAMA UML - Estructura de la Base de Datos

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê    ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê    ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ     AUTORES     ‚îÇ    ‚îÇ  LIBROS_AUTORES  ‚îÇ    ‚îÇ     LIBROS      ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§    ‚îÇ   (Tabla Pivot)  ‚îÇ    ‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ id (PK)         ‚îÇ‚óÑ‚îÄ‚îÄ‚îÄ‚î§ autor_id (FK)    ‚îÇ‚îÄ‚îÄ‚îÄ‚ñ∫‚îÇ id (PK)         ‚îÇ
‚îÇ nombre          ‚îÇ    ‚îÇ libro_id (FK)    ‚îÇ    ‚îÇ titulo          ‚îÇ
‚îÇ                 ‚îÇ    ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò    ‚îÇ precio          ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò                           ‚îÇ rating          ‚îÇ
                                              ‚îÇ categoria       ‚îÇ
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê                           ‚îÇ en_stock        ‚îÇ
|                 |                           | cantidad        |
‚îÇ   CATEGORIAS    ‚îÇ                           ‚îÇ                 ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§                           ‚îÇ descripcion     ‚îÇ
‚îÇ id (PK)         ‚îÇ‚óÑ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÇ categoria_id (FK)‚îÇ
‚îÇ nombre          ‚îÇ                           ‚îÇ url             ‚îÇ
‚îÇ                 ‚îÇ                           ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

Relaciones:
- AUTORES ‚Üî LIBROS: Muchos a Muchos (un autor puede escribir varios libros, 
  un libro puede tener varios autores)
- CATEGORIAS ‚Üî LIBROS: Uno a Muchos (una categor√≠a tiene muchos libros)
""")

In [None]:

# BLOQUE 7: Creaci√≥n de Base de Datos (DDL)

def create_database():
    """Crea la base de datos y todas las tablas"""
    
    conn = sqlite3.connect('books_detective.db')
    cursor = conn.cursor()
    
    # DDL - Data Definition Language
    print("üèóÔ∏è Creando estructura de base de datos...")
    
    # Tabla Categor√≠as
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS categorias (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        nombre VARCHAR(100) UNIQUE NOT NULL
    )
    """)
    
    # Tabla Autores
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS autores (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        nombre VARCHAR(200) UNIQUE NOT NULL
    )
    """)
    
    # Tabla Libros
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS libros (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        titulo VARCHAR(500) NOT NULL,
        precio DECIMAL(10,2),
        rating INTEGER CHECK(rating >= 0 AND rating <= 5),
        categoria_id INTEGER,
        en_stock BOOLEAN,
        cantidad INTEGER,
        descripcion TEXT,
        url VARCHAR(1000),
        FOREIGN KEY (categoria_id) REFERENCES categorias(id)
    )
    """)
    
    # Tabla de relaci√≥n muchos a muchos
    cursor.execute("""
    CREATE TABLE IF NOT EXISTS libros_autores (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        libro_id INTEGER,
        autor_id INTEGER,
        FOREIGN KEY (libro_id) REFERENCES libros(id) ON DELETE CASCADE,
        FOREIGN KEY (autor_id) REFERENCES autores(id) ON DELETE CASCADE,
        UNIQUE(libro_id, autor_id)
    )
    """)
    
    conn.commit()
    print("‚úÖ Estructura de base de datos creada exitosamente")
    
    return conn

# Crear la base de datos
conn = create_database()

# BLOQUE 8: Inserci√≥n de Datos (DML)


def insert_data(enriched_books, connection):
    """Elimina datos existentes e inserta nuevos datos en la base de datos"""
    
    cursor = connection.cursor()
    print("üßπ Eliminando contenido existente de las tablas...")
    
    # Eliminar contenido de las tablas en el orden correcto para evitar conflictos de claves for√°neas
    cursor.execute("DELETE FROM libros_autores")
    cursor.execute("DELETE FROM libros")
    cursor.execute("DELETE FROM autores")
    cursor.execute("DELETE FROM categorias")
    
    # Reiniciar los IDs autoincrementales
    cursor.execute("DELETE FROM sqlite_sequence WHERE name='libros_autores'")
    cursor.execute("DELETE FROM sqlite_sequence WHERE name='libros'")
    cursor.execute("DELETE FROM sqlite_sequence WHERE name='autores'")
    cursor.execute("DELETE FROM sqlite_sequence WHERE name='categorias'")
    
    connection.commit()
    print("‚úÖ Tablas limpiadas y IDs reiniciados exitosamente")
    
    print("üìù Insertando datos en la base de datos...")
    
    # DML - Data Manipulation Language
    
    # 1. Insertar categor√≠as √∫nicas
    categories = set(book['category'] for book in enriched_books)
    for category in categories:
        cursor.execute("""
            INSERT OR IGNORE INTO categorias (nombre) VALUES (?)
        """, (category,))
    
    # 2. Insertar autores √∫nicos
    all_authors = set()
    for book in enriched_books:
        for author in book['authors']:
            all_authors.add(author)
    
    for author in all_authors:
        cursor.execute("""
            INSERT OR IGNORE INTO autores (nombre) VALUES (?)
        """, (author,))
    
    # 3. Insertar libros
    for book in enriched_books:
        # Obtener category_id
        cursor.execute("SELECT id FROM categorias WHERE nombre = ?", (book['category'],))
        categoria_id = cursor.fetchone()[0]
        
        cursor.execute("""
            INSERT INTO libros (
                titulo, precio, rating, categoria_id, en_stock, cantidad,
                descripcion, url
            ) VALUES (?, ?, ?, ?, ?, ?, ?, ?)
        """, (
            book['title'],
            book['price'],
            book['rating'],
            categoria_id,
            book['in_stock'],
            book['quantity'],
            book['description'],
            book['url']
        ))
        
        libro_id = cursor.lastrowid
        
        # 4. Insertar relaciones libro-autor
        for author in book['authors']:
            cursor.execute("SELECT id FROM autores WHERE nombre = ?", (author,))
            autor_id = cursor.fetchone()[0]
            
            cursor.execute("""
                INSERT OR IGNORE INTO libros_autores (libro_id, autor_id) 
                VALUES (?, ?)
            """, (libro_id, autor_id))
    
    connection.commit()
    print("‚úÖ Datos insertados exitosamente")
    
    # Mostrar estad√≠sticas
    cursor.execute("SELECT COUNT(*) FROM libros")
    total_books = cursor.fetchone()[0]
    
    cursor.execute("SELECT COUNT(*) FROM autores")
    total_authors = cursor.fetchone()[0]
    
    cursor.execute("SELECT COUNT(*) FROM categorias")
    total_categories = cursor.fetchone()[0]
    
    print(f"üìä Estad√≠sticas:")
    print(f"   üìö Libros: {total_books}")
    print(f"   ‚úçÔ∏è Autores: {total_authors}")
    print(f"   üè∑Ô∏è Categor√≠as: {total_categories}")

# Insertar todos los datos
insert_data(enriched_books, conn)

In [None]:

# BLOQUE 9: Consultas SQLüïµÔ∏è‚Äç‚ôÇÔ∏è


def execute_query(connection, query, description):
    """Ejecuta una consulta y muestra los resultados"""
    print(f"\nüîç {description}")
    print("=" * 60)
    
    cursor = connection.cursor()
    cursor.execute(query)
    results = cursor.fetchall()
    columns = [desc[0] for desc in cursor.description]
    
    # Crear DataFrame para mejor visualizaci√≥n
    df = pd.DataFrame(results, columns=columns)
    print(df.to_string(index=False))
    
    return df

# CONSULTA 1: Libros baratos pero bien rankeados (el santo grial del lector pobre)
query1 = """
SELECT 
    l.titulo,
    l.precio,
    l.rating,
    c.nombre as categoria,
    GROUP_CONCAT(a.nombre, ', ') as autores
FROM libros l
JOIN categorias c ON l.categoria_id = c.id
JOIN libros_autores la ON l.id = la.libro_id
JOIN autores a ON la.autor_id = a.id
WHERE l.rating >= 4 AND l.precio < 20
GROUP BY l.id, l.titulo, l.precio, l.rating, c.nombre
ORDER BY l.rating DESC, l.precio ASC
LIMIT 10
"""

execute_query(conn, query1, 
              "üí∞ CONSULTA 1: Libros baratos pero bien rankeados (para lectores con presupuesto ajustado)")

# CONSULTA 2: Los autores m√°s prol√≠ficos (¬øqui√©n no para de escribir?)
query2 = """
SELECT 
    a.nombre as autor,
    COUNT(l.id) as total_libros,
    AVG(l.rating) as rating_promedio,
    AVG(l.precio) as precio_promedio,
    MIN(l.precio) as libro_mas_barato,
    MAX(l.precio) as libro_mas_caro
FROM autores a
JOIN libros_autores la ON a.id = la.autor_id
JOIN libros l ON la.libro_id = l.id
GROUP BY a.id, a.nombre
HAVING COUNT(l.id) > 1
ORDER BY total_libros DESC, rating_promedio DESC
LIMIT 15
"""

execute_query(conn, query2, 
              "‚úçÔ∏è CONSULTA 2: Autores m√°s prol√≠ficos (los que no paran de escribir)")

# CONSULTA 3: An√°lisis por categor√≠as (¬ød√≥nde est√° el oro literario?)
query3 = """
SELECT 
    c.nombre as categoria,
    COUNT(l.id) as total_libros,
    AVG(l.rating) as rating_promedio,
    AVG(l.precio) as precio_promedio,
    COUNT(CASE WHEN l.rating >= 4 THEN 1 END) as libros_4_o_mas_estrellas,
    ROUND(COUNT(CASE WHEN l.rating >= 4 THEN 1 END) * 100.0 / COUNT(l.id), 2) as porcentaje_buenos_libros
FROM categorias c
JOIN libros l ON c.id = l.categoria_id
GROUP BY c.id, c.nombre
ORDER BY rating_promedio DESC, porcentaje_buenos_libros DESC
"""

execute_query(conn, query3, 
              "üìä CONSULTA 3: An√°lisis por categor√≠as (¬øcu√°l g√©nero tiene los mejores libros?)")