In [9]:
import os
import pandas as pd
import requests
import ast


In [10]:

def descargar_imagen(ruta_guardado, url_imagen, numero_imagen):
    """
    Descarga una imagen desde la URL proporcionada y la guarda en la ruta especificada.

    Parámetros:
    ruta_guardado (str): La ruta del directorio donde se guardará la imagen.
    url_imagen (str): La URL de la imagen que se va a descargar.
    numero_imagen (int): Número de la imagen, utilizado para nombrar el archivo.
    """
    # Realizar una solicitud GET a la URL
    response = requests.get(url_imagen)

    # Verificar si la solicitud fue exitosa
    if response.status_code == 200:
        # Crear la carpeta donde se guardará la imagen
        os.makedirs(ruta_guardado, exist_ok=True)
        
        # Crear el nombre de la imagen basado en el contador
        image_name = f'{numero_imagen}.jpg'
        
        # Ruta completa donde se guardará la imagen
        image_path = os.path.join(ruta_guardado, image_name)
        
        # Guardar la imagen en el directorio especificado
        with open(image_path, 'wb') as f:
            f.write(response.content)
        
        print(f'Imagen guardada en: {image_path}')
    else:
        print(f'Error al descargar la imagen. Código de estado: {response.status_code}')

def procesar_dataset(ruta_dataset):
    """
    Procesa el dataset, crea carpetas para cada capítulo y descarga las imágenes.

    Parámetros:
    ruta_dataset (str): Ruta al archivo del dataset CSV.
    """
    # Leer el dataset
    df = pd.read_csv(ruta_dataset)
    
    for index, row in df.iterrows():
        anime_name_clean = row['anime']
        capitulo = row['capitulo']
        paginas = ast.literal_eval(row['paginas'])
        
        # Crear carpeta para el capítulo
        ruta_capitulo = os.path.join("mangas" , anime_name_clean, f'capitulo_{capitulo}')
        os.makedirs(ruta_capitulo, exist_ok=True)
        
        # Contador de imágenes
        numero_imagen = 1
        
        # Descargar las imágenes
        for url in paginas:
            descargar_imagen(ruta_capitulo, url, numero_imagen)
            numero_imagen += 1

# Ejemplo de uso
ruta_dataset = 'mangas/Goblin Slayer Year One/dataset/capitulos_complt.csv'
procesar_dataset(ruta_dataset)


Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\1.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\2.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\3.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\4.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\5.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\6.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\7.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\8.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\9.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\10.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\11.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\12.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\13.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\14.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\15.jpg
Imagen guardada en: Goblin Slayer Year One\capitulo_1.0\16.jpg
I