# Génération Automatisée d'Images à partir de Modèles Replicate

Ce script extrait des modèles de génération d'images à partir du site "Replicate", les stocke dans une base de données MySQL et télécharge les images générées en utilisant ces modèles en fonction d'un prompt donné. Elle utilise Selenium WebDriver pour automatiser la navigation sur le site, BeautifulSoup pour analyser le contenu HTML et MySQL Connector pour la gestion de la base de données.

# Installer les dépendances 

In [1]:
pip install selenium

Note: you may need to restart the kernel to use updated packages.


In [2]:
pip install webdriver_manager

Note: you may need to restart the kernel to use updated packages.


In [3]:
pip install mysql

Note: you may need to restart the kernel to use updated packages.


In [4]:
pip install mysql-connector-python

Note: you may need to restart the kernel to use updated packages.


In [8]:
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup
import mysql.connector
import json
import requests

# Initialize Driver

La fonction initialize_driver() initialise un navigateur web en utilisant Selenium WebDriver pour contrôler un navigateur Chrome. Elle configure les options du navigateur, télécharge automatiquement le pilote Chrome nécessaire, crée un service Chrome avec ce pilote, puis instancie et retourne un objet navigateur Chrome WebDriver prêt à être utilisé.

In [9]:
def initialize_driver():
    options = Options()
    options.add_argument("--disable-extensions")
    options.add_argument("--ignore-certificate-errors")
    options.add_argument("--no-sandbox")
    

    driver_path = ChromeDriverManager().install()
    service = Service(driver_path)
    driver = webdriver.Chrome(service=service, options=options)
     
    return driver


# Go to page

La fonction goToPage(driver, url) charge une page web à l'URL spécifiée, attend un court délai pour que la page se charge complètement, puis utilise BeautifulSoup pour analyser et extraire le contenu HTML de la page. Elle retourne ensuite cet objet de soup qui représente la structure de la page.

In [10]:
def goToPage(driver, url):
    driver.get(url)
    time.sleep(5)
    body = driver.find_element(By.TAG_NAME, 'body')
    soup = BeautifulSoup(body.get_attribute('innerHTML'), 'html.parser')
    return soup

# Init DB

La fonction init_db() initialise une connexion à une base de données MySQL locale. elle crée une table appelée "models" avec des colonnes spécifiques pour stocker des informations sur les modèles. Ensuite, elle retourne l'objet de connexion.

In [11]:

def init_db():
    try:
        conn = mysql.connector.connect(
            host="localhost",
            user="root",
            password="",
            database="replicate"
        )

        cursor = conn.cursor()

        create_table_query = """CREATE TABLE IF NOT EXISTS models (
            id INT AUTO_INCREMENT PRIMARY KEY,
            name VARCHAR(255) NOT NULL,
            description TEXT NOT NULL,
            image TEXT NOT NULL
        )"""

        cursor.execute(create_table_query)

        conn.commit()

        return conn

    except Exception as e:
        print(f"Error: {e}")
        return None
    


# Insert Model

La fonction insert_model insère les données d'un modèle dans une base de données. Elle prend en paramètre le moteur de base de données, le nom du modèle, sa description et les URL de ses images d'exemple.

In [12]:

def insert_model(engine, model_name, model_description, model_example_images):
    try:
        query = f"INSERT INTO models (name, description, image) VALUES ('{model_name}', '{model_description}', '{model_example_images}')"
        cursor = engine.cursor()    
        cursor.execute(query)
        engine.commit()
        cursor.close()
        print(f"Model {model_name} inserted successfully")
    except Exception as e:
        print(f"Error: {e}")
        engine.rollback()
    finally:
        cursor.close()
        engine.close()


# Get text to image models

La fonction get_text_to_image_models() prend en entrée la soupe de modèle (model_soup) et extrait les informations pertinentes telles que le nom du modèle, sa description et les URL de ses images d'exemple. Elle recherche les éléments HTML correspondants dans la soupe et les extrait en fonction de leur structure et de leurs classes CSS. Ensuite, elle effectue des traitements supplémentaires pour déterminer le nombre de fois que le modèle a été exécuté, le cas échéant. Enfin, elle retourne ces informations sous forme de tuple pour une utilisation ultérieure.

In [13]:
def get_text_to_image_models(model_soup):
    model_name = model_soup.select_one('h3').text
    model_description = model_soup.select_one('p.mt-1.max-w-xl').text.strip()
    model_examples = model_soup.select('div.mb-2lh.h-40.overflow-hidden div img')
    model_number_of_runs_element = model_soup.select_one('span:contains("runs")')

    if model_number_of_runs_element:
        model_number_of_runs_text = model_number_of_runs_element.text
        number_of_runs_unit = model_number_of_runs_text.split(" ")[0][-2]
        model_number_of_runs = model_number_of_runs_text.split(" ")[0][:-2]
        print(model_number_of_runs, number_of_runs_unit)

        if model_number_of_runs.isdigit():
            print(model_number_of_runs.isdigit())
            model_number_of_runs = int(model_number_of_runs)
            if number_of_runs_unit == "K":
                model_number_of_runs *= 1000
            elif number_of_runs_unit == "M":
                model_number_of_runs *= 1000000
        else:
            model_number_of_runs = None
    else:
        model_number_of_runs = None

    images_src = [img['data-src'] for img in model_examples]

    return model_name, model_description, images_src,model_number_of_runs



# Main

Le programme principal main() commence par initialiser un navigateur web et définir l'URL cible. Ensuite, il récupère le contenu de la page, attend un court délai pour le chargement complet, puis extrait une liste de modèles à partir de cette page. Pour chaque modèle, il accède à sa page spécifique, extrait les informations telles que le nom, la description et les images d'exemple, puis insère ces données dans une base de données. Enfin, une fois toutes les opérations terminées, il ferme le navigateur.

In [18]:

def main():
    driver = initialize_driver()
    domain = "https://replicate.com"
    url = '/collections/text-to-image'
    url = f'{domain}{url}'
    soup = goToPage(driver, url)
    time.sleep(10)
    models_list = soup.select('div.grid.grid-cols-1.lg\:grid-cols-2.grid-flow-row.auto-rows-max.gap-8 a')
    
    for model in models_list:
        model_url = f'{domain}{model["href"]}'
        model_soup = goToPage(driver, model_url)
        time.sleep(10)

        model_name, model_description, model_example_images,model_number_of_runs = get_text_to_image_models(model_soup)
        model_example_images = ",".join(model_example_images)
        engine = init_db()
        insert_model(engine, model_name, model_description, model_example_images)


    driver.quit()


# Download Image

Cette fonction télécharger des images à partir d'une URL fournie. Elle envoye une requête pour récupérer le contenu de l'image à cette URL. Ensuite, elle génère un nom unique apres elle crée un fichier dans un répertoire de sortie spécifié et y écrit le contenu de l'image téléchargée. 

In [15]:

def download_image(image_url, output_dir):
    try:
        response = requests.get(image_url)
        image_name = image_url.split("/")[-1] + "-" + str(time.time()) + ".png"
        with open(f'{output_dir}{image_name}', 'wb') as image_file:
            image_file.write(response.content)
        print(f"Image {image_name} downloaded successfully")
    except Exception as e:
        print(f"Error: {e}")
        print(f"Error downloading image {image_url}")


# Generate Image



Cette fonction utilise le navigateur web pour accéder à replicate.com et utiliser des modèles disponibles sur ce site afin de générer des images à partir d'un prompt donné. Elle itère à travers une liste de modèles, remplit un champ de texte avec le prompt, déclenche la génération de l'image, télécharge l'image générée et répète le processus pour chaque modèle.

In [16]:

def generate_image(prompt):
    
    driver = initialize_driver()
    domain = "https://replicate.com"
    url = '/collections/text-to-image'
    url = f'{domain}{url}'
    soup = goToPage(driver, url)
    time.sleep(10)
    models_list = soup.select('div.grid.grid-cols-1.lg\:grid-cols-2.grid-flow-row.auto-rows-max.gap-8 a')
    
    for model in models_list:
        try :
            model_url = f'{domain}{model["href"]}'
            model_soup = goToPage(driver, model_url)
            prompt_input = driver.find_element(By.ID, 'prompt')
            prompt_input.clear()
            if prompt_input:
                
                prompt_input.send_keys(prompt)
                time.sleep(5)
                generate_button = driver.find_element(By.CSS_SELECTOR , 'button[type="submit"]')
                generate_button.click()
                time.sleep(20)
                output_image = driver.find_element(By.CSS_SELECTOR, '[data-testid="value-output-image"]')  
                image_url = output_image.get_attribute('src')
                download_image(image_url, "output/")
                print(f"Image generated successfully for model {model['href']}")
        except Exception as e:
            print(f"Error: {e}")
            print(f"Error generating image for model {model['href']}")
            continue

    driver.quit()


In [21]:
main()

107.5 M
Model 
stability-ai/
stable-diffusion
          



 inserted successfully


KeyboardInterrupt: 

In [22]:
generate_image("Paris metro station at night")

Image out-0.png-1711627758.898023.png downloaded successfully
Image generated successfully for model /stability-ai/stable-diffusion
Image out-0.png-1711627792.0609264.png downloaded successfully
Image generated successfully for model /stability-ai/sdxl
Error: Message: no such window: target window already closed
from unknown error: web view not found
  (Session info: chrome=123.0.6312.86)
Stacktrace:
	GetHandleVerifier [0x008C4CC3+225091]
	(No symbol) [0x007F4E11]
	(No symbol) [0x00699A7A]
	(No symbol) [0x0067E312]
	(No symbol) [0x006F517B]
	(No symbol) [0x007055A6]
	(No symbol) [0x006EF2F6]
	(No symbol) [0x006C79B9]
	(No symbol) [0x006C879D]
	sqlite3_dbdata_init [0x00D39A63+4064547]
	sqlite3_dbdata_init [0x00D4106A+4094762]
	sqlite3_dbdata_init [0x00D3B968+4072488]
	sqlite3_dbdata_init [0x00A3C9C9+930953]
	(No symbol) [0x008007E4]
	(No symbol) [0x007FAD08]
	(No symbol) [0x007FAE31]
	(No symbol) [0x007ECAA0]
	BaseThreadInitThunk [0x7730FCC9+25]
	RtlGetAppContainerNamedObjectPath [0x778