# Question 1

Création de la table user_for_comparison et insertion des données


# Question 2

Création de la table user_for_comparison et insertion des données


In [5]:
import psycopg2
from faker import Faker
import random
from datetime import datetime, timedelta
import os
from dotenv import load_dotenv

# Ajouter aux variables environnementales celles contenues dans le .env
load_dotenv(".env")

USER = os.environ.get("POSTGRESQL_LOCAL_USER")
PASSWORD = os.environ.get("POSTGRESQL_LOCAL_PASSWORD")

# Connexion à PostgreSQL
conn = psycopg2.connect(user=USER, password=PASSWORD, host="localhost", port="5432", dbname="app_auth")
conn.autocommit = True
cur = conn.cursor()

# Création de la table user_for_comparison
cur.execute("""
CREATE TABLE IF NOT EXISTS user_for_comparison (
    user_id SERIAL PRIMARY KEY,
    firstname VARCHAR(255),
    lastname VARCHAR(255),
    email VARCHAR(255) UNIQUE,
    username VARCHAR(255) UNIQUE,
    password VARCHAR(255),
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

ALTER TABLE user_for_comparison
ADD CONSTRAINT username_length_check CHECK (LENGTH(username) > 8),
ADD CONSTRAINT password_length_check CHECK (LENGTH(password) > 8);
""")

# Initialiser Faker
fake = Faker()

# Ensemble pour suivre les emails et usernames uniques
used_emails = set()
used_usernames = set()

# Fonction pour générer une date aléatoire entre deux dates
def random_date(start, end):
    return start + timedelta(
        seconds=random.randint(0, int((end - start).total_seconds())),
    )

# Dates de début et de fin
start_date = datetime(2023, 1, 1)
end_date = datetime(2023, 6, 30)

# Générer et insérer 100000 utilisateurs
for _ in range(100000):
    firstname = fake.first_name()
    lastname = fake.last_name()
    email = f"{firstname.lower()}.{lastname.lower()}@example.com"
    while email in used_emails:
        email = f"{firstname.lower()}.{lastname.lower()}{random.randint(1, 99)}@example.com"
    used_emails.add(email)

    username = f"{firstname.lower()}{lastname.lower()}{random.randint(100, 999)}"
    while username in used_usernames or len(username) <= 8:
        username = f"{firstname.lower()}{lastname.lower()}{random.randint(1000, 9999)}"
    used_usernames.add(username)

    password = fake.password(length=random.randint(9, 12))
    created_at = random_date(start_date, end_date).strftime("%Y-%m-%d")

    # Préparer et exécuter la requête SQL d'insertion
    try:
        query = """
        INSERT INTO user_for_comparison (firstname, lastname, email, username, password, created_at)
        VALUES (%s, %s, %s, %s, %s, %s);
        """
        cur.execute(query, (firstname, lastname, email, username, password, created_at))
    except psycopg2.errors.UniqueViolation:
        # Ignorer l'insertion en cas de violation de l'unicité
        continue

# Valider les insertions
conn.commit()

# Fermer la connexion
cur.close()
conn.close()


# Question 2

Mesurer le temps d'exécution

In [11]:
import psycopg2
import time
import os
from dotenv import load_dotenv

# Ajouter aux variables environnementales celles contenues dans le .env
load_dotenv(".env")

USER = os.environ.get("POSTGRESQL_LOCAL_USER")
PASSWORD = os.environ.get("POSTGRESQL_LOCAL_PASSWORD")

# Connexion à PostgreSQL
conn = psycopg2.connect(user=USER, password=PASSWORD, host="localhost", port="5432", dbname="app_auth")
cur = conn.cursor()

# Liste de quelques usernames à tester
usernames = ['philipstewart294', 'theresasmith452', 'melissajohnson382'] # Remplacer par des usernames réels de la base de données

# Mesurer le temps d'exécution pour chaque username
for username in usernames:
    start_time = time.time() # Commencer le chronomètre

    cur.execute("SELECT * FROM user_for_comparison WHERE username = %s", (username,))
    result = cur.fetchone()

    end_time = time.time() # Arrêter le chronomètre
    execution_time = end_time - start_time # Calculer le temps d'exécution

    print(f"Username: {username}, Execution Time: {execution_time} seconds")

# Fermer la connexion
cur.close()
conn.close()

Username: philipstewart294, Execution Time: 0.005005836486816406 seconds
Username: theresasmith452, Execution Time: 0.0009968280792236328 seconds
Username: melissajohnson382, Execution Time: 0.0 seconds


# Question 3

Index sur la colone username

In [12]:
import psycopg2
import os
from dotenv import load_dotenv

# Ajouter aux variables environnementales celles contenues dans le .env
load_dotenv(".env")

USER = os.environ.get("POSTGRESQL_LOCAL_USER")
PASSWORD = os.environ.get("POSTGRESQL_LOCAL_PASSWORD")

# Connexion à PostgreSQL
conn = psycopg2.connect(user=USER, password=PASSWORD, host="localhost", port="5432", dbname="app_auth")
cur = conn.cursor()

# Créer un index sur la colonne username
cur.execute("CREATE INDEX IF NOT EXISTS idx_username ON user_for_comparison (username);")

# Valider la création de l'index
conn.commit()

# Fermer la connexion
cur.close()
conn.close()


Test du temps d'execution

In [14]:
import time

# Connexion à PostgreSQL
conn = psycopg2.connect(user=USER, password=PASSWORD, host="localhost", port="5432", dbname="app_auth")
cur = conn.cursor()

# Liste de quelques usernames à tester (assurez-vous qu'ils existent dans votre base de données)
usernames = ['philipstewart294', 'theresasmith452', 'melissajohnson382']  # Remplacer par des usernames réels

# Mesurer le temps d'exécution pour chaque username
for username in usernames:
    start_time = time.time()  # Commencer le chronomètre

    cur.execute("SELECT * FROM user_for_comparison WHERE username = %s", (username,))
    result = cur.fetchone()

    end_time = time.time()  # Arrêter le chronomètre
    execution_time = end_time - start_time  # Calculer le temps d'exécution

    print(f"Username: {username}, Execution Time After Indexing: {execution_time} seconds")

# Fermer la connexion
cur.close()
conn.close()


Username: philipstewart294, Execution Time After Indexing: 0.005997657775878906 seconds
Username: theresasmith452, Execution Time After Indexing: 0.0 seconds
Username: melissajohnson382, Execution Time After Indexing: 0.0010025501251220703 seconds
