In [16]:
# ============================
# Cellule 1 : Import "src.*" depuis le notebook
# ============================
# Problème classique : ton notebook est souvent dans un sous-dossier (ex: notebooks/)
# et Python ne "voit" pas automatiquement la racine du projet.
# Objectif : remonter dans les dossiers parents jusqu'à trouver le dossier "src/"
# puis ajouter cette racine dans sys.path pour pouvoir faire :
#   from src.db_models import ...
# ============================

from pathlib import Path
import sys

# Dossier courant (souvent celui où le notebook est lancé)
nb_dir = Path.cwd()

# On remonte jusqu'à trouver un dossier parent contenant "src/"
project_root = next(p for p in [nb_dir, *nb_dir.parents] if (p / "src").exists())

# Ajoute la racine du projet au PYTHONPATH (si pas déjà présent)
if str(project_root) not in sys.path:
    sys.path.insert(0, str(project_root))

# Affiche la racine trouvée (utile pour vérifier)
project_root




PosixPath('/home/ubuntu/ExamenBloc2')

In [17]:
# ============================
# Cellule 2 : Connexion à la base + session SQLAlchemy
# ============================
# - SQLALCHEMY_DATABASE_URL vient de src/config.py
# - engine = point d'entrée SQLAlchemy vers la base (connexion / pool)
# - session = interface ORM pour faire des requêtes (SELECT/INSERT/UPDATE/DELETE)
# ============================

from sqlalchemy import create_engine, text, inspect
from sqlalchemy.orm import sessionmaker

# URL de connexion (ex: mysql+pymysql://user:pass@host:3306/dbname)
from src.config import SQLALCHEMY_DATABASE_URL

# Tes modèles ORM (tables)
from src.db_models import Base, Event, Order, Customer

# Création de l'engine :
# - echo=False : ne spam pas les logs SQL dans le notebook
# - future=True : API SQLAlchemy moderne
engine = create_engine(SQLALCHEMY_DATABASE_URL, echo=False, future=True)

# Création d'une fabrique de sessions
# - autoflush=False : pas de flush implicite trop agressif (souvent plus confortable en notebook)
# - autocommit=False : on contrôle les commits explicitement
SessionLocal = sessionmaker(bind=engine, autoflush=False, autocommit=False, future=True)

# Ouvre une session (à fermer à la fin)
session = SessionLocal()

print("✅ Connected OK ->", SQLALCHEMY_DATABASE_URL)



✅ Connected OK -> mysql+pymysql://exam:exampwd@localhost:3306/examdb


In [18]:
# ============================
# Cellule 3 : Créer/assurer les tables
# ============================
# Base.metadata.create_all(engine) :
# - crée les tables qui n'existent pas
# - ne supprime rien
# - ne modifie pas automatiquement les schémas déjà existants (pour ça il faut Alembic)
# ============================

Base.metadata.create_all(engine)
print("✅ Tables ensured (created if missing).")


✅ Tables ensured (created if missing).


In [19]:
# ============================
# Cellule 4 : Lister les tables existantes
# ============================
# inspect(engine) permet d'interroger le schéma de la base
# ============================

insp = inspect(engine)
tables = insp.get_table_names()
tables


['table_customers', 'table_events', 'table_orders']

In [8]:
# ============================
# Cellule 5 : Inspecter les colonnes d'une table
# ============================
# Renvoie une liste de dictionnaires : nom, type, nullable, etc.
# ============================

columns_orders = insp.get_columns("table_orders")
columns_orders


[{'name': 'order_id',
  'type': VARCHAR(length=36),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'customer_customer_id',
  'type': VARCHAR(length=36),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'order_device',
  'type': VARCHAR(length=20),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'order_channel',
  'type': VARCHAR(length=20),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'order_main_category',
  'type': VARCHAR(length=50),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'order_n_items',
  'type': INTEGER(),
  'default': None,
  'comment': None,
  'nullable': False,
  'autoincrement': False},
 {'name': 'order_basket_value',
  'type': FLOAT(),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'order_shipping_fee',
  'type': FLOAT(),
  'default': None,
  'comment': None,
  'nullable': False},
 {'name': 'order_discount',
  'type': FLOAT(),
  'de

In [20]:
# ============================
# Cellule 6 : Compter les lignes
# ============================
# Ici on utilise du SQL brut (text) pour aller vite.
# scalar() récupère la première valeur de la première ligne (COUNT(*))
# ============================

tables_to_check = ["table_customers", "table_orders", "table_events"]

for t in tables_to_check:
    n = session.execute(text(f"SELECT COUNT(*) FROM {t}")).scalar()
    print(f"{t}: {n} rows")


table_customers: 600 rows
table_orders: 2736 rows
table_events: 4000 rows


In [21]:
# ============================
# Cellule 7 : Lire quelques lignes (SQL brut)
# ============================
# - LIMIT 5 : éviter de charger trop de données
# - mappings() : renvoie chaque ligne sous forme de dict (clé=nom de colonne)
# - all() : récupère toutes les lignes du résultat
# ============================

rows = session.execute(text("SELECT * FROM table_orders LIMIT 5")).mappings().all()
rows


[{'order_id': 'ORD-00004', 'customer_customer_id': 'CUST-0400', 'order_device': 'mobile', 'order_channel': 'ads', 'order_main_category': 'home', 'order_n_items': 4, 'order_basket_value': 492.95, 'order_shipping_fee': 0.0, 'order_discount': 14.59, 'order_order_total': 478.36, 'order_is_returned': 0, 'price_average_per_item': 123.238},
 {'order_id': 'ORD-00005', 'customer_customer_id': 'CUST-0070', 'order_device': 'desktop', 'order_channel': 'direct', 'order_main_category': 'fashion', 'order_n_items': 7, 'order_basket_value': 243.1, 'order_shipping_fee': 0.0, 'order_discount': 0.0, 'order_order_total': 243.1, 'order_is_returned': 0, 'price_average_per_item': 34.7286},
 {'order_id': 'ORD-00006', 'customer_customer_id': 'CUST-0112', 'order_device': 'mobile', 'order_channel': 'affiliate', 'order_main_category': 'sports', 'order_n_items': 6, 'order_basket_value': 189.15, 'order_shipping_fee': 0.0, 'order_discount': 0.0, 'order_order_total': 189.15, 'order_is_returned': 0, 'price_average_per_

In [22]:
# ============================
# Cellule 8 : Lire via ORM
# ============================
# session.query(Order).limit(5).all() renvoie des objets Order.
# Pour affichage notebook, ce n'est pas toujours très lisible sans __repr__.
# ============================

orders_obj = session.query(Order).limit(5).all()
orders_obj


[<src.db_models.Order at 0x7bb734b1d090>,
 <src.db_models.Order at 0x7bb734b1d030>,
 <src.db_models.Order at 0x7bb734b1d120>,
 <src.db_models.Order at 0x7bb734b1d150>,
 <src.db_models.Order at 0x7bb734b1d180>]

In [23]:
# ============================
# Cellule 9 : Lire en pandas DataFrame
# ============================
# pandas.read_sql permet de faire directement un SELECT vers DataFrame.
# Très pratique pour vérifier rapidement les données.
# ============================

import pandas as pd

df_orders = pd.read_sql("SELECT * FROM table_orders LIMIT 20", con=engine)
df_orders.head()


Unnamed: 0,order_id,customer_customer_id,order_device,order_channel,order_main_category,order_n_items,order_basket_value,order_shipping_fee,order_discount,order_order_total,order_is_returned,price_average_per_item
0,ORD-00004,CUST-0400,mobile,ads,home,4,492.95,0.0,14.59,478.36,0,123.238
1,ORD-00005,CUST-0070,desktop,direct,fashion,7,243.1,0.0,0.0,243.1,0,34.7286
2,ORD-00006,CUST-0112,mobile,affiliate,sports,6,189.15,0.0,0.0,189.15,0,31.525
3,ORD-00010,CUST-0105,tablet,ads,beauty,8,416.16,0.0,0.0,416.16,0,52.02
4,ORD-00011,CUST-0495,desktop,seo,home,8,323.31,0.0,0.0,323.31,1,40.4137


In [25]:
# ============================
# Cellule 10 : Nettoyage
# ============================
# Toujours fermer la session quand tu as fini (bonne pratique)
# ============================

session.close()
print("✅ Session closed")


✅ Session closed


In [27]:
import webbrowser

url = "https://34.251.2.21:8080"
webbrowser.open(url)  # Ouvre l

False

In [32]:
from IPython.display import IFrame

url = "https://www.udea.edu.co"
IFrame(url, width=800, height=600)

In [33]:
from IPython.display import IFrame

url = "https://34.251.2.21:8081"
IFrame(url, width=800, height=600)