# DataSens E1_v2 — 02_schema_create

- Objectifs: DDL PostgreSQL (noyau 18 tables)
- Prérequis: 01_setup_env + PostgreSQL démarré (`DATASENS_PG_URL`)
- Sortie: schéma Merise relationnel
- Guide: docs/GUIDE_TECHNIQUE_E1.md



> Notes:
> - E1_v2 passe sur PostgreSQL (environnement réaliste).
> - `create_engine(PG_URL)` prépare la connexion via SQLAlchemy.
> - Le bloc DDL crée les tables si absentes (FK, contraintes, index implicites).
> - Les rôles: `source` (provenance), `flux` (collecte), `document` (contenu).


In [None]:
# DataSens E1_v2 - 02_schema_create
# PostgreSQL DDL (18 tables cœur)
import os

from sqlalchemy import create_engine

PG_URL = os.getenv("DATASENS_PG_URL", "postgresql+psycopg2://ds_user:ds_pass@localhost:5432/datasens")
engine = create_engine(PG_URL, future=True)
print("Connexion PG:", engine.url)

ddl_sql = """
CREATE TABLE IF NOT EXISTS type_donnee (
  id_type_donnee SERIAL PRIMARY KEY,
  libelle VARCHAR(100) NOT NULL
);
CREATE TABLE IF NOT EXISTS source (
  id_source SERIAL PRIMARY KEY,
  id_type_donnee INT REFERENCES type_donnee(id_type_donnee),
  nom VARCHAR(100) NOT NULL,
  url TEXT,
  fiabilite FLOAT
);
CREATE TABLE IF NOT EXISTS flux (
  id_flux SERIAL PRIMARY KEY,
  id_source INT NOT NULL REFERENCES source(id_source) ON DELETE CASCADE,
  date_collecte TIMESTAMP NOT NULL DEFAULT NOW(),
  format VARCHAR(20),
  manifest_uri TEXT
);
CREATE TABLE IF NOT EXISTS territoire (
  id_territoire SERIAL PRIMARY KEY,
  ville VARCHAR(120),
  code_insee VARCHAR(10),
  lat FLOAT,
  lon FLOAT
);
CREATE TABLE IF NOT EXISTS document (
  id_doc SERIAL PRIMARY KEY,
  id_flux INT REFERENCES flux(id_flux) ON DELETE SET NULL,
  id_territoire INT REFERENCES territoire(id_territoire) ON DELETE SET NULL,
  titre TEXT,
  texte TEXT,
  langue VARCHAR(10),
  date_publication TIMESTAMP,
  hash_fingerprint VARCHAR(64) UNIQUE
);
"""
with engine.begin() as conn:
    conn.exec_driver_sql(ddl_sql)
print("✅ DDL de base déployé")

