Lecture fichier référentiel masque

In [None]:
import pandas as pd
import pyarrow.parquet as pq
from sqlalchemy import create_engine, text,inspect

# Chemin vers votre fichier Parquet
FILE_PATH_PARQUET = '../vigie_rh/fichiers/parquet/vigierh_ref_masque.parquet'

# URL BDD
PATH_BDD = 'postgresql://helios:h3li0s@localhost:5532/helios-preprod'

# Connexion à la base
engine = create_engine(PATH_BDD)

# 📥 Lire le fichier Parquet
df = pd.read_parquet(FILE_PATH_PARQUET, engine='pyarrow')

# Correspondance des colonnes (Parquet -> Table SQL)
column_mapping = {
    'ind_masque_code': 'code',
    'ind_masque': 'label'

}

df.rename(columns=column_mapping, inplace=True)

# 🔍 Récupérer les colonnes existantes dans la table
with engine.connect() as conn:
    inspector = inspect(engine)
    table_columns = [col["name"] for col in inspector.get_columns("vigierh_ref_masque")]

# ✂️ Garder uniquement les colonnes qui existent dans la table
df = df[[col for col in df.columns if col in table_columns]]

# Supprimer les anciennes données AVANT insertion
with engine.connect() as conn:
    conn.execute(text("DELETE FROM vigierh_ref_masque;"))  # Supprime toutes les données
    conn.commit()

# Insérer les nouvelles données en respectant la structure de la table
df.to_sql(
    'vigierh_ref_masque', engine, 
    if_exists='append',  # Ajoute les nouvelles données sans modifier la structure
    index=False,  # Ne pas insérer l'index Pandas
    chunksize=1000,  # Insertion par lots pour optimiser la performance
    method='multi'  # Regrouper les INSERT pour améliorer la vitesse
)

print(" Données insérées avec succès !")


Lecture fichier référentiel nature contrat

In [None]:
import pandas as pd
import pyarrow.parquet as pq
from sqlalchemy import create_engine, text,inspect

# Chemin vers votre fichier Parquet
FILE_PATH_PARQUET = '../vigie_rh/fichiers/parquet/vigierh_ref_nature_contrat.parquet'

# URL BDD
PATH_BDD = 'postgresql://helios:h3li0s@localhost:5532/helios-preprod'

# Connexion à la base
engine = create_engine(PATH_BDD)

# 📥 Lire le fichier Parquet
df = pd.read_parquet(FILE_PATH_PARQUET, engine='pyarrow')

# Correspondance des colonnes (Parquet -> Table SQL)
column_mapping = {
    'nature_contrat_code': 'code',
    'nature_contrat': 'label'

}

df.rename(columns=column_mapping, inplace=True)

# 🔍 Récupérer les colonnes existantes dans la table
with engine.connect() as conn:
    inspector = inspect(engine)
    table_columns = [col["name"] for col in inspector.get_columns("vigierh_ref_type_contrat")]

# ✂️ Garder uniquement les colonnes qui existent dans la table
df = df[[col for col in df.columns if col in table_columns]]

# Supprimer les anciennes données AVANT insertion
with engine.connect() as conn:
    conn.execute(text("DELETE FROM vigierh_ref_type_contrat;"))  # Supprime toutes les données
    conn.commit()

# Insérer les nouvelles données en respectant la structure de la table
df.to_sql(
    'vigierh_ref_type_contrat', engine, 
    if_exists='append',  # Ajoute les nouvelles données sans modifier la structure
    index=False,  # Ne pas insérer l'index Pandas
    chunksize=1000,  # Insertion par lots pour optimiser la performance
    method='multi'  # Regrouper les INSERT pour améliorer la vitesse
)

print(" Données insérées avec succès !")


Lecture fichier référentiel profession1

In [None]:
import pandas as pd
import pyarrow.parquet as pq
from sqlalchemy import create_engine, text, inspect

# Chemin vers votre fichier Parquet
FILE_PATH_PARQUET = '../vigie_rh/fichiers/parquet/vigierh_ref_profession1.parquet'

# URL BDD
PATH_BDD = 'postgresql://helios:h3li0s@localhost:5532/helios-preprod'

# Connexion à la base
engine = create_engine(PATH_BDD)

# 📥 Lire le fichier Parquet
df = pd.read_parquet(FILE_PATH_PARQUET, engine='pyarrow')

# Correspondance des colonnes (Parquet -> Table SQL)
column_mapping = {
    'profession1_code': 'code',
    'profession1': 'label'

}

df.rename(columns=column_mapping, inplace=True)

# 🔍 Récupérer les colonnes existantes dans la table
with engine.connect() as conn:
    inspector = inspect(engine)
    table_columns = [col["name"] for col in inspector.get_columns("vigierh_ref_profession_filiere")]

# ✂️ Garder uniquement les colonnes qui existent dans la table
df = df[[col for col in df.columns if col in table_columns]]

# Supprimer les anciennes données AVANT insertion
with engine.connect() as conn:
    conn.execute(text("DELETE FROM vigierh_ref_profession_filiere;"))  # Supprime toutes les données
    conn.commit()

# Insérer les nouvelles données en respectant la structure de la table
df.to_sql(
    'vigierh_ref_profession_filiere', engine, 
    if_exists='append',  # Ajoute les nouvelles données sans modifier la structure
    index=False,  # Ne pas insérer l'index Pandas
    chunksize=1000,  # Insertion par lots pour optimiser la performance
    method='multi'  # Regrouper les INSERT pour améliorer la vitesse
)

print(" Données insérées avec succès !")


Lecture fichier référentiel profession2

In [None]:
import pandas as pd
import pyarrow.parquet as pq
from sqlalchemy import create_engine, text, inspect

# Chemin vers votre fichier Parquet
FILE_PATH_PARQUET = '../vigie_rh/fichiers/parquet/vigierh_ref_profession2.parquet'

# URL BDD
PATH_BDD = 'postgresql://helios:h3li0s@localhost:5532/helios-preprod'

# Connexion à la base
engine = create_engine(PATH_BDD)

# 📥 Lire le fichier Parquet
df = pd.read_parquet(FILE_PATH_PARQUET, engine='pyarrow')

# Correspondance des colonnes (Parquet -> Table SQL)
column_mapping = {
    'profession2_code': 'code',
    'profession2': 'label'

}

df.rename(columns=column_mapping, inplace=True)

# 🔍 Récupérer les colonnes existantes dans la table
with engine.connect() as conn:
    inspector = inspect(engine)
    table_columns = [col["name"] for col in inspector.get_columns("vigierh_ref_profession_groupe")]

# ✂️ Garder uniquement les colonnes qui existent dans la table
df = df[[col for col in df.columns if col in table_columns]]

# Supprimer les anciennes données AVANT insertion
with engine.connect() as conn:
    conn.execute(text("DELETE FROM vigierh_ref_profession_groupe;"))  # Supprime toutes les données
    conn.commit()

# Insérer les nouvelles données en respectant la structure de la table
df.to_sql(
    'vigierh_ref_profession_groupe', engine, 
    if_exists='append',  # Ajoute les nouvelles données sans modifier la structure
    index=False,  # Ne pas insérer l'index Pandas
    chunksize=1000,  # Insertion par lots pour optimiser la performance
    method='multi'  # Regrouper les INSERT pour améliorer la vitesse
)

print(" Données insérées avec succès !")


Lecture fichier référentiel qualité

In [None]:
import pandas as pd
import pyarrow.parquet as pq
from sqlalchemy import create_engine, text, inspect

# Chemin vers votre fichier Parquet
FILE_PATH_PARQUET = '../vigie_rh/fichiers/parquet/vigierh_ref_qualite.parquet'

# URL BDD
PATH_BDD = 'postgresql://helios:h3li0s@localhost:5532/helios-preprod'

# Connexion à la base
engine = create_engine(PATH_BDD)

# 📥 Lire le fichier Parquet
df = pd.read_parquet(FILE_PATH_PARQUET, engine='pyarrow')

# Correspondance des colonnes (Parquet -> Table SQL)
column_mapping = {
    'ind_qualite_code': 'code',
    'ind_qualite': 'label'

}

df.rename(columns=column_mapping, inplace=True)

# 🔍 Récupérer les colonnes existantes dans la table
with engine.connect() as conn:
    inspector = inspect(engine)
    table_columns = [col["name"] for col in inspector.get_columns("vigierh_ref_qualite")]

# ✂️ Garder uniquement les colonnes qui existent dans la table
df = df[[col for col in df.columns if col in table_columns]]

# Supprimer les anciennes données AVANT insertion
with engine.connect() as conn:
    conn.execute(text("DELETE FROM vigierh_ref_qualite;"))  # Supprime toutes les données
    conn.commit()

# Insérer les nouvelles données en respectant la structure de la table
df.to_sql(
    'vigierh_ref_qualite', engine, 
    if_exists='append',  # Ajoute les nouvelles données sans modifier la structure
    index=False,  # Ne pas insérer l'index Pandas
    chunksize=1000,  # Insertion par lots pour optimiser la performance
    method='multi'  # Regrouper les INSERT pour améliorer la vitesse
)

print(" Données insérées avec succès !")


Lecture fichier référentiel redressement

In [None]:
import pandas as pd
import pyarrow.parquet as pq
from sqlalchemy import create_engine, text,inspect

# Chemin vers votre fichier Parquet
FILE_PATH_PARQUET = '../vigie_rh/fichiers/parquet/vigierh_ref_redressement.parquet'

# URL BDD
PATH_BDD = 'postgresql://helios:h3li0s@localhost:5532/helios-preprod'

# Connexion à la base
engine = create_engine(PATH_BDD)

# 📥 Lire le fichier Parquet
df = pd.read_parquet(FILE_PATH_PARQUET, engine='pyarrow')

# Correspondance des colonnes (Parquet -> Table SQL)
column_mapping = {
    'ind_redressement_code': 'code',
    'ind_redressement': 'label'

}

df.rename(columns=column_mapping, inplace=True)

# 🔍 Récupérer les colonnes existantes dans la table
with engine.connect() as conn:
    inspector = inspect(engine)
    table_columns = [col["name"] for col in inspector.get_columns("vigierh_ref_redressement")]

# ✂️ Garder uniquement les colonnes qui existent dans la table
df = df[[col for col in df.columns if col in table_columns]]

# Supprimer les anciennes données AVANT insertion
with engine.connect() as conn:
    conn.execute(text("DELETE FROM vigierh_ref_redressement;"))  # Supprime toutes les données
    conn.commit()

# Insérer les nouvelles données en respectant la structure de la table
df.to_sql(
    'vigierh_ref_redressement', engine, 
    if_exists='append',  # Ajoute les nouvelles données sans modifier la structure
    index=False,  # Ne pas insérer l'index Pandas
    chunksize=1000,  # Insertion par lots pour optimiser la performance
    method='multi'  # Regrouper les INSERT pour améliorer la vitesse
)

print(" Données insérées avec succès !")
