In [1]:
import pandas as pd
import numpy as np
import os
import warnings
import time
import re

import json

from skrub import TableReport
from ollama import Client
from pdfquery import PDFQuery
from pprint import pprint
from IPython.display import display, HTML, Markdown

import bid_utils

#!pip install -U -q "google-genai>=1.0.0"
from google import  genai
#from google.colab import userdata

  match = re.search(r"\d+", str(duree_travaux_value))
  match = re.search(r"\d+", str(prix_travaux_value))


# Preparation des données (dataframe) pour automatiser l'extraction des informations

In [2]:
## load the dfs built in 1_collect_files
rep_drive_ATAE =  r"C:\Users\jch_m\ATAE"
rep_data_input =  r"C:\Users\jch_m\ATAE\Nicolas MONCEAU - NICOLAS\Stage_AppelsOffres\data_input"
rep_data_output = r"C:\Users\jch_m\ATAE\Nicolas MONCEAU - NICOLAS\Stage_AppelsOffres\data_output"

path_df_EBP = os.path.join(rep_data_output, "df_EBP.pkl")
df_EBP = pd.read_pickle(path_df_EBP)

path_df_consult = os.path.join(rep_data_output, "df_consult.pkl")
df_consult = pd.read_pickle(path_df_consult)

path_df_rejet = os.path.join(rep_data_output, "df_rejet.pkl")
df_rejet = pd.read_pickle(path_df_rejet)

# preparation du path pour le fichier resultat 
path_df_consult_elevated = os.path.join(rep_data_output, "df_consult_elevated.pkl")

In [3]:
# Merge df_consult and df_EBP pour sync EBP ID on the mission/files
# note: no need to sync EBP with rejet, because none of the Rejet file match an EBP entry (dans la liste des repertoires et fichiers). normal ?

# Define the columns to match on
match_columns = ['SPS Name', 'Ville', 'Entreprise', 'Mission']

df_consult_ebp = pd.merge(df_consult, df_EBP, on=match_columns, how='left', suffixes=('_consult', '_ebp'))
df_consult_ebp['ID EBP'] = df_consult_ebp['ID EBP_ebp'].fillna("no EBP")
df_consult_ebp = df_consult_ebp.drop(columns=['ID EBP_ebp','ID EBP_consult', 'statut_ebp'])

#df_consult_ebp['file_name'] = df_consult_ebp['file_path'].str.split(r'\\').str[-1].strip()
df_consult_ebp['file_name'] = df_consult_ebp['file_path'].str.split(r'\\').str[-1].str.strip()

In [4]:
# define a unique 'no EBP xx'  for each combinaison of SPS+Ville+Entreprise+Mission, for all related files
#
mask = df_consult_ebp["ID EBP"] == "no EBP"

# Create the combined series only for the masked rows
combined_series_for_update = (
    df_consult_ebp.loc[mask, 'SPS Name'].astype(str) + '_' +
    df_consult_ebp.loc[mask, 'Ville'].astype(str) + '_' +
    df_consult_ebp.loc[mask, 'Entreprise'].astype(str) + '_' +
    df_consult_ebp.loc[mask, 'Mission'].astype(str)
)

# Generate unique IDs for this series
unique_ids, _ = pd.factorize(combined_series_for_update)

# Assign back to the original DataFrame using the mask
df_consult_ebp.loc[mask, "ID EBP"] = "no EBP " + (unique_ids + 1).astype(str)


In [5]:
# Add columns "AO_docs" (True/False), "AO_Doc_type"(CCTP, CCAP, RC, AAPC, Memo_tech), "Commande"(True/False)

# Set AO_doc_type
# Initialize all with default value
df_consult_ebp['AO_doc_type'] = 'no type'

# Define mask for inclusion et exclusion 
df_consult_ebp['AO_docs'] = (
    (df_consult_ebp['file_path'].str.lower().str.contains('devis') & df_consult_ebp['file_path'].str.lower().str.contains(r'\\consul')) | 
    (df_consult_ebp['file_path'].str.lower().str.contains(r'\\adm') & df_consult_ebp['file_path'].str.lower().str.contains(r'\\consul'))
)
mask = df_consult_ebp['AO_docs'] == True

# Création d'un masque d'exclusion : lot est retiré provisoirement
mots_cles_a_exclure = ["plan ", "assurance", "honneur", "plans", "coupe", "vue", "facade", "archi"] 
exclusion_mask = df_consult_ebp.loc[mask, 'file_path'].str.lower().apply(
    lambda x: any(mot in x for mot in mots_cles_a_exclure)
)

# Sélection des lignes à inclure (qui ne contiennent pas les mots-clés à exclure)
inclusion_mask = mask.copy()
inclusion_mask.loc[mask] = ~exclusion_mask

# par ordre inverse d'importance, pour que les derniers checks ecrasent eventuellement les premiers
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('sps', case=False, na=False), 'AO_doc_type'] = 'CCTP'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('PA-', case=False, na=False), 'AO_doc_type'] = 'Procedure Adaptee'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('RC', case=False, na=False), 'AO_doc_type'] = 'Reglement'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('lettre', case=False, na=False), 'AO_doc_type'] = 'Lettre Consult'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('courier', case=False, na=False), 'AO_doc_type'] = 'Lettre Consult'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('consult', case=False, na=False), 'AO_doc_type'] = 'Lettre Consult'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('AAPC', case=False, na=False), 'AO_doc_type'] = 'AAPC' #Achat avec concurence
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('glement', case=False, na=False), 'AO_doc_type'] = 'Reglement'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('planning', case=False, na=False), 'AO_doc_type'] = 'Planning'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('phasag', case=False, na=False), 'AO_doc_type'] = 'Planning'
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('programme', case=False, na=False), 'AO_doc_type'] = 'CCTP' # Technique
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('CCTP', case=False, na=False),'AO_doc_type'] = 'CCTP' # Technique
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('CCP', case=False, na=False), 'AO_doc_type'] = 'CCP' # General , Technique et Admin
df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('CCAP', case=False, na=False), 'AO_doc_type'] = 'CCAP' #Administratif
#df_consult_ebp.loc[inclusion_mask & df_consult_ebp['file_name'].str.contains('DCE', case=False, na=False), 'AO_doc_type'] = 'CCTP' # Dossier Consult 


In [6]:
print("nb total de fichiers:",len(df_consult_ebp['AO_doc_type']))
print("nb total de fichiers de consultation:",len(df_consult_ebp[df_consult_ebp['AO_docs']==True] ))
print("nb de fichiers AO_docs avec un type identifié:",len(df_consult_ebp['AO_doc_type']) - len(df_consult_ebp[df_consult_ebp['AO_doc_type']=='no type']))
print("\nDétails par type", df_consult_ebp['AO_doc_type'].value_counts())


nb total de fichiers: 158545
nb total de fichiers de consultation: 3106
nb de fichiers AO_docs avec un type identifié: 829

Détails par type AO_doc_type
no type              157716
CCTP                    345
Reglement               244
CCAP                    181
AAPC                     28
Lettre Consult           12
Planning                  9
Procedure Adaptee         7
CCP                       3
Name: count, dtype: int64


In [7]:
# Liste de fichiers de consultations sans type clairement identifié (ou volontairement exclus)
#
list_file_AO_notype = ""
mask2 = (df_consult_ebp['AO_docs'] == True) &  (df_consult_ebp['AO_doc_type'] == 'no type')
list_file_AO_notype = [df_consult_ebp.loc[mask2, 'file_name'], df_consult_ebp.loc[mask2, 'file_path']]
for index, row in df_consult_ebp.loc[mask2, ['file_name', 'file_path']].iterrows():
    file = row['file_name']
    file_path = row['file_path'].strip()

    if any(mot in file.lower() for mot in mots_cles_a_exclure):
        pass

    bid_utils.path_to_link(file_path)


In [8]:
TableReport(df_consult_ebp)

Processing column  10 / 10


Unnamed: 0_level_0,SPS Name,Ville,Entreprise,Mission,statut_consult,file_path,ID EBP,file_name,AO_doc_type,AO_docs
Unnamed: 0_level_1,SPS Name,Ville,Entreprise,Mission,statut_consult,file_path,ID EBP,file_name,AO_doc_type,AO_docs
0.0,Cyrille CHARTIER - CYRILLE,BOUGUENAIS,BGTA Ministère environnement,Sécurisation BGTA,Perdu,C:\Users\jch_m\ATAE\Cyrille CHARTIER - CYRILLE\00-DEVIS\2022\00-Echec 2022\BOUGUENAIS - BGTA Ministère environnement - Sécurisation BGTA\CONSULTATION\0SNIA_Ouest_22_006_RC_V1_0 (1).pdf,no EBP 1,0SNIA_Ouest_22_006_RC_V1_0 (1).pdf,Reglement,True
1.0,Cyrille CHARTIER - CYRILLE,CHAUMES EN RETZ,PORNIC AGGLO,APS La Sicaudais,Perdu,C:\Users\jch_m\ATAE\Cyrille CHARTIER - CYRILLE\00-DEVIS\2023\00-Echec 2023\CHAUMES EN RETZ - PORNIC AGGLO - APS La Sicaudais\Dde de complément\MEMOIRE TECHNIQUE ATAE.pdf,no EBP 2,MEMOIRE TECHNIQUE ATAE.pdf,no type,False
2.0,Cyrille CHARTIER - CYRILLE,CHAUMES EN RETZ,PORNIC AGGLO,APS La Sicaudais,Perdu,C:\Users\jch_m\ATAE\Cyrille CHARTIER - CYRILLE\00-DEVIS\2023\00-Echec 2023\CHAUMES EN RETZ - PORNIC AGGLO - APS La Sicaudais\Réponse\MEMOIRE TECHNIQUE ATAE .pdf,no EBP 2,MEMOIRE TECHNIQUE ATAE .pdf,no type,False
3.0,Cyrille CHARTIER - CYRILLE,BOUGUENAIS,MAIRIE,Salle de sport Joel Dubois et Cossec,Devis,C:\Users\jch_m\ATAE\Cyrille CHARTIER - CYRILLE\00-DEVIS\2023\BOUGUENAIS - MAIRIE - Salle de sport Joel Dubois et Cossec\Consultation\CCTP Hors lots techniques janvier 2023.pdf,no EBP 3,CCTP Hors lots techniques janvier 2023.pdf,CCTP,True
4.0,Cyrille CHARTIER - CYRILLE,BOUGUENAIS,MAIRIE,Salle de sport Joel Dubois et Cossec,Devis,C:\Users\jch_m\ATAE\Cyrille CHARTIER - CYRILLE\00-DEVIS\2023\BOUGUENAIS - MAIRIE - Salle de sport Joel Dubois et Cossec\Consultation\CCTP Lots techniques BOUGUENAIS_AVP janvier 2023.pdf,no EBP 3,CCTP Lots techniques BOUGUENAIS_AVP janvier 2023.pdf,CCTP,True
,,,,,,,,,,
158540.0,Yann HERVE - YANN,VIHIERS,TERRENA,Désamiantage de couverture,Archive,C:\Users\jch_m\ATAE\Yann HERVE - YANN\04-ARCHIVES\2025\VIHIERS - TERRENA - Désamiantage de couverture\PLANS\Vihiers - Toiture tôles fibrociment.pdf,230750,Vihiers - Toiture tôles fibrociment.pdf,no type,False
158541.0,Yann HERVE - YANN,VIHIERS,TERRENA,Désamiantage de couverture,Archive,C:\Users\jch_m\ATAE\Yann HERVE - YANN\04-ARCHIVES\2025\VIHIERS - TERRENA - Désamiantage de couverture\PPSPS+VIC\ADA AMIANTE\FOR 28G PRC PPSPS 180A Terrena VIHIER.pdf,230750,FOR 28G PRC PPSPS 180A Terrena VIHIER.pdf,no type,False
158542.0,Yann HERVE - YANN,VIHIERS,TERRENA,Désamiantage de couverture,Archive,C:\Users\jch_m\ATAE\Yann HERVE - YANN\04-ARCHIVES\2025\VIHIERS - TERRENA - Désamiantage de couverture\PPSPS+VIC\AFC\S30C-0i23110814420.pdf,230750,S30C-0i23110814420.pdf,no type,False
158543.0,Yann HERVE - YANN,VIHIERS,TERRENA,Désamiantage de couverture,Archive,C:\Users\jch_m\ATAE\Yann HERVE - YANN\04-ARCHIVES\2025\VIHIERS - TERRENA - Désamiantage de couverture\REGISTRE JOURNAL\RJ 01 VIHIERS TERRENA .pdf,230750,RJ 01 VIHIERS TERRENA .pdf,no type,False

Column,Column name,dtype,Null values,Unique values,Mean,Std,Min,Median,Max
0,SPS Name,ObjectDType,0 (0.0%),17 (< 0.1%),,,,,
1,Ville,ObjectDType,0 (0.0%),17844 (11.3%),,,,,
2,Entreprise,ObjectDType,0 (0.0%),4804 (3.0%),,,,,
3,Mission,ObjectDType,0 (0.0%),10418 (6.6%),,,,,
4,statut_consult,ObjectDType,0 (0.0%),6 (< 0.1%),,,,,
5,file_path,ObjectDType,0 (0.0%),126011 (79.5%),,,,,
6,ID EBP,ObjectDType,0 (0.0%),25943 (16.4%),,,,,
7,file_name,ObjectDType,0 (0.0%),109399 (69.0%),,,,,
8,AO_doc_type,ObjectDType,0 (0.0%),9 (< 0.1%),,,,,
9,AO_docs,BoolDType,0 (0.0%),2 (< 0.1%),,,,,

Column 1,Column 2,Cramér's V,Pearson's Correlation
Mission,ID EBP,0.799,
file_path,file_name,0.577,
AO_doc_type,AO_docs,0.526,
SPS Name,Ville,0.427,
Ville,ID EBP,0.304,
Ville,Entreprise,0.289,
Ville,Mission,0.286,
SPS Name,Entreprise,0.258,
SPS Name,Mission,0.257,
Entreprise,Mission,0.244,


In [9]:
# Creation d'un DF_consult_elevated avec une ligne par "EBP ID", 
# et l'ajout des features resultants de l'extraction 

df_consult_ao = df_consult_ebp[df_consult_ebp['AO_docs']==True]
df_consult_elevated = df_consult_ao.drop_duplicates(subset=["ID EBP"], keep="first")

# Suppression des colonnes desormais inutiles
df_consult_elevated = df_consult_elevated.drop(columns=['file_path','file_name','AO_docs','AO_doc_type'])


In [10]:
df_consult_elevated.info()


<class 'pandas.core.frame.DataFrame'>
Index: 926 entries, 0 to 158400
Data columns (total 6 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   SPS Name        926 non-null    object
 1   Ville           926 non-null    object
 2   Entreprise      926 non-null    object
 3   Mission         926 non-null    object
 4   statut_consult  926 non-null    object
 5   ID EBP          926 non-null    object
dtypes: object(6)
memory usage: 50.6+ KB


# Definition des prompts et functions d'extractions

In [11]:
# Prompts pour la collection des infos par type de document
#
prompt_role = "your are an assistant to analyse the bids for Coordination SPS, extract key informations followins the specified instructions in term of format and content"

###### ---- CCTP -------------- ###################
format_json_cctp = {
    "Nom Chantier": "",
    "Lieu du Chantier": "",
    "Maitre ouvrage": "",
    "Maitre oeuvre": "",
    "Type de Travaux": "",
    "Planning phase conception": "",
    "Planning phase realisation": "",
    "Prix des travaux": 0,
    "Duree des travaux": 0,
    "Categorie operation SPS": "",
} 
json_string_cctp = json.dumps(format_json_cctp, ensure_ascii=False, indent=2)

prompt_resumer_cctp = """
En Francais, extraire du **Texte CCxP** les **Informations** suivantes : 

**Informations**:
'Nom Chantier': scope du projet, objet du chantier, objectif du programme, 
'Lieu du Chantier': ville  Commune  Departement Rue , 
'Maitre ouvrage': nom du Maitre d'ouvrage du projet,
'Maitre oeuvre': nom du maitre d'oeuvre du chantier ,
'Type de Travaux': type et nature du travaux du chantier exemple: amenagement construction ,
'Planning phase conception': date et duree Previsionnelle, 
'Planning phase realisation': date et duree Previsionnelle, 
'Prix des travaux' : en euros HT <integer>, 
'Durée Prévisionnelle des Travaux': en nombre de mois <integer>,
'Categorie operation SPS':  I II ou III, 

**Instructions**: 
Donne uniquement les informations disponibles dans le texte CCxP, sans interpretation ou estimation. 
Donne des reponses chiffrées et quantifiées lorsque c'est possible. 
La reponse doit etre ecrite en francais et avoir un maximum 900 mots 
Réponds uniquement aux informations demandées qui sont toutes dans le texte

**Texte CCxP**: 
"""

prompt_json_cctp = f"""
Format the output, focusing on informations requested and available within the **Text** and initial document . 
Do not invent anything. 
Strickly follow the JSON format request. Write in French: \n{json_string_cctp}\

**Text**: 
"""

###### ---- Reglement -------------- ###################
format_json_regl = {
    "Critere Prix": 0,
    "Critere Technique": {
        "global": 0,
        "details": {
            "Moyen Humain et Experience": 0,
            "Methodologie": 0,
            "Cohérence du temps": 0,
            "Compréhension des enjeux": 0,
        }
    },
    "Prix des travaux": 0,
    "Duree des travaux": 0,
}
string_json_regl = json.dumps(format_json_regl, ensure_ascii=False, indent=2)

prompt_resumer_regl = """ 
Extract from **Texte** the following informations related to 'evaluation et critère de l'offre'  : 

**Informations**:
'Critère Prix': quel poid ou ponderation pour le critère de l'examen du prix des prestations , valeur de la note maximale ? <integer>,
'Critère Technique' : quel poids ou ponderations pour le critère de l'examen la valeur technique de l'offre ? et detaillant si disponible les sous-critères suivants <integer>,
'Moyen Humain et Experience': quel poids pour la compétences, moyen matériel ? <integer>,
'Methodologie': quel poids ou note pour ce sous-critère de la methode technique ? <integer>,
'Cohérence du temps': quel poids ou note pour ce sous-critère du temps de travail estimé pour ce service ? <integer>,
'Compréhension des enjeux': quel poids ou note pour ce sous-critère Compréhension des enjeux pour ce service ? <integer>,, 
'Prix des travaux' : en euros HT <integer>, 
'Durée Prévisionnelle des Travaux': en nombre de mois <integer>,

**Instructions**: 
Donne uniquement les informations disponibles dans le texte , sans interpretation ou estimation. 
Donne des reponses chiffrées et quantifiées lorsque c'est possible. 
La reponse doit etre ecrite en francais et avoir un maximum 500 mots 
Réponds uniquement aux informations demandées qui sont toutes dans le texte

**Texte**: 
"""

prompt_json_regl = f"""
Format the output, focusing on informations requested and available within the **Text** and initial document . 
Do not invent anything. 
Strickly follow the JSON format request. Write in French: 
{string_json_regl}

**Text**: \n 
""" 

###### ---- AAPC -------------- ###################
format_json_aapc = {
    "Mission": "",
    "Lieu du Chantier": "",
    "Maitre ouvrage": "",
    "Lot": "",
    "Tranche": "",
    "Prix des travaux": 0,
    "Duree des travaux": 0,
}
string_json_aapc = json.dumps(format_json_aapc, ensure_ascii=False, indent=2)

prompt_resumer_aapc = """ 
Extract from **Texte** the following informations related to 'evaluation et critère de l'offre'  : 

**Informations**:
'Mission': scope du projet, objet du chantier, objectif du programme, 
'Lieu du Chantier': ville  Commune  Departement Rue , 
'Maitre ouvrage': nom du Maitre d'ouvrage du projet,
'Tranche': le projet est il decoupé en plusieurs Tranche ou phases ex '2 tranches', 'non'
'Lot': le projet est il decoupé en plusieurs lots, ex '3 lots', 'non',
'Prix des travaux' : en euros HT, <integer>,
'Durée des Travaux': en nombre de mois, <integer>,

**Instructions**: 
Donne uniquement les informations disponibles dans le texte , sans interpretation ou estimation. 
Donne des reponses chiffrées et quantifiées lorsque c'est possible. 
La reponse doit etre ecrite en francais et avoir un maximum 500 mots 
Réponds uniquement aux informations demandées qui sont toutes dans le texte

**Texte**: 
"""

prompt_json_aapc = f"""
Format the output, focusing on informations requested and available within the **Text** and initial document . 
Do not invent anything. 
Strickly follow the JSON format request. Write in French: 
{string_json_aapc}

**Text**: \n 
""" 

###### ---- CCAP -------------- ###################
format_json_ccap= {
    "Objet du marché": "",
    "Lieu du Chantier": "",
    "Maitre ouvrage": "",
    "Maitre oeuvre": "",
    "tranche": "",
    "Lot": "",
}
string_json_ccap = json.dumps(format_json_ccap, ensure_ascii=False, indent=2)

prompt_resumer_ccap = """ 
Extract from **Texte** the following informations related to 'evaluation et critère de l'offre'  : 

**Informations**:
'Objet du marché': scope du projet, objet du chantier, objectif du programme, 
'Lieu du Chantier': ville  Commune  Departement Rue , 
'Maitre ouvrage': nom du Maitre d'ouvrage du projet,
'Maitre oeuvre': nom du Maitre d'oeuvre du projet, en phase de conception et de realisation 
'Tranche': le projet est il decoupé en plusieurs tranches, ex '2 tranches', 'non',
'Lot': le projet est il decoupé en plusieurs lot, ex '3 lots', 'non',

**Instructions**: 
Donne uniquement les informations disponibles dans le texte , sans interpretation ou estimation. 
Donne des reponses chiffrées et quantifiées lorsque c'est possible. 
La reponse doit etre ecrite en francais et avoir un maximum 500 mots 
Réponds uniquement aux informations demandées qui sont toutes dans le texte

**Texte**: 
"""

prompt_json_ccap = f"""
Format the output, focusing on informations requested and available within the **Text** and initial document . 
Do not invent anything. 
Strickly follow the JSON format request. Write in French: 
{string_json_ccap}

**Text**: \n 
""" 


In [12]:
# Init Ollama, with list of model, prompt

ollama_url = "http://localhost:11434"

# Get an ollama client
llmclient = Client(host=ollama_url)
model_options = {
    "num_predict": 1300,  # max number of tokens to predict
    "temperature": 0.05,
    "top_p": 0.2,
    "num_ctx": 9000 # max number of tokens to input
}
"""
model_options_json = {
    "num_predict": 1300,  # max number of tokens to predict
    "temperature": 0.05,
    "top_p": 0.2,
    "format": "json",
    "num_ctx": 9000 # max number of tokens to input
}
"""

# 'mistral-small3.1=14G  llama3.2:latest=2G gemma3:4b=3.3G
#list_model = ["gemma3:4b", "llama3.2", "minicpm-v", "mistral-small3.1"]
list_model = ["gemma3:12b", "gemma2:9b", "llama3.1:8b", "mistral:7b"]

MODEL_ID = "gemini-2.5-flash-preview-05-20" # @param ["gemini-2.0-flash-lite","gemini-2.0-flash","gemini-2.5-flash-preview-05-20","gemini-2.5-pro-preview-06-05"] {"allow-input":true, isTemplate: true}
Genaiclient = genai.Client(api_key=os.environ['GOOGLE_API_KEY'])

response = Genaiclient.models.generate_content(
    model=MODEL_ID,
    contents="How to be happy today?"
)
#display(Markdown(response.text))
print(response.text)

Being happy today isn't about achieving a state of constant euphoria, but rather about cultivating moments of contentment, gratitude, and peace, and effectively managing moments of stress or negativity.

Here are some actionable tips you can try *today*:

1.  **Start with Gratitude:** Before you even get out of bed, think of 3 things you're grateful for. They can be tiny (the warm blanket, a cup of coffee) or significant (your health, a loved one). This immediately shifts your focus.

2.  **Hydrate and Nourish:** Drink a glass of water. Eat a nutritious meal that you enjoy. Your physical well-being strongly impacts your mood.

3.  **Move Your Body:** Even 5-10 minutes can make a difference. Stretch, do a few jumping jacks, walk around the block, dance to your favorite song. Movement releases endorphins.

4.  **Do One Small Productive Thing:** Tidy a small area, send that email you've been putting off, or complete a single task on your to-do list. The feeling of accomplishment, even tin

In [13]:
## Run GOOGLE GENAI with predeifned prompt for avery file/text 
##
def run_genai_docs(text_from_file, prompt_resumer,prompt_json ):
    #Resumer
    prompt_full_r = prompt_resumer + text_from_file
    result = Genaiclient.models.generate_content(model=MODEL_ID,  contents=prompt_full_r)
    #bid_utils.print_text_wrapped(f"\nLLM response pour resumer: \n" + result.text)
    
    #JSON
    prompt_full_j = prompt_json + result.text
    result = Genaiclient.models.generate_content(model=MODEL_ID,  contents=prompt_full_j)
    #bid_utils.print_text_wrapped(f"\nLLM response pour JSON: \n{result.text}")
    return(result.text)




In [None]:
## Run all models for the same task (prompt + file) for comparison
##

def run_model_CCTP(text_from_file, model_name):
    #Init system:
    llmclient.chat(model=model_name, options=model_options, messages=[{'role':'system','content': prompt_role}])
    
    #Resumer
    prompt_full_r = prompt_resumer_cctp + text_from_file
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s \n" + result.message.content)
    bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s")
    
    #JSON
    prompt_full_j = prompt_json_cctp + result.message.content
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_j}], format='json')
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour JSON: in {result['total_duration']/10**9:.0f}s \n{result.message.content}")
    return(result.message.content)


def run_model_reglement(text_from_file, model_name):
    #Init system:
    llmclient.chat(model=model_name, options=model_options, messages=[{'role':'system','content': prompt_role}])
    
    #Resumer
    prompt_full_r = prompt_resumer_regl + text_from_file
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s \n" + result.message.content)
    bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s")

    #JSON
    prompt_full_j = prompt_json_regl + result.message.content
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_j}], format='json')
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour JSON: in {result['total_duration']/10**9:.0f}s \n{result.message.content}")
    return(result.message.content)


def run_model_aapc(text_from_file, model_name):
    #Init system:
    llmclient.chat(model=model_name, options=model_options, messages=[{'role':'system','content': prompt_role}])
    
    #Resumer
    prompt_full_r = prompt_resumer_aapc + text_from_file
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s \n" + result.message.content)
    #bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s")

    #JSON
    prompt_full_j = prompt_json_aapc + result.message.content
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_j}], format='json')
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour JSON: in {result['total_duration']/10**9:.0f}s \n{result.message.content}")
    return(result.message.content)


def run_model_ccap(text_from_file, model_name):
    #Init system:
    llmclient.chat(model=model_name, options=model_options, messages=[{'role':'system','content': prompt_role}])
    
    #Resumer
    prompt_full_r = prompt_resumer_ccap + text_from_file
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_r}])
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s \n" + result.message.content)
    bid_utils.print_text_wrapped(f"\nLLM response pour resumer: in {result['total_duration']/10**9:.0f}s")
    
    #JSON
    prompt_full_j = prompt_json_ccap + result.message.content
    result = llmclient.chat(model=model_name, options=model_options, messages=[{'role':'user','content':prompt_full_j}], format='json')
    #pprint(result, compact=True)
    #bid_utils.print_text_wrapped(f"\nLLM response pour JSON: in {result['total_duration']/10**9:.0f}s \n{result.message.content}")
    return(result.message.content)




In [None]:
# Teste plusieurs models sur l'enchaienement d'analyse de fichiers pour 1 EBP ID
def test_models_for_1_ebp(list_model_to_test):
    ebp_id_l = ["no EBP 13"] # impose ce projet "no EBP 13" => CCTP,CCAP, Regl  / #no EBP 9717
    ebp_id = ebp_id_l[0]
    list_consult_type = ['Lettre Consult', 'CCP', 'CCTP', 'CCAP', 'Planning', 'AAPC', 'Reglement']

    #filtered_row = df_consult_ebp[df_consult_ebp['ID EBP'] == selected_ebp_id[0]].iloc[0]
    #print(f"\n ***** ID:{selected_ebp_id} statut_consult: {filtered_row['statut_consult']} ****** ")
    filtered_row = df_consult_ebp[df_consult_ebp['ID EBP'] == ebp_id].iloc[0]
    print(f"\n ***** ID:{ebp_id} statut_consult: {filtered_row['statut_consult']} ***** ")
    print(f"Ville:{filtered_row['Ville']}  Entreprise:{filtered_row['Entreprise']}  Mission:{filtered_row['Mission']}")
    
    for model_name in list_model_to_test:
        print(f" ===================== {model_name} ==========================")
        for doc_type in list_consult_type:
            list_file_consult = df_consult_ebp[(df_consult_ebp['ID EBP'] == ebp_id) & (df_consult_ebp['AO_doc_type'] == doc_type)]['file_path']
        
            if not list_file_consult.empty:
                print("Doc type:",doc_type)
                text_multi_files = ""
                for file_path in list_file_consult:
                    #nb_segment = file_path.split("\\")
                    #print("==> ", nb_segment[-1].strip())
                    bid_utils.path_to_link(file_path.strip(), option=None)
                    text_file = bid_utils.loadpdf_as_text(file_path.strip())
                    text_multi_files += text_file + "\n" # Contatenate text
                
                # Trim text to suppress long' '
                text_input = re.sub(r'\s+', ' ', text_multi_files).strip()
                
                # Run model for each doc type
                if doc_type == "CCTP" or doc_type == "CCP" or doc_type == "Lettre Consult" or doc_type == "Planning" :
                    json_result = run_genai_docs(text_input, prompt_resumer_cctp, prompt_json_cctp)
                    #bid_utils.update_df_with_json_cctp(json_result , ebp_id, df_consult_elevated)
                   
                if doc_type == "Reglement" or doc_type == "Lettre Consult":
                    json_result = run_genai_docs(text_input, prompt_resumer_regl, prompt_json_regl)
                    #bid_utils.update_df_with_json_regl(json_result , ebp_id, df_consult_elevated)
                    
                if doc_type == "AAPC" or doc_type == "Planning":
                    json_result = run_genai_docs(text_input,  prompt_resumer_aapc, prompt_json_aapc)
                    #bid_utils.update_df_with_json_aapc(json_result , ebp_id, df_consult_elevated)
                   
                if doc_type == "CCAP" or doc_type == "CCP" or doc_type == "Planning":
                    json_result = run_genai_docs(text_input,  prompt_resumer_ccap, prompt_json_ccap)
                    #bid_utils.update_df_with_json_ccap(json_result , ebp_id, df_consult_elevated)
                
#list_model = ["gemma3:4b", "gemma3:12b", "gemma2:9b", "llama3.1:8b", "llama3.2:latest", "qwen3:8b"]
list_model = [MODEL_ID]
test_models_for_1_ebp(list_model)

# Main part
- boucle pour extraire les infos
- verification des infos collectées

In [14]:
#### Enchainement des de l'extraction des docs d'un projet pour cumuler les infos.

# modele fixé
model_name = MODEL_ID # ou "llama3.2:latest" "gemma3:4b"

# Liste ordonnées des types de doc Consult à explorer
list_consult_type = ['Lettre Consult', 'CCP', 'CCTP', 'CCAP', 'Planning', 'AAPC', 'Reglement']

consult_mask = (df_consult_ebp['AO_docs'] == True) 
#cctp_mask = df_consult_ebp['AO_doc_type'] == "CCTP"

consult_ebp_ids = df_consult_ebp.loc[consult_mask, 'ID EBP'].unique()
print(f"il y a {len(consult_ebp_ids)} projets avec au moins 1 document du type 'Consultation' ")
print("nb de fichiers AO_docs avec un type identifié:",len(df_consult_ebp['AO_doc_type']) - len(df_consult_ebp[df_consult_ebp['AO_doc_type']=='no type']))

count = 0
start_exec = 0
max_count = 101
nb_model_called = 0
count_ebp_model = 0 

for ebp_id in consult_ebp_ids:

    filtered_row = df_consult_ebp[df_consult_ebp['ID EBP'] == ebp_id].iloc[0]
    print(f"\n ***** {count+1}/{max_count}:  ID:{ebp_id} statut_consult: {filtered_row['statut_consult']} ***** ")
    print(f"Ville:{filtered_row['Ville']}  Entreprise:{filtered_row['Entreprise']}  Mission:{filtered_row['Mission']}")

    for doc_type in list_consult_type:
        list_file_consult = df_consult_ebp[(df_consult_ebp['ID EBP'] == ebp_id) & (df_consult_ebp['AO_doc_type'] == doc_type)]['file_path']
        flag_callmodel = False
        if not list_file_consult.empty:
            print("Doc type:",doc_type)
            text_multi_files = ""
            for file_path in list_file_consult:
                #nb_segment = file_path.split("\\")
                #print("==> ", nb_segment[-1].strip())
                bid_utils.path_to_link(file_path.strip(), option=None)
                text_file = bid_utils.loadpdf_as_text(file_path.strip())
                text_multi_files += text_file + "\n" # Contatenate text
            
            # Trim text to suppress long' '
            text_input = re.sub(r'\s+', ' ', text_multi_files).strip()

            if count >= start_exec:
                # Run model for each doc type
                flag_callmodel = True
                if doc_type == "CCTP" or doc_type == "CCP" or doc_type == "Lettre Consult" or doc_type == "Planning" :
                    json_result = run_genai_docs(text_input, prompt_resumer_cctp, prompt_json_cctp)
                    bid_utils.update_df_with_json_cctp(json_result , ebp_id, df_consult_elevated)
                    nb_model_called += 1
                if doc_type == "Reglement" or doc_type == "Lettre Consult":
                    json_result = run_genai_docs(text_input, prompt_resumer_regl, prompt_json_regl)
                    bid_utils.update_df_with_json_regl(json_result , ebp_id, df_consult_elevated)
                    nb_model_called += 1
                if doc_type == "AAPC" or doc_type == "Planning":
                    json_result = run_genai_docs(text_input, prompt_resumer_aapc, prompt_json_aapc)
                    bid_utils.update_df_with_json_aapc(json_result , ebp_id, df_consult_elevated)
                    nb_model_called += 1
                if doc_type == "CCAP" or doc_type == "CCP" or doc_type == "Planning":
                    json_result = run_genai_docs(text_input, prompt_resumer_ccap, prompt_json_ccap)
                    bid_utils.update_df_with_json_ccap(json_result , ebp_id, df_consult_elevated)
                    nb_model_called += 1
    count_ebp_model += 1
    if count_ebp_model % 50 == 0:
        df_consult_elevated.to_pickle(path_df_consult_elevated)
        print(f"\nCount {count_ebp_model}: DataFrame successfully saved to '{path_df_consult_elevated}'")

    if count > max_count:
        break
    count += 1

il y a 926 projets avec au moins 1 document du type 'Consultation' 
nb de fichiers AO_docs avec un type identifié: 829

 ***** 1/101:  ID:no EBP 1 statut_consult: Perdu ***** 
Ville:BOUGUENAIS  Entreprise:BGTA Ministère environnement  Mission:Sécurisation BGTA
Doc type: Reglement



 ***** 2/101:  ID:no EBP 3 statut_consult: Devis ***** 
Ville:BOUGUENAIS  Entreprise:MAIRIE  Mission:Salle de sport Joel Dubois et Cossec
Doc type: CCTP



 ***** 3/101:  ID:no EBP 13 statut_consult: Perdu ***** 
Ville:ST NAZAIRE  Entreprise:SONADEV  Mission:CONSTRUCTION GROUPE SCOLAIRE
Doc type: CCTP


Doc type: AAPC


Doc type: Reglement



 ***** 4/101:  ID:no EBP 15 statut_consult: Devis ***** 
Ville:PORNIC  Entreprise:LAD  Mission:démolition
Doc type: CCTP



 ***** 5/101:  ID:no EBP 16 statut_consult: Devis ***** 
Ville:ST HERBLAIN  Entreprise:VLOK  Mission:Réhab Bat industriel en AGENCE V-LOK

 ***** 6/101:  ID:no EBP 19 statut_consult: Devis ***** 
Ville:GPSN  Entreprise:Dalkia  Mission:Chaufferie
Doc type: CCTP



 ***** 7/101:  ID:250286 statut_consult: Chantier ***** 
Ville:BERNERIE  Entreprise:LAD  Mission:PRE BOISMAIN
Doc type: CCTP



 ***** 8/101:  ID:220935 statut_consult: Chantier ***** 
Ville:MONTOIR  Entreprise:MAIRIE  Mission:Ecole Jaurès & Multi-accueil
Doc type: CCTP


Doc type: CCAP


Doc type: Reglement



 ***** 9/101:  ID:230152 statut_consult: Chantier ***** 
Ville:CHAUMES EN RETZ  Entreprise:PORNIC AGGLO  Mission:Tx Alvéoles ISDND Écocentre Ste Anne
Doc type: CCTP



 ***** 10/101:  ID:no EBP 54 statut_consult: Chantier ***** 
Ville:ST NAZAIRE  Entreprise:SONADEV  Mission:Zac de Brais
Doc type: CCAP



 ***** 11/101:  ID:18000296 statut_consult: Chantier ***** 
Ville:PELLERIN  Entreprise:ATLANTIC EAU  Mission:Traversée Loire Feeder de sécurisation (DIUO) (Lot 1-2-3)
Doc type: Reglement



 ***** 12/101:  ID:18000298 statut_consult: Chantier ***** 
Ville:PELLERIN  Entreprise:ATLANTIC EAU  Mission:Traversée Loire Feeder de sécurisation (DIUO) (Lot 1-2-3)
Doc type: Reglement



 ***** 13/101:  ID:18000297 statut_consult: Chantier ***** 
Ville:PELLERIN  Entreprise:ATLANTIC EAU  Mission:Traversée Loire Feeder de sécurisation (DIUO) (Lot 1-2-3)
Doc type: Reglement



 ***** 14/101:  ID:250240 statut_consult: Chantier ***** 
Ville:PORNICHET  Entreprise:MAIRIE  Mission:REHAB VIEUX MOLE
Doc type: CCTP


Doc type: CCAP


Doc type: Reglement



 ***** 15/101:  ID:250275 statut_consult: Chantier ***** 
Ville:TRIGNAC  Entreprise:CENTRALITES 44  Mission:Aménagmt MAM
Doc type: CCTP



 ***** 16/101:  ID:250427 statut_consult: Chantier ***** 
Ville:TRIGNAC  Entreprise:SAS VALIMMO  Mission:Cultura parking
Doc type: CCTP



 ***** 17/101:  ID:230180 statut_consult: Archive ***** 
Ville:ST SEB  Entreprise:MAIRIE  Mission:luminaires bâts municipaux

 ***** 18/101:  ID:230776 statut_consult: Archive ***** 
Ville:VERTOU  Entreprise:SCI de l'ALLIER  Mission:Bat LCJ CAPTEURS

 ***** 19/101:  ID:no EBP 231 statut_consult: Archive ***** 
Ville:Plan 01  Entreprise:Masse RDC Coupes Facades  Mission:LCJ CAPTEURS Vertou.pdf

 ***** 20/101:  ID:230233 statut_consult: Archive ***** 
Ville:PELLERIN  Entreprise:DEPT44  Mission:Collège P&M Curie Modulaires 4 classes

 ***** 21/101:  ID:240188 statut_consult: Archive ***** 
Ville:ST NAZAIRE  Entreprise:NANTES UNIV  Mission:Projet filière Heinlex

 ***** 22/101:  ID:no EBP 602 statut_consult: Devis ***** 
Ville:DEPT85  Entreprise:DEPT85  Mission:Accord cadre Bâtiments et collèges
Doc type: CCTP


Doc type: CCAP


Doc type: Reglement



 ***** 23/101:  ID:no EBP 606 statut_consult: Perdu ***** 
Ville:CHEVROLIERE  Entreprise:ACISTE ING  Mission:Restauration église
Doc type: CCAP


Doc type: Reglement



 ***** 24/101:  ID:no EBP 608 statut_consult: Perdu ***** 
Ville:SOULLANS  Entreprise:MAIRIE  Mission:Ilot Eglise
Doc type: Reglement



 ***** 25/101:  ID:no EBP 610 statut_consult: Perdu ***** 
Ville:SOULLANS  Entreprise:MAIRIE  Mission:Aménagement plaine +construction complexe sport& courts tennis
Doc type: Reglement



 ***** 26/101:  ID:no EBP 611 statut_consult: Perdu ***** 
Ville:ST PHILIBERT GD.L. & STE LUMINE DE COUTAIS  Entreprise:CC  Mission:Itinéraire cyclable 87
Doc type: CCTP



 ***** 27/101:  ID:no EBP 612 statut_consult: Perdu ***** 
Ville:VERTOU  Entreprise:MAIRIE  Mission:Construction GS Echalonnieres
Doc type: CCTP


Doc type: CCAP



 ***** 28/101:  ID:no EBP 613 statut_consult: Devis ***** 
Ville:CHALLANS  Entreprise:SCCV BATICANA (LOTIPROMO)  Mission:Clémenceau 4 MI
Doc type: CCTP



 ***** 29/101:  ID:no EBP 614 statut_consult: Devis ***** 
Ville:GETIGNE  Entreprise:LESNI  Mission:Bureaux
Doc type: CCTP


ClientError: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.', 'status': 'RESOURCE_EXHAUSTED', 'details': [{'@type': 'type.googleapis.com/google.rpc.QuotaFailure', 'violations': [{'quotaMetric': 'generativelanguage.googleapis.com/generate_content_free_tier_input_token_count', 'quotaId': 'GenerateContentInputTokensPerModelPerMinute-FreeTier', 'quotaDimensions': {'location': 'global', 'model': 'gemini-2.5-flash'}, 'quotaValue': '250000'}]}, {'@type': 'type.googleapis.com/google.rpc.Help', 'links': [{'description': 'Learn more about Gemini API quotas', 'url': 'https://ai.google.dev/gemini-api/docs/rate-limits'}]}, {'@type': 'type.googleapis.com/google.rpc.RetryInfo', 'retryDelay': '24s'}]}}

In [15]:
print("nb of count_ebp_model",count_ebp_model)
print("nb of nb_model_called",nb_model_called, "\n")

#f_consult_ebp.loc[consult_mask].head()
df_consult_elevated.loc[consult_mask].info()

nb of count_ebp_model 28
nb of nb_model_called 32 

<class 'pandas.core.frame.DataFrame'>
Index: 926 entries, 0 to 158400
Data columns (total 35 columns):
 #   Column                               Non-Null Count  Dtype  
---  ------                               --------------  -----  
 0   SPS Name                             926 non-null    object 
 1   Ville                                926 non-null    object 
 2   Entreprise                           926 non-null    object 
 3   Mission                              926 non-null    object 
 4   statut_consult                       926 non-null    object 
 5   ID EBP                               926 non-null    object 
 6   regl crit-prix                       11 non-null     float64
 7   regl crit-tech global                11 non-null     float64
 8   regl duree-travaux                   11 non-null     float64
 9   regl prix travaux                    11 non-null     float64
 10  regl crit-tech-moyen_humain          11 non-null

In [16]:
df_consult_elevated.columns

Index(['SPS Name', 'Ville', 'Entreprise', 'Mission', 'statut_consult',
       'ID EBP', 'regl crit-prix', 'regl crit-tech global',
       'regl duree-travaux', 'regl prix travaux',
       'regl crit-tech-moyen_humain', 'regl crit-tech-methodologie',
       'regl crit-tech-coherence_temps', 'regl crit-tech-comprehension_enjeux',
       'cctp nom_chantier', 'cctp lieu', 'cctp type travaux',
       'cctp duree travaux', 'cctp planning conception', 'cctp prix travaux',
       'cctp maitre ouvrage', 'cctp maitre oeuvre', 'cctp cat SPS',
       'aapc mission', 'aapc lieu', 'aapc m_ouvrage', 'aapc tot',
       'aapc tranche', 'aapc prix_travaux', 'aapc duree_travaux', 'ccap objet',
       'ccap lieu', 'ccap m_ouvrage', 'ccap m_oeuvre', 'ccap lot'],
      dtype='object')

In [17]:
# show key info per columns
keywords = ['cctp', 'aapc', 'regl', 'ccp']
list_col_added = [col for col in df_consult_elevated.columns if any(keyword in col for keyword in keywords)]
mask_non_null = df_consult_elevated[list_col_added].map(lambda x: pd.notna(x) and (x != 0 or x != ""))
count_non_null_rows = mask_non_null.any(axis=1).sum()

filtered_df = df_consult_elevated[mask_non_null.any(axis=1)]
TableReport(filtered_df)

Processing column  35 / 35


Unnamed: 0_level_0,SPS Name,Ville,Entreprise,Mission,statut_consult,ID EBP,regl crit-prix,regl crit-tech global,regl duree-travaux,regl prix travaux,regl crit-tech-moyen_humain,regl crit-tech-methodologie,regl crit-tech-coherence_temps,regl crit-tech-comprehension_enjeux,cctp nom_chantier,cctp lieu,cctp type travaux,cctp duree travaux,cctp planning conception,cctp prix travaux,cctp maitre ouvrage,cctp maitre oeuvre,cctp cat SPS,aapc mission,aapc lieu,aapc m_ouvrage,aapc tot,aapc tranche,aapc prix_travaux,aapc duree_travaux,ccap objet,ccap lieu,ccap m_ouvrage,ccap m_oeuvre,ccap lot
Unnamed: 0_level_1,SPS Name,Ville,Entreprise,Mission,statut_consult,ID EBP,regl crit-prix,regl crit-tech global,regl duree-travaux,regl prix travaux,regl crit-tech-moyen_humain,regl crit-tech-methodologie,regl crit-tech-coherence_temps,regl crit-tech-comprehension_enjeux,cctp nom_chantier,cctp lieu,cctp type travaux,cctp duree travaux,cctp planning conception,cctp prix travaux,cctp maitre ouvrage,cctp maitre oeuvre,cctp cat SPS,aapc mission,aapc lieu,aapc m_ouvrage,aapc tot,aapc tranche,aapc prix_travaux,aapc duree_travaux,ccap objet,ccap lieu,ccap m_ouvrage,ccap m_oeuvre,ccap lot
0.0,Cyrille CHARTIER - CYRILLE,BOUGUENAIS,BGTA Ministère environnement,Sécurisation BGTA,Perdu,no EBP 1,60.0,40.0,7.0,33920.0,0.0,0.0,0.0,0.0,,,,,,,,,,,,,,,,,,,,,
3.0,Cyrille CHARTIER - CYRILLE,BOUGUENAIS,MAIRIE,Salle de sport Joel Dubois et Cossec,Devis,no EBP 3,,,,,,,,,REHABILITATION ET EXTENSION DU COMPLEXE SPORTIF JOEL DUBOIS,"1 Rue de la Commune de Paris 1871, Bouguenais","Réhabilitation et Extension, Rénovation, Démolition, Gros Œuvre, Charpente Bois, Couverture-Étanchéité - Bardage, Menuiseries Extérieures - Métallerie, Menuiseries Intérieures - Doublage, Faux-Plafonds, Revêtements de Sols, Revêtement de Sol Sportif, Équipements Sportifs, Désamiantage, Chauffage, Ventilation, Plomberie, Électricité Courants Forts et Faibles",0.0,Janvier 2023,0.0,COMMUNE DE BOUGUENAIS / VILLE DE BOUGUENAIS,Architecte : SAS Didier LE BORGNE et ASSOCIES ; Économiste : GESTIONBAT ; BET STRUCTURE : PLBI ; BET FLUIDES : GEFI INGENIERIE,,,,,,,,,,,,,
38.0,Cyrille CHARTIER - CYRILLE,ST NAZAIRE,SONADEV,CONSTRUCTION GROUPE SCOLAIRE,Perdu,no EBP 13,30.0,70.0,0.0,0.0,15.0,20.0,30.0,5.0,Groupe scolaire Jean Zay,"Saint Nazaire, quartier KERLEDE","Construction et reconstruction (groupe scolaire, multi accueil, plateau sportif)",0.0,Du 12 juin 2025 au 4 mars 2026 (environ 8 mois et 20 jours pour la phase de consultation/conception préliminaire),0.0,SONADEV TERRITOIRES PUBLICS,,Catégorie 2 ou 3,Construction d’un groupe scolaire sur le quartier KERLEDE à Saint-Nazaire. Le marché concerne une mission de Coordonnateur Sécurité et Protection de la Santé (CSPS) pour ce projet.,"rue Ferdinand Buisson, à Saint-Nazaire (44).",SONADEV TERRITOIRES PUBLICS.,,Oui,8600000.0,0.0,,,,,
44.0,Cyrille CHARTIER - CYRILLE,PORNIC,LAD,démolition,Devis,no EBP 15,,,,,,,,,"Travaux de démolition, désamiantage et talutage de l'îlot 2.2 de la ZAC de la Ria","Pornic, Loire-Atlantique, Rue Général de Gaulle (ZAC de la Ria)","Démolition, désamiantage, talutage et éventuellement dépollution",7.0,Montage PRO/DCE : octobre 2024 ; Validation DCE : Mi-décembre 2024 (durée prévisionnelle CSPS : 5 mois),1500000.0,"Loire-Atlantique Développement (LAD-SELA), en qualité de concessionnaire-aménageur de la ZAC de la Ria, pour le compte de la commune de Pornic","Groupement composé de : AD INGE (mandataire pour la démolition), AREST (BE structure) et APC Ingénierie (BE géotechnique - fondation)",II,,,,,,,,,,,,
49.0,Cyrille CHARTIER - CYRILLE,GPSN,Dalkia,Chaufferie,Devis,no EBP 19,,,,,,,,,Construction d’une chaufferie biomasse et d'un bâtiment de chaufferie à Montoir de Bretagne.,"Rue des Evens, Montoir de Bretagne (44).","Travaux de construction d'une chaufferie biomasse et d'un bâtiment de chaufferie, incluant les travaux de process (installation et montage des chaudières bois et gaz, convoyage biomasse, travaux hydrauliques, chaudière gaz, travaux électriques CFO/CFA process, automatisme et supervision) et les travaux de bâtiment (VRD/espaces verts, gros œuvre bâtiment et génie civil, génie civil industriel, bardage, étanchéité, couverture, serrurerie, charpente, structure, menuiseries extérieures, second œuvre, travaux électriques CFO/CFA locaux sociaux/extérieurs/circulations, chauffage, ventilation, désenfumage, plomberie sanitaires).",16.0,Début : Juillet 2025 ; Fin : Novembre 2025 ; Durée : 5 mois,9500000.0,ESTER (Estuaire Saint-Nazaire Energies Renouvelables),Maitrise d’œuvre Process : Best Energies ; Maitrise d’œuvre Bâtiment : Triade (architecte du projet),,,,,,,,,,,,,
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2994.0,Eric Garnier - ERIC,SOULLANS,MAIRIE,Ilot Eglise,Perdu,no EBP 608,50.0,50.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,,,,,,,,,,,,,,
2997.0,Eric Garnier - ERIC,SOULLANS,MAIRIE,Aménagement plaine +construction complexe sport& courts tennis,Perdu,no EBP 610,60.0,40.0,0.0,0.0,0.0,0.0,0.0,0.0,,,,,,,,,,,,,,,,,,,,,
2999.0,Eric Garnier - ERIC,ST PHILIBERT GD.L. & STE LUMINE DE COUTAIS,CC,Itinéraire cyclable 87,Perdu,no EBP 611,,,,,,,,,Itinéraire cyclable n°87 De Saint Lumine de Coutais à Saint Philbert de Grand Lieu,"Communes de Saint Lumine de Coutais et Saint Philbert de Grand Lieu (Carrefour de Raingeardière à Saint Lumine de Coutais, sous le passage de la RD117 sur Saint Philbert de Grand Lieu)","Réalisation d'un itinéraire cyclable, Aménagements VRD (Voiries et Réseaux Divers), Signalisation et Mobilier",1.0,3 semaines,0.0,Grand Lieu Communauté,A2i infra Ingénierie B.E.T. VOIRIE RESEAUX,,,,,,,,,,,,,
3000.0,Eric Garnier - ERIC,VERTOU,MAIRIE,Construction GS Echalonnieres,Perdu,no EBP 612,,,,,,,,,Construction d’un nouveau groupe scolaire aux Echalonnières,Boulevard Luc Dejoie à Vertou,"Construction d'un nouveau groupe scolaire, incluant des travaux de bâtie (3248 m² de surface utile bâtie) et l'aménagement de surfaces extérieures (5864 m²)",19.0,"Concours de Maître d’œuvre : Septembre 2021 (1er jury) à Janvier 2022 (2nd jury). Mise au point de l’Esquisse : Février 2022. Études de MOE : APS : Avril 2022, APD et dépôt du PC : Juin 2022, PRO/DCE : Juillet 2022. Consultation des Entreprises : Juillet / Août 2022",7217400.0,Ville de Vertou,Cabinet LEIBAR SEIGNEURIN,Catégorie 1,,,,,,,,"Réalisation d'une mission de coordination en matière de Sécurité et de Protection de la Santé des travailleurs (SPS), de catégorie 1, relative à la construction d’un groupe scolaire. Les missions couvrent les phases de conception et de réalisation.","Aux Echalonnières à VERTOU (44), Loire-Atlantique. Le lieu de prestation du service est Boulevard Luc DEJOIE, 44123 VERTOU.","Ville de VERTOU, représentée par Monsieur le Maire Rodolphe Amailland.",Actuellement en cours de consultation (nom non précisé dans le texte).,Non renseigné.

Column,Column name,dtype,Null values,Unique values,Mean,Std,Min,Median,Max
0,SPS Name,ObjectDType,0 (0.0%),2 (9.5%),,,,,
1,Ville,ObjectDType,0 (0.0%),16 (76.2%),,,,,
2,Entreprise,ObjectDType,0 (0.0%),13 (61.9%),,,,,
3,Mission,ObjectDType,0 (0.0%),19 (90.5%),,,,,
4,statut_consult,ObjectDType,0 (0.0%),3 (14.3%),,,,,
5,ID EBP,ObjectDType,0 (0.0%),21 (100.0%),,,,,
6,regl crit-prix,Float64DType,10 (47.6%),6 (28.6%),39.1,20.2,0.0,40.0,60.0
7,regl crit-tech global,Float64DType,10 (47.6%),6 (28.6%),44.5,22.5,0.0,50.0,70.0
8,regl duree-travaux,Float64DType,10 (47.6%),3 (14.3%),0.909,2.21,0.0,0.0,7.0
9,regl prix travaux,Float64DType,10 (47.6%),3 (14.3%),81000.0,258000.0,0.0,0.0,858000.0

Column 1,Column 2,Cramér's V,Pearson's Correlation
SPS Name,ID EBP,1.0,
ccap m_oeuvre,ccap lot,1.0,
ccap m_ouvrage,ccap lot,1.0,
ccap m_ouvrage,ccap m_oeuvre,1.0,
ccap lieu,ccap lot,1.0,
ccap lieu,ccap m_oeuvre,1.0,
ccap lieu,ccap m_ouvrage,1.0,
ccap objet,ccap lot,1.0,
ccap objet,ccap m_oeuvre,1.0,
ccap objet,ccap m_ouvrage,1.0,


In [18]:
# Save the DataFrame to a pickle file

df_consult_elevated.to_pickle(path_df_consult_elevated)
print(f"\nDataFrame successfully saved to '{path_df_consult_elevated}'")


DataFrame successfully saved to 'C:\Users\jch_m\ATAE\Nicolas MONCEAU - NICOLAS\Stage_AppelsOffres\data_output\df_consult_elevated.pkl'
