In [1]:
# ------------------------- Préparation des informations de réduction des valeurs catégorielles -----------------------------

import pandas as pd
import statsmodels.api
from statsmodels.api import stats
import statsmodels.formula.api as smf

# Ajuster les paramètres pour afficher toutes les lignes et colonnes
pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)

In [2]:
def load_incidents():
    """
    Charge le dataset sauvegardé 'Preprocess.csv' contenant le merge prétraités des données des incidents et mobilisations.

    Cette fonction effectue les opérations suivantes :
    - Charge le datasets à partir du fichier CSV.
    - Affiche  les premieres lignes
    - Affiche les infos du dataset
    
    Returns:
        pd.DataFrame: Le DataFrame contenant les données des incidents et mobilisations.
    """
    #charge le dataset
    df = pd.read_csv("../data/PreProcess.csv", sep=";", low_memory=False)
    #affiche les premieres lignes et infos du dataframe
    display(df.head())
    display(df.info())
    return df


In [3]:
# Traitment des catégories StopCode, PropertyType, Postcode_district
# Pour conserver les valeurs catégorielles en fonction d'un 
# Test de Anova, pour chacune des cibles

cols_cible_type = ["PumpSecondsOnSite", "TurnoutTimeSeconds", "TravelTimeSeconds"]

def calc_anova_for_all_targets(df):
    """
    Calcule les tests ANOVA pour toutes les cibles spécifiées dans le DataFrame fourni.

    Cette fonction effectue les opérations suivantes :
    - Définit les colonnes catégorielles et les colonnes cibles à analyser.
        ["PumpSecondsOnSite_min", "PumpSecondsOnSite_mean", "PumpSecondsOnSite_max"],
        ["TurnoutTimeSeconds_min", "TurnoutTimeSeconds_mean", "TurnoutTimeSeconds_max"],
        ["TravelTimeSeconds_min", "TravelTimeSeconds_mean", "TravelTimeSeconds_max"],
    - Affiche le nombre de valeurs uniques pour chaque colonne catégorielle.
    - Filtre les données pour inclure uniquement les années après 2016 afin de réduire le temps de calcul.
    - Effectue des tests ANOVA pour chaque colonne cible avec toutes les colonnes catégorielles.
    - Crée un DataFrame des résultats avec les coefficients et les p-values.
    - Affiche les résultats des tests ANOVA.
    - Fusionne les résultats dans un DataFrame compilé par type de cible.

    Args:
        df (pd.DataFrame): Le DataFrame contenant les données à analyser.

    Returns:
        list: Une liste de DataFrames compilés contenant les résultats des tests ANOVA pour chaque type de cible.
    """


    # Catégories
    cols_categ = [
        "StopCode",
        "PropertyType",
        "Postcode_district",
    ]
    # Cibles à caluler
    cols_cible = [
        ["PumpSecondsOnSite_min", "PumpSecondsOnSite_mean", "PumpSecondsOnSite_max"],
        ["TurnoutTimeSeconds_min", "TurnoutTimeSeconds_mean", "TurnoutTimeSeconds_max"],
        ["TravelTimeSeconds_min", "TravelTimeSeconds_mean", "TravelTimeSeconds_max"],
    ]

    # Nb de valeurs actuelles par catégories
    for col in cols_categ:
        print(col, len(df[col].unique()))
    print()

    # Test de Anova sur les données après 2016, pour réduire le temps de calcul
    df_temp = df[df.CalYear.astype("int") > 2016]

    # Test de Anova sur chaque colonne cible avec toutes les colonnes catégorielles
    all_result = []
    # Formatage des colonnes catégorielles pour le test de Anova
    cols_to_check = "+".join(cols_categ)
    # Pour chaque tableau, par type de cible 
    # (exemple PumpSecondsOnSite, calcul pour min, mean, max)
    for cols in cols_cible:
        cible_results = []
        # Pour chaque valeur à calculer (min, max, mean)
        for col in cols:
            print("Test de", col)
            # Test de Anova pour une cible, par exemple PumpSecondsOnSite_min
            results = smf.ols(f"{col} ~ {cols_to_check}", data=df_temp).fit()
            # table = stats.anova_lm(result)
            # display(table)
            # Création d'un Dataframe du résultat avec le coefficient et la pvalue
            results_df = pd.DataFrame(
                {
                    f"{col} coefficients": round(results.params, 3),
                    f"{col} pvalues": round(results.pvalues, 3),
                }
            )
            # Ajoute le résultat au tableau par type de cible
            cible_results.append(results_df)
            # display(results_df)
            # print("Test de", col, "ok")
        # Ajoute le résultat par type de cible aux résultats globaux
        all_result.append(cible_results)

    # Contrôle
    for cible_results in all_result:
        for result in cible_results:
            display(result.head())

    # Merge les resultats dans un dataFrame, en gardant un Dataframe par type de cible
    # et en mettant les résultats pvalue et codef par min, mean et max en colonne
    compiled_results = []
    for cible_results in all_result:
        cible_result = cible_results[0]
        i = 0
        for result in cible_results:
            if i == 0:
                print("continue")
                i += 1
                continue
            print("merge")
            cible_result = pd.merge(
                cible_result, result, left_index=True, right_index=True, how="outer"
            )
        compiled_results.append(cible_result)

    return compiled_results



def calculate_keeps_by_target(compiled_results):
    
     """
     Ajoute 2 colonnes Discord et Keep dans les dataframes pour finaliser le choix
     
     des valeurs catégorielles à conserver dans la liste de DataFrame fourni.  

    Args:
        df (pd.DataFrame): Une liste de DataFrames compilés contenant les résultats des tests ANOVA pour chaque type de cible.

    Returns:
        list: Une liste de DataFrames compilés contenant les valeurs catégorielles à conserver.
    """
     
    print("Calcule Discords")


   
    def TreatDiscordRow(columns, row):
     """
    Détermine si les p-values dans une ligne donnée sont uniformes ou discordantes.

    Cette fonction effectue les opérations suivantes :
    - Crée une liste de booléens indiquant si les p-values sont inférieures ou égales à 0.05.
    - Calcule la somme des booléens pour déterminer si toutes les p-values sont uniformes (toutes significatives ou toutes non significatives).
    - Retourne True si les p-values sont discordantes (c'est-à-dire, certaines sont significatives et d'autres non), sinon retourne False.

    Args:
        columns (list): La liste des noms de colonnes du DataFrame.
        row (pd.Series): Une ligne du DataFrame contenant les p-values à vérifier.

    Returns:
        bool: True si les p-values sont discordantes, sinon False.
    """
        keeps = []
        nb = 0

        for i in range(1, len(columns), 2):
            # print("col", columns[i])
            # print(row)
            # Crée un tableau à 3 boolean qui indique si <= 0.05 ou non 
            keeps.append(row[columns[i]] <= 0.05)
            nb += 1
        # Somme des 3 boolean, si le résultat donne 3 ou 0 alors les 3 pvalue
        # sont uniformes, sinon non, donc Discord
        val = not (sum(keeps) == 0) | (sum(keeps) == nb)  # sum(keeps)
        # print(val)
        return val

    
    def TreatKeepRow(columns, row):
        """
    Détermine si une ligne doit être conservée en fonction des p-values.

    Cette fonction effectue les opérations suivantes :
    - Vérifie si toutes les p-values sont significatives (<= 0.05) ou non significatives (> 0.05).
    - Si toutes les p-values sont non significatives, la ligne n'est pas conservée.
    - Si toutes les p-values sont significatives, la ligne est conservée.
    - Sinon, la ligne est conservée si la p-value de la moyenne ou du maximum est significative.
    
    Args:
        columns (list): Liste des colonnes du DataFrame.
        row (pd.Series): Ligne du DataFrame à vérifier.

    Returns:
        bool: True si la ligne doit être conservée, False sinon.
    """ 
  
        keeps = []
        nb = 0
        for i in range(1, len(columns), 2):
            # print("col", columns[i])
            # print(row[columns[i]])
            keeps.append(row[columns[i]] <= 0.05)
            nb += 1
        val = sum(keeps)
        # si toutes les pvalues sont non significatives
        if val == 0:
            return False
        # si toutes les pvalues sont significatives
        elif val == nb:
            return True
        # sinon, conserve si c'est significatif sur la moyenne ou max
        else:

            mean_col = [s for s in columns if "mean pvalues" in s][0]
            max_col = [s for s in columns if "max pvalues" in s][0]            
            mean = row[mean_col]
            max = row[max_col]
            keep = True if (mean <= 0.05) | (max <= 0.05) else False
            print(mean_col, mean, max_col, max, keep)
            # print("mean_col", mean_col)
            # print("mean_col", val)
            return keep

    # Pour chaque type de cible (ex : PumpSecondsOnSite) on a un DF avec les 
    # pvalue par cible min, max, mean et une ligne par valeur de catégorie
    for cible_results in compiled_results:
        # display(cible_results.head())
        # Ajout d'une colonne Discord qui indique si les pvalue sont toutes
        # <0.05 ou > 0.05, donc un Keep évident
        cible_results["Discord"] = cible_results.apply(
            lambda row: TreatDiscordRow(cible_results.columns, row), axis=1
        )
        # Calcul si on garde ou non la valeur catégorielle pour un type de cible
        cible_results["Keep"] = cible_results.apply(
            lambda row: TreatKeepRow(cible_results.columns, row), axis=1
        )
        # Contrôle
        display(cible_results[cible_results.Discord == True].head())
    # Résumé des données conserver par type de cible
    for i in range(0, len(compiled_results)):
        print(
            f"{cols_cible_type[i]} {compiled_results[i]["Discord"].sum()} discords, {compiled_results[i]["Keep"].sum()} keeps, sur {len(compiled_results[i])}, "
            f"conserve {round(compiled_results[i]["Keep"].sum() / len(compiled_results[i]) * 100, 0)}%"
        )
    return compiled_results

In [4]:
 
def save_categorical_reduction(compiled_results):
     """
    Sauvegarde les informations des valeurs catégorielles après réduction dans des fichiers CSV.

    Cette fonction effectue les opérations suivantes :
    - Conserve uniquement les valeurs catégorielles marquées comme "Keep" dans les résultats compilés.
    - Supprime la ligne "Intercept" des résultats.
    - Crée deux colonnes, "Column" et "Value", à partir de l'index des résultats.
    - Sauvegarde les DataFrames résultants dans des fichiers CSV.

    Args:
        compiled_results (list): Une liste de DataFrames contenant les résultats compilés des tests ANOVA.
    """
     
    def SplitCatValue(s, return_name):
        """
    Sépare une chaîne de caractères en deux parties et retourne l'une des parties en fonction du paramètre `return_name`.

    Cette fonction effectue les opérations suivantes :
    - Sépare la chaîne de caractères `s` en deux parties en utilisant le caractère '[' comme séparateur.
    - Retourne la première partie si `return_name` est True.
    - Retourne la deuxième partie, sans les deux premiers et le dernier caractère, si `return_name` est False.

    Args:
        s (str): La chaîne de caractères à séparer.
        return_name (bool): Un booléen indiquant quelle partie de la chaîne doit être retournée.

    Returns:
        str: La partie de la chaîne de caractères spécifiée par `return_name`.
    """
        result = s.split("[")
        return result[0] if return_name else result[1][2:-1]

    # Sauve les infos des valeurs catégorielles
    for i in range(0, len(compiled_results)):
        # Conserve uniquement la valeur Keep, qui est le résultat final
        # L'index étant la valeur catégorielle
        df_to_save = compiled_results[i][["Keep"]]
        # supprime la ligne Intercept
        df_to_save = df_to_save.drop(
            df_to_save[df_to_save.index.str.upper() == "INTERCEPT"].index
        )
        # Les valeurs de df_keep ont le format
        #           AddressQualifier[T.IN STREET CLOSE TO GAZETTEER LOCATION]	True (colonne Keep)
        # Crée 2 colonnes, nom de colonne et valeur
        # Prend l'index
        df_to_save["Column"] = df_to_save.index
        # Split l'index et retourne la 1ere partie qui est le nom de la catégorie
        df_to_save["Column"] = df_to_save["Column"].apply(lambda s: SplitCatValue(s, True))
        df_to_save["Value"] = df_to_save.index
        # Split l'index et retourne la 2eme partie qui est la valeur catégorielle
        df_to_save["Value"] = df_to_save["Value"].apply(lambda s: SplitCatValue(s, False))
        display(df_to_save.head(10))
        # Sauvegarde le DF dans un fichier
        name = f"keep {cols_cible_type[i]}"
        print(name)
        df_to_save.to_csv(f"../data/{name}.csv", sep=";", index=False)

In [5]:
df = load_incidents()
compiled_results = calc_anova_for_all_targets(df)
compiled_results = calculate_keeps_by_target(compiled_results)
save_categorical_reduction(compiled_results)
# 10 minutes

Unnamed: 0,IncidentNumber,CalYear,HourOfCall,PropertyType,Postcode_district,NumPumpsAttending,StopCode,Month,DayOfWeek,PumpSecondsOnSite_min,PumpSecondsOnSite_mean,PumpSecondsOnSite_max,TurnoutTimeSeconds_min,TurnoutTimeSeconds_mean,TurnoutTimeSeconds_max,TravelTimeSeconds_min,TravelTimeSeconds_mean,TravelTimeSeconds_max
0,235138081,2009,0,CAR,SW11,2.0,SST-RTC,1,4,240.0,390.0,540.0,253.0,253.0,253.0,89.0,89.0,89.0
1,2091,2009,0,ROAD SURFACE/PAVEMENT,N9,1.0,SECONDARY FIRE,1,4,420.0,420.0,420.0,151.0,151.0,151.0,157.0,157.0,157.0
2,3091,2009,0,DOMESTIC GARDEN (VEGETATION NOT EQUIPMENT),UB10,1.0,SECONDARY FIRE,1,4,720.0,720.0,720.0,108.0,108.0,108.0,102.0,102.0,102.0
3,5091,2009,0,CYCLE PATH/PUBLIC FOOTPATH/BRIDLEWAY,N7,2.0,SECONDARY FIRE,1,4,120.0,120.0,120.0,114.0,128.0,142.0,108.0,113.5,119.0
4,6091,2009,0,PURPOSE BUILT FLATS/MAISONETTES - UP TO 3 STOREYS,NW5,2.0,ALARM,1,4,360.0,360.0,360.0,83.0,89.0,95.0,89.0,108.0,127.0


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1591527 entries, 0 to 1591526
Data columns (total 18 columns):
 #   Column                   Non-Null Count    Dtype  
---  ------                   --------------    -----  
 0   IncidentNumber           1591527 non-null  object 
 1   CalYear                  1591527 non-null  int64  
 2   HourOfCall               1591527 non-null  int64  
 3   PropertyType             1591527 non-null  object 
 4   Postcode_district        1591527 non-null  object 
 5   NumPumpsAttending        1591527 non-null  float64
 6   StopCode                 1591527 non-null  object 
 7   Month                    1591527 non-null  int64  
 8   DayOfWeek                1591527 non-null  int64  
 9   PumpSecondsOnSite_min    1591527 non-null  float64
 10  PumpSecondsOnSite_mean   1591527 non-null  float64
 11  PumpSecondsOnSite_max    1591527 non-null  float64
 12  TurnoutTimeSeconds_min   1591527 non-null  float64
 13  TurnoutTimeSeconds_mean  1591527 non-null 

None

StopCode 26
PropertyType 292
Postcode_district 324

Test de PumpSecondsOnSite_min
Test de PumpSecondsOnSite_mean
Test de PumpSecondsOnSite_max
Test de TurnoutTimeSeconds_min
Test de TurnoutTimeSeconds_mean
Test de TurnoutTimeSeconds_max
Test de TravelTimeSeconds_min
Test de TravelTimeSeconds_mean
Test de TravelTimeSeconds_max


Unnamed: 0,PumpSecondsOnSite_min coefficients,PumpSecondsOnSite_min pvalues
Intercept,812.586,0.19
StopCode[T.CHIMNEY FIRE],2856.532,0.0
StopCode[T.LATE CALL],1230.093,0.0
StopCode[T.PRIMARY FIRE],1551.532,0.0
StopCode[T.SECONDARY FIRE],443.792,0.0


Unnamed: 0,PumpSecondsOnSite_mean coefficients,PumpSecondsOnSite_mean pvalues
Intercept,781.555,0.229
StopCode[T.CHIMNEY FIRE],3025.469,0.0
StopCode[T.LATE CALL],1139.469,0.0
StopCode[T.PRIMARY FIRE],2029.01,0.0
StopCode[T.SECONDARY FIRE],448.303,0.0


Unnamed: 0,PumpSecondsOnSite_max coefficients,PumpSecondsOnSite_max pvalues
Intercept,351.056,0.631
StopCode[T.CHIMNEY FIRE],3141.756,0.0
StopCode[T.LATE CALL],1013.849,0.0
StopCode[T.PRIMARY FIRE],2652.239,0.0
StopCode[T.SECONDARY FIRE],447.871,0.0


Unnamed: 0,TurnoutTimeSeconds_min coefficients,TurnoutTimeSeconds_min pvalues
Intercept,87.712,0.0
StopCode[T.CHIMNEY FIRE],1.926,0.516
StopCode[T.LATE CALL],16.018,0.004
StopCode[T.PRIMARY FIRE],-2.037,0.0
StopCode[T.SECONDARY FIRE],4.272,0.0


Unnamed: 0,TurnoutTimeSeconds_mean coefficients,TurnoutTimeSeconds_mean pvalues
Intercept,101.868,0.0
StopCode[T.CHIMNEY FIRE],1.191,0.692
StopCode[T.LATE CALL],5.858,0.304
StopCode[T.PRIMARY FIRE],0.498,0.002
StopCode[T.SECONDARY FIRE],0.444,0.125


Unnamed: 0,TurnoutTimeSeconds_max coefficients,TurnoutTimeSeconds_max pvalues
Intercept,122.609,0.0
StopCode[T.CHIMNEY FIRE],-0.894,0.804
StopCode[T.LATE CALL],-5.748,0.399
StopCode[T.PRIMARY FIRE],4.006,0.0
StopCode[T.SECONDARY FIRE],-3.949,0.0


Unnamed: 0,TravelTimeSeconds_min coefficients,TravelTimeSeconds_min pvalues
Intercept,451.722,0.0
StopCode[T.CHIMNEY FIRE],-1.7,0.866
StopCode[T.LATE CALL],34.892,0.068
StopCode[T.PRIMARY FIRE],-7.928,0.0
StopCode[T.SECONDARY FIRE],-11.341,0.0


Unnamed: 0,TravelTimeSeconds_mean coefficients,TravelTimeSeconds_mean pvalues
Intercept,512.153,0.0
StopCode[T.CHIMNEY FIRE],-6.288,0.547
StopCode[T.LATE CALL],-6.697,0.735
StopCode[T.PRIMARY FIRE],6.532,0.0
StopCode[T.SECONDARY FIRE],-26.229,0.0


Unnamed: 0,TravelTimeSeconds_max coefficients,TravelTimeSeconds_max pvalues
Intercept,556.895,0.0
StopCode[T.CHIMNEY FIRE],-11.411,0.348
StopCode[T.LATE CALL],-49.299,0.032
StopCode[T.PRIMARY FIRE],24.055,0.0
StopCode[T.SECONDARY FIRE],-41.506,0.0


continue
merge
merge
continue
merge
merge
continue
merge
merge
Calcule Discords
PumpSecondsOnSite_mean pvalues 0.051 PumpSecondsOnSite_max pvalues 0.027 True
PumpSecondsOnSite_mean pvalues 0.107 PumpSecondsOnSite_max pvalues 0.141 False
PumpSecondsOnSite_mean pvalues 0.067 PumpSecondsOnSite_max pvalues 0.046 True
PumpSecondsOnSite_mean pvalues 0.074 PumpSecondsOnSite_max pvalues 0.673 False
PumpSecondsOnSite_mean pvalues 0.079 PumpSecondsOnSite_max pvalues 0.423 False
PumpSecondsOnSite_mean pvalues 0.25 PumpSecondsOnSite_max pvalues 0.015 True
PumpSecondsOnSite_mean pvalues 0.071 PumpSecondsOnSite_max pvalues 0.508 False
PumpSecondsOnSite_mean pvalues 0.174 PumpSecondsOnSite_max pvalues 0.865 False
PumpSecondsOnSite_mean pvalues 0.099 PumpSecondsOnSite_max pvalues 0.533 False
PumpSecondsOnSite_mean pvalues 0.112 PumpSecondsOnSite_max pvalues 0.561 False
PumpSecondsOnSite_mean pvalues 0.225 PumpSecondsOnSite_max pvalues 0.957 False
PumpSecondsOnSite_mean pvalues 0.151 PumpSecondsOnSite_

Unnamed: 0,PumpSecondsOnSite_min coefficients,PumpSecondsOnSite_min pvalues,PumpSecondsOnSite_mean coefficients,PumpSecondsOnSite_mean pvalues,PumpSecondsOnSite_max coefficients,PumpSecondsOnSite_max pvalues,Discord,Keep
Postcode_district[T.CR6],1162.606,0.034,1120.016,0.051,1426.907,0.027,True,True
Postcode_district[T.KT22],1420.584,0.036,1144.002,0.107,1177.248,0.141,True,False
Postcode_district[T.TN14],1099.578,0.041,1030.426,0.067,1268.336,0.046,True,True
PropertyType[T.AIRFIELD/RUNWAY],-1030.825,0.009,-739.04,0.074,197.09,0.673,True,False
PropertyType[T.BARBECUE],-882.688,0.012,-646.26,0.079,-331.87,0.423,True,False


TurnoutTimeSeconds_mean pvalues 0.011 TurnoutTimeSeconds_max pvalues 0.001 True
TurnoutTimeSeconds_mean pvalues 0.002 TurnoutTimeSeconds_max pvalues 0.001 True
TurnoutTimeSeconds_mean pvalues 0.053 TurnoutTimeSeconds_max pvalues 0.025 True
TurnoutTimeSeconds_mean pvalues 0.003 TurnoutTimeSeconds_max pvalues 0.0 True
TurnoutTimeSeconds_mean pvalues 0.002 TurnoutTimeSeconds_max pvalues 0.0 True
TurnoutTimeSeconds_mean pvalues 0.001 TurnoutTimeSeconds_max pvalues 0.0 True
TurnoutTimeSeconds_mean pvalues 0.008 TurnoutTimeSeconds_max pvalues 0.001 True
TurnoutTimeSeconds_mean pvalues 0.002 TurnoutTimeSeconds_max pvalues 0.0 True
TurnoutTimeSeconds_mean pvalues 0.041 TurnoutTimeSeconds_max pvalues 0.011 True
TurnoutTimeSeconds_mean pvalues 0.005 TurnoutTimeSeconds_max pvalues 0.001 True
TurnoutTimeSeconds_mean pvalues 0.046 TurnoutTimeSeconds_max pvalues 0.01 True
TurnoutTimeSeconds_mean pvalues 0.031 TurnoutTimeSeconds_max pvalues 0.005 True
TurnoutTimeSeconds_mean pvalues 0.003 TurnoutTime

Unnamed: 0,TurnoutTimeSeconds_min coefficients,TurnoutTimeSeconds_min pvalues,TurnoutTimeSeconds_mean coefficients,TurnoutTimeSeconds_mean pvalues,TurnoutTimeSeconds_max coefficients,TurnoutTimeSeconds_max pvalues,Discord,Keep
PropertyType[T.AIRPORT - HANGAR],-10.2,0.336,-27.175,0.011,-42.974,0.001,True,True
PropertyType[T.AIRPORT BUILDING (NOT TERMINAL OR HANGAR)],-18.868,0.061,-31.739,0.002,-40.978,0.001,True,True
PropertyType[T.ANIMAL BOARDING/BREEDING ESTABLISHMENT - CATS],-18.036,0.243,-30.304,0.053,-41.992,0.025,True,True
PropertyType[T.ANIMAL PRODUCTS PROCESSING PLANT],-14.16,0.187,-31.838,0.003,-49.378,0.0,True,True
PropertyType[T.ART GALLERY],-16.716,0.094,-31.842,0.002,-46.381,0.0,True,True


TravelTimeSeconds_mean pvalues 0.027 TravelTimeSeconds_max pvalues 0.038 True
TravelTimeSeconds_mean pvalues 0.022 TravelTimeSeconds_max pvalues 0.025 True
TravelTimeSeconds_mean pvalues 0.017 TravelTimeSeconds_max pvalues 0.027 True
TravelTimeSeconds_mean pvalues 0.034 TravelTimeSeconds_max pvalues 0.074 True
TravelTimeSeconds_mean pvalues 0.124 TravelTimeSeconds_max pvalues 0.321 False
TravelTimeSeconds_mean pvalues 0.032 TravelTimeSeconds_max pvalues 0.036 True
TravelTimeSeconds_mean pvalues 0.551 TravelTimeSeconds_max pvalues 0.033 True
TravelTimeSeconds_mean pvalues 0.037 TravelTimeSeconds_max pvalues 0.057 True
TravelTimeSeconds_mean pvalues 0.042 TravelTimeSeconds_max pvalues 0.05 True
TravelTimeSeconds_mean pvalues 0.03 TravelTimeSeconds_max pvalues 0.041 True
TravelTimeSeconds_mean pvalues 0.023 TravelTimeSeconds_max pvalues 0.035 True
TravelTimeSeconds_mean pvalues 0.039 TravelTimeSeconds_max pvalues 0.057 True
TravelTimeSeconds_mean pvalues 0.028 TravelTimeSeconds_max pvalue

Unnamed: 0,TravelTimeSeconds_min coefficients,TravelTimeSeconds_min pvalues,TravelTimeSeconds_mean coefficients,TravelTimeSeconds_mean pvalues,TravelTimeSeconds_max coefficients,TravelTimeSeconds_max pvalues,Discord,Keep
Postcode_district[T.BR2],-85.978,0.082,-113.192,0.027,-123.569,0.038,True,True
Postcode_district[T.BR5],-86.692,0.08,-117.334,0.022,-133.07,0.025,True,True
Postcode_district[T.BR6],-96.375,0.051,-121.691,0.017,-132.035,0.027,True,True
Postcode_district[T.CM13],151.945,0.015,136.776,0.034,134.681,0.074,True,True
Postcode_district[T.CM14],116.283,0.025,82.643,0.124,62.139,0.321,True,False


PumpSecondsOnSite 106 discords, 87 keeps, sur 616, conserve 14.0%
TurnoutTimeSeconds 133 discords, 287 keeps, sur 616, conserve 47.0%
TravelTimeSeconds 136 discords, 443 keeps, sur 616, conserve 72.0%


Unnamed: 0,Keep,Column,Value
Postcode_district[T.BR1],False,Postcode_district,BR1
Postcode_district[T.BR2],False,Postcode_district,BR2
Postcode_district[T.BR3],False,Postcode_district,BR3
Postcode_district[T.BR4],False,Postcode_district,BR4
Postcode_district[T.BR5],False,Postcode_district,BR5
Postcode_district[T.BR6],False,Postcode_district,BR6
Postcode_district[T.BR7],False,Postcode_district,BR7
Postcode_district[T.BR8],True,Postcode_district,BR8
Postcode_district[T.CM13],False,Postcode_district,CM13
Postcode_district[T.CM14],False,Postcode_district,CM14


keep PumpSecondsOnSite


Unnamed: 0,Keep,Column,Value
Postcode_district[T.BR1],False,Postcode_district,BR1
Postcode_district[T.BR2],False,Postcode_district,BR2
Postcode_district[T.BR3],False,Postcode_district,BR3
Postcode_district[T.BR4],False,Postcode_district,BR4
Postcode_district[T.BR5],False,Postcode_district,BR5
Postcode_district[T.BR6],False,Postcode_district,BR6
Postcode_district[T.BR7],False,Postcode_district,BR7
Postcode_district[T.BR8],False,Postcode_district,BR8
Postcode_district[T.CM13],False,Postcode_district,CM13
Postcode_district[T.CM14],False,Postcode_district,CM14


keep TurnoutTimeSeconds


Unnamed: 0,Keep,Column,Value
Postcode_district[T.BR1],True,Postcode_district,BR1
Postcode_district[T.BR2],True,Postcode_district,BR2
Postcode_district[T.BR3],True,Postcode_district,BR3
Postcode_district[T.BR4],False,Postcode_district,BR4
Postcode_district[T.BR5],True,Postcode_district,BR5
Postcode_district[T.BR6],True,Postcode_district,BR6
Postcode_district[T.BR7],False,Postcode_district,BR7
Postcode_district[T.BR8],False,Postcode_district,BR8
Postcode_district[T.CM13],True,Postcode_district,CM13
Postcode_district[T.CM14],False,Postcode_district,CM14


keep TravelTimeSeconds
