<a href="https://colab.research.google.com/github/nralibera/PAr_135/blob/main/fault_classification.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [17]:
import numpy as np
import random as rd
from tqdm import tqdm


## **I. Préparation des outils pour générer les données**
On a besoin de quelques fonctions afin de générer le tableau contenant les données d'entrainement du modèle. On souhaite notemment deux tableaux: le premier `matrix_data` contenant les matrices (3D avec shape=(n,m,p)) et le deuxième `label` contenant les fautes qui correspondent aux matrices (1D avec shape=(p)). Par exemple, la matrice `matrix_data(:,:,15)` correspond à la faute de type `label(15)`.

In [18]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [19]:
def build_matrix(matrix_line):
    matrix_line= [x.replace('\n','' ) for x in matrix_line] 
    matrix = np.array([[int(i) for i in x] for x in matrix_line])
    matrix= np.reshape(matrix,(55,108,1))
    return matrix

In [30]:
def build_data (filename,fault_list):
    matrix_file= open("/content/drive/My Drive/PAR/"+filename,"r")
    matrix_lines = matrix_file.readlines()
    matrix_file.close()
    
    matrix_lines = [line.replace("\n","") for line in matrix_lines]
    
    
    #initialisation
    matrix_data = build_matrix(matrix_lines[1:56])
    label_data = np.array([fault_list.index(matrix_lines[0])])
    
    for i in tqdm(range(56,len(matrix_lines),56)):
        label_data = np.concatenate([label_data,np.array([fault_list.index(matrix_lines[i])])])
        matrix = build_matrix(matrix_lines[i+1:i+56])
        matrix_data=np.concatenate([matrix_data,matrix],axis=2)
    
    return matrix_data,label_data

## **II. Contructions des données pour l'entrainement du modèle :**
Dans cette partie, nous allons construire les tableaux de données avec les fonctions définies ci-dessus. Nous allons, dans un premier tableau, construire la base de données avec les matrices des fautes permanentes ainsi que les fautes intermittentes. Le deuxième tableau contiendra les labels de chaque matrice.

In [24]:
#building the right_matrix
right_matrix_file=open('/content/drive/My Drive/PAR/right_matrix.txt',"r")
right_matrix = build_matrix(right_matrix_file.readlines())
right_matrix_file.close()

In [31]:
#building permanent_fault
fault_list_file = open('/content/drive/My Drive/PAR/fault_matrix_file2.txt',"r")
fault_list=fault_list_file.readlines()
fault_list_file.close()
fault_list = [fault_list[i].replace("\n","") for i in range(0,len(fault_list),56)]
permanent_fault_matrix,permanent_fault_label= build_data("fault_matrix_file2.txt",fault_list)

['N1\tSA0', 'N1\tSA1', 'N5\tSA0', 'N5\tSA1', 'U811/Z;U811/A;U811/B;N9;N12\tSA0', 'N9;U811/A\tSA1', 'N12;U811/B\tSA1', 'U811/Z\tSA1', 'U817/Z;U817/A;N15\tSA1', 'U817/Z;U817/A;N15\tSA0', 'N18\tSA0', 'N18\tSA1', 'N23\tSA0', 'N23\tSA1', 'N26\tSA0', 'N26\tSA1', 'N29\tSA0', 'N29\tSA1', 'N32\tSA0', 'N32\tSA1', 'N35\tSA0', 'N35\tSA1', 'N38\tSA0', 'N38\tSA1', 'N41\tSA0', 'N41\tSA1', 'U1237/Z;U1237/A;N44\tSA1', 'U1237/Z;U1237/A;N44\tSA0', 'N47\tSA0', 'N47\tSA1', 'N50\tSA0', 'N50\tSA1', 'N53;U1163/D0\tSA0', 'N53;U1163/D0\tSA1', 'U1163/Z\tSA0', 'U1163/Z\tSA1', 'U1163/S0\tSA0', 'U1163/S0\tSA1', 'U1163/D1\tSA0', 'U1163/D1\tSA1', 'N54;U1162/D0\tSA0', 'N54;U1162/D0\tSA1', 'U1162/Z\tSA0', 'U1162/Z\tSA1', 'U1162/S0\tSA0', 'U1162/S0\tSA1', 'U1162/D1\tSA0', 'U1162/D1\tSA1', 'N55;U1165/D1\tSA0', 'N55;U1165/D1\tSA1', 'U1165/Z\tSA0', 'U1165/Z\tSA1', 'U1165/S0\tSA0', 'U1165/S0\tSA1', 'U1165/D0\tSA0', 'U1165/D0\tSA1', 'N56;U1175/D0\tSA0', 'N56;U1175/D0\tSA1', 'U1175/Z\tSA0', 'U1175/Z\tSA1', 'U1175/S0\tSA0', 'U

100%|██████████| 3608/3608 [01:37<00:00, 37.19it/s]


In [None]:
#building intermittent_fault matrix
fault_list_file2 = open('/content/drive/My Drive/PAR/equivalent_fault.txt',"r")
fault_list2=fault_list_file2.readlines()
fault_list_file2.close()
fault_list2 = [i.replace("\n","") for i in fault_list2]

intermittent_fault1_matrix,intermittent_fault1_label = build_data("intermittent_fault.txt",fault_list2)
intermittent_fault2_matrix,intermittent_fault2_label = build_data("intermittent_fault2.txt",fault_list2)


 15%|█▌        | 6197/40540 [04:31<44:27, 12.87it/s]

In [None]:
#Concatenating all faults in one matrix and label
matrix_data = np.concatenate([permanent_fault_matrix,intermittent_fault1_matrix,intermittent_fault2_matrix],axis=2)
labels = np.concatenate([permanent_fault_label,intermittent_fault1_label,intermittent_fault2_label])