In [None]:
import numpy as np
import pandas as pd
import math
import os
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.impute import SimpleImputer
from scipy.spatial.distance import euclidean

In [None]:
def load_signature_data(file_path):
    # Définir les noms de colonnes
    column_names = ['x', 'y', 'timestamp', 'button', 'azimuth', 'altitude', 'pressure']

    # Charger le fichier CSV dans un DataFrame Pandas en utilisant les noms de colonnes
    df = pd.read_csv(file_path, sep=' ', index_col=False, names=column_names)

    # Supprimer la première ligne qui contient le nombre de lignes
    df = df.iloc[1:]

    # Réinitialiser les index du DataFrame
    df = df.reset_index(drop=True)
    
    return df

In [None]:
def CalculeFeature(df):
    epsilon = 1e-8  # Small epsilon value to avoid division by zero
    # Calculer la différence de coordonnées à chaque instant
    delta_x = df['x'].diff()
    delta_y = df['y'].diff()

    # Calculer la norme de la vitesse à chaque instant
    delta_t = df['timestamp'].diff() + epsilon
    vitesse = np.sqrt(delta_x**2 + delta_y**2) / delta_t

    # Calculer la norme de l'accélération à chaque instant
    acceleration = vitesse.diff() / delta_t
    df['acceleration'] = acceleration 

    # Calculer l'inclinaison du stylo
    pen_incl = np.arctan2(df['altitude'], df['azimuth'])
    df['pen_incl'] = pen_incl 
      
    # Calculer les dérivées secondes des coordonnées à chaque point

    dx = np.gradient(df['x'])
    dy = np.gradient(df['y'])

    d2x = np.gradient(dx)
    d2y = np.gradient(dy)

    denominator = np.power(dx*dx + dy*dy, 1.5) + epsilon  # Add epsilon to denominator
    curvature = np.abs(d2x*dy - dx*d2y) / denominator
    
    df['curvature'] = curvature
    if df.isnull().any().any():  # Check if any column has null values
        df = df.fillna(df.mean())
    return df 

In [None]:
def Fiturescomaper(df):
    nouvelledf = df[['x', 'y', 'timestamp', 'pen_incl', 'curvature', 'acceleration']]
    return nouvelledf

def DonnerClasse(directory):
    # Initialiser une liste pour stocker les DataFrames de chaque utilisateur
    dfs = []

    # Parcourir tous les fichiers du répertoire
    for filename in os.listdir(directory):
        if filename.endswith('.TXT'):
            # Joindre le chemin du fichier avec le répertoire de travail actuel
            file_path = os.path.join(directory, filename)

            df = Fiturescomaper(CalculeFeature(load_signature_data(file_path)))

            user_id, signature_id = filename.split('S')
            user_id = int(user_id[1:])
            signature_id = int(signature_id[:-4]) 

            df['classe'] = user_id
        
            # Ajouter le DataFrame à la liste
            dfs.append(df)
    
    # Concaténer tous les DataFrames en un seul DataFrame
    result = pd.concat(dfs, axis=0, ignore_index=True)

    return result 

In [None]:
def KNN(data):
# Séparer les données en ensembles d'entraînement et de test
 X = data[['x', 'y', 'timestamp', 'pen_incl', 'curvature', 'acceleration']]
 y = data['classe']
 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

# Remplacer les valeurs infinies ou trop grandes par NaN
 X_train[~np.isfinite(X_train)] = 0
 X_test[~np.isfinite(X_test)] = 0

# Imputer les valeurs manquantes par la moyenne de chaque colonne
 imputer = SimpleImputer(strategy='mean')
 X_train = imputer.fit_transform(X_train)
 X_test = imputer.transform(X_test)

# Appliquer l'algorithme KNN avec k=5
 k = 3
 knn = KNeighborsClassifier(n_neighbors=k)
 knn.fit(X_train, y_train)

# Prédire les classes pour les données de test
 y_pred = knn.predict(X_test)

# Calculerl'accuracy
 accuracy = accuracy_score(y_test, y_pred)
 print('knn Accuracy:', accuracy)

 return knn

In [None]:
def compare_signatures(signature_path1, signature_path2):
  
    signature1 = Fiturescomaper(CalculeFeature(load_signature_data(signature_path1)))
    signature2 = Fiturescomaper(CalculeFeature(load_signature_data(signature_path2)))

    data = DonnerClasse('data/Task1/') 
    knn=KNN(data) 
   
    minN = min(len(signature1), len(signature2))
    
    y1=knn.predict(signature1.iloc[:minN,:])
    y2=knn.predict(signature2.iloc[:minN,:]) 

    accuracy = accuracy_score(y1, y2)   
    if abs(len(signature1) - len(signature2)) > 20:
        similarity=False
    elif accuracy>0.90 : 
        similarity = True
    else :
        similarity = False
    return accuracy , similarity

In [None]:
# Définir le répertoire contenant les fichiers texte
directory = './data/Task1/'

data = DonnerClasse(directory)

acc=compare_signatures("./data/Task1/U1S13.TXT", "./data/Task1/U10S11.TXT")
print("",acc)

knn Accuracy: 0.9937368614957849
 (0.9859154929577465, True)


