In [None]:
data/
    piece_identite/
        id1.jpg
        id2.jpg
        ...
    diplome/
        diploma1.jpg
        diploma2.jpg
        ...


In [None]:
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam

# Chemins des répertoires de données
train_dir = 'data/train'
validation_dir = 'data/validation'

# Prétraitement des images et augmentation des données
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

validation_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(224, 224),
    batch_size=32,
    class_mode='binary'
)

validation_generator = validation_datagen.flow_from_directory(
    validation_dir,
    target_size=(224, 224),
    batch_size=32,
    class_mode='binary'
)

# Charger le modèle MobileNetV2 pré-entraîné sans la top layer
base_model = MobileNetV2(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# Ajouter des couches de classification
x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(1024, activation='relu')(x)
predictions = Dense(1, activation='sigmoid')(x)

# Définir le modèle complet
model = Model(inputs=base_model.input, outputs=predictions)

# Compiler le modèle
model.compile(optimizer=Adam(learning_rate=0.0001), loss='binary_crossentropy', metrics=['accuracy'])

# Entraîner le modèle
model.fit(train_generator, validation_data=validation_generator, epochs=10)

# Sauvegarder le modèle entraîné
model.save('document_classifier_model.h5')


In [None]:
from tensorflow.keras.models import load_model
from tensorflow.keras.preprocessing import image
import numpy as np

# Charger le modèle
model = load_model('document_classifier_model.h5')

# Charger et prétraiter une nouvelle image
img_path = 'path_to_new_image.jpg'
img = image.load_img(img_path, target_size=(224, 224))
img_array = image.img_to_array(img) / 255.0
img_array = np.expand_dims(img_array, axis=0)

# Prédire la catégorie de la nouvelle image
prediction = model.predict(img_array)
predicted_class = 'piece_identite' if prediction[0] < 0.5 else 'diplome'
print(predicted_class)


In [None]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import SVC
from sklearn.pipeline import make_pipeline
from sklearn.model_selection import train_test_split
from sklearn import metrics

# Exemple de données
documents = [
    "Diplôme en informatique de l'université X",
    "Carte d'identité de la République",
    "Support de cours de mathématiques",
    # ...
]
labels = ["Diplôme", "Pièce d'identité", "Support de cours"]

# Prétraitement et séparation des données
X_train, X_test, y_train, y_test = train_test_split(documents, labels, test_size=0.3, random_state=42)

# Pipeline TF-IDF et SVM
pipeline = make_pipeline(TfidfVectorizer(), SVC(kernel='linear'))

# Entraînement du modèle
pipeline.fit(X_train, y_train)

# Prédictions et évaluation
y_pred = pipeline.predict(X_test)
print(metrics.classification_report(y_test, y_pred))


In [None]:
# Classification de Documents

In [None]:
from flask import Flask, render_template, request
import os
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neighbors import KNeighborsClassifier
import joblib

app = Flask(__name__)

# Exemple de données d'entraînement (à remplacer par vos données réelles)
documents = [
    "Piece d'identite de Jean",
    "Diplome de Marie",
    "Support de cours de Maths",
    "Piece d'identite de Paul",
    "Diplome de Sophie",
    "Support de cours de Physique"
]
labels = [
    "Piece d'identite",
    "Diplome",
    "Support de cours",
    "Piece d'identite",
    "Diplome",
    "Support de cours"
]

# Conversion des documents en vecteurs TF-IDF
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(documents)
y = np.array(labels)

# Entraîner un classificateur KNN
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X, y)

# Sauvegarder le modèle et le vectorizer
joblib.dump(model, 'knn_model.pkl')
joblib.dump(vectorizer, 'tfidf_vectorizer.pkl')

@app.route('/classify', methods=['POST'])
def classify():
    document = request.form['document']
    
    # Charger le modèle et le vectorizer
    model = joblib.load('knn_model.pkl')
    vectorizer = joblib.load('tfidf_vectorizer.pkl')
    
    # Transformer le document en vecteur TF-IDF
    X_new = vectorizer.transform([document])
    
    # Prédire la catégorie du document
    prediction = model.predict(X_new)[0]
    
    return f'Le document est classé comme: {prediction}'

if __name__ == '__main__':
    app.run(debug=True)


In [None]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import SVC
from sklearn.pipeline import make_pipeline
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

# Exemple de données d'entraînement
documents = ["Document 1", "Document 2", ...]
labels = ["Classe 1", "Classe 2", ...]

# Diviser les données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(documents, labels, test_size=0.2, random_state=42)

# Créer un pipeline de prétraitement et de modèle
model = make_pipeline(TfidfVectorizer(), SVC(kernel='linear'))

# Entraîner le modèle
model.fit(X_train, y_train)

# Évaluer le modèle
predictions = model.predict(X_test)
print(classification_report(y_test, predictions))
