In [1]:
from PIL import Image
import os
import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras import layers, models
import numpy as np
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
import tensorflow as tf
from facenet_pytorch import MTCNN
import cv2
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.applications import EfficientNetB0
from sklearn.pipeline import Pipeline
from sklearn.base import BaseEstimator, TransformerMixin

In [5]:
# Класс для предобработки изображений
class ImagePreprocessor(BaseEstimator, TransformerMixin):
    def __init__(self):
        self.mtcnn = MTCNN(keep_all=True)

    def fit(self, X, y=None):
        return self  # Возвращаем сам объект для совместимости с Pipeline

    def transform(self, image_path):
        # Загрузка изображения
        image = Image.open(image_path)

        # Приведение к стандартному размеру
        standard_size = (1024, 1024)
        resized_image = image.resize(standard_size)

        # Обнаружение лиц
        boxes, _ = self.mtcnn.detect(image)

        if boxes is not None and len(boxes) == 1:
            print("На изображении одно лицо")
        else:
            print("Либо нет лица, либо несколько лиц")

        # Обнаружение лиц и ключевых точек
        boxes, probs, landmarks = self.mtcnn.detect(resized_image, landmarks=True)

        if landmarks is not None:
            landmark = landmarks[0]  # Используем первое лицо
            
            # Закомментированные строки, связанные с областью вокруг глаз
            left_eye, right_eye = landmark[0], landmark[1]
            eye_region = resized_image.crop((left_eye[0] - 70, left_eye[1] - 70, right_eye[0] + 70, right_eye[1] + 70))
            eye_region = eye_region.resize((224, 224)).convert('L')
            eye_region.show()
            eye_region_array = np.array(eye_region)
            eye_region_array = np.stack([eye_region] * 3, axis=-1)  # Дублируем канал
            #eye_region_array = np.array(eye_region) / 255.0  # Нормализация

            mouth_left, mouth_right = landmark[3], landmark[4]

            # Выделение и преобразование области вокруг рта
            mouth_region = resized_image.crop((mouth_left[0] - 70, mouth_left[1] - 70, mouth_right[0] + 70, mouth_right[1] + 70))
            mouth_region = mouth_region.resize((224, 224)).convert('L')
            
            mouth_region_array = np.array(mouth_region)
            mouth_region_array = np.stack([mouth_region_array] * 3, axis=-1)  # Дублируем канал
            # Конвертация в массив numpy и нормализация
            #mouth_region_array = np.array(mouth_region) / 255.0

            return eye_region_array, mouth_region_array
        else:
            raise ValueError("Не удалось обнаружить ключевые точки на изображении.")

def load_model(weights_path, dense_units, dropout_rate):
    base_model = EfficientNetB0(include_top=False, weights='imagenet', input_shape=(224, 224, 3))
    base_model.trainable = False  # Замораживаем базовую модель

    model = models.Sequential([
        base_model,
        layers.GlobalAveragePooling2D(),
        layers.Dense(dense_units, activation='relu'),
        layers.Dropout(dropout_rate),  # Можно изменить по необходимости
        layers.Dense(1, activation='sigmoid')  # Бинарная классификация
    ])

    # Загрузка весов, если они существуют
    try:
        model.load_weights(weights_path)
        print(f"Весы для {weights_path} загружены успешно")
    except Exception as e:
        print(f"Ошибка загрузки весов: {e}")

    return model

# Загрузка моделей для глаз и губ
model_lips = load_model("best_model_weights_lips.h5", 128, 0)
model_eyes = load_model("best_model_weights_eyes.h5", 256, 0.2)

# Функция для предсказания для губ
def predict_lips(image_path):
    preprocessor = ImagePreprocessor()
    _, mouth_region_array = preprocessor.transform(image_path)  # Получаем только массив губ

    # Изменение формы массива для входа в модель
    mouth_region_array = np.expand_dims(mouth_region_array, axis=0)

    # Получение предсказания
    prediction = model_lips.predict(mouth_region_array)
    
    return prediction[0][0]

# Функция для предсказания для глаз
def predict_eyes(image_path):
    preprocessor = ImagePreprocessor()
    eye_region_array, _ = preprocessor.transform(image_path)  # Получаем только массив глаз

    # Изменение формы массива для входа в модель
    eye_region_array = np.expand_dims(eye_region_array, axis=0)

    # Получение предсказания
    prediction = model_eyes.predict(eye_region_array)
    
    return prediction[0][0]

image_path = "data//jeremy.jpg"
probability_lips = predict_lips(image_path)
probability_eyes = predict_eyes(image_path)

print(f"Вероятность пластической операции на губах: {probability_lips:.4f}")
print(f"Вероятность пластической операции на глазах: {probability_eyes:.4f}")

Весы для best_model_weights_lips.h5 загружены успешно
Весы для best_model_weights_eyes.h5 загружены успешно
На изображении одно лицо
На изображении одно лицо
Вероятность пластической операции на губах: 0.0001
Вероятность пластической операции на глазах: 0.0480
