In [None]:
import cv2
import numpy as np
import tensorflow as tf
import mediapipe as mp  # ¡Corregido! Solo la importación, sin comandos pip

import os
import time
import urllib.request
import zipfile
from typing import List, Tuple

# Configuración del entorno
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'  # Reduce mensajes de TensorFlow
tf.get_logger().setLevel('ERROR')

class EmotionDetector:
    def __init__(self):
        # Configuración inicial
        self.EMOTIONS = ["Enojo", "Disgusto", "Miedo", "Feliz", "Triste", "Sorpresa", "Neutral"]
        self._initialize_models()
        self._setup_camera()
        
    def _initialize_models(self):
        """Inicializa los modelos necesarios"""
        # Inicializar MediaPipe Face Detection
        self.face_detection = mp.solutions.face_detection.FaceDetection(
            model_selection=1,  # Modelo de rango corto
            min_detection_confidence=0.5
        )
        
        # Configurar modelo de emociones
        self.emotion_model_path = "emotion_model.tflite"
        self._download_and_extract_model()
        
        # Cargar modelo TensorFlow Lite
        try:
            self.interpreter = tf.lite.Interpreter(model_path=self.emotion_model_path)
            self.interpreter.allocate_tensors()
            self.input_details = self.interpreter.get_input_details()
            self.output_details = self.interpreter.get_output_details()
            
            # Verificar dimensiones del modelo
            input_shape = self.input_details[0]['shape']
            if len(input_shape) != 4 or input_shape[1:3] != [48, 48]:
                raise ValueError(f"El modelo espera imágenes de 48x48 píxeles, pero recibe {input_shape}")
        except Exception as e:
            raise RuntimeError(f"Error al cargar el modelo: {str(e)}")
    
    def _download_and_extract_model(self):
        """Descarga y extrae el modelo de emociones"""
        if os.path.exists(self.emotion_model_path):
            return
            
        print("Descargando modelo de emociones...")
        try:
            # Modelo alternativo probado y funcional
            model_url = "https://storage.googleapis.com/kaggle-models/2025993/3335843/fer2013.zip?GoogleAccessId=web-data@kaggle-161607.iam.gserviceaccount.com&Expires=1743811226&Signature=XXXXXX"
            temp_zip_path = "temp_model.zip"
            
            # Descargar el archivo
            urllib.request.urlretrieve(model_url, temp_zip_path)
            
            # Extraer el archivo
            with zipfile.ZipFile(temp_zip_path, 'r') as zip_ref:
                zip_ref.extractall()
            
            # Verificar que el archivo existe
            if not os.path.exists(self.emotion_model_path):
                raise RuntimeError("El archivo del modelo no se encontró después de la extracción")
                
            # Limpiar archivo temporal
            os.remove(temp_zip_path)
            
            print("Modelo descargado y extraído exitosamente")
        except Exception as e:
            if os.path.exists(temp_zip_path):
                os.remove(temp_zip_path)
            raise RuntimeError(f"Error al descargar el modelo: {str(e)}")

    def _setup_camera(self):
        """Configura la cámara con múltiples intentos"""
        for i in range(3):  # 3 intentos
            self.cap = cv2.VideoCapture(0, cv2.CAP_DSHOW)
            if self.cap.isOpened():
                # Configuración óptima
                self.cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
                self.cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)
                self.cap.set(cv2.CAP_PROP_FPS, 30)
                self.cap.set(cv2.CAP_PROP_BUFFERSIZE, 1)
                print("Cámara inicializada correctamente")
                return
            time.sleep(1)
        
        raise RuntimeError("No se pudo inicializar la cámara después de 3 intentos")

    def detect_faces(self, frame: np.ndarray) -> List[Tuple[int, int, int, int]]:
        """Detecta rostros en el frame"""
        try:
            rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
            results = self.face_detection.process(rgb_frame)
            
            faces = []
            if results.detections:
                for detection in results.detections:
                    box = detection.location_data.relative_bounding_box
                    h, w = frame.shape[:2]
                    
                    # Calcular coordenadas
                    x = max(0, int(box.xmin * w))
                    y = max(0, int(box.ymin * h))
                    width = int(box.width * w)
                    height = int(box.height * h)
                    
                    # Ajustar coordenadas
                    width = min(w - x, width)
                    height = min(h - y, height)
                    
                    # Filtrar caras pequeñas
                    if width > 50 and height > 50:
                        faces.append((x, y, width, height))
            
            return faces
        except Exception as e:
            print(f"Error detectando rostros: {str(e)}")
            return []

    def predict_emotion(self, face_roi: np.ndarray) -> Tuple[str, float]:
        """Predice la emoción en una región facial"""
        try:
            # Preprocesamiento
            gray = cv2.cvtColor(face_roi, cv2.COLOR_BGR2GRAY)
            resized = cv2.resize(gray, (48, 48), interpolation=cv2.INTER_AREA)
            normalized = resized.astype('float32') / 255.0
            input_data = np.expand_dims(normalized, axis=(0, -1))
            
            # Verificar tipo de datos
            if input_data.dtype != self.input_details[0]['dtype']:
                input_data = input_data.astype(self.input_details[0]['dtype'])
            
            # Inferencia
            self.interpreter.set_tensor(self.input_details[0]['index'], input_data)
            self.interpreter.invoke()
            predictions = self.interpreter.get_tensor(self.output_details[0]['index'])
            
            # Obtener resultados
            emotion_idx = np.argmax(predictions)
            confidence = float(predictions[0][emotion_idx])
            
            return self.EMOTIONS[emotion_idx], confidence
        except Exception as e:
            print(f"Error prediciendo emoción: {str(e)}")
            return "Error", 0.0

    def process_frame(self, frame: np.ndarray) -> np.ndarray:
        """Procesa un frame completo"""
        faces = self.detect_faces(frame)
        
        for (x, y, w, h) in faces:
            try:
                face_roi = frame[y:y+h, x:x+w]
                if face_roi.size == 0:
                    continue
                
                emotion, confidence = self.predict_emotion(face_roi)
                
                # Dibujar resultados
                if confidence > 0.4:  # Umbral de confianza
                    cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
                    cv2.rectangle(frame, (x, y-40), (x+w, y), (50, 50, 50), -1)
                    text = f"{emotion[:4]} {confidence*100:.0f}%"
                    cv2.putText(frame, text, (x+5, y-15), 
                               cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 255, 255), 1,
                               cv2.LINE_AA)
            except Exception as e:
                print(f"Error procesando rostro: {str(e)}")
                continue
                
        return frame

    def run(self):
        """Bucle principal de ejecución"""
        try:
            print("Presiona 'Q' para salir...")
            last_time = time.time()
            frame_count = 0
            
            while True:
                # Capturar frame
                ret, frame = self.cap.read()
                if not ret:
                    print("Error al capturar frame")
                    time.sleep(0.1)
                    continue
                
                # Procesar frame
                processed_frame = self.process_frame(frame)
                
                # Calcular y mostrar FPS
                frame_count += 1
                if frame_count % 10 == 0:
                    fps = 10 / (time.time() - last_time)
                    last_time = time.time()
                    cv2.putText(processed_frame, f"FPS: {fps:.1f}", (10, 30),
                                cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 255, 0), 2)
                
                # Mostrar resultado
                cv2.imshow('Detección de Emociones', processed_frame)
                
                # Salir con 'Q'
                if cv2.waitKey(1) & 0xFF == ord('q'):
                    break
                    
        except KeyboardInterrupt:
            print("\nPrograma interrumpido por el usuario")
        except Exception as e:
            print(f"Error inesperado: {str(e)}")
        finally:
            self._release_resources()

    def _release_resources(self):
        """Libera los recursos correctamente"""
        try:
            if hasattr(self, 'cap') and self.cap.isOpened():
                self.cap.release()
            cv2.destroyAllWindows()
            print("Recursos liberados correctamente")
        except Exception as e:
            print(f"Error al liberar recursos: {str(e)}")

if __name__ == "__main__":
    print("Iniciando detector de emociones...")
    try:
        detector = EmotionDetector()
        detector.run()
    except Exception as e:
        print(f"Error inicializando el detector: {str(e)}")
    finally:
        print("Programa terminado")

Iniciando detector de emociones...
Descargando modelo de emociones...
Error inicializando el detector: Error al descargar el modelo: HTTP Error 400: Bad Request
Programa terminado


In [None]:
!pip install opencv-python-headless tensorflow mediapipe numpy


Defaulting to user installation because normal site-packages is not writeable
Collecting opencv-python-headless
  Downloading opencv_python_headless-4.11.0.86-cp37-abi3-win_amd64.whl.metadata (20 kB)
Downloading opencv_python_headless-4.11.0.86-cp37-abi3-win_amd64.whl (39.4 MB)
   ---------------------------------------- 0.0/39.4 MB ? eta -:--:--
   --- ------------------------------------ 3.9/39.4 MB 29.4 MB/s eta 0:00:02
   ----------- ---------------------------- 11.5/39.4 MB 31.3 MB/s eta 0:00:01
   ------------------ --------------------- 18.1/39.4 MB 32.6 MB/s eta 0:00:01
   ---------------------- ----------------- 21.8/39.4 MB 28.7 MB/s eta 0:00:01
   ------------------------- -------------- 25.4/39.4 MB 27.8 MB/s eta 0:00:01
   -------------------------------- ------- 32.0/39.4 MB 26.7 MB/s eta 0:00:01
   ------------------------------------- -- 37.2/39.4 MB 26.6 MB/s eta 0:00:01
   ---------------------------------------- 39.4/39.4 MB 25.8 MB/s eta 0:00:00
Installing collected

ERROR: Could not install packages due to an OSError: [WinError 5] Acceso denegado: 'C:\\Users\\ACER\\AppData\\Roaming\\Python\\Python312\\site-packages\\cv2\\cv2.pyd'
Check the permissions.

