Alejandro Rodríguez Mesa, Visión por Computador


Tarea - Crea un Pop Art

Nota: La detección de movimiento y las líneas como contorno son interesantes, pero no están pulidos del todo. Les falta por captar muchos detalles, el rendimiento es un problema porque al tratar de valorar zonas más pequeñas de pixeles a la hora de calcular el promedio, se notaban muchos parones.

Paquetes necesarios

In [5]:

import cv2 as cv 
import numpy as np
import matplotlib.pyplot as plt


Inicializaciones

In [3]:
#Dimensiones de la imagen a crear
ancho = 600
alto = 600

Detección de movimiento


In [6]:
# Inicializamos la captura de video
vid = cv.VideoCapture(0)

# Se define el número de celdas en cada dimensión (ncells x ncells)
ncells = 10
cell_size = 4  # Tamaño de la celda (8x8 píxeles)
off = int(ncells / 2)

# Inicializamos fotograma anterior como None
previous_frame = None

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Convertimos el fotograma actual a escala de grises
    gray_frame = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    
    # Si no hay fotograma anterior, lo inicializamos con el actual
    if previous_frame is None:
        previous_frame = gray_frame
        continue
    
    # Creamos una imagen negra del mismo tamaño que el fotograma para mostrar los cambios
    diff_frame = np.zeros_like(gray_frame)
    
    # Dividimos la imagen en regiones de 8x8 píxeles y comparamos la intensidad promedio
    for i in range(0, gray_frame.shape[0], cell_size):
        for j in range(0, gray_frame.shape[1], cell_size):
            # Definimos la región de la celda en la imagen
            current_cell = gray_frame[i:i+cell_size, j:j+cell_size]
            previous_cell = previous_frame[i:i+cell_size, j:j+cell_size]
            
            # Calculamos la intensidad promedio en la celda actual y la celda anterior
            current_avg = np.mean(current_cell)
            previous_avg = np.mean(previous_cell)
            
            # Si la diferencia es mayor a un umbral, pintamos la celda de blanco
            if abs(current_avg - previous_avg) > 10:  # Umbral de diferencia (puedes ajustarlo)
                diff_frame[i:i+cell_size, j:j+cell_size] = 255  # Pinta de blanco
    
    # Mostramos el fotograma resultante con los cambios detectados
    cv.imshow('Cam', diff_frame)
    
    # Actualizamos el fotograma anterior
    previous_frame = gray_frame
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()

Deteccion de caras

In [None]:
# Cargamos el clasificador en cascada para la detección de rostros
face_cascade = cv.CascadeClassifier(cv.data.haarcascades + 'haarcascade_frontalface_default.xml')

# Inicializamos la captura de video
vid = cv.VideoCapture(0)

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Convertimos el fotograma actual a escala de grises
    gray_frame = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    
    # Detectamos rostros en el fotograma actual
    faces = face_cascade.detectMultiScale(gray_frame, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
    
    # Dibujamos un rectángulo alrededor de cada rostro detectado
    for (x, y, w, h) in faces:
        cv.rectangle(frame, (x, y), (x + w, y + h), (255, 0, 0), 2)
    
    # Mostramos el fotograma con los rostros detectados
    cv.imshow('Rostros detectados', frame)
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()


Efecto desenfoque de cara

In [7]:
# Cargamos el clasificador en cascada para la detección de rostros
face_cascade = cv.CascadeClassifier(cv.data.haarcascades + 'haarcascade_frontalface_default.xml')

# Inicializamos la captura de video
vid = cv.VideoCapture(0)

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Convertimos el fotograma actual a escala de grises
    gray_frame = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    
    # Detectamos rostros en el fotograma actual
    faces = face_cascade.detectMultiScale(gray_frame, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
    
    # Aplicacmos un desenfoque al area detectada como cara
    for (x, y, w, h) in faces:
        frame[y:y+h, x:x+w] = cv.GaussianBlur(frame[y:y+h, x:x+w], (51, 51), 30)
    
    # Mostramos el fotograma con los rostros detectados
    cv.imshow('Rostros detectados', frame)
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()

Cara de lineas


In [2]:
# Cargamos el clasificador en cascada para la detección de rostros
face_cascade = cv.CascadeClassifier(cv.data.haarcascades + 'haarcascade_frontalface_default.xml')

# Inicializamos la captura de video
vid = cv.VideoCapture(0)

# Se define el número de celdas en cada dimensión (ncells x ncells)
cell_size = 8  # Tamaño de la celda (8x8 píxeles)

# Inicializamos fotograma anterior como None
previous_frame = None

# Función para aplicar filtros de color pop art
def apply_pop_art_effect(frame):
    # Convertimos la imagen a color si está en escala de grises
    if len(frame.shape) == 2:  # Si es una imagen de un solo canal (escala de grises)
        frame = cv.cvtColor(frame, cv.COLOR_GRAY2BGR)

    # Aplicamos diferentes mapas de colores
    color_map1 = cv.applyColorMap(frame, cv.COLORMAP_HOT)
    color_map2 = cv.applyColorMap(frame, cv.COLORMAP_JET)
    color_map3 = cv.applyColorMap(frame, cv.COLORMAP_RAINBOW)
    color_map4 = cv.applyColorMap(frame, cv.COLORMAP_HSV)
    
    # Dividimos la imagen en 4 partes iguales y aplicamos diferentes mapas de color
    height, width = frame.shape[:2]
    half_height, half_width = height // 2, width // 2
    
    # Crear una imagen en blanco para combinar los efectos de color
    pop_art_frame = np.zeros_like(frame)

    # Asignar cada mapa de color a una sección
    pop_art_frame[:half_height, :half_width] = color_map1[:half_height, :half_width]
    pop_art_frame[:half_height, half_width:] = color_map2[:half_height, half_width:]
    pop_art_frame[half_height:, :half_width] = color_map3[half_height:, :half_width]
    pop_art_frame[half_height:, half_width:] = color_map4[half_height:, half_width:]
    
    return pop_art_frame

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Convertimos el fotograma actual a escala de grises (necesario para la detección de rostros y cambios)
    gray_frame = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    
    # Detectamos rostros en el fotograma actual
    faces = face_cascade.detectMultiScale(gray_frame, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
    
    # Si no hay fotograma anterior, lo inicializamos con el actual
    if previous_frame is None:
        previous_frame = gray_frame
        continue

    # Aplicamos un efecto pop art en la imagen en escala de grises
    pop_art_frame = apply_pop_art_effect(gray_frame)
    
    # Aplicamos el efecto de pintura de líneas a las regiones donde se detectaron rostros
    for (x, y, w, h) in faces:
        face_region = frame[y:y+h, x:x+w]
        
        # Aplicamos el detector de bordes de Canny para crear el efecto de líneas
        edges = cv.Canny(face_region, 100, 200)
        
        # Convertimos los bordes a un formato de 3 canales para combinarlo con la imagen original
        edges_colored = cv.cvtColor(edges, cv.COLOR_GRAY2BGR)
        
        # Reemplazamos la región del rostro original con el efecto de líneas
        pop_art_frame[y:y+h, x:x+w] = edges_colored

    # Dividimos la imagen en regiones de 8x8 píxeles y comparamos la intensidad promedio
    for i in range(0, gray_frame.shape[0], cell_size):
        for j in range(0, gray_frame.shape[1], cell_size):
            # Verificamos si la celda actual está dentro de un rostro
            in_face = False
            for (x, y, w, h) in faces:
                if x <= j < x + w and y <= i < y + h:
                    in_face = True
                    break
            
            if in_face:
                continue  # No aplicamos detección de cambios en los rostros
            
            # Definimos la región de la celda en la imagen
            current_cell = gray_frame[i:i + cell_size, j:j + cell_size]
            previous_cell = previous_frame[i:i + cell_size, j:j + cell_size]
            
            # Calculamos la intensidad promedio en la celda actual y la celda anterior
            current_avg = np.mean(current_cell)
            previous_avg = np.mean(previous_cell)
            
            # Si la diferencia es mayor a un umbral, pintamos la celda de blanco
            if abs(current_avg - previous_avg) > 10:  # Umbral de diferencia
                pop_art_frame[i:i + cell_size, j:j + cell_size] = (255, 255, 255)  # Celda blanca para indicar cambio
    
    # Mostramos el fotograma resultante con los cambios detectados y los rostros modificados
    cv.imshow('Pop Art Cam', pop_art_frame)
    
    # Actualizamos el fotograma anterior
    previous_frame = gray_frame
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()


ModuleNotFoundError: No module named 'cv'

Pop Art de lineas

In [12]:
import cv
import numpy as np

# Inicializamos la captura de video
vid = cv.VideoCapture(0)

# Se define el número de celdas en cada dimensión (ncells x ncells)
cell_size = 8  # Tamaño de la celda (8x8 píxeles)

# Inicializamos fotograma anterior como None
previous_frame = None

# Función para aplicar un estilo pop art basado en contornos de línea
def apply_pop_art_line_effect(frame):
    # Aplicamos el detector de bordes de Canny para obtener los contornos
    edges = cv.Canny(frame, 100, 200)
    
    # Convertimos los bordes a un formato de 3 canales (RGB)
    edges_colored = cv.cvtColor(edges, cv.COLOR_GRAY2BGR)
    
    # Aplicamos el mapa de color azul a los bordes
    color_map = cv.applyColorMap(edges_colored, cv.COLORMAP_JET)
    
    return color_map

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Convertimos el fotograma actual a escala de grises (necesario para detectar bordes)
    gray_frame = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)
    
    # Aplicamos el efecto pop art con contornos de líneas a toda la imagen
    pop_art_frame = apply_pop_art_line_effect(gray_frame)

    # Mostramos el fotograma resultante con el efecto de contornos de línea y pop art
    cv.imshow('Pop Art Line Cam', pop_art_frame)
    
    # Actualizamos el fotograma anterior
    previous_frame = gray_frame
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()


pop art Triangulos

In [17]:
import cv
import numpy as np

# Inicializamos la captura de video
vid = cv.VideoCapture(0)

# Tamaño de la celda para la segmentación (aumentado para reducir el número de triángulos)
cell_size = 24

def draw_triangle_grid(img, cell_size):
    height, width = img.shape[:2]
    triangles = []
    
    for y in range(0, height, cell_size):
        for x in range(0, width, cell_size):
            # Definimos las coordenadas de los triángulos
            points1 = np.array([[x, y], [x + cell_size, y], [x, y + cell_size]], np.int32)
            points2 = np.array([[x + cell_size, y], [x + cell_size, y + cell_size], [x, y + cell_size]], np.int32)
            triangles.append((points1, points2))
    
    return triangles

def apply_triangle_effect(frame, triangles):
    height, width = frame.shape[:2]
    output = np.zeros((height, width, 3), dtype=np.uint8)
    
    for points1, points2 in triangles:
        # Extraemos el color promedio del área del triángulo
        mask1 = np.zeros((height, width), dtype=np.uint8)
        cv.fillConvexPoly(mask1, points1, 255)
        color1 = cv.mean(frame, mask=mask1)[:3]

        mask2 = np.zeros((height, width), dtype=np.uint8)
        cv.fillConvexPoly(mask2, points2, 255)
        color2 = cv.mean(frame, mask=mask2)[:3]

        cv.fillConvexPoly(output, points1, color1)
        cv.fillConvexPoly(output, points2, color2)
    
    return output

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Dibujamos la malla de triángulos
    triangles = draw_triangle_grid(frame, cell_size)
    
    # Aplicamos el efecto triangular
    triangle_frame = apply_triangle_effect(frame, triangles)

    # Mostramos el fotograma resultante con el efecto triangular
    cv.imshow('Triangle Cam', triangle_frame)
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()


Pop Art circulos

In [18]:
import cv
import numpy as np

# Inicializamos la captura de video
vid = cv.VideoCapture(0)

# Tamaño de la celda para la segmentación (ajustado para los círculos)
cell_size = 24

def draw_circle_grid(img, cell_size):
    height, width = img.shape[:2]
    circles = []
    
    for y in range(cell_size // 2, height, cell_size):
        for x in range(cell_size // 2, width, cell_size):
            # Definimos las coordenadas de los círculos
            circles.append((x, y, cell_size // 2))
    
    return circles

def apply_circle_effect(frame, circles):
    height, width = frame.shape[:2]
    output = np.zeros((height, width, 3), dtype=np.uint8)
    
    for x, y, radius in circles:
        # Creamos una máscara circular
        mask = np.zeros((height, width), dtype=np.uint8)
        cv.circle(mask, (x, y), radius, 255, -1)
        
        # Extraemos el color promedio del área del círculo
        color = cv.mean(frame, mask=mask)[:3]

        # Aplicamos el color promedio al círculo en la imagen de salida
        cv.circle(output, (x, y), radius, color, -1)
    
    return output

while True:
    # Leemos el fotograma actual
    ret, frame = vid.read()
    
    # Verificamos que se haya leído correctamente el fotograma
    if not ret:
        break
    
    # Dibujamos la malla de círculos
    circles = draw_circle_grid(frame, cell_size)
    
    # Aplicamos el efecto de círculos
    circle_frame = apply_circle_effect(frame, circles)

    # Mostramos el fotograma resultante con el efecto de círculos
    cv.imshow('Circle Cam', circle_frame)
    
    # Si se presiona la tecla 'ESC', salimos del bucle
    if cv.waitKey(20) == 27:
        break

# Libera el objeto de captura y cierra las ventanas
vid.release()
cv.destroyAllWindows()
