In [1]:
print("Hello World!")

Hello World!


#1 Operaciones Morfologicas

In [None]:
%pip install ipywidgets

In [None]:
%pip uninstall opencv-python opencv-python-headless -y

In [None]:
%pip install opencv-python

In [None]:
%pip install numpy

In [2]:
import cv2
import numpy as np

# Inicializar la captura de video desde la webcam (índice 0)
cap = cv2.VideoCapture(0)

# Definir el kernel
kernel = np.ones((5, 5), np.uint8)

# Crear una ventana de visualización
cv2.namedWindow('Estilizado en Tiempo Real', cv2.WINDOW_NORMAL)

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break
    
    smoothed = cv2.bilateralFilter(frame, d=9, sigmaColor=75, sigmaSpace=75)

    # Redimensionar el marco para procesamiento más rápido
    frame = cv2.resize(frame, (640, 480))

    # Convertir a escala de grises
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # Aplicar cierre
    closed = cv2.morphologyEx(gray, cv2.MORPH_CLOSE, kernel)

    # Aplicar apertura
    opened = cv2.morphologyEx(closed, cv2.MORPH_OPEN, kernel)

    # Aplicar binarización
    _, binary = cv2.threshold(opened, 120, 255, cv2.THRESH_BINARY_INV)

    # Calcular el gradiente morfológico
    gradient = cv2.morphologyEx(opened, cv2.MORPH_GRADIENT, kernel)

    # Invertir el gradiente para obtener bordes en blanco sobre fondo negro
    gradient_inv = cv2.bitwise_not(gradient)

    # Convertir el gradiente a tres canales
    gradient_colored = cv2.cvtColor(gradient_inv, cv2.COLOR_GRAY2BGR)

    # Aplicar el efecto de dibujo
    styled_frame = cv2.bitwise_and(smoothed, gradient_colored)

    # Mostrar el fotograma en proceso
    cv2.imshow('Estilizado en Tiempo Real', styled_frame)

    # Romper el ciclo con 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberar recursos
cap.release()
cv2.destroyAllWindows()

#2 Yolo

In [None]:
%pip install ultralytics

In [None]:
# Instalar 
%pip install matplotlib

In [1]:
import cv2
from ultralytics import YOLO

model = YOLO("yolov5s.pt") 

# Iniciar la captura de video
cap = cv2.VideoCapture(0)

# Comprobar si la cámara está abierta
if not cap.isOpened():
    print("Error: No se pudo abrir la cámara.")
    exit()

while True:
    ret, frame = cap.read()
    if not ret:
        break
    
    # Realizar la detección de objetos
    results = model(frame)
    
    # Procesar los resultados
    for result in results:
        for box in result.boxes:
            # Convertir las coordenadas del tensor a una lista y luego a enteros
            xyxy = box.xyxy[0].cpu().numpy()  # Convertir a numpy array y luego a enteros
            x1, y1, x2, y2 = map(int, xyxy)  # Convertir a enteros
            
            # Obtener el índice de la clase y convertirlo a entero
            class_idx = int(box.cls[0])
            
            # Obtener el nombre de la clase utilizando el índice
            label = model.names[class_idx]
            
            # Dibujar la caja y la etiqueta en el frame
            cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)
            cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
    
    # Mostrar el video en tiempo real con las detecciones
    cv2.imshow('Detección en Tiempo Real', frame)
    
    # Salir del bucle si se presiona 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberar la cámara y cerrar las ventanas
cap.release()
cv2.destroyAllWindows()


PRO TIP  Replace 'model=yolov5s.pt' with new 'model=yolov5su.pt'.
YOLOv5 'u' models are trained with https://github.com/ultralytics/ultralytics and feature improved performance vs standard YOLOv5 models trained with https://github.com/ultralytics/yolov5.


0: 480x640 (no detections), 207.8ms
Speed: 0.5ms preprocess, 207.8ms inference, 0.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 185.7ms
Speed: 0.0ms preprocess, 185.7ms inference, 0.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 186.8ms
Speed: 0.0ms preprocess, 186.8ms inference, 8.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 186.9ms
Speed: 0.0ms preprocess, 186.9ms inference, 0.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 180.2ms
Speed: 0.0ms preprocess, 180.2ms inference, 1.2ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 177.7ms
Speed: 1.1ms preprocess, 177.7ms

Note: you may need to restart the kernel to use updated packages.


#3 Unet

In [10]:
%pip install tensorflow tensorflow-hub

Collecting tensorflow-hub
  Downloading tensorflow_hub-0.16.1-py2.py3-none-any.whl.metadata (1.3 kB)
Collecting tf-keras>=2.14.1 (from tensorflow-hub)
  Downloading tf_keras-2.16.0-py3-none-any.whl.metadata (1.6 kB)
Downloading tensorflow_hub-0.16.1-py2.py3-none-any.whl (30 kB)
Downloading tf_keras-2.16.0-py3-none-any.whl (1.7 MB)
   ---------------------------------------- 0.0/1.7 MB ? eta -:--:--
    --------------------------------------- 0.0/1.7 MB 660.6 kB/s eta 0:00:03
   -- ------------------------------------- 0.1/1.7 MB 880.9 kB/s eta 0:00:02
   -- ------------------------------------- 0.1/1.7 MB 901.1 kB/s eta 0:00:02
   ---- ----------------------------------- 0.2/1.7 MB 1.1 MB/s eta 0:00:02
   ---- ----------------------------------- 0.2/1.7 MB 1.1 MB/s eta 0:00:02
   ---- ----------------------------------- 0.2/1.7 MB 772.8 kB/s eta 0:00:02
   ----- ---------------------------------- 0.3/1.7 MB 827.5 kB/s eta 0:00:02
   ------ --------------------------------- 0.3/1.7 MB 8

In [None]:
%pip install keras

In [14]:
%pip install segmentation-models-pytorch


Collecting segmentation-models-pytorch
  Downloading segmentation_models_pytorch-0.3.3-py3-none-any.whl.metadata (30 kB)
Collecting pretrainedmodels==0.7.4 (from segmentation-models-pytorch)
  Downloading pretrainedmodels-0.7.4.tar.gz (58 kB)
     ---------------------------------------- 0.0/58.8 kB ? eta -:--:--
     -------------------- ------------------- 30.7/58.8 kB ? eta -:--:--
     ---------------------------------------- 58.8/58.8 kB 1.0 MB/s eta 0:00:00
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Collecting efficientnet-pytorch==0.7.1 (from segmentation-models-pytorch)
  Downloading efficientnet_pytorch-0.7.1.tar.gz (21 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Collecting timm==0.9.2 (from segmentation-models-pytorch)
  Downloading timm-0.9.2-py3-none-any.whl.metadata (68 kB)
     ---------------------------------------- 0.0/68.5 kB ? eta -:--:--
     ----

In [2]:
%pip install --upgrade pip

Collecting pip
  Downloading pip-24.1-py3-none-any.whl.metadata (3.6 kB)
Downloading pip-24.1-py3-none-any.whl (1.8 MB)
   ---------------------------------------- 0.0/1.8 MB ? eta -:--:--
   ---------------------------------------- 0.0/1.8 MB ? eta -:--:--
   ---------------------------------------- 0.0/1.8 MB ? eta -:--:--
   - -------------------------------------- 0.1/1.8 MB 656.4 kB/s eta 0:00:03
   -- ------------------------------------- 0.1/1.8 MB 1.1 MB/s eta 0:00:02
   --- ------------------------------------ 0.2/1.8 MB 1.1 MB/s eta 0:00:02
   ----- ---------------------------------- 0.2/1.8 MB 1.4 MB/s eta 0:00:02
   ------- -------------------------------- 0.3/1.8 MB 1.4 MB/s eta 0:00:02
   ---------- ----------------------------- 0.5/1.8 MB 1.6 MB/s eta 0:00:01
   ----------- ---------------------------- 0.5/1.8 MB 1.7 MB/s eta 0:00:01
   -------------- ------------------------- 0.7/1.8 MB 1.6 MB/s eta 0:00:01
   ----------------- ---------------------- 0.8/1.8 MB 1.9 MB/s

In [3]:
%pip install --upgrade certifi

Note: you may need to restart the kernel to use updated packages.


In [4]:
%pip install --upgrade --force-reinstall ssl

Collecting ssl
  Downloading ssl-1.16.tar.gz (33 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'error'
Note: you may need to restart the kernel to use updated packages.


  error: subprocess-exited-with-error
  
  × python setup.py egg_info did not run successfully.
  │ exit code: 1
  ╰─> [21 lines of output]
      Traceback (most recent call last):
        File "<string>", line 2, in <module>
        File "<pip-setuptools-caller>", line 14, in <module>
        File "c:\Projects\TF-PROC.IMAGES\.venv\Lib\site-packages\setuptools\__init__.py", line 16, in <module>
          from .dist import Distribution
        File "c:\Projects\TF-PROC.IMAGES\.venv\Lib\site-packages\setuptools\dist.py", line 30, in <module>
          from . import _entry_points
        File "c:\Projects\TF-PROC.IMAGES\.venv\Lib\site-packages\setuptools\_entry_points.py", line 6, in <module>
          from .extern.jaraco.text import yield_lines
        File "c:\Projects\TF-PROC.IMAGES\.venv\Lib\site-packages\setuptools\_vendor\jaraco\text\__init__.py", line 12, in <module>
          from setuptools.extern.jaraco.context import ExceptionTrap
        File "c:\Projects\TF-PROC.IMAGES\.venv\

In [14]:
%pip install kagglehub

Collecting kagglehub
  Downloading kagglehub-0.2.5-py3-none-any.whl.metadata (18 kB)
Downloading kagglehub-0.2.5-py3-none-any.whl (34 kB)
Installing collected packages: kagglehub
Successfully installed kagglehub-0.2.5
Note: you may need to restart the kernel to use updated packages.


In [19]:
import torch
import torchvision.models as models
import torchvision.transforms as transforms  # Añadir esta línea

# Descargar el modelo UNet preentrenado
model = models.segmentation.deeplabv3_resnet101(pretrained=True)
model = model.eval()  # Establecer el modelo en modo de evaluación (no entrenamiento)


In [2]:
import torch
import torchvision.models as models
import torchvision.transforms as transforms
import cv2

# Descargar el modelo FCN-ResNet101 preentrenado
model = models.segmentation.fcn_resnet101(pretrained=True)
model = model.eval()  # Establecer el modelo en modo de evaluación (no entrenamiento)

# Función para preprocesar la imagen capturada
def preprocess_image(img):
    # Redimensionar imagen a tamaño esperado por el modelo
    transform = transforms.Compose([
        transforms.ToPILImage(),
        transforms.Resize((256, 256)),
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
    ])
    img = transform(img)
    img = img.unsqueeze(0)  # Agregar dimensión batch (1, C, H, W)
    return img

# Función para procesar el video desde la webcam
def process_video(model):
    cap = cv2.VideoCapture(0)  # Capturar video desde la primera cámara disponible
    
    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break
        
        # Preprocesar el frame capturado
        img = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        img_tensor = preprocess_image(img)
        
        # Pasar la imagen por el modelo FCN-ResNet101
        with torch.no_grad():
            output = model(img_tensor)['out'][0]
        
        # Convertir la salida del modelo a imagen numpy y ajustar para visualización
        output = output.argmax(0).byte().cpu().numpy()
        
        # Mostrar la imagen procesada en una ventana de OpenCV
        cv2.imshow('Segmentación en tiempo real', output)
        
        # Salir del bucle con 'q'
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    
    cap.release()
    cv2.destroyAllWindows()

# Llamar a la función para procesar el video
process_video(model)


Downloading: "https://download.pytorch.org/models/fcn_resnet101_coco-7ecb50ca.pth" to C:\Users\127573/.cache\torch\hub\checkpoints\fcn_resnet101_coco-7ecb50ca.pth
100%|██████████| 208M/208M [01:38<00:00, 2.21MB/s] 


## Ejemplos con imagenes

In [2]:
import cv2
import os
import numpy as np

# Obtener la ruta de la carpeta actual
current_folder = os.getcwd()
imgs_folder = os.path.join(current_folder, 'imgs')

# Función para aplicar un efecto de dibujo animado usando operaciones morfológicas
def cartoonize_image_morph(image_path):
    # Leer la imagen
    img = cv2.imread(image_path)
    if img is None:
        print(f"Error: no se puede leer la imagen {image_path}")
        return

    # Convertir a escala de grises
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    
    # Aplicar la operación de gradiente morfológico
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2, 2))
    gradient = cv2.morphologyEx(gray, cv2.MORPH_GRADIENT, kernel)

    # Aplicar un umbral al gradiente
    _, gradient_thresh = cv2.threshold(gradient, 40, 220, cv2.THRESH_BINARY)

    # Invertir el gradiente para obtener los bordes en blanco
    gradient_inv = cv2.bitwise_not(gradient_thresh)
    
    # Expande el gradiente invertido a tres canales para que coincida con la imagen original
    expanded_gradient_inv = cv2.merge([gradient_inv, gradient_inv, gradient_inv])

    # Combinar la imagen original con los bordes
    cartoon = cv2.bitwise_and(img, expanded_gradient_inv)

    return cartoon

# Procesar todas las imágenes en la carpeta 'imgs'
for filename in os.listdir(imgs_folder):
    # Filtrar solo archivos de imagen comunes
    if filename.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.gif', '.webp')):
        input_path = os.path.join(imgs_folder, filename)
        output_path_cartoon = os.path.join(current_folder, f'cartoon_{filename}')
        
        # Procesar la imagen
        cartoon_image = cartoonize_image_morph(input_path)
        
        # Guardar la imagen procesada
        if cartoon_image is not None:
            cv2.imwrite(output_path_cartoon, cartoon_image)

print("Procesamiento completado. Las imágenes se han guardado en la carpeta actual.")


Procesamiento completado. Las imágenes se han guardado en la carpeta actual.


#Ejemplos con Videos

In [3]:
import torch
import torchvision.models as models
import torchvision.transforms as transforms
import cv2

# Descargar el modelo FCN-ResNet101 preentrenado
model = models.segmentation.fcn_resnet101(pretrained=True)
model = model.eval()  # Establecer el modelo en modo de evaluación (no entrenamiento)

# Función para preprocesar la imagen capturada
def preprocess_image(img):
    # Redimensionar imagen a tamaño esperado por el modelo (128x128 píxeles)
    transform = transforms.Compose([
        transforms.ToPILImage(),  # Convertir la imagen de numpy array a PIL Image
        transforms.Resize((128, 128)),  # Redimensionar la imagen a 128x128 píxeles
        transforms.ToTensor(),  # Convertir la imagen a un tensor de PyTorch
        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),  # Normalizar los valores de los píxeles
    ])
    img = transform(img)  # Aplicar todas las transformaciones definidas arriba a la imagen
    img = img.unsqueeze(0)  # Agregar una dimensión adicional al tensor (batch dimension)
    return img

# Función para procesar un video
def process_video(input_file, output_file=None):
    cap = cv2.VideoCapture(input_file)  # Abrir el archivo de video
    
    # Verificar si el video se abrió correctamente
    if not cap.isOpened():
        print(f"No se pudo abrir el archivo de video: {input_file}")
        return
    
    # Obtener las propiedades del video
    frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = int(cap.get(cv2.CAP_PROP_FPS))
    total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
    
    # Redimensionar la resolución del video de salida
    target_width = 128  # Ancho objetivo
    target_height = int(frame_height * (target_width / frame_width))  # Mantener la relación de aspecto
    target_size = (target_width, target_height)
    
    # Crear objeto para guardar el video procesado si se especifica un nombre de archivo de salida
    if output_file:
        out = cv2.VideoWriter(output_file, cv2.VideoWriter_fourcc(*'mp4v'), fps, target_size)
    
    frame_count = 0
    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break
        
        # Redimensionar el fotograma capturado
        frame_resized = cv2.resize(frame, target_size)
        
        # Preprocesar el frame redimensionado
        img = cv2.cvtColor(frame_resized, cv2.COLOR_BGR2RGB)
        img_tensor = preprocess_image(img)
        
        # Pasar la imagen por el modelo FCN-ResNet101
        with torch.no_grad():
            output = model(img_tensor)['out'][0]
        
        # Convertir la salida del modelo a imagen numpy y ajustar para visualización
        output = output.argmax(0).byte().cpu().numpy()
        
        # Mostrar la imagen procesada en la consola o guardarla en el video de salida
        if output_file:
            out.write(cv2.cvtColor(output, cv2.COLOR_GRAY2BGR))  # Convertir a formato BGR para guardar
        else:
            print(output)  # Mostrar el array numpy en la consola
        
        frame_count += 1
    
    cap.release()
    if output_file:
        out.release()
    cv2.destroyAllWindows()

# Llamar a la función para procesar el video
input_video = 'video.mkv'  # Reemplazar con el nombre de tu archivo de video
output_video = 'video_procesado.mkv'  # Opcional: nombre del archivo de salida, si deseas guardar el video procesado
process_video(input_video, output_video)


KeyboardInterrupt: 