## Detección de objetos con YOLO y OpenCV

El algoritmo YOLO revolucionó la detección de objetos al introducir un enfoque unificado que divide la imagen en una cuadrícula y predice cuadros delimitadores y probabilidades de clase dentro de cada celda de la cuadrícula. A diferencia de otros algoritmos que se basan en ventanas deslizantes o propuestas de regiones, YOLO realiza la detección en una sola pasada.
1. **Rendimiento en tiempo real**: la arquitectura de YOLO le permite lograr la detección de objetos en tiempo real, lo que lo hace adecuado para aplicaciones que requieren resultados rápidos y precisos.
2. **Simplicidad y eficiencia**: el diseño de una sola pasada de YOLO simplifica el proceso de detección y lo hace más eficiente computacionalmente en comparación con otros algoritmos.
3. **Robustez**: YOLO funciona bien incluso en imágenes con múltiples objetos u objetos de diferentes tamaños, gracias a su enfoque basado en cuadrícula.

### Configuración del entorno
1. Instalar las bibliotecas necesarias: comience instalando las bibliotecas necesarias, incluidas Ultralytics YOLO, OpenCV y cvzone. Puede usar pip o conda para instalar estas bibliotecas según sus preferencias.
2. Descargar los pesos de YOLO: YOLO requiere pesos entrenados previamente para realizar la detección de objetos. Puede descargar el archivo de pesos del repositorio oficial de Ultralytics o utilizar una fuente alternativa.

### Cargando el modelo YOLO
1. Importe las bibliotecas necesarias: comience importando las bibliotecas necesarias, incluidas YOLO del paquete Ultralytics, cv2 (OpenCV) y math.
2. Configurar el modelo YOLO: inicialice una instancia de la clase YOLO y cargue los pesos YOLO utilizando la ruta al archivo de pesos que descargó anteriormente.
3. Definir los nombres de las clases: crear una lista de nombres de clases correspondientes a las clases de salida del modelo YOLO. Los nombres de las clases suelen estar disponibles en la documentación o el conjunto de datos utilizados para entrenar el modelo YOLO.

https://docs.ultralytics.com/tasks/detect/


In [2]:
from ultralytics import YOLO
import  cv2
import cvzone
import math

#cap = cv2.VideoCapture(0)
cap = cv2.VideoCapture('./video/video1.MP4')
cap.set(3, 1280)
cap.set(4, 720)

model = YOLO('./yolo_model/yolov8n.pt')

classNames =["persona",
"bicicleta",
"coche",
"motocicleta",
"avión",
"autobús",
"tren",
"camión",
"barco",
"semáforo",
"hidrante",
"señal de stop",
"parquímetro",
"banco",
"pájaro",
"gato",
"perro",
"caballo",
"oveja",
"vaca",
"elefante",
"oso",
"cebra",
"jirafa",
"mochila",
"paraguas",
"bolso",
"corbata",
"maleta",
"frisbee",
"esquís",
"tabla de snowboard",
"pelota de deporte",
"cometa",
"bate de béisbol",
"guante de béisbol",
"monopatín",
"tabla de surf",
"raqueta de tenis",
"botella",
"copa de vino",
"taza",
"tenedor",
"cuchillo",
"cuchara",
"cuenco",
"plátano",
"manzana",
"sándwich",
"naranja",
"brócoli",
"zanahoria",
"perrito caliente",
"pizza",
"donut",
"pastel",
"silla",
"sofá",
"planta en maceta",
"cama",
"mesa de comedor",
"inodoro",
"televisor",
"portátil",
"ratón",
"control remoto",
"teclado",
"teléfono móvil",
"microondas",
"horno",
"tostadora",
"fregadero",
"nevera",
"libro",
"reloj",
"jarrón",
"tijeras",
"oso de peluche",
"secador de pelo",
"cepillo de dientes"]

while True:
    success, img  =cap.read()
    if not success:
        print("No se puede recibir fotograma. Saliendo ...")
        break
    results = model(img, stream=True)
    for r in results:
        boxes = r.boxes
        for box in boxes:
            x1, y1, x2, y2 = box.xyxy[0]
            x1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2)
            w, h = x2-x1, y2-y1
            cvzone.cornerRect(img, (x1, y1, w, h))

            conf = math.ceil((box.conf[0]*100))/100

            cls = box.cls[0]
            name = classNames[int(cls)]

            cvzone.putTextRect(img, f'{name} 'f'{conf}', (max(0,x1), max(35,y1)), scale = 1,thickness=2,font=cv2.FONT_HERSHEY_PLAIN,offset=10)
    cv2.imshow("Image", img)
    if cv2.waitKey(25) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

Downloading https://github.com/ultralytics/assets/releases/download/v8.3.0/yolov8n.pt to 'yolo_model\yolov8n.pt': 100%|██████████| 6.25M/6.25M [00:00<00:00, 9.17MB/s]


No se puede recibir fotograma. Saliendo ...


In [3]:
cap.release()
cv2.destroyAllWindows()

### Detección de objetos
La detección de objetos mediante cajas delimitadoras es una técnica de visión artificial que implica detectar y localizar objetos en una imagen dibujando una caja delimitadora alrededor de cada objeto.

### Segmentación de instancias
La segmentación de instancias es una técnica de visión artificial que implica la identificación y localización de objetos en una imagen a nivel de píxel. A diferencia de la segmentación semántica, que sólo clasifica cada píxel, la segmentación de instancias distingue entre diferentes instancias de la misma clase.

### Estimación de pose
La estimación de pose es una técnica utilizada para determinar la pose del objeto en relación con la cámara o el sistema de coordenadas mundial. Esto implica la identificación de puntos clave o articulaciones en objetos, particularmente humanos o animales.


### Clasificación
La clasificación de imágenes es una tarea de visión artificial que implica categorizar una imagen en una o más clases o categorías predefinidas según su contenido visual.

### Cajas delimitadoras orientadas (OBB)
Las cajas delimitadoras orientadas (OBB) son un método en la visión artificial para detectar objetos en ángulo en imágenes utilizando cajas delimitadoras rotadas, a menudo aplicado a imágenes aéreas y de satélite. A diferencia de las cajas delimitadoras tradicionales, las OBB pueden ajustarse mejor a los objetos en varias orientaciones.


### Seguimiento de múltiples objetos
El seguimiento de múltiples objetos es una técnica de visión artificial que implica la detección y el seguimiento de múltiples objetos a lo largo del tiempo en una secuencia de vídeo. Esta tarea amplía la detección de objetos manteniendo identidades consistentes de los objetos a través de los fotogramas.

https://docs.ultralytics.com/es/datasets/#classification