# 1. Import Dependencies

In [1]:
#!pip install opencv-python



En esta primera celda de código, importamos algunas bibliotecas que serán necesarias para nuestro proyecto:

+ cv2: Importamos la biblioteca OpenCV, que es una biblioteca de visión por computadora ampliamente utilizada para procesamiento de imágenes y videos.
+ uuid: Importamos la biblioteca UUID, que nos permite generar identificadores únicos universales.
+ os: Importamos la biblioteca del sistema operativo, que nos proporciona funciones para interactuar con el sistema operativo subyacente, como manipulación de archivos y directorios.
+ time: Importamos la biblioteca de tiempo, que nos proporciona funciones para medir el tiempo y realizar operaciones relacionadas con el tiempo.

Estas bibliotecas nos proporcionarán las herramientas necesarias para trabajar con imágenes, generar identificadores únicos, manipular archivos y medir el tiempo de ejecución de nuestro código.

In [1]:
# Import opencv
import cv2 

# Import uuid
import uuid

# Import Operating System
import os

# Import time
import time

# 2. Define Images to Collect


En esta celda, hemos definido dos variables:

+ labels: Una lista de cadenas que contiene las etiquetas de las clases que queremos reconocer en nuestras imágenes. En este caso, las etiquetas son 'thumbsup', 'thumbsdown', 'thankyou' y 'livelong'.
+ number_imgs: Un entero que indica el número de imágenes que queremos capturar para cada clase. En este caso, se han especificado 5 imágenes por clase.

Estas variables serán útiles más adelante cuando capturemos las imágenes y las etiquetemos

In [2]:
labels = ['thumbsup', 'thumbsdown', 'thankyou', 'livelong']
number_imgs = 5

# 3. Setup Folders 

En esta celda, hemos definido una variable llamada IMAGES_PATH. Esta variable contiene la ruta al directorio donde almacenaremos las imágenes capturadas. La ruta se ha construido utilizando la función os.path.join() para asegurar la portabilidad del código entre diferentes sistemas operativos.

La ruta está compuesta por los siguientes componentes:

+ 'Tensorflow': Nombre de la carpeta principal.
+ 'workspace': Nombre de la carpeta de trabajo dentro de la carpeta principal.
+ 'images': Nombre de la carpeta donde se almacenarán las imágenes dentro de la carpeta de trabajo.
+ 'collectedimages': Nombre de la carpeta específica donde se almacenarán las imágenes capturadas dentro de la carpeta de imágenes.

In [3]:
IMAGES_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'collectedimages')

En este bloque de código, se realiza la creación de los directorios necesarios para almacenar las imágenes capturadas. Aquí está lo que hace cada parte:

1. Primero, se verifica si el directorio IMAGES_PATH no existe utilizando la función os.path.exists().
2. Si IMAGES_PATH no existe, se procede a crearlo:
3. En sistemas operativos tipo Unix (como Linux o macOS), se utiliza el comando mkdir -p para crear todos los directorios necesarios, incluyendo los directorios padres si no existen.
4. En sistemas operativos Windows, se utiliza el comando mkdir para crear el directorio IMAGES_PATH.
5. Luego, se itera sobre cada etiqueta en la lista labels:
6. Se construye la ruta completa para la etiqueta actual utilizando os.path.join() y se asigna a la variable path.
7. Se verifica si el directorio correspondiente a la etiqueta actual no existe.
8. Si el directorio no existe, se crea utilizando el comando mkdir.

Este bloque de código asegura que todos los directorios necesarios para almacenar las imágenes estén creados antes de comenzar a capturarlas.

In [4]:
if not os.path.exists(IMAGES_PATH):
    if os.name == 'posix':
        !mkdir -p {IMAGES_PATH}
    if os.name == 'nt':
         !mkdir {IMAGES_PATH}
for label in labels:
    path = os.path.join(IMAGES_PATH, label)
    if not os.path.exists(path):
        !mkdir {path}

# 4. Capture Images

En este fragmento de código, estamos capturando imágenes utilizando la cámara web para cada una de las etiquetas definidas en la lista `labels`. Aquí está el desglose de lo que hace cada línea:

1. Se inicia un bucle `for` para iterar sobre cada etiqueta en la lista `labels`.
2. Se abre la cámara web utilizando `cv2.VideoCapture(0)`. El número 0 indica que estamos utilizando la cámara web predeterminada del sistema.
3. Se imprime un mensaje indicando la etiqueta para la cual se están recopilando las imágenes.
4. Se pausa la ejecución durante 5 segundos utilizando `time.sleep(5)`. Esto permite al usuario prepararse antes de comenzar a capturar imágenes.
5. Se inicia otro bucle `for` para capturar un número específico de imágenes para la etiqueta actual.
6. Se imprime un mensaje indicando el número de imagen actual que se está capturando.
7. Se lee un fotograma de la cámara web utilizando `cap.read()`. El resultado se almacena en las variables `ret` (un indicador de si la lectura fue exitosa) y `frame` (la imagen capturada).
8. Se genera un nombre único para la imagen utilizando `uuid.uuid1()` y se guarda en la variable `imgname`.
9. Se guarda la imagen capturada en el directorio correspondiente utilizando `cv2.imwrite()`.
10. Se muestra la imagen capturada en una ventana con el título 'frame' utilizando `cv2.imshow()`.
11. Se pausa la ejecución durante 2 segundos utilizando `time.sleep(2)`. Esto da tiempo al usuario para ver la imagen capturada antes de capturar la siguiente.
12. Se verifica si se presionó la tecla 'q' utilizando `cv2.waitKey(1) & 0xFF == ord('q')`. Si se presiona 'q', se rompe el bucle y se detiene la captura de imágenes.
13. Se libera la cámara utilizando `cap.release()` y se cierran todas las ventanas utilizando `cv2.destroyAllWindows()`.

Este bloque de código permite capturar imágenes para cada etiqueta especificada en la lista `labels`. Cada imagen se guarda en su directorio correspondiente dentro de `IMAGES_PATH`.

In [18]:
for label in labels:
    cap = cv2.VideoCapture(0)
    print('Collecting images for {}'.format(label))
    time.sleep(5)
    for imgnum in range(number_imgs):
        print('Collecting image {}'.format(imgnum))
        ret, frame = cap.read()
        imgname = os.path.join(IMAGES_PATH,label,label+'.'+'{}.jpg'.format(str(uuid.uuid1())))
        cv2.imwrite(imgname, frame)
        cv2.imshow('frame', frame)
        time.sleep(2)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
cap.release()
cv2.destroyAllWindows()

Collecting images for thumbsup
Collecting image 0
Collecting image 1
Collecting image 2
Collecting image 3
Collecting image 4


# 5. Image Labelling

En esta celda, estamos instalando dos paquetes adicionales que necesitaremos para trabajar con objetos de TensorFlow en nuestras imágenes. 

1. `#!pip install --upgrade pyqt5 lxml`: Utilizamos el comando de instalación de pip `pip install` para instalar o actualizar dos paquetes:
   - `pyqt5`: Este paquete proporciona enlaces Python para Qt, un conjunto de herramientas y bibliotecas para crear interfaces gráficas de usuario (GUI).
   - `lxml`: Este paquete es una biblioteca de Python que facilita el análisis y la manipulación de archivos XML y HTML.

Estos paquetes son necesarios para trabajar con el módulo de detección de objetos de TensorFlow, que utilizaremos para detectar objetos en nuestras imágenes más adelante en el código.


In [10]:
#!pip install --upgrade pyqt5 lxml

Collecting pyqt5
  Using cached PyQt5-5.15.4-cp36.cp37.cp38.cp39-none-win_amd64.whl (6.8 MB)
Collecting lxml
  Using cached lxml-4.6.3-cp37-cp37m-win_amd64.whl (3.5 MB)
Collecting PyQt5-sip<13,>=12.8
  Using cached PyQt5_sip-12.8.1-cp37-cp37m-win_amd64.whl (62 kB)
Collecting PyQt5-Qt5>=5.15
  Using cached PyQt5_Qt5-5.15.2-py3-none-win_amd64.whl (50.1 MB)
Installing collected packages: PyQt5-sip, PyQt5-Qt5, pyqt5, lxml
Successfully installed PyQt5-Qt5-5.15.2 PyQt5-sip-12.8.1 lxml-4.6.3 pyqt5-5.15.4


En este bloque de código, estamos configurando la herramienta LabelImg, que nos permitirá etiquetar manualmente las imágenes que hemos capturado. 

1. `LABELIMG_PATH = os.path.join('Tensorflow', 'labelimg')`: Se define la variable `LABELIMG_PATH`, que contiene la ruta al directorio donde se almacenará la herramienta LabelImg. Esta ruta se construye utilizando la función `os.path.join()` para asegurar la portabilidad del código entre diferentes sistemas operativos.

2. Se verifica si el directorio `LABELIMG_PATH` no existe utilizando la función `os.path.exists()`.

3. Si el directorio `LABELIMG_PATH` no existe, se crea utilizando el comando `mkdir` y se clona el repositorio de GitHub que contiene la herramienta LabelImg utilizando el comando `git clone`. Esto se realiza en una sola línea utilizando la sintaxis de comandos del sistema operativo dentro de una cadena de texto precedida por el signo de exclamación `!`, que indica que se ejecutará como un comando en la terminal.

Con este bloque de código, aseguramos que la herramienta LabelImg esté disponible en el directorio especificado para que podamos utilizarla para etiquetar nuestras imágenes.



In [5]:
LABELIMG_PATH = os.path.join('Tensorflow', 'labelimg')

In [6]:
if not os.path.exists(LABELIMG_PATH):
    !mkdir {LABELIMG_PATH}
    !git clone https://github.com/tzutalin/labelImg {LABELIMG_PATH}

"git" no se reconoce como un comando interno o externo,
programa o archivo por lotes ejecutable.


En esta sección del código, estamos realizando algunas configuraciones adicionales dependiendo del sistema operativo:

1. `if os.name == 'posix':`: Se verifica si el sistema operativo es tipo Unix (como Linux o macOS) utilizando `os.name`. En caso afirmativo, se ejecuta el comando `make qt5py3`. Este comando compila los archivos de la interfaz de usuario de Qt para Python 3.

2. `if os.name =='nt':`: Se verifica si el sistema operativo es Windows utilizando `os.name`. En caso afirmativo, se cambia al directorio de `LABELIMG_PATH` y se ejecuta el comando `pyrcc5 -o libs/resources.py resources.qrc`. Este comando compila el archivo de recursos `.qrc` en un archivo de Python que contiene los recursos necesarios para la interfaz de usuario de LabelImg.

Estos comandos son necesarios para configurar correctamente la herramienta LabelImg en diferentes sistemas operativos, asegurando que esté lista para su uso posterior en el etiquetado de imágenes.



In [7]:
if os.name == 'posix':
    !make qt5py3
if os.name =='nt':
    !cd {LABELIMG_PATH} && pyrcc5 -o libs/resources.py resources.qrc

c:\Users\VicPr\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\Scripts\pyrcc5: File does not exist 'resources.qrc'


Este último comando es utilizado para ejecutar la herramienta LabelImg. 

1. `!cd {LABELIMG_PATH}`: Este comando cambia el directorio de trabajo actual al directorio donde está ubicada la herramienta LabelImg.

2. `&&`: Este operador lógico permite ejecutar múltiples comandos en una sola línea, en secuencia. El segundo comando solo se ejecutará si el primero se ejecuta con éxito.

3. `python labelImg.py`: Este comando ejecuta el script `labelImg.py`, que es el archivo principal de la herramienta LabelImg. Al ejecutar este script, se abrirá la interfaz de usuario de LabelImg, que nos permitirá etiquetar manualmente las imágenes.

Con este último comando, hemos lanzado la herramienta LabelImg y estamos listos para comenzar a etiquetar nuestras imágenes capturadas anteriormente.


In [8]:
!cd {LABELIMG_PATH} && python labelImg.py

python: can't open file 'c:\\Users\\VicPr\\OneDrive\\Documentos\\TFODCourse-main\\Tensorflow\\labelimg\\labelImg.py': [Errno 2] No such file or directory


# 6. Move them into a Training and Testing Partition

In [None]:
#SE REALIZO EN LA PARTE DE TRAINING AND DETECION:)

# OPTIONAL - 7. Compress them for Colab Training

En esta parte del código, estamos definiendo las rutas para los directorios de entrenamiento y prueba, así como la ruta para el archivo de archivo. 

1. `TRAIN_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'train')`: Esta línea define la ruta al directorio donde almacenaremos las imágenes de entrenamiento. Utiliza la función `os.path.join()` para construir la ruta de manera portátil.

2. `TEST_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'test')`: Aquí definimos la ruta al directorio donde almacenaremos las imágenes de prueba. Al igual que en la línea anterior, se utiliza `os.path.join()` para construir la ruta.

3. `ARCHIVE_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'archive.tar.gz')`: Esta línea define la ruta para el archivo de archivo que contendrá nuestras imágenes. Utiliza `os.path.join()` para construir la ruta de manera portátil.

Estos directorios y archivos serán utilizados más adelante en nuestro flujo de trabajo, para organizar y almacenar nuestras imágenes de entrenamiento y prueba, así como para generar un archivo de archivo que contendrá todas nuestras imágenes.

In [9]:
TRAIN_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'train')
TEST_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'test')
ARCHIVE_PATH = os.path.join('Tensorflow', 'workspace', 'images', 'archive.tar.gz')

Este comando crea un archivo tar comprimido que contiene los directorios de entrenamiento y prueba. 

1. `!tar -czf {ARCHIVE_PATH} {TRAIN_PATH} {TEST_PATH}`: 
   - `tar`: Es el comando utilizado en sistemas Unix para crear, mantener y manipular archivos tar (archivos de archivo).
   - `-czf`: Son las opciones utilizadas con el comando tar:
     - `-c`: Crea un nuevo archivo tar.
     - `-z`: Comprime el archivo usando gzip.
     - `-f`: Especifica el nombre del archivo tar que se va a crear.
   - `{ARCHIVE_PATH}`: Especifica la ruta y el nombre del archivo tar que se va a crear. Esta ruta fue definida anteriormente en el código.
   - `{TRAIN_PATH}` y `{TEST_PATH}`: Son las rutas a los directorios de entrenamiento y prueba que se incluirán en el archivo tar. Estas rutas también fueron definidas anteriormente en el código.

En resumen, este comando crea un archivo tar comprimido que contiene los directorios de entrenamiento y prueba, que serán utilizados en el entrenamiento y evaluación de nuestro modelo de aprendizaje automático.



In [10]:
!tar -czf {ARCHIVE_PATH} {TRAIN_PATH} {TEST_PATH}

tar: COMMONPROGRAMW6432=C??????????????????????1: Couldn't visit directory: No such file or directory
tar: : Couldn't visit directory: No such file or directory
tar: Error exit delayed from previous errors.


In [None]:
# Fernando
# GPS