# Detección de plantas a partir de imágenes

### Integrantes



*   Javier de Jesús Silva (Ing. Sistemas e informática)
*   Santiago Salazar Ramirez (Ing. Sistemas e informática)
*   Jonathan Marcillo Pantoja (Ing. Agricola)
*   Juan José Garcia Marquez (Ing. Control) 
*   Alejandro Olivares Restrepo (Ing Mecanica)
*   Juan Sebastián Durán Roldán (Ing. Sistemas e informática)




### Descripción

<p>Actualmente existe una gran relevancia en el campo, dado que es uno de los sectores más relevantes en la economía nacional, como también es uno de los más preocupantes a la hora de hablar de modernización de métodos de producción y de distribución. Con esta problemática en mente se fundó la idea de realizar una identificación de plantas, esto como base para futuros análisis. </p>

<p>Las diferentes formas, colores y posiciones que pueden tomar las plantas es el principal problema de nuestra investigación, siendo poco uniforme la forma de identificar las diferentes plantas según la imagen en donde se tenga que identificar. Otro problema sería los factores ambientales que rodean a la planta, es decir, ¿en qué condiciones se encuentra el alrededor de la vegetación? Podría afectar la luminosidad que le llega a la planta, la humedad del ambiente, la cantidad de objetos diferentes dispersos cerca a la planta, etc. Con esto en mente formamos la pregunta de esta investigación: ¿qué es lo esencial de una planta para identificar lo que es la planta? </p>

<p>Es importante clasificar las plantas, debido a que de esta manera comprendemos su funcionalidad, sus cualidades, características y podemos comprender el comportamiento natural, así como utilizar a favor las propiedades de la misma.

Las plantas tienen muchas cualidades importantes, algunas medicinales, otras generadores y otras consumibles. El clarificarlas nos permite entender cómo se comportan las plantas y cómo pueden ser útiles. </p>

<p>A raíz de esto nace la idea de seleccionar y clasificar las plantas de manera automatizada con el uso de visión artificial en el proceso, esto es un componente importante por la gran variedad de utilidades que posee, por ejemplo, la detección de objetos y la evaluación de resultados. </p>

### ¿Cómo vamos a resolver esto?

¿Por qué? : Hoy en día algunas empresas utilizan materiales que son nocivos para la salud del trabajador "fungicidas", lo cual genera ambientes hostiles que imposibilitan el desempeño ideal. Además del ambiente, el factor humano afecta el proceso de revisión, los cuales pueden ser ocasionados por el mismo estado anímico o cansancio físico del colaborador, surgiendo entonces esta alternativa: el uso de algoritmos de supervisión para seleccionarlas.

¿Cómo? : Para la toma de imágenes de las plantas es necesario un espacio de trabajo  en donde la interferencia sea mínima, garantizando así gran detalle en toda el área de la hoja, y poder hacer una buena clasificación de la misma.  Luego se procede a convertir las imágenes a diferentes espacios de color y analizar la información que se puede obtener de la imagen a partir de cada uno de los canales analizados, para lo cual, se procede a analizar también su respectivo histograma y poder realizar un mejor análisis.


¿Para qué?: Se implementará un software de reconocimiento con visión artificial para la selección de hojas de plantas, identificando áreas donde se encuentren estas, una para cada una. Con el objetivo de automatizar este proceso de selección ya sea para procesos industriales donde se tenga que identificar zonas con plantaciones o calcular el nivel de vegetación en un area.

###Objetivos


1.   Seleccionar y clasificar plantas de manera automatizada a través del uso de la visión artificial.​

2.   Evaluar diferentes tipos de algoritmos de detección y reconocimiento de patrones que permitan detectar plantas.

3.   Encontrar aplicativos en varias plantas y entornos a fin de crear un algoritmo que pueda detectar sin importar variables de video o fotografia.









### Contribuciones

Se analizaron los diferentes canales de color,  para posteriormente, aislar la planta del medio donde se encuentra, utilizando los umbrales del filtro verde  y utilizando grafos para limpiar la imagen. Se buscó el pixel verde que esté más arriba, más a la izquierda, más arriba a la derecha y más arriba a la izquierda. Luego de ello se hacen recuadros de cada componente del grafo, para identificar las plantas de la imagen. ​

### Dataset

<p>Lo más importante por anunciar: algunas imágenes usadas en este trabajo NO son de nuestra creación, son suministradas gracias a Minervini, Scharr y Tsaftaris; es gracias a ellos que el siguiente análisis fue posible. La composición de las plantas se basa de una variedad de pequeñas plantas con una diferente cantidad distinta de hojas, donde cada planta es diferente en cuanto a las formas de sus hojas y su cantidad, pero su base no difiere entre ellas. <br> La cantidad de imágenes suministradas por Minervini son más de 500, pero se usaron 5 para la caracterización de las imágenes. El mayor limitante a la hora de realizar todo el proceso es distinguir la planta de su contorno, puesto sus colores son similares entre sí. <br> Además de estas imágenes se añadieron otras tomadas por el mismo equipo de trabajo, junto a unos cuantos vídeos para demostrar la detección de plantas.</p>

In [None]:
%matplotlib inline
import cv2
import matplotlib.pyplot as plt
import numpy as np

## Análisis canales RGB

<p> El proceso consiste en leer las imágenes, para luego por cada imagen mostrar 3 imágenes según el canal correspondiente (RGB). Este proceso se realizó con el objetivo de identificar en qué canal la planta se distingue del ambiente. Cabe aclarar que se aplicó una corección de gama, para poder aplicar en condiciones similares las plantas (algunas plantas tienen diferencia en la luz del ambiente, haciendo necesario este paso). <p>

In [None]:
# Funciones para aplicar cambio en luz
#Definir la función para aplicar la transformación sobre la imagen RGB
def apply_f_on_rgb(img, f, args):
    
    #Crear una matriz de ceros del tamaño de la imagen de entrada
    res = np.zeros(img.shape, np.uint8)
    #Aplicar la transformación f sobre cada canal del espacio de color RGB
    res[:,:,0] = f(img[:,:,0], *args)
    res[:,:,1] = f(img[:,:,1], *args)
    res[:,:,2] = f(img[:,:,2], *args)
    
    return res

#Definir la función de transformación de la imagen (corrección gamma)
def gamma_correction(img, a, gamma):
    
    #Crear copia de la imagen tipo flotante dada la normalización
    img_copy = img.copy().astype(np.float32)/255.0
    #La función corrección gamma es de la forma ax^gamma, donde x es la imagen de entrada
    res_gamma = cv2.pow(img_copy,gamma)
    res = cv2.multiply(res_gamma, a)
    
    #Asegurar que la los datos queden entre 0 y 255 y sean uint8
    res[res<0] = 0
    res = res*255.0
    res[res>255] = 255
    
    res = res.astype(np.uint8)
    
    return res

In [None]:
#Canal RGB
# Paths de las diferentes imagenes
img_path = ["res/img1.png", "res/img2.png", "res/img3.png", "res/img4.png","res/img6.jpg","res/img5.png","res/img8.jpg","res/img9.jpg","res/img10.jpg"]

# Se hace una lista para ir agregando las diferentes imagenes ya leídas, no solo el path.
loaded_img = []
# El brillo aumentado, para usar las listas a las que se les va a aplicar la función de gamma
brillo_aumentado = []

for p in img_path:
  loaded_img.append(cv2.imread(p, cv2.IMREAD_COLOR))
# Se carga cada imagen y se le aplica la función
for img in loaded_img:
    #Dar valor a los parámetros a,gamma (args)
  a = 1
  gamma = 0.75
  # cv2.cvtColor(img, cv2.COLOR_BGR2XYZ)
  #Aplicar la transformación corrección gamma sobre la imagen de entrada
  b = apply_f_on_rgb(cv2.cvtColor(img, cv2.COLOR_BGR2RGB), gamma_correction, [a, gamma])
  brillo_aumentado.append(b)

# Se hace un for por cada imagen y se crean 3 imagenes en sus tres distintos canales con la función de brillo
for img_rgb in brillo_aumentado:
    img_R, img_G, img_B = img_rgb[:,:,0], img_rgb[:,:,1], img_rgb[:,:,2]
    # El subplot es para agregar las 4 imagenes: 3 de los distintos canales y la imagen original
    fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4, figsize=(30, 8))
    # Se desactiva el axis, dado que no es necesario verlo como si se tratase de un plano cartesiano.
    ax1.axis("off")
    ax2.axis("off")
    ax3.axis("off") 
    ax4.axis("off") 
    # Los subtitulos para que se pueda notar cual es cada imagen
    fig.suptitle('RGB', fontsize=20)
    ax1.set_title('[RGB] Canal R')
    ax1.imshow(img_R, cmap='Reds', aspect='auto')
    ax2.set_title('[RGB] Canal G')
    ax2.imshow(img_G, cmap='Greens', aspect='auto')
    ax3.set_title('[RGB] Canal B')
    ax3.imshow(img_B, "Blues", aspect='auto')
    ax4.set_title('Imagen original')
    ax4.imshow(img_rgb, aspect='auto')

## Análisis canales LAB

<p> Como ya se tienen las imágenes no es necesario volver a tomar del path, sino que meramente se hace un análisis de los canales posibles con LAB, para luego elegir cual es el mejor canal para la distinción de la planta en la imagen. </p>

In [None]:
 #Canal LAB

channel_A_imgs = []
# Un for en todas las imagenes de brillo aumentado
for img in brillo_aumentado:
    #img = img[140:140 + 20, 120:120 + 20]
    # Se pasa a tipo img_lab
    img_lab  = cv2.cvtColor(img, cv2.COLOR_BGR2LAB)
    img_L, img_A, img_B = img_lab[:,:,0], img_lab[:,:,1], img_lab[:,:,2]

    # Se agregan a esta lista porque se decidió más tarde que este es el mejor canal para hacer el análisis posterior 
    channel_A_imgs.append(img_A)
    fig, ((ax1, ax2, ax3, ax4), (his1, his2, his3, his4)) = plt.subplots(2,4, figsize=(25, 15))
    ax1.axis("off")
    ax2.axis("off")
    ax3.axis("off")
    ax4.axis("off")

    #Canales
    fig.suptitle('Canal LAB', fontsize=20)
    ax1.set_title('[LAB] Canal Luminosidad')
    ax1.imshow(img_L, aspect='auto')
    ax2.set_title('[LAB] Canal A*')
    ax2.imshow(img_A, aspect='auto')
    ax3.set_title('[LAB] Canal B*')
    ax3.imshow(img_B, aspect='auto')
    ax4.set_title('Formato original')
    ax4.imshow(img_lab, aspect='auto')

    # Histogramas
    his1.set_title('[LAB] Histograma canal luminosidad')
    hisdata = img_L.ravel()
    his1.hist(hisdata,histtype='step', bins=255, range=(0.0, 255.0),density=True)
    his2.set_title('[LAB] Histograma canal A*')
    hisdata = img_A.ravel()
    his2.hist(hisdata,histtype='step', bins=255, range=(0.0, 255.0),density=True)
    his3.set_title('[LAB] Histograma canal B*')
    hisdata = img_B.ravel()
    his3.hist(hisdata,histtype='step', bins=255, range=(0.0, 255.0),density=True)
    his4.set_title('Formato original')
    hisdata = img_lab.ravel()
    his4.hist(hisdata,histtype='step', bins=255, range=(0.0, 255.0),density=True)

## Análisis canales XYZ

In [None]:
  #Canal XYZ
# For en las imagenes
for img in brillo_aumentado:
    # Pasar a XYZ
    img_xyz  = cv2.cvtColor(img, cv2.COLOR_BGR2XYZ)
    img_X, img_Y, img_Z = img_xyz[:,:,0], img_xyz[:,:,1], img_xyz[:,:,2]
    fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4, figsize=(30, 8))
    ax1.axis("off")
    ax2.axis("off")
    ax3.axis("off") 
    ax4.axis("off") 
    fig.suptitle('Canal XYZ', fontsize=20)
    ax1.set_title('Canal X')
    # Se usa gray para una mejor visualización
    ax1.imshow(img_X, cmap = "gray", aspect='auto')
    ax2.set_title('Canal Y')
    ax2.imshow(img_Y, cmap = "gray", aspect='auto')
    ax3.set_title('Canal Z')
    ax3.imshow(img_Z, cmap = "gray", aspect='auto')
    ax4.set_title('Formato original')
    ax4.imshow(img_xyz,  aspect='auto')

## Aislamiento de la planta

### Métricas

| Canales                 | Identificación                                                                                                                                                                            | Ventajas                                                                                                                                                                  | Desventajas                                                                                                        | Análisis                                                                                                                                                   |
|-------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------|
| [RGB] Canal R           |<ul><li>Las plantas no poseen una diferenciación en el canal rojo con respecto a su ambiente.</li><li>A menos que sea una planta de color rojo no existe utilidad real.</li></ul>                                 |         <ul><li>Para nuestro caso particular: No existe ventaja alguna. No existen muchas plantas de color rojo.</li></ul>                                                                | <ul><li>No va a identificar la mayoría de plantas.</li></ul>                                                                       | Es preferible no manejar este canal para la identificación de plantas                                                                                      |
| [RGB] Canal G           | <ul><li>Las plantas se diferencian del ambiente.</li><li>La mayoría de plantas son verdes, siendo este color de un tono más oscuro a comparación del ambiente.</li></ul>                                        | <ul><li>Diferenciación entre la planta y el ambiente.</li> <li> Rango de valores manejables para la definición de planta.</li></ul>                                                               | <ul><li> Algunos objetos que no son plantas se identifican como tal.</li></ul>                                                      | Este fue el método seleccionado, pero con una leve modificación para poder identificar qué objetos podrían ser plantas (más adelante se explica el método) |
| [RGB] Canal B           | <ul><li>Surge el mismo problema que el canal rojo: no se diferencia la planta del ambiente.</li> <li>¿Qué tan común es encontrar una planta de tono azul? No existe una utilidad real.</li>  </ul>               | <ul><li> No tiene ventaja alguna.</li></ul>                                                                                                                                                | <ul><li> No va a identificar planta alguna.</li> <li>En caso de emplearlo sólo funcionaría para casos específicos.</li></ul>               | Tampoco se va a implementar esta solución.                                                                                                                 |
| [LAB] Canal Luminosidad | <ul><li>Distingue la planta del ambiente, pero algunos objetos del ambiente también son identificados.</li> <li>Es dependiente de la iluminación del objeto, hace difícil la distinción entre plantas.</li></ul> |  <ul><li>Distingue la planta del ambiente. </li></ul>                                                                                                                                      | <ul><li>Esa distinción es dependiente del ambiente, no es lineal la selección de la planta.</li></ul>                             | Hace compleja la identificación de la planta, dado que es demasiado dependiente de las variables ambientales.                                              |
| [LAB] Canal A*          | <ul><li>Existe una diferencia clara entre la planta y el ambiente.</li> <li>A simple vista parece ser un candidato potencial para la futura identificación de plantas.</li></ul>                               | <ul><li>Distingue la planta del ambiente.</li> <li>La cantidad de objetos identificados que no son plantas es mínimo.</li> <li>El rango de valores para la planta es conciso y no tan amplio.</li></ul> | <ul><li>En algunas ocasiones no extrae la planta deseada según la intensidad de píxel deseada.</li></ul>                      | En su momento fue una opción empleada para la identificación de la planta, ahora con la diferenciación de verdes se prefirió no emplear este.              |
| [LAB] Canal B*          | <ul><li>En algunos casos identifica la planta, en otros siquiera la puede</li></ul> diferenciar.                                                                                                          | <ul><li> En algunos casos distingue la planta del ambiente. </li></ul>                                                                                                                     | <ul><li>En otros casos no puede distinguir la planta del ambiente, es muy dependiente de la luz y el color de la planta.</li> | Descartada por ineficiente para identificar plantas verdes.                                                                                                |
| [XYZ] Canal X,Y,Z       | <ul><li> Se resumieron en una sola fila por la ineficiencia de estos canales: no puede identificar siquiera la planta.</li></ul>                                                                           |<ul><li> Ninguna. </li></ul>                                                                                                                                                               | <ul><li> Tal vez para otros objetos estos canales pueden ser útiles, pero para este caso específico no tiene función.</li></ul>     | Descartada por su inutilidad.                                                                                                                              |

<p>Este es uno de los puntos más importantes para la correcta detección de las plantas. Para poder tomar la planta como tal tenemos que tomar el canal verde, pero no necesariamente todo color que tenga una gran cantidad de canal verde es verde. ¿Qué significa esto? Que si se toma meramente el canal verde se pueden tomar otros colores que se identifican como verde, como lo sería el amarillo. Una correción para esto es hacer una comparación entre el verde y sus otros dos canales (rojo y ázul), con la comparación adecuada (línea 9) se puede llegar a hacer la primera figura de la planta. </p>

In [None]:
# Lista de todas las imagenes con la aislación del verde
adjusted_green_channels = []

for img_rgb in brillo_aumentado:
  rc, gc, bc = img_rgb[:, :, 0], img_rgb[:, :, 1], img_rgb[:, :, 2]
  new_gc = gc.copy()

  for r in range(gc.shape[0]):
    for c in range(gc.shape[1]):
      # Aquí se hace una diferencia entre el canal verde y el canal azul y rojo: si este canal verde es mayor a los otros se selecciona (también tiene que ser mayor a 100)
      if int(gc[r][c]) > 0.75*int(rc[r][c]) + 0.45*int(bc[r][c]) and int(gc[r][c]) > 100:
        new_gc[r][c] = gc[r][c]
      else:
        # En caso contrario el pixel se vuelve blanco
        new_gc[r][c] = 0

  adjusted_green_channels.append(new_gc)

  fig, ax1 = plt.subplots(1,1, figsize=(10, 8))

  fig.suptitle("Planta N°", fontsize = 20)
  ax1.imshow(new_gc, "Greens", aspect = "auto")



## Implementación de grafos

<p>Hay un problema claro en la primera detección de imágenes: existen pixeles alejados de la planta y que siquiera son plantas, lo cual haría que estos pixeles sean identificados como plantas. Los grafos sirven en este ejercicio dado que cada píxel tiene pixeles adyacentes, entonces se considera cada pixel como un nodo y su cercanía inmediata (un cuadrado alrededor del pixel) como las aristas entre dichos nodos. </p>

In [None]:
import networkx as nx  # Se importa la libreria
listaGrafos = [] # Creacion de los grafos de cada imagen

for cosa in adjusted_green_channels:
    G = nx.Graph()  # Se inicializa el grafo
    for r in range(cosa.shape[0]): # r se refiere a row
        for c in range(cosa.shape[1]): # c se refiere a column
            if cosa[r][c] > 0: # R
                posicionNodo = (cosa.shape[1]*r)+c   # Numero_Fila * numeroFilas
                G.add_node(posicionNodo, position = [r,c]) # Para resumir se añade la posición a cada nodo, para no tener problema a la hora de usar las coordenadas
                if c > 0: # Si la columna es mayor a 0, para ir haciendo las aristas con los elementos atras de él
                    if cosa[r][c-1] > 0: # Cada vez que se pone que mayor a 0 significa si no es un pixel blanco, porque la idea es hacer adyacencia con los pixeles de colores
                        G.add_edge(posicionNodo,posicionNodo-1)
                if r > 0: # Ahora si la fila es mayor a 0, para ir haciendo las aristas con: los elementos detras de él, los elementos detrás de él pero a la izquierda y los elementos detrás de él pero a la derecha
                    if cosa[r-1][c] > 0:
                        G.add_edge(posicionNodo,posicionNodo-(cosa.shape[1]))
                    if c > 0: 
                        if cosa[r-1][c-1] > 0:
                            G.add_edge(posicionNodo,posicionNodo-(cosa.shape[1])-1)
                    if c < cosa.shape[1]-1:
                        if cosa[r-1][c+1] > 0:
                            G.add_edge(posicionNodo,posicionNodo-(cosa.shape[1])+1)
    listaGrafos.append(G)





Ya luego de la creación del grafo se revisan los componentes del grafo, donde si la longitud del componente es inferior a cierta constante (2000) entonces los pixeles de dicho componente se tornan 0 (blancos), para luego borrar estos nodos del grafo. Ya con esto se eliminarían los pixeles alejados que aparecen en la imagen (dato anormal).

In [None]:
for i in range(len(adjusted_green_channels)): # Ahora vamos a quitar los pixeles outliers, es decir, todo pixel que no haga parte de lo que se considere como planta
    G = listaGrafos[i] # El grafo 
    listaEliminar = [] # Además de poner el pixel a 0 se quita del grafo, para no tenerlo ahí
    Elemento = nx.connected_components(G) # Los componentes del grafo
    for elemento in Elemento: # Hora de iterar sobre los componentes del grafo
        if len(elemento) < 2000: # Esta es la condición para eliminar el componente y poner sus pixeles en 0. Si el componente tiene menos de 2000 nodos entonces se quita
            lista = list(elemento) # El elemento es un set, toca pasarlo a lista
            listaEliminar.append(lista) # Como este se va a eliminar entonces lo metemos a la listaEliminar
            listaCoordenadas = [G.nodes[x]['position'] for x in lista] # Vamos a transformar la lista (la lista de nodos) a las coordenadas, que es su atributi
            for cosa in listaCoordenadas: # Vamos a iterar sobre la lista de coordenadas para poder poner ese pixel como un pixel blanco, no verde
                adjusted_green_channels[i][cosa[0]][cosa[1]] = 0
    for elemento in listaEliminar: # Para cada componente que sea menor a 2000 se le quitan sus nodos al grafo
        for nodo in elemento:
            G.remove_node(nodo)

        

In [None]:
for clean in adjusted_green_channels:
  fig, ax1 = plt.subplots(1,1, figsize=(10, 8))

  fig.suptitle("Planta N°", fontsize = 20)
  ax1.imshow(clean, "Greens", aspect = "auto")

## Detección de las plantas

<p> Como primera instancia se buscan las posiciones Y y X más extremos de cada componente del grafo, considerando que la idea es delimitar con un rectángulo rojo la planta (componente del grafo). Pero existe un problema aquí: se pueden estar considerado plantas a objetos que no lo son, más que todo por una discontinuidad de los componentes del grafo. Como solución se plantea ver la intersección de cada cuadrado de cada componente (con el método de obtener las posiciones extremas), sabiendo que en caso de que exista algún tipo de intersección o que un rectángulo esté contenido dentro de otro se van a juntar estos dos componentes para crear uno solo, así evitando que se formen rectángulos erroneos (se delimiten partes incorrectas). </p>

In [None]:
# Vamos a cambiar esos sets de los componentes a listas, para luego 
# poder trabajar con ellos
listaComponenteImagen = [] 
for i in range(len(adjusted_green_channels)):
    G = listaGrafos[i]
    listaComponente = []
    Elemento = nx.connected_components(G)
    for elemento in Elemento:
        listaComponente.append(list(elemento))
    listaComponenteImagen.append(listaComponente)


In [None]:
# La idea de la intersección entre cuadrados es identificar si el punto de un cuadrado está dentro de otro cuadrado. Así es que se dice que existe una intersección o contención del cuadrado
def interseccionCuadrados(cuadrado1,cuadrado2):
    # cuadrado: [ (),(),(),()]
    for ve in cuadrado1:
        if cuadrado2[3][0]>ve[0]>cuadrado2[0][0] and cuadrado2[0][1]<ve[1]<cuadrado2[1][1]: # ¿El cuadrado 1 se intersecta o está dentro del cuadrado 2?
            return True
    for ve in cuadrado2:
        if cuadrado1[3][0]>ve[0]>cuadrado1[0][0] and cuadrado1[0][1]<ve[1]<cuadrado1[1][1]: # ¿El cuadrado 2 se intersecta o está dentro del cuadrado 1?
            return True
    return False

In [None]:
# Encontrar los cuadrados para cada grafo de cada imagen
for i in range(len(listaComponenteImagen)): # Iterar sobre cada imagen
    G = listaGrafos[i] # El grafo en cuestión
    listaCoordenadasComponente = [] # La lista de coordenadas de cada componente del grafo
    for elemento in listaComponenteImagen[i]:
        listaCoordenadasComponente.append([G.nodes[x]['position'] for x in elemento]) # Se agregan las coordenadas
    listaPuntos = []
    for componente in listaCoordenadasComponente:
            # Se hallan las posiciones de: Arriba, Abajo, Izquierda y derecha del cuadrado. 
            posArriba = min(componente,key=lambda x: x[0])[0]
            posAbajo = max(componente,key=lambda x: x[0])[0]
            posIzquierda = min(componente,key=lambda x: x[1])[1]
            posDerecha = max(componente,key=lambda x: x[1])[1]
            # Los vertices del cuadrado
            vtl = (posArriba,posIzquierda)
            vtr = (posArriba,posDerecha)
            vbl = (posAbajo,posIzquierda)
            vbr = (posAbajo,posDerecha)
            listaPuntos.append([vtl,vtr,vbl,vbr])
    for j in range(len(listaComponenteImagen[i])-1):
        for k in range(j+1,len(listaComponenteImagen[i])):
            # Se revisan entre los componentes si existe una intersección entre cuadrados
            intersectados = interseccionCuadrados(listaPuntos[j],listaPuntos[k])
            if intersectados == True:
                # En caso de intersección se une el primer nodo del componente1 y el primer nodo del componente2 -> Ahora sólo hay 1 un componente, se unen los cuadrados
                G.add_edge(listaComponenteImagen[i][j][0],listaComponenteImagen[i][k][0])
            
    


In [None]:
import matplotlib.patches as patches

In [None]:
# La idea es crear cuadrados rojos alrededor de cada planta
for i in range(len(adjusted_green_channels)): 
    fig, ax1 = plt.subplots(1,1, figsize=(10, 8))
    G = listaGrafos[i] #El grafo de la imagen en cuestion
    Elemento = nx.connected_components(G)
    for elemento in Elemento:
        lista = list(elemento)
        listaCoordenadas = [G.nodes[x]['position'] for x in lista] # Se obtienen las coordenadas de cada componente
        posArriba = min(listaCoordenadas,key=lambda x: x[0])[0] # Se obtienen las posiciones más arriba, más abajo
        posAbajo = max(listaCoordenadas,key=lambda x: x[0])[0]
        posIzquierda = min(listaCoordenadas,key=lambda x: x[1])[1] # Más izquierda, más derecha
        posDerecha = max(listaCoordenadas,key=lambda x: x[1])[1]
        # Esto para crear un cuadrado alrededor del componente (planta)
        rect = patches.Rectangle((posIzquierda,posAbajo),posDerecha-posIzquierda,posArriba-posAbajo, linewidth=1, edgecolor='r', facecolor='none')
        ax1.add_patch(rect) # Se añade al plot
        #listaCuadrado.append([posArriba,posAbajo,posIzquierda,posDerecha])
    # Se muestra la imagen
    ax1.imshow(cv2.cvtColor(loaded_img[i], cv2.COLOR_BGR2RGB), aspect = "auto")

## Detección de plantas en vídeo

<p> Ahora vamos a observar qué tan bien sirve este algoritmo en un vídeo </p>

In [None]:
# Lo que hace es de vídeo a imágenes
video = 'videos/tres.mp4'
vidcap = cv2.VideoCapture(video)
success,image = vidcap.read()
count = 0
while success:
    string = "videos/3/frame{contar}.jpg".format(contar = count)
    cv2.imwrite(string, image)     # save frame as JPEG file      
    success,image = vidcap.read()
    count += 1
cantidadPlantaVideo = count



Se ajusta el brillo para las imagenes del vídeo

In [None]:
imagenes_cargadas = []
brillo_aumentado = []
for i in range(cantidadPlantaVideo):
    imagenes_cargadas.append(cv2.imread("videos/3/frame{contar}.jpg".format(contar = i), cv2.IMREAD_COLOR))
for img in imagenes_cargadas:
    a = 1
    gamma = 0.75
    # cv2.cvtColor(img, cv2.COLOR_BGR2XYZ)
    #Aplicar la transformación corrección gamma sobre la imagen de entrada
    b = apply_f_on_rgb(cv2.cvtColor(img, cv2.COLOR_BGR2RGB), gamma_correction, [a, gamma])
    brillo_aumentado.append(b)





<p>Se hace el análisis de qué pixeles verdes</p>

In [None]:
verdeAjustado = []
for img_rgb in brillo_aumentado:
    rc, gc, bc = img_rgb[:, :, 0], img_rgb[:, :, 1], img_rgb[:, :, 2]
    new_gc = gc.copy()
    for r in range(gc.shape[0]):
        for c in range(gc.shape[1]):
            if int(gc[r][c]) > 0.75*int(rc[r][c]) + 0.45*int(bc[r][c]) and int(gc[r][c]) > 100:
                new_gc[r][c] = gc[r][c]
            else:
                new_gc[r][c] = 0
    verdeAjustado.append(new_gc)


Asignación de los grafos y limpieza en los grafos

In [None]:
import networkx as nx  # Se importa la libreria
grafos = [] # Creacion de los grafos de cada imagen

for cosa in verdeAjustado:
    G = nx.Graph()  # Se inicializa el grafo
    for r in range(cosa.shape[0]): # r se refiere a row
        for c in range(cosa.shape[1]): # c se refiere a column
            if cosa[r][c] > 0: # R
                posicionNodo = (cosa.shape[1]*r)+c   # Numero_Fila * numeroFilas
                G.add_node(posicionNodo, position = [r,c]) # Para resumir se añade la posición a cada nodo, para no tener problema a la hora de usar las coordenadas
                if c > 0: # Si la columna es mayor a 0, para ir haciendo las aristas con los elementos atras de él
                    if cosa[r][c-1] > 0: # Cada vez que se pone que mayor a 0 significa si no es un pixel blanco, porque la idea es hacer adyacencia con los pixeles de colores
                        G.add_edge(posicionNodo,posicionNodo-1)
                if r > 0: # Ahora si la fila es mayor a 0, para ir haciendo las aristas con: los elementos detras de él, los elementos detrás de él pero a la izquierda y los elementos detrás de él pero a la derecha
                    if cosa[r-1][c] > 0:
                        G.add_edge(posicionNodo,posicionNodo-(cosa.shape[1]))
                    if c > 0:
                        if cosa[r-1][c-1] > 0:
                            G.add_edge(posicionNodo,posicionNodo-(cosa.shape[1])-1)
                    if c < cosa.shape[1]-1:
                        if cosa[r-1][c+1] > 0:
                            G.add_edge(posicionNodo,posicionNodo-(cosa.shape[1])+1)
    grafos.append(G)

In [None]:
for i in range(len(verdeAjustado)): # Ahora vamos a quitar los pixeles outliers, es decir, todo pixel que no haga parte de lo que se considere como planta
    G = grafos[i] # El grafo 
    listaEliminar = [] # Además de poner el pixel a 0 se quita del grafo, para no tenerlo ahí
    Elemento = nx.connected_components(G) # Los componentes del grafo
    for elemento in Elemento: # Hora de iterar sobre los componentes del grafo
        if len(elemento) < 1000: # Esta es la condición para eliminar el componente y poner sus pixeles en 0. Si el componente tiene menos de 2000 nodos entonces se quita
            lista = list(elemento) # El elemento es un set, toca pasarlo a lista
            listaEliminar.append(lista) # Como este se va a eliminar entonces lo metemos a la listaEliminar
            listaCoordenadas = [G.nodes[x]['position'] for x in lista] # Vamos a transformar la lista (la lista de nodos) a las coordenadas, que es su atributi
            for cosa in listaCoordenadas: # Vamos a iterar sobre la lista de coordenadas para poder poner ese pixel como un pixel blanco, no verde
                verdeAjustado[i][cosa[0]][cosa[1]] = 0
    for elemento in listaEliminar: # Para cada componente que sea menor a 2000 se le quitan sus nodos al grafo
        for nodo in elemento:
            G.remove_node(nodo)

<p>Detección de plantas</p>

In [None]:
# Vamos a cambiar esos sets de los componentes a listas, para luego 
# poder trabajar con ellos
listacomponente = [] 
for i in range(len(verdeAjustado)):
    G = grafos[i]
    listaComponente = []
    Elemento = nx.connected_components(G)
    for elemento in Elemento:
        listaComponente.append(list(elemento))
    listacomponente.append(listaComponente)

In [None]:
# Encontrar los cuadrados para cada grafo de cada imagen
for i in range(len(listacomponente)): # Iterar sobre cada imagen
    G = grafos[i] # El grafo en cuestión
    listaCoordenadasComponente = [] # La lista de coordenadas de cada componente del grafo
    for elemento in listacomponente[i]:
        listaCoordenadasComponente.append([G.nodes[x]['position'] for x in elemento]) # Se agregan las coordenadas
    listaPuntos = []
    for componente in listaCoordenadasComponente:
            posArriba = min(componente,key=lambda x: x[0])[0]
            posAbajo = max(componente,key=lambda x: x[0])[0]
            posIzquierda = min(componente,key=lambda x: x[1])[1]
            posDerecha = max(componente,key=lambda x: x[1])[1]
            vtl = (posArriba,posIzquierda)
            vtr = (posArriba,posDerecha)
            vbl = (posAbajo,posIzquierda)
            vbr = (posAbajo,posDerecha)
            listaPuntos.append([vtl,vtr,vbl,vbr])
    for j in range(len(listacomponente[i])-1):
        for k in range(j+1,len(listacomponente[i])):
            intersectados = interseccionCuadrados(listaPuntos[j],listaPuntos[k])
            if intersectados == True:
                G.add_edge(listacomponente[i][j][0],listacomponente[i][k][0])
            
    


<p>Agregar las imagenes </p>

In [None]:
for i in range(len(verdeAjustado)): 
    fig, ax1 = plt.subplots(1,1, figsize=(10, 8))
    G = grafos[i] #El grafo de la imagen en cuestion
    Elemento = nx.connected_components(G)
    for elemento in Elemento:
        lista = list(elemento)
        listaCoordenadas = [G.nodes[x]['position'] for x in lista] # Se obtienen las coordenadas de cada componente
        posArriba = min(listaCoordenadas,key=lambda x: x[0])[0] # Se obtienen las posiciones más arriba, más abajo
        posAbajo = max(listaCoordenadas,key=lambda x: x[0])[0]
        posIzquierda = min(listaCoordenadas,key=lambda x: x[1])[1] # Más izquierda, más derecha
        posDerecha = max(listaCoordenadas,key=lambda x: x[1])[1]
        # Esto para crear un cuadrado alrededor del componente (planta)
        rect = patches.Rectangle((posIzquierda,posAbajo),posDerecha-posIzquierda,posArriba-posAbajo, linewidth=1, edgecolor='r', facecolor='none')
        ax1.add_patch(rect) # Se añade al plot
    ax1.axis('off')
    ax1.imshow(cv2.cvtColor(imagenes_cargadas[i], cv2.COLOR_BGR2RGB), aspect = "auto")
    plt.close(fig)
    fig.savefig('videos/imagenes/{numero}.png'.format(numero = i))

Creación del vídeo

In [None]:
import cv2
import numpy as np


img_array = []
for i in range(cantidadPlantaVideo):
    filename = "videos/imagenes/{numero}.png".format(numero = i)
    img = cv2.imread(filename)
    height, width, layers = img.shape
    size = (width,height)
    img_array.append(img)


out = cv2.VideoWriter('resultado/project1.avi',cv2.VideoWriter_fourcc(*'DIVX'), 15, size)
 
for i in range(len(img_array)):
    out.write(img_array[i])
out.release()

## Empleando YOLO

Esta sección es para probar el cómo funcionaría la identificación de plantas con YOLO con un modelo predeterminado, es un adicionado que se deseó agregar para comparar con nuestra implementación de grafos.

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

Primer paso: Descarga de Yolo junto a las librerias necesarias

In [None]:
!git clone https://github.com/ultralytics/yolov5

In [None]:

!pip install -r yolov5/requirements.txt

In [None]:
%cd yolov5

Guardamos un archivo mp4 para luego emplear YOLO

In [None]:
from google.colab import files
uploaded=files.upload()

In [None]:
!python detect.py --source Cinco.mp4

### Análisis entre YoloV e identificación de verdes

| Métodos                   | Análisis                                                                                                                                                                                                                                                                                               | Ventajas                                                                                                                                                                                                                                                                      | Desventajas                                                                                                                                  |
|---------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------|
| Identificación de verdes  | <ul><li>Identifica todo objeto que parezca al verde de una planta.</li> <li>En algunas ocasiones identifica toda la imagen como una planta.</li> <li>Dependiente de la cantidad de luz.</li><li>Aunque no requiera de un gran proceso de entrenamiento sigue teniendo el problema de identificar las plantas de forma eficiente.</li></ul> | <ul><li>No requiere de entrenamiento.</li> <li>Su tiempo de carga es inferior al de entrenamiento de una red neuronal.</li> <li>En algunas ocasiones identifica bien las plantas, esto si cumple con los requisitos de luz y de color.</li></ul>                                                            | <ul><li>Tiempos de carga para los vídeos.</li> <li>Identificación de objetos que no son plantas.</li> <li>Identificación del escenario como una planta completa.</li></ul> |
| Yolov5 modelo por defecto | <ul><li>Identifica las plantas que vengan en maceta.</li> <li>Confunde la maceta por una zanahoria u otro tipo de objeto extraño.</li> <li>En algunos casos identifica la planta con otro objeto, como un brócoli.</li> <li>Es dependiente del modelo.</li> <li>Requiere un dataset de entrenamiento grande para su mejora.</li></ul>              | <ul><li>Ya luego de ser entrenada los tiempos de carga son demasiado bajos.</li> <li>Identifica bien algunas plantas que están en maceta, en otros casos salta y hace caso omiso.</li> <li>Tiene la posibilidad de mejora si se realiza un gran dataset de plantas para el entrenamiento (10.000)</li></ul> | <ul><li>Identificación de objetos que no son plantas.</li> <li>Mal uso de labels.</li> <li>El entrenamiento dura es demasiado largo. </li></ul>                            |

# Conclusiones y resultados
Como conclusiones finales logramos identificar las plantas en base a colores relacionados, cumpliendo así nuestro objetivo y facilitando el reconocimientos de estas, independientemente si son videos o imágenes, esto gracias a todas las funciones anteriormente explicada donde cada uno nos va permitiendo identificar y pulir más la lectura del elemento en especifico. durante el proceso de descomposición de los canales del data set, y sus filtros, la elaboración de grafos para poder identificar mejor las formas y la aceptación de esta logramos que esto se desarrollara de manera eficaz.

Se realizó la descomposición de las imágenes del dataset en canales RGB, XYZ y LAB donde se observó que en las descomposiciones XYZ y LAB no se observaron grandes diferencias que permitieran segmentar las imágenes, también se concluyó que por las condiciones cromáticas del objeto de estudio , lo más apropiado para segmentar las imágenes es el canal RGB , en especial el canal G(aquel que contiene el color verde característico de las plantas). Con este método se pudo aislar el verde de las plantas, pero no solamente de estas sino el verde de todos los objetos encontrados en la imagen, por lo que se llevó a cabo un filtro de aceptación de cuanto verde era apto para ser identificado como hoja de la planta. Seguido a esto no fue la única dificultad se presentaron píxeles aislados que eran indeseables, a esto se le aplicó un grafo que permitía identificar las conexiones entre píxeles y eliminar los que estén sueltos; posteriormente se solucionó el problema y la imagen de se obtuvo más limpia y con la forma de la planta deseada. Finalmente, ya identificada la forma de la planta, el software procede a encerrar en un cuadro de color rojo los límites.


**REFERENCIAS**

MRUNALINI Badnakhe.et al. An Application of K-Means Clustering and Artificial Intelligence in Pattern Recognition for Crop Diseases. [En línea]. ipcsit. [Consultado el 18 de Marzo de 2017]. Disponible en internet: http://www.ipcsit.com/vol20/26-ICAIT2011-A4023.pdf

 KULKARNI Anand.et al. Applying image processing technique to detect plant diseases. [En línea]. researchgate	[Consultado	el	18	de	Marzo	de	2017].


VIJAYASHREE T. et al. Authentication Of Leaf Image Using Image Processing Technique. [En línea]. arpnjournals [Consultado el 18 de Marzo de 2017]. Disponible en internet: http://www.arpnjournals.com/jeas/research_papers/rp_2015/jeas_0515_2091.pdf

UNIVERSIDAD POLITECNICA DE VALENCIA. Desarrollo De Un Sistema De Visión Artificial Para El Control Eficiente De Pulverizadores De Cera En El Tratamineo Pos-Cosecha De La Fruta. [En línea]. horticom. [Consultado el 3 de Marzo de 2017]. Disponible en internet: http://www.horticom.com/pd/imagenes/76/144/76144.pdf10

3CIENCIAS. Visión Artificial Aplicada Al Control De La Calidad. [En línea] 3ciencias.com [Consultado el 18 de Marzo de 2017]. Disponible en internet: https://www.3ciencias.com/wp- content/uploads/2014/12/VISI%C3%93N-ARTIFICIAL-APLICADA-AL-CONTROL-DE-LA- CALIDAD.pdf