<a href="https://colab.research.google.com/github/Isaac-PM/ai-character-recognition/blob/main/testing.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Reconocimiento de dígitos (números)

## Generalidades

- Se usan imágenes de 28x28 píxeles, siendo en total 784 píxeles.
- Cada píxel tiene un valor que se encuentra en un rango de 0 a 255, siendo **0 completamente negro** y **255 completamente blanco**.
- Red neuronal<sup>1</sup> de dos capas<sup>2</sup>, sin contar a la capa de entrada como una.
- El conjunto de datos a utilizar es **MNIST database**.
- La idea central es, que durante el proceso de entrenamiento de la red, los parámetros de esta se ajusten para aproximarse a una función deseada (reconocer dígitos).

<center><img   src="https://i.imgur.com/tTH00qo.jpg"   width=""   height=""   /></center>

_Elaboración propia._

***

## Matriz inicial

\begin{align}
    &m = \text{número de imágenes} \\
    &x = \begin{bmatrix}
 x_{1\,1}&  x_{1\,2}&  x_{1\,...}& x_{1\,784}\\ 
 x_{2\,1}&  x_{2\,2}&  x_{2\,...}& x_{2\,784}\\ 
 x_{m-1\,1}&  x_{m-1\,2}&  x_{m-1\,...}& x_{m-1\,784}\\ 
 x_{m\,1}&  x_{m\,2}&  x_{m\,...}& x_{m\,784}
\end{bmatrix}
\end{align}

Se trabaja con la matriz transpuesta de $x$ ($x^{t}$), por lo que hay $m$ columnas con 784 filas.

## Propagación hacia adelante (forward propagation)

\begin{align}
    &A^{[0]} = \text{capa de entrada (input layer)} \\
    &Z^{[1]} = \text{capa oculta (desactivada) (hidden layer)}
\end{align}

Con la finalidad de obtener $Z^{[1]}$, se deberá aplicar un peso (weight, $w^{[1]}$) y un sesgo (bias, $b^{[1]}$), de manera que:

\begin{align}
    &Z^{[1]} = w^{[1]}\cdot A^{[0]} \ + \ b^{[1]} \\
    &w^{[1]} = \text{pesos de las conexiones de la primera capa (first layer connections weight)}
\end{align}

Posteriormente, se aplica una "función de activación", en este caso **ReLU**<sup>3</sup>.

\begin{align}
    &A^{[1]} \ = \ \text{ReLU}(Z^{[1]})
\end{align}

Y se pasa a la segunda capa:

\begin{align}
    &Z^{[2]} = w^{[2]}\cdot A^{[1]} \ + \ b^{[2]} \\
    &w^{[2]} = \text{pesos de las conexiones de la segunda capa (second layer connections weight)}
\end{align}

Finalmente se aplicará la función de activación **softmax**<sup>3</sup>.


\begin{align}
    &\begin{bmatrix}
6.66\\ 
2.5\\ 
1.3
\end{bmatrix}\rightarrow \, \frac{e^{z_{i}}}{\sum_{j \ = \ 1}^{K}e^{z_{j}}} \,\rightarrow \, \begin{bmatrix}
0.95\\ 
0.027\\ 
0.023
\end{bmatrix}
\end{align}

En el lado izquierdo se observan los valores de una capa de entrada (_input layer_), posterior a aplicada la función **softmax** estos valores se transforman en probabilidades, correspondiento a la probabilidad de que una imagen sea de cierta clase.

\begin{align}
    &A^{[2]} \ = \ \text{softmax}(Z^{[2]})
\end{align}

## Propagación hacia atrás (backwards propagation)

Se trata de ajustar los pesos según su contribución a la predicción inicial de la red. 

En este caso, se resta el _label_ que si le correspodía a la imagen procesada, por ejemplo, si el _label_ indicaba un 7, se hace esta resta a $A^{[2]}$, de la siguiente manera:

\begin{align}
    &A^{[2]} - \begin{bmatrix}
0...\\ 
0...\\ 
0...\\ 
0...\\ 
0...\\ 
0...\\ 
0...\\ 
1...\\ 
0...\\ 
0...
\end{bmatrix}
\end{align}

Nótese que el espacio en la matriz (ver tamaños reales abajo) que representa un 7 se le asigna un 1.

El proceso busca determinar el error en la predicción, además se debe encontrar la contribución de $w^{[x]}$ y $b^{[x]}$, al error $dz^{[x]}$.

\begin{align}
    &dz^{[2]} = A^{[2]} - \gamma \ \text{(según label)} \\
    &dw^{[2]} = \frac{1}{m}dz^{[2]}A^{[1]t} \\
\end{align}



**AQUI** 9:20


### Tamaños reales de las matrices



***

## Conceptos
### Red neuronal<sup>1</sup>

Se trata de un campo de estudio de la informática, que trata de "reflejar" el comportamiento del cerebro humano en el reconocimiento de patrones.<sup>[A]</sup>

Una red se ve compuesta por:<sup>[A]</sup> 

- Capa de entrada (_input layer_).
- Capas ocultas (_deep neural network_ ó _hidden layers_).
- Capa de sálida (_output layer_).

#### Funcionamiento

- Cada nodo se conecta a otro, con un peso asociado.
- Si la salida de un nodo se encuentra por encima de un umbral (_threshold_), se activa, mandando sus datos a la siguiente capa de la red.

<center><img   src="https://i.imgur.com/kP4Dma1.jpg"   width=""   height=""   /></center>

_Elaboración propia._<sup>[B]</sup>

### Capas<sup>2</sup>

Las capas son el metacomponente principal de las redes neuronales. En cuanto a la **red oculta**, esta realiza distintas funciones que se encargan de la transformación (análisis) de los datos.<sup>[C]</sup>

#### Neuronas (nodos)

Las neuronas, son los componentes de las capas, comunicadas por conexiones, las cuales tienen un peso asignado.<sup>[D]</sup>


### Funciones de activación<sup>3</sup> <sup>[E]</sup>

Si se mantuviese la red de una forma lineal, recordando que, las neuronas de la red reciben una suma ponderada de de sus entradas (más el sesgo), dando el resultado a la siguiente capa, por lo que el resultado (en este caso) sería el equivalente a operar en una sola capa esos valores. 

La función de activación se colocará entre el receptor de la siguiente capa y la suma lineal de los componentes de la capa anterior.

<center><img   src="https://i.imgur.com/niNM2kL.jpg"   width=""   height=""   /></center>

_Elaboración propia._

Este ajuste servirá para el posterior proceso de propagación hacia atrás (backwards propagation), en el cual con ayuda de la derivada de la función de costo, se ajustarán los pesos de las conexiones dependiendo de como se ajuste a la predicción esperada.

Algunas funciones son:

- Sigmoide (logística): tomando en cuenta el [problema del desvanecimiento de gradiente](https://es.wikipedia.org/wiki/Problema_de_desvanecimiento_de_gradiente), se puede usar en clasificación binaria (perro o gato)
- Tangente hiperbólica: comprende valores de -1 a 1, dando resultados más específicos que la Sigmoide.

#### ReLU (unidad lineal rectificada) <sup>[E]</sup>

\begin{align}
    &f(x)=\max(0,x)
\end{align}

Esta función no se encuentra acotada para números positivos, permitiendo un aprendizaje más rápido de la red.

#### Softmax <sup>[F], [G]</sup>

Es un tipo de función la cual soporta "sistemas de clasificación multinomial", siendo útil en el presente caso. 

Esta devuelve la distribución de probabilidad de cada una de las clases (posibles categorías, en este caso los dígitos).

Posee la siguiente fórmula:

\begin{align}
    &\sigma (\overrightarrow{z})_{i} \ = \ \frac{e^{z_{i}}}{\sum_{j \ = \ 1}^{K}e^{z_{j}}} \\
    &\overrightarrow{z} = \text{vector de entrada (input vector).} \\
    &z_{i} = \text{todos los valores del vector de entrada (input vector values).} \\
    &e^{z_{i}} = \text{valor mayor que 0, pequeño si la entrada fue negativa, grande si la entrada lo fue.} \\
    &\text{(value greater than 0, if the input was negative the value is small, otherwise it is large.)} \\
    &\sum_{j \ = \ 1}^{K}e^{z_{j}} = \text{normaliza el valor en el rango [0,1].} \\
    &\text{(normalizes the value in the range [0,1].)} \\
    &K = \text{número de clases (class number).}
\end{align}









## Referencias

- <sup>[A]</sup> What are Neural Networks? (2021, August 03). Retrieved from https://www.ibm.com/cloud/learn/neural-networks
- <sup>[B]</sup> ELEMENTOS BÁSICOS DE UNA RED NEURONAL ARTIFICIAL. (2007, October 01). Retrieved from https://advancedtech.wordpress.com/2007/08/31/elementos-basicos-de-una-red-neuronal-artificial
- <sup>[C]</sup> Singh, H. (2021). Neural Network | Introduction to Neural Network | Neural Network for DL. Analytics Vidhya. Retrieved from https://www.analyticsvidhya.com/blog/2021/03/basics-of-neural-network
- <sup>[D]</sup> Tech, R. (2021, July 07). Tu primera red neuronal en Python y Tensorflow. Youtube. Retrieved from https://www.youtube.com/watch?v=iX_on3VxZzk&list=PLZ8REt5zt2Pn0vfJjTAPaDVSACDvnuGiG
- <sup>[E]</sup> Tech, R. (2022, May 25). Funciones de activación a detalle (Redes neuronales). Youtube. Retrieved from https://www.youtube.com/watch?v=_0wdproot34
- <sup>[F]</sup> Las matemáticas del Machine Learning: Funciones de activación. (2021, June 25). Retrieved from https://empresas.blogthinkbig.com/las-matematicas-del-machine-learning-funciones-de-activacion
- <sup>[G]</sup> Softmax Function. (2019, May 17). Retrieved from https://deepai.org/machine-learning-glossary-and-terms/softmax-layer


In [1]:
print("Hello world!")

Hello world!


<center><h2 style="text-align: center;">Licencia / License</h2><h3 style="text-align: center;">Isaac-PM @ <a href="https://github.com/Isaac-PM">https://github.com/Isaac-PM</a></h3><p style="text-align: center;">Salvo que se indique lo contrario, esta obra tiene licencia <strong>Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)</strong> @ <a href="https://creativecommons.org/licenses/by-sa/4.0/">https://creativecommons.org/licenses/by-sa/4.0/</a></p><p style="text-align: center;">&nbsp;</p><p style="text-align: center;">Unless otherwise noted, this work is licensed <strong>Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)</strong> @ <a href="https://creativecommons.org/licenses/by-sa/4.0/">https://creativecommons.org/licenses/by-sa/4.0/</a>.</p><p style="text-align: center;">&nbsp;</p><p style="text-align: center;"><strong>Derechos reservados a los autores indicados en el campo de referencias.</strong></p></center>