# Introducción al Aprendizaje Automático

* Prof. Esteban Pérez Hidalgo
* Física Computacional I I-2024
* Escuela de Física - Tecnológico de Costa Rica
![IA.jpg](attachment:IA.jpg)

* Machine learning, as the name suggest, are a group of algorithms that try to enable the learning capability of the computers, so that they can learn from the data or past experiences. 
* The idea is that, as a kid, we gain many skills from learning. One example is that we learned how to recognize cats and dogs from a few cases that our parents showed to us. We may just see a few cats and dogs pictures, and next time on the street when we see a cat, even though it may be different from the pictures we saw, we know it is a cat. This ability to learn from the data that presented to us and later can be used to generalize to recognize new data is one of the things we want to teach our computers to do.
* Although the terms can be confused, machine learning (ML) is an important subset of artificial intelligence. ML is concerned with using specialized algorithms to uncover meaningful information and find hidden patterns from perceived data to corroborate the rational decision-making process.

## Algunos conceptos relacionados

![ai-ml-ds.png](attachment:ai-ml-ds.png)

1. **Data Science:** aplicación de métodos científicos, procesos y sistemas para obtener conocimiento de un conjunto de datos en sus diferentes formas. Supone la gestión y la manipulación del set de datos mediante el uso de técnicas estadísticas y de las ciencias de la computación.

![data_science.png](attachment:data_science.png)

2. **Big Data:** incremento de bases de datos de forma tal que  se supera la capacidad del software convencional para ser capturados, administrados y procesados en un tiempo razonable. El volumen de los datos masivos crece constantemente. Esto supone la resolución de tareas más complejas.


3. **Artificial Intelligence (IA)**: estudio y desarrollo de técnicas que implementan sistemas informáticos cuyas tareas simulan capacidades asociadas al aprendizaje y/o a la inteligencia humana. Los seres humanos actuamos o tomamos decisiones ante la experiencia y las condiciones de nuestro entorno. La IA corresponde al estudio de agentes informáticos que implementen estas capacidades de procesos cognitivos.


4. **Machine Learning (ML):** subárea de la IA enfocada en proveer a los sistemas computacionales la habilidad para aprender y mejorar automáticamente a través de la experiencia, sin estar explícitamente programado.

## Ejemplos de aplicaciones del ML

You can use machine learning in many ways:

* Predecir la probabilidad de que un paciente padezca cierta enfermedad.
* Predecir eventos climáticos.
* Visión por computadora.
* Sistemas de recomendación
* Procesamiento del lenguaje natural.
* Entender los sentimientos de un texto.
* Detección de noticias falsas.

Áreas como las finanzas, economía, ciencias de la tierra,exploración espacial, ingeniería biomédica, ciencias cognitivas e incluso las humanidadeshan adaptado modelos de aprendizaje automático para resolver tareas que involucran el procesamiento de muchos datos.

## Pasos para construir un modelo de aprendizaje automático

On a high level, the craft of creating machine learning (ML) processes is comprised of a number of steps:

<div>
<img src="attachment:25.01.02-components-of-ML.png" width="500"/>
</div>

* **Decide on the question**. Most ML processes start by asking a question that cannot be answered by a simple conditional program or rules-based engine. These questions often revolve around predictions based on a collection of data.


* **Collect and prepare data**. To be able to answer your question, you need data. The quality and, sometimes, quantity of your data will determine how well you can answer your initial question. Visualizing data is an important aspect of this phase. _Garbage in, garbage out_


* **Choose a training method**. Depending on your question and the nature of your data, you need to choose how you want to train a model to best reflect your data and make accurate predictions against it. This is the part of your ML process that requires specific expertise and, often, a considerable amount of experimentation.


* **Train the model**. Using your training data, you'll use various algorithms to train a model to recognize patterns in the data. The model might leverage internal weights that can be adjusted to privilege certain parts of the data over others to build a better model.


* **Evaluate the model**. You use never before seen data (your testing data) from your collected set to see how the model is performing.


* **Parameter tuning**. Based on the performance of your model, you can redo the process using different parameters, or variables, that control the behavior of the algorithms used to train the model.


* **Predict**. Use new inputs to test the accuracy of your model.

## Tipos de aprendizaje automático

There are different types of machine learning algorithms. One popular way to classify them is shown in the following figure:

<div>
<img src="attachment:25.01.01-types-of-ML.jpg" width="500"/>
</div>

En el **aprendizaje supervisado**, se desarrollan algoritmos que requieren de ejemplos de entrenamiento para los cuales se conoce de antemano la salida correcta (etiqueta).

En el **aprendizaje no supervisado**, se desarrollan algoritmos que tratan de encontrar la estructura subyacente o patrones presentes en datos no etiquetados (para los cuales se desconoce la salida deseada).

En el **aprendizaje por reforzamiento**, se desarrollan algoritmos que buscan optimizar las acciones a tomar para obtener una recompensa en una situación en particular. Por ejemplo, para el juego de ajedrez, el programa [Alpha-Zero](https://en.wikipedia.org/wiki/AlphaZero) fue entrenado bajo un esquema de aprendizaje por reforzamiento.

Existen otros enfoques de ML como: el aprendizaje **semi-supervisado**, **auto-supervisado**, **híbrido**.

### Conjuntos de datos para Aprendizaje Automático

- UCI: https://archive.ics.uci.edu/datasets

- Kaggle: https://www.kaggle.com/datasets

### Principales bibliotecas en Python  

- **ML/DL**: scikit-learn, Keras, TensorFlow, PyTorch.
- **NLP**: NLTK, Gensim, SpaCy, Pattern, TextBlob.
- **CV**: scikit-image, OpenCV, Scipy, Pillow, Mahotas.
- **RS**: surprise, Lightfm, spotlight, RecQ, music-recommender.

# Redes Neuronales Artificiales (ANNs)

### Modelo de la neurona artificial

Modelo de McCulloch-Pitts:

<div>
<img src="attachment:Diagram-of-the-MCP.png" width="500"/>
</div>

$$
y_k = \varphi \Bigl(\sum_{j=0}^{m}w_{kj}x_j\Bigr)
$$

* La neurona recibe "estímulos" que tienen diferentes pesos _w_
* Se suman los estímulos recibidos (pesados) y se evalúa en una función de activación
* La función de activación resulta en el estímulo que emite la neurona a la siguiente capa de la red. Entre las funciones de activación utilizadas popularmente están:
    * Función lineal
    * Función paso
    * Función rampa
    * Función sigmoide

![activacion1.PNG](attachment:activacion1.PNG)

![activacion2.PNG](attachment:activacion2.PNG)

### Modelos de redes neuronales artificiales (ANN)


![deep_network.PNG](attachment:deep_network.PNG)

* Feedforward Neural Network (FFN)
* Redes neuronales convulucionales (CNN)
* Redes Neuronales generativas (GAN)


## Referencias
* https://pythonnumericalmethods.berkeley.edu/notebooks/chapter25.01-Concept-of-Machine-Learning.html
* https://github.com/microsoft/ML-For-Beginners
* https://github.com/microsoft/AI-For-Beginners
* Engelbrecht, A. P. (2007). Computational intelligence: an introduction. John Wiley & Sons.