# Aprendizaje Computacional  

## Mario Graff (mgraffg@ieee.org, mario.graff@infotec.mx)  
## [https://github.com/ingeotec](https://github.com/ingeotec)
## [https://github.com/mgraffg](https://github.com/mgraffg)
## CONACYT - INFOTEC  

# Objetivo

Conocer las características de problemas de aprendizaje supervisado. Conocer las fortalezas y debilidades de diferentes tipos de algoritmos de aprendizaje de tal manera de que se pueda seleccionar el algoritmo mas adecuado al problema planteado. Implementar y analizar el rendimiento de diferentes algoritmos de aprendizaje supervisado.

# Temas

1. Introducción
2. Aprendizaje supervisado
3. Métodos paramétricos
4. Métodos no-paramétricos
5. Máquinas de kernel
6. Métodos no convencionales de aprendizaje
7. Diseño y análisis de experimentos de aprendizaje
8. Aplicaciones

# Introducción

1.1. Inteligencia Computacional - _Computational Intelligence_  
1.2. ¿Dónde está el aprendizaje computacional en Big Data / Ciencia de Datos?  
1.3. ¿Qué es aprendizaje computacional?  
1.4. ¿Cuáles son los tipos de aprendizaje?  
1.5. Herramientas

# Inteligencia Computacional

* A.C. se encuentra en el área de IC  
* Estudio de sistemas inteligentes  
* Entender como se puede generar comportamiento inteligente

# Big Data
* [Journal of Big Data](http://journalofbigdata.springeropen.com)
  * Captura de datos y almacenamiento  
  * Visualización  
  * Algoritmos de aprendizaje para Big Data  
  * Herramientas para data mining  
* [Big Data Research](http://www.journals.elsevier.com/big-data-research)  
  * Todos los aspectos fundamentales a Big Data  
  * Artículos en plataformas específicas para tratar Big Data  
  * Promover ciencia de datos (Data Science) y colaboración interdisciplinaria  
  * Uso de big data en dominios específicos  
* [IEEE Transactions on Big Data](http://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=6687317)
  * Investigación interdisciplinaria  
  * Manejo de datos  
  * Visualización  
  * Infraestructura, rendimiento

# Data mining
* [Data Mining and Knowledge Discovery](http://link.springer.com/journal/10618)
  * Editorial - What to do with all this data?
  * Extraer información de bases de datos
  * Métodos de data mining
  * Algoritmos para data mining
  * Aplicaciones
* Obtener conocimiento de los datos
* Técnicas para procesar datos
* Técnicas de aprendizaje

* La aplicación de algoritmos de aprendizaje a grandes colecciones

# Data Science
* [International Journal of Data Science and Analytics](http://link.springer.com/journal/41060)
  * Investigación guiada por los datos  
  * Trabajo interdisciplinario
  * Metodología, teorías, tecnologías y aplicaciones para los datos
* Experto en el dominio  
* Experto en la técnica  
* Capacidad para manejo de información

# ¿Qué es aprendizaje computacional?

* Algoritmo - ordenar una conjunto de números
* Encontrar el camino mas corto entre dos vértices


* Generar una composición de $\{+, -, \cdot, /, ...\}$ para seguir una serie de puntos
* Decidir si una noticia es de la sección de deportes

# ¿Cuáles son los tipos de aprendizaje?

* Reglas de asociación
* Aprendizaje Supervisado
* Aprendizaje no supervisado
* Aprendizaje por refuerzo

# Reglas de asociación
* $P(Y | X)$
* ej. $X =$ cerveza y $Y =$ botana
* ej. $Y =$ pañales

* $P(Y | X, D)$
* $D$ - Atributos de un cliente

# Aprendizaje Supervisado  
* Se tiene un _supervisor_
* Clasificación
  * Se tiene un conjunto de clases  
  * ej. Recocimiento de caracteres  
  * Análisis médico - tiene un padecimiento  
  * Función _discriminante_  
  * Generado un modelo se _predice_ la clases
  * Probabilidad de pertenecer a una clase - $P(Y | X)$

* Regresión
  * Se predice una variable continua
  * ej. Valor de una acción
  * La temperatura
  * Los costos de bienes inmuebles 

# Aprendizaje por refuerzo

* _policy_ conjunto de acciones para llegar al objetivo
* Juegos
* Robots
* Control

# Aprendizaje no Supervisado

* No se cuenta con un _supervisor_
* Agrupamiento - Clustering
* ej. Segmentación de clientes
* Agrupación de documentos

# Herramientas

* Python
* numpy
* scipy
* scikit-learn - sklearn
* jupyter notebook
* matplotlib
* pandas

# Python

* [Distribución de Anaconda](https://www.anaconda.com/distribution)
* miniconda
```bash
cd $HOME
wget http://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh -O miniconda.sh
chmod 755 miniconda.sh
./miniconda.sh -b
export PATH=$HOME/miniconda3/bin:$PATH
conda update --yes conda
conda install --yes pip
```

# Librerias - Uso - Graficar

* Instalar librerías

```bash
conda install scikit-learn ipython matplotlib jupyter
```

* Graficar la siguiente función  
    $f(x) = 12.4 x^2 - 3.4 x + 43$

* En Python seria:

```python  
import numpy as np  

x = np.linspace(-10, 10, 100)  
y = 12.4 * x**2 - 3.4 * x + 43  
plot(x, y)  
```

In [None]:
%pylab inline
import numpy as np

x = np.linspace(-10, 10, 100)
y = 12.4 * x**2 - 3.4 * x + 43
plot(x, y)

# Actividades

1. Leer la descripción de las siguientes revistas:
  * [Journal of Big Data](http://journalofbigdata.springeropen.com)
  * [Big Data Research](http://www.journals.elsevier.com/big-data-research)
  * [IEEE Transactions on Big Data](http://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=6687317)
  * [Data Mining and Knowledge Discovery](http://link.springer.com/journal/10618)
  * [International Journal of Data Science and Analytics](http://link.springer.com/journal/41060)
2. Revisar las siguientes páginas
  * [Kaggle](http://www.kaggle.com)
  * [Codalab](http://codalab.org)
  * [ingeotec](http://ingeotec.mx)
3. Leer
  * [Introduction to Machine Learning, Second Edition](https://mitpress.mit.edu/books/introduction-machine-learning)
    * Capítulo 1
  * [Understanding Machine Learning: From Theory to Algorithms](http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning)  
    * Capítulo 1  
  * [Computational Intelligence and Knowledge](https://www.cs.ubc.ca/~poole/ci/ch1.pdf)  
    * Sección 1.1  

4. Enviar 5 preguntas de las cuales no conozca su respuesta