<a href="https://colab.research.google.com/github/aszapla/Curso-DL/blob/master/1_1_Introduccion.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1.1 Introducción

Profesor: Juan Ramón Rico (<juanramonrico@ua.es>)


---
# Importante: antes de comenzar

Para seguir este tutorial hay que acceder al menú `Archivo / Guadar una copia en Drive...`. Una vez guardada la copia en vuestro Drive ya se puede editar y modificar.

---

# Conceptos básicos

## De la Artificial Intelligence al Deep Learning

Comenzaremos por el término más general y terminaremos con el más concreto.

- [Artificial ingelligence](https://en.wikipedia.org/wiki/Artificial_intelligence) (AI): Es la inteligencia que se le asocia a las máquinas en contraste con la que puede desarrollar un ser vivo. Coloquialmente se les asocia funciones como aprender o resolver problemas.

- [Machine Learning](https://en.wikipedia.org/wiki/Machine_learning) (ML): Es la rama de la AI que estudia técnicas que permitan aprender a los Ordenadores. Concreamente, se trata de crear programas capaces de generalizar comportamientos de ejemplos. Por lo tanto es un proceso de inducción del conocimiento.

- [Deep Learning](https://en.wikipedia.org/wiki/Deep_learning) (DL): Es una evolución de técnicas de 
ML basadas en redes neuronales que han supuesto un avances en campos como el análisis de imágen, robótica, reconocimiento del habla, traducción automática, etc.

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/ai-ml-dl.jpg)</center>


## Crecimiento de proyectos basados en Deep Learning en Google

Para presentar de un forma gráfica el impacto de las técnicas basadas en Deep Learning presentamos se siguiente gráfico.

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/DL-Google.jpg)</center>

- Se puede observar el gran incremento de estas técnicas a partir de mediados del 2015;
- El uso de estas técnicas se han extendido a otras grandes empresas y estamos en un periodo donde se comienzan a usar en pequeñas y medianas.

## Diferencias básicas entre la programación tradicional y el aprendizaje automático.

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/programming_ML.svg)</center>

## Aplicaciones del Machine Learning en la industria

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/ML_applications.svg)</center>

## Sistemas predictivos, presente y futuro

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/AI-eye.jpg)</center>

- Los sistemas predictivos están cambiando la forma en la que se abordan ciertos problemas y que cambiarán nuestro entorno. Algunos ejemplos:

  - La **conducción autónoma** de una programación por casos (if/else) se hace inabordable mientras que con la imitación de un humano aprendiendo de su comportamiento es viable;

  - **Traducción automática** de estar basada en reglas a aprender de textos traducidos por humanos;

  - **Búsqueda de empleo** de emparejar currículum vitae con las demandas de empleo a predecir cuales serán los mejores candidatos para un trabajo aprendiendo de los emparejamientos previos.

- Se puede decir que los datos son com una nueva fuente de energía;

Charlas relacionadadas:

- Encontramos más información en [**Prediction Machines: The Simple Economics of Artificial Intelligence**](https://www.youtube.com/watch?v=Q4o56nufXTw) que es una charla del profesor [Ajay Agrawal](https://agrawal.ca/) (fundador de [Creative Destruction Lab](https://www.creativedestructionlab.com/people/ajay-agrawal/) and co-fundador de AI/robotics company Kindred).

- Por otro lado, el conocido [Andrew Ng](http://www.andrewng.org/) que trabaja en [Baidu](https://en.wikipedia.org/wiki/Baidu), [Universidad de Stanford](https://es.wikipedia.org/wiki/Universidad_Stanford) y co-fundador de [Coursera](https://www.coursera.org/) impartió esta charla, [**The State of Artificial Intelligence**](https://www.youtube.com/watch?v=NKpuX_yzdYs), para [The Artificial Intelligence Channel](https://www.youtube.com/channel/UC5g-f-g4EVRkqL8Xs888BLA) sobre el **impacto** de la  **inteligencia artificial** en la sociedad.


# Uso de Python como lenguaje de programación

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/python-logo.svg)</center>

## ¿Qué es Python?

- *Python* es un lenguaje de programación interpretado y multiplataforma cuya sintaxis favorece un código legible.
- Creado a finales de los ochenta por Guido van Rossum en el Centro para las Matemáticas y la Informática (CWI, Centrum Wiskunde & Informatica, Paises Bajos).
- El nombre del lenguaje proviene de la afición de su creador por los humoristas británicos Monty Python.
- Se trata de un lenguaje de programación multiparadigma: orientado a objetos, programación imperativa y programación funcional.
- Se pueden crear módulos en C o C++ para acelerar la ejecución de los procesos.
- Web principal <https://www.python.org/>


## Sus principales ventajas

- Python Software Foundation License (software libre y código abierto).
- Gracias al uso de paquetes se aplica en cálculo, álgebra líneal y simbólica, mantenimiento sistemas operativos, visualización de datos, estadística, Machine Learning y Deep Learning.
- Tiene una comunidad muy activa y cada vez se puede aplicar a más ámbitos.
- Se puede ejecutar en programas o en entornos interactivos paso a paso.
- Fácil instalación y mantenimiento mediante gestores de paquetes como `pip` (bajo nivel) o `Anaconda` (avanzado y orientado a empresas <https://anaconda.org/>).
- Se recomienda usar un editor sencillo y multiventana para facilitar su uso. Spyder (<https://github.com/spyder-ide/>)

# Comenzando con Python

## Instalar Python

![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/Python_web.png)

- Acceder a <https://www.python.org/>.
- Descargar la última versión.

## Preparando la instalación de paquetes. El entorno virtual.

Para comenzar abrimos un terminal en el sistema operativo que usemos (Windows, Mac OSX, Linux).

Vamos a crear un entorno virtual para facilitar la instalación local de paquetes.

`python3.6 -m venv py36`

`source ./py36/bin/activate`

Ahora vamos a instalar los paquetes básicos para seguir este curso:

`pip install pip -U`

`pip install jupyter`

Nos desplazamos donde están los apuntes (ficheros `.ipynb`)

`jupyter notebook`

Cargamos el fichero actual `Introduccion.ipynb`

## Uso alternativo con Google Colab (Drive)

<center>![](https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/google_colab1.png)</center>

[Google Colab](https://colab.research.google.com/) es un proyecto de investigación que quiere ayudar a promocionar el aprendizaje automático en ámbito de la educación y la investigación. Es un entorno similar al `Jupyter notebook` que no necesita de la instalación de programas para editar y ejercutar código, ya que se realizar en la nube.

Colaboratory notebooks usa [Google Drive](https://drive.google.com) y permite compartir el documento como si fuera de texto (Docs) o de un libro de cálculo (Sheets). Colaboratory es de uso gratuito.

Para más información, revisar [FAQ](https://research.google.com/colaboratory/faq.html).

### Cómo instalar paquetes adicionales
Google Colab tiene instalados una serie de paquetes básicos:

In [0]:
!pip list

 Si necesitamos instalar otros adicionales lo podemos hacer con:

In [0]:
!pip install -q keras h5py sklearn

## Paquetes básicos y avanzados

### NumPy
<center><img src="https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/numpy-logo.jpg" height="100"></center>

Numpy permite el manejo de vectores de una forma fácil y eficiente, además muchos otros paquetes están construidos sobre éste.
- Documentación <https://docs.scipy.org/doc/numpy/user/>
- Tutorial de inicio rápido <https://docs.scipy.org/doc/numpy/user/quickstart.html>






### Pandas
<center><img src="https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/pandas-logo.png" height="100"></center>

Pandas es un paquete de alto rendimiento para estructuras de datos tipo tabla, análisis y visualización de datos. Está construido sobre `NumPy` y `MatPlotLib`.
- Documentación <https://pandas.pydata.org/pandas-docs/stable/>
- Tutorial de inicio rápido <https://pandas.pydata.org/pandas-docs/stable/10min.html>    

### Scikit-Learn

<center><img src="https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/sklearn-logo.png" height="100"></center>
  
Scikit-Learn es el principal paquete de aprendizaje automático (Machine Learning) de propósito general en `Python`. Tiene gran cantidad de algoritmos y módulos para el pre-procesamiento, validación cruzada y ajuste de hiper-parámetros de modelos, clasificación/regresión, etc.
- Documentación <http://scikit-learn.org/stable/documentation.html>
- Tutorial de inicio rápido <http://elitedatascience.com/python-machine-learning-tutorial-scikit-learn>

### Keras
 <center><img src="https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/keras-logo.png" height="100"></center>

Keras es un paquete que permite la creación y prueba de redes neuronales avanzadas (Deep Learning). Tiene una sintaxis sencilla que permite modelar rápido
- Documentación <https://keras.io/>
- Tutorial de inicio rápido <https://elitedatascience.com/keras-tutorial-deep-learning-in-python>    

### MatPlotLib
<center><img src="https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/matplotlib-logo.svg" height="100"></center>

MatPlotLib es un paquete flexible de visualización de gráficos. Es potente pero algo difícil para usuarios nóveles.
- Documentación <https://matplotlib.org/contents.html>
- Tutorial de inicio rápido <https://matplotlib.org/users/pyplot_tutorial.html>

### Plotnine
<center><img src="https://www.dlsi.ua.es/~juanra/UA/curso_verano_DL/images/plotnine-logo.png" height="100"></center>

Plotnine es de recienbre creación y hace mucho más fácil visualizar los datos más comunes. Está construido sobre Matplotlib y ofrece facilidades de alto nivel (similar al paquete `ggplot2` de `R`).
- Documentación <https://plotnine.readthedocs.io/en/stable/index.html>
- Tutoriales de inicio rápido <https://plotnine.readthedocs.io/en/stable/tutorials.html>

# Operaciones básicas

Conocer con qué versión de Python estamos trabajando

In [0]:
!python -V

## Suma y resta

Vamos a practicar como si fuera una calculadora:

| | | | | |
|--|--|--|--|--|--
| 2+2 | 2+float('inf') | float('inf')+float('inf') | 2-2 | 2-float('inf') | float('inf')-float('inf')

In [0]:
float('inf')-float('inf')

## Multiplicación y división

| | | | | 
|--|--|--|--|--
| 2*2 | 2*0 | 2*float('inf') | float('inf')*float('inf') | float('inf')*0
| 0/0 | 0/2 | 2/0 | float('inf')/float('inf') | float('inf')/0 


In [0]:
2*2

## Otras operaciones básicas

### División entera y módulo

`5 // 2`

`5 % 2`

### Exponentes

`2**3`


In [0]:
5//2

## Características especiales de Python

- *Python* al igual que *R* trabaja con números **nan** (Not a Number) no definidos o valores no disponibles **NA** (Not Available) en la operaciones y en sus **funciones**

- La **mayoría** de lenguajes de programación habituales se detendrían y mostrarían un mensaje de **error**.

`sum([2,3])
sum(c(2,float('nan'))
`

- En apartados posteriores veremos como se trata la ausencia de datos.


# Variables, tipos básicos, condiciones y bucles

## Números

- Se puede usar directamente como una **calculadora**.
- Los **valores** o el **resultado** de las operaciones se puede guardar en **variables**.

In [0]:
a = 2*4+7-4
print('a: {}'.format(a))

b = 5/2+a
print('b: {}'.format(b))

c = 5//2+a
print('c: {}'.format(c))


## Caracteres

In [0]:
a = 'Ejemplo 1 con una comilla'
print(a)

b = "Ejemplo 2 con doble comilla"
print(b)

## Listas

In [0]:
list = ['uno','dos','tres']

for i in list:
  print(i)
  
list.remove('uno')
list.append('cuatro')

for i in list:
  print('new',i)

## Conjuntos

In [0]:
lista = ['uno','dos','tres','tres']
conjunto = set(lista)
print(conjunto)

print('\'uno\' pertenece al conjunto {}'.format('uno' in conjunto))
print('\'cuatro\' pertenece al conjunto {}'.format('cuatro' in conjunto))

## Diccionarios

In [0]:
str2num = {'uno':1, 'dos':2, 'tres':3}
num2str = { 1:'uno', 2:'dos', 3:'tres'}

print('uno -> {}'.format(str2num['uno']))
print('1 -> {}'.format(num2str[1]))

print('Todos los items de str2num')
for key, value in str2num.items():
  print('\t{} -> {}'.format(key, value))

In [0]:
# Accedemos a una clave que no existe usando el método 'get'

print(str2num.get('cuatro'))

In [0]:
# Si accedemos a una clave que no existe usando con [] se produce un error

try:
  print(str2num['cuatro'])
except KeyError:
  print('La clave no existe')

## Condiciones

In [0]:
a = 1
if a>1:
  print('La variable "a" mayor que 1')
else:
  print('La variable "a" NO es mayor que 1')

In [0]:
a = 1
b = 2
if a>1 and b>1:
  print('{} y {} son mayores que 1'.format(a,b))
else:
  print('{} y {} NO son mayores que 1'.format(a,b))

In [0]:
a = 1
b = 2
if a>1 or b>1:
  print('{} o {} es mayor que 1'.format(a,b))
else:
  print('Ni {}, ni {} son mayores que 1'.format(a,b))

## Bucles

### for

In [0]:
lista = ['uno','dos','tres','tres']
for i in lista:
  print(i)
  
for i in range(len(lista)):
  print('{} {}'.format(i,lista[i]))

### while

In [0]:
i = 0
while i < 5:
    print(i)
    i += 1

---

# Resumen

* Diferencias entre los conceptos de **Artificial Intelligence**, **Machine Learning** y **Deep Learning**.
* Ejemplos de aplicaciones de Machine Learning en ámbitos empresariales.
* Uso del lenguaje **Python** para el análisis de datos en general y para **Deep Learning** en particular.
* Ejemplos básicos de **código** Python.

