# Programación funcional

En esta sección vamos a ver unas pinceladas de programación funcional que será de gran utilidad para trabajar más tarde con `pyspark`

![](img/function_python.png)

### La función  `map`  y la función `reduce`

La función `map` toma una función y un objeto iterable y devuelve un nuevo iterable con la función aplicada. En python es muy parecida a la compresión de lista que ya hemos visto.

Por otro lado la función `reduce` reduce los valores de la lista hasta conseguir un único valor. Para ello hay que usar una función reductora que tome dos valores y devuelva solo uno.

![](img/reduce_diagram.png)

In [None]:
def es_par(x):
    return bool(x % 2)

In [None]:
[es_par(i) for i in range(10)]

In [None]:
map(es_par, range(10))

In [None]:
list(map(es_par, range(10)))

In [None]:
def sumar_1(x,y):
    return x+y+1

In [None]:
from functools import reduce

In [None]:
reduce(sumar_1,range(4))

In [None]:
def concatenar(x,y):
    return str(x) + ' - ' + str(y)

In [None]:
reduce(concatenar,range(10))

In [None]:
' - '.join([str(i) for i in range(10)])

In [None]:
x = range(10)

In [None]:
lista_listas = [

    range(2),
    range(3),
    range(4),
    range(5),
    range(6)

]

In [None]:
lista_listas

In [None]:
def unir_lista(x,y):
    return list(x) + list(y)

In [None]:
reduce(unir_lista, lista_listas)

### Funciones `lambda`

Las funciones `lambda` en Python no son más que funciones que definimos al vuelo. Suele se muy útil cuando necesitamos definir funciones sencillas.

In [None]:
list(map(lambda x: bool(x % 2),range(10)))

In [None]:
reduce(lambda i,j: list(i) + list(j), lista_listas)

###  Funciones `filter` y `sorted`

In [None]:
import random

In [None]:
puedo = ["Juan","Jorge"]

In [None]:
valores = [

    dict(
        nombre = puedo[random.randint(0,1)],
        valor = random.randint(0,1000)
    ) for i in range(100)

]

In [None]:
valores[:10]

In [None]:
len(valores)

In [None]:
filtrados = filter(lambda x: x['nombre'] == 'Jorge', valores)

In [None]:
filtrados

In [None]:
list(filtrados)[:10]

In [None]:
sorted(valores, key = lambda x: -x['valor'])[:10]

# Control de errores

Es normal cuando desarrollamos código que nos encontremos con errores. Sobre todo cuando escribimos funciones.

In [None]:
def dividir_1(x,y):
    return (x+1.0)/y

In [None]:
dividir_1(9,2)

In [None]:
dividir_1(9,0)

In [None]:
try:    
    9.0/0
    
except:    
    print("## Ha habido un error")


Solo vamos a ver la opción `except` que es la más genérica pero podemos usar muchas más para controlar los distintos tipos de errores (el fichero no existe, error en la lectura...), ver más: https://docs.python.org/2/tutorial/errors.html

#### Detectar el tipo de variable con `isinstance`

In [None]:
x = 10

In [None]:
range(10)

In [None]:
x = 10.0

In [None]:
isinstance(x,int)

In [None]:
isinstance(x,float)



# Expresiones regulares

![](img/regex.jpg)
<center>https://docs.python.org/2/howto/regex.html</center>

Las expresiones regulares sirven para buscar patrones en cadenas de texto. Aunque ser un experto es realmente difícil tener unas pequeñas nociones nos puede ser de gran ayuda a la hora de tratar con datos.

En Python el módulo encargado es `re` y está basado en las expresiones regulares tipo `Perl`

In [None]:
import re

In [None]:
usuarios = [
    
    'juan',
    'pepe',
    'hola@facebook.com',
    'jose',
    'ramon',
    'jayuso@comillas.edu'

]

Detectar un patrón de correo electrónico:

In [None]:
[
    re.findall(r'^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$',i) 
    for i in usuarios
]

In [None]:
[
    re.sub(r'^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$',r'\1@mi_dominio.\3',i)
    for i in usuarios
]