# Programación funcional

En esta sección vamos a ver unas pinceladas de programación funcional que será de gran utilidad para trabajar más tarde con `pyspark`

![](img/function_python.png)

### La función  `map`  y la función `reduce`

La función `map` toma una función y un objeto iterable y devuelve un nuevo iterable con la función aplicada. En python es muy parecida a la compresión de lista que ya hemos visto.

Por otro lado la función `reduce` reduce los valores de la lista hasta conseguir un único valor. Para ello hay que usar una función reductora que tome dos valores y devuelva solo uno.

![](img/reduce_diagram.png)

In [1]:
def es_par(x):
    return bool(x % 2)

In [2]:
[es_par(i) for i in range(10)]

[False, True, False, True, False, True, False, True, False, True]

In [3]:
map(es_par, range(10))

<map at 0x2575e9e9ac0>

In [4]:
list(map(es_par, range(10)))

[False, True, False, True, False, True, False, True, False, True]

In [5]:
def sumar_1(x,y):
    return x+y+1

In [6]:
from functools import reduce

In [7]:
reduce(sumar_1,range(4))

9

In [8]:
def concatenar(x,y):
    return str(x) + ' - ' + str(y)

In [9]:
reduce(concatenar,range(10))

'0 - 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9'

In [None]:
' - '.join([str(i) for i in range(10)])

In [16]:
x = range(10)

In [15]:
lista_listas = [

    range(2),
    range(3),
    range(4),
    range(5),
    range(6)

]

In [17]:
lista_listas

[range(0, 2), range(0, 3), range(0, 4), range(0, 5), range(0, 6)]

In [18]:
def unir_lista(x,y):
    return list(x) + list(y)

In [19]:
reduce(unir_lista, lista_listas)

[0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5]

### Funciones `lambda`

Las funciones `lambda` en Python no son más que funciones que definimos al vuelo. Suele se muy útil cuando necesitamos definir funciones sencillas.

In [10]:
list(map(lambda x: bool(x % 2),range(10)))

[False, True, False, True, False, True, False, True, False, True]

In [20]:
reduce(lambda i,j: list(i) + list(j), lista_listas)

[0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5]

###  Funciones `filter` y `sorted`

In [24]:
import random

In [22]:
puedo = ["Juan","Jorge"]

In [25]:
valores = [

    dict(
        nombre = puedo[random.randint(0,1)],
        valor = random.randint(0,1000)
    ) for i in range(100)

]

In [26]:
valores[:10]

[{'nombre': 'Jorge', 'valor': 103},
 {'nombre': 'Juan', 'valor': 911},
 {'nombre': 'Juan', 'valor': 144},
 {'nombre': 'Juan', 'valor': 246},
 {'nombre': 'Juan', 'valor': 261},
 {'nombre': 'Juan', 'valor': 383},
 {'nombre': 'Jorge', 'valor': 665},
 {'nombre': 'Jorge', 'valor': 564},
 {'nombre': 'Jorge', 'valor': 444},
 {'nombre': 'Jorge', 'valor': 580}]

In [27]:
len(valores)

100

In [28]:
filtrados = filter(lambda x: x['nombre'] == 'Jorge', valores)

In [29]:
filtrados

<filter at 0x2575ea3d6d0>

In [30]:
list(filtrados)[:10]

[{'nombre': 'Jorge', 'valor': 103},
 {'nombre': 'Jorge', 'valor': 665},
 {'nombre': 'Jorge', 'valor': 564},
 {'nombre': 'Jorge', 'valor': 444},
 {'nombre': 'Jorge', 'valor': 580},
 {'nombre': 'Jorge', 'valor': 469},
 {'nombre': 'Jorge', 'valor': 836},
 {'nombre': 'Jorge', 'valor': 827},
 {'nombre': 'Jorge', 'valor': 521},
 {'nombre': 'Jorge', 'valor': 836}]

In [31]:
sorted(valores, key = lambda x: -x['valor'])[:10]

[{'nombre': 'Juan', 'valor': 998},
 {'nombre': 'Juan', 'valor': 984},
 {'nombre': 'Jorge', 'valor': 924},
 {'nombre': 'Juan', 'valor': 923},
 {'nombre': 'Juan', 'valor': 912},
 {'nombre': 'Juan', 'valor': 911},
 {'nombre': 'Jorge', 'valor': 901},
 {'nombre': 'Jorge', 'valor': 857},
 {'nombre': 'Juan', 'valor': 857},
 {'nombre': 'Jorge', 'valor': 851}]

# Control de errores

Es normal cuando desarrollamos código que nos encontremos con errores. Sobre todo cuando escribimos funciones.

In [None]:
def dividir_1(x,y):
    return (x+1.0)/y

In [None]:
dividir_1(9,2)

In [None]:
dividir_1(9,0)

In [None]:
try:    
    9.0/0
    
except:    
    print("## Ha habido un error")


Solo vamos a ver la opción `except` que es la más genérica pero podemos usar muchas más para controlar los distintos tipos de errores (el fichero no existe, error en la lectura...), ver más: https://docs.python.org/2/tutorial/errors.html

#### Detectar el tipo de variable con `isinstance`

In [None]:
x = 10

In [None]:
range(10)

In [None]:
x = 10.0

In [None]:
isinstance(x,int)

In [None]:
isinstance(x,float)



# Expresiones regulares

![](img/regex.jpg)
<center>https://docs.python.org/2/howto/regex.html</center>

Las expresiones regulares sirven para buscar patrones en cadenas de texto. Aunque ser un experto es realmente difícil tener unas pequeñas nociones nos puede ser de gran ayuda a la hora de tratar con datos.

En Python el módulo encargado es `re` y está basado en las expresiones regulares tipo `Perl`

In [32]:
import re

In [33]:
usuarios = [
    
    'juan',
    'pepe',
    'hola@facebook.com',
    'jose',
    'ramon',
    'jayuso@comillas.edu'

]

Detectar un patrón de correo electrónico:

In [34]:
[
    re.findall(r'^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$',i) 
    for i in usuarios
]

[[],
 [],
 [('hola', 'facebook', 'com')],
 [],
 [],
 [('jayuso', 'comillas', 'edu')]]

In [35]:
[
    re.sub(r'^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$',r'\1@mi_dominio.\3',i)
    for i in usuarios
]

['juan',
 'pepe',
 'hola@mi_dominio.com',
 'jose',
 'ramon',
 'jayuso@mi_dominio.edu']