# Programación funcional

En esta sección vamos a ver unas pinceladas de programación funcional que será de gran utilidad para trabajar más tarde con `pyspark`

![](img/function_python.png)

### La función  `map`  y la función `reduce`

La función `map` toma una función y un objeto iterable y devuelve un nuevo iterable con la función aplicada. En python es muy parecida a la compresión de lista que ya hemos visto.

Por otro lado la función `reduce` reduce los valores de la lista hasta conseguir un único valor. Para ello hay que usar una función reductora que tome dos valores y devuelva solo uno.

![](img/reduce_diagram.png)

In [1]:
def es_par(x):
    return bool(x % 2)

In [2]:
[es_par(i) for i in range(10)]

[False, True, False, True, False, True, False, True, False, True]

In [3]:
map(es_par, range(10))

<map at 0x19cddfa6c88>

In [4]:
list(map(es_par, range(10)))

[False, True, False, True, False, True, False, True, False, True]

In [5]:
def sumar_1(x,y):
    return x+y+1

In [6]:
from functools import reduce

In [7]:
reduce(sumar_1,range(4))

9

In [8]:
def concatenar(x,y):
    return str(x) + ' - ' + str(y)

In [9]:
reduce(concatenar,range(10))

'0 - 1 - 2 - 3 - 4 - 5 - 6 - 7 - 8 - 9'

In [None]:
' - '.join([str(i) for i in range(10)])

In [None]:
x = range(10)

In [10]:
lista_listas = [

    range(2),
    range(3),
    range(4),
    range(5),
    range(6)

]

In [11]:
lista_listas

[range(0, 2), range(0, 3), range(0, 4), range(0, 5), range(0, 6)]

In [12]:
def unir_lista(x,y):
    return list(x) + list(y)

In [13]:
reduce(unir_lista, lista_listas)

[0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5]

### Funciones `lambda`

Las funciones `lambda` en Python no son más que funciones que definimos al vuelo. Suele se muy útil cuando necesitamos definir funciones sencillas.

In [14]:
list(map(lambda x: bool(x % 2),range(10)))

[False, True, False, True, False, True, False, True, False, True]

In [15]:
reduce(lambda i,j: list(i) + list(j), lista_listas)

[0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5]

###  Funciones `filter` y `sorted`

In [22]:
import random

In [23]:
puedo = ["Juan","Jorge"]

In [24]:
valores = [

    dict(
        nombre = puedo[random.randint(0,1)],
        valor = random.randint(0,1000)
    ) for i in range(100)

]

In [25]:
valores[:10]

[{'nombre': 'Jorge', 'valor': 532},
 {'nombre': 'Jorge', 'valor': 893},
 {'nombre': 'Jorge', 'valor': 297},
 {'nombre': 'Juan', 'valor': 515},
 {'nombre': 'Juan', 'valor': 667},
 {'nombre': 'Juan', 'valor': 104},
 {'nombre': 'Jorge', 'valor': 944},
 {'nombre': 'Jorge', 'valor': 245},
 {'nombre': 'Jorge', 'valor': 751},
 {'nombre': 'Jorge', 'valor': 567}]

In [26]:
len(valores)

100

In [27]:
filtrados = filter(lambda x: x['nombre'] == 'Jorge', valores)

In [28]:
filtrados

<filter at 0x19cde087f48>

In [29]:
list(filtrados)[:10]

[{'nombre': 'Jorge', 'valor': 532},
 {'nombre': 'Jorge', 'valor': 893},
 {'nombre': 'Jorge', 'valor': 297},
 {'nombre': 'Jorge', 'valor': 944},
 {'nombre': 'Jorge', 'valor': 245},
 {'nombre': 'Jorge', 'valor': 751},
 {'nombre': 'Jorge', 'valor': 567},
 {'nombre': 'Jorge', 'valor': 605},
 {'nombre': 'Jorge', 'valor': 128},
 {'nombre': 'Jorge', 'valor': 661}]

In [30]:
sorted(valores, key = lambda x: -x['valor'])[:10]

[{'nombre': 'Jorge', 'valor': 999},
 {'nombre': 'Jorge', 'valor': 995},
 {'nombre': 'Jorge', 'valor': 985},
 {'nombre': 'Jorge', 'valor': 973},
 {'nombre': 'Jorge', 'valor': 944},
 {'nombre': 'Jorge', 'valor': 927},
 {'nombre': 'Juan', 'valor': 917},
 {'nombre': 'Jorge', 'valor': 893},
 {'nombre': 'Juan', 'valor': 891},
 {'nombre': 'Jorge', 'valor': 887}]

# Control de errores

Es normal cuando desarrollamos código que nos encontremos con errores. Sobre todo cuando escribimos funciones.

In [31]:
def dividir_1(x,y):
    return (x+1.0)/y

In [32]:
dividir_1(9,2)

5.0

In [33]:
dividir_1(9,0)

ZeroDivisionError: float division by zero

In [34]:
try:    
    9.0/0
    
except:    
    print("## Ha habido un error")


## Ha habido un error


Solo vamos a ver la opción `except` que es la más genérica pero podemos usar muchas más para controlar los distintos tipos de errores (el fichero no existe, error en la lectura...), ver más: https://docs.python.org/2/tutorial/errors.html

#### Detectar el tipo de variable con `isinstance`

In [None]:
x = 10

In [None]:
range(10)

In [35]:
x = 10.0

In [36]:
isinstance(x,int)

False

In [37]:
isinstance(x,float)

True



# Expresiones regulares

![](img/regex.jpg)
<center>https://docs.python.org/2/howto/regex.html</center>

Las expresiones regulares sirven para buscar patrones en cadenas de texto. Aunque ser un experto es realmente difícil tener unas pequeñas nociones nos puede ser de gran ayuda a la hora de tratar con datos.

En Python el módulo encargado es `re` y está basado en las expresiones regulares tipo `Perl`

In [40]:
import re

In [38]:
usuarios = [
    
    'juan',
    'pepe',
    'hola@facebook.com',
    'jose',
    'ramon',
    'jayuso@comillas.edu'

]

Detectar un patrón de correo electrónico:

In [41]:
[
    re.findall(r'^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$',i) 
    for i in usuarios
]

[[],
 [],
 [('hola', 'facebook', 'com')],
 [],
 [],
 [('jayuso', 'comillas', 'edu')]]

In [42]:
[
    re.sub(r'^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$',r'\1@mi_dominio.\3',i)
    for i in usuarios
]

['juan',
 'pepe',
 'hola@mi_dominio.com',
 'jose',
 'ramon',
 'jayuso@mi_dominio.edu']