In [1]:
!ls

sample_data



# Recorridos sobre colecciones

Cuando se manejan colecciones en Python, es común necesitar realizar recorridos sobre ellas. Para ello, en python se dispone de iteradores y generadores. A alto nivel, se puede pensar en un iterador / generador (en este punto, no vamos a distinguirlos) como en un mecanismo que permite consumir o procesar elementos de forma secuencial. Un iterador proporcionará cada elemento de una colección manteniendo el estado del proceso de recorrido. Un generador funciona de forma similar a un iterador.

Este mecanismo es la base de dos conceptos que se verán también en este módulo, como mapping y reduce. Mapping aplica una función a cada elemento de una colección, mientras que reduce realiza algún tipo de agregación sobre los elementos.

## Obtener un iterador a partir de una colección

Un iterador es, en esencia, un objeto que puede ser recorrido. En el código que se presenta abajo, la función **```next```** devuelve el siguiente elemento del iterador. El iterador guarda el estado del recorrido tras cada llamada. Finalmente, cuando el recorrido se ha terminado, se lanza la excepción `StopIteration` que finaliza el proceso.



In [2]:
iterador = iter([1,2,3,4,5,6])
while True:
  try:
    elemento = next(iterador)
    print (f'El elemento de la lista es {elemento}')
  except StopIteration:
    print ('Recorrido')
    break

El elemento de la lista es 1
El elemento de la lista es 2
El elemento de la lista es 3
El elemento de la lista es 4
El elemento de la lista es 5
El elemento de la lista es 6
Recorrido


In [3]:
type(iterador)

list_iterator

## Iteradores en colecciones

Al aplicar la función iter sobre una colección en Python, se produce un iterador diferente para cada iterador. Por ejemplo:

In [None]:
type(iterador)

list_iterator

`list_iterator` produce un iterador que recorre cada elemento de la lista

In [None]:
dictionary = {1:'juan','2':'pepe'}
iterdict = iter(dictionary)
type(iterdict)

dict_keyiterator

Sin embargo, un iterador sobre un diccionario recorrerá las claves de este diccionario:

In [None]:
while True:
  try:
    elemento = next(iterdict)
    print (f'El elemento del iterador -clave- es {elemento}')
    print (f'El valor de ese elemento es {dictionary.get(elemento)}')
  except StopIteration:
    print ('Recorrido')
    break

El elemento del iterador -clave- es 1
El valor de ese elemento es juan
El elemento del iterador -clave- es 2
El valor de ese elemento es pepe
Recorrido


## Implementación de un iterador

Como acabamos de explicar, un iterador recorre una colección. Por tanto, gestiona:

1. Un estado
2. Un método ```__next__``` que va a devolver el siguiente elemento y que de forma interna actualizará el estado en el que se encuentra el iterador. Cuando termine, será el encargado de lanzar la excepción ```StopIteration```
3. Un método, ```__iter__``` que definirá la clase como un iterador. Por lo general la implementación devuelve ```self```asumiendo que la clase puede definirse como un iterador.

Vamos a implementar un ejemplo:

In [None]:
class Iterador:
  """
  Esta clase recorrerá los elementos de forma secuencial hasta un límite
  """
  def __init__(self, limite ):
    self._limite = limite
    self._actual = 0
    self._siguiente = 1

  def __iter__(self):
    return (self)

  def __next__(self):
    if self._actual>self._limite:
      raise StopIteration
    else:
      self._actual = self._actual + 1
      return self._actual

In [None]:
nuevo = Iterador(9)
while True:
  try:
    elemento = next(nuevo)
    print (f'El elemento del iterador  es {elemento}')
  except StopIteration:
    print ('Recorrido')
    break

In [None]:
class AnilloIterador:
  """
  Esta clase recorrerá los elementos en un anillo hasta límite
  """
  pass

In [None]:
iterador = AnilloIterador()


1

In [None]:
## Modifica el código anterior para que cuando se llegue al límite, se vuelva al estado inicial

class AnilloIteradorSalto:
  """
  Esta clase recorrerá los elementos con saltos alternativos de 1 y 3 elementos, hasta un límite, momento en el que se volverá a iniciar,
  siempre que se completen nciclos
  hasta un límite
  """pass

## itertools
Contiene una colección de funciones que permite gestionar iteradores y generadores de manera potente y eficiente.

En esta guía únicamente vamos a analizar las primitivas principales, pero recomiendo revisar la [documentación oficial](https://docs.python.org/3/library/itertools.html)

In [None]:
from itertools import *

### chain

Combina varios iterables en uno de forma que se puedan recorrer como una unidad

In [None]:
seq = chain( [1,2,3], [11 ,12 ,13 ,14] , [x * x for x in range(1 ,6)] )
for item in seq:
  print( item , end=" -- ")

1 -- 2 -- 3 -- 11 -- 12 -- 13 -- 14 -- 1 -- 4 -- 9 -- 16 -- 25 -- 

### zip y zip_longest

`zip` Devuelve un iterador de tuplas, donde la i-ésima tupla contiene el i-ésimo elemento de cada una de las secuencias de argumentos o iterables. El iterador se detiene cuando se agota el iterable de entrada más corto. Sin embargo `zip_longest` permite no agotar la generación de tuplas al especificar un valor de relleno

In [None]:
seq = zip( ['A','B'],['C','D','E'],['X','Y','Z'])
for item in seq:
  print( item )

('A', 'C', 'X')
('B', 'D', 'Y')


In [None]:
seq = zip_longest( ['A','B'],['C','D','E'],['X','Y','Z'], fillvalue="::")
for item in seq:
  print( item )

('A', 'C', 'X')
('B', 'D', 'Y')
('::', 'E', 'Z')


### product
Realiza el producto cartesiano de los elementos de las secuencias

In [None]:
seq = product( ['A','B'],['C','D','E'],['X','Y','Z'])
for item in seq:
  print( item )

('A', 'C', 'X')
('A', 'C', 'Y')
('A', 'C', 'Z')
('A', 'D', 'X')
('A', 'D', 'Y')
('A', 'D', 'Z')
('A', 'E', 'X')
('A', 'E', 'Y')
('A', 'E', 'Z')
('B', 'C', 'X')
('B', 'C', 'Y')
('B', 'C', 'Z')
('B', 'D', 'X')
('B', 'D', 'Y')
('B', 'D', 'Z')
('B', 'E', 'X')
('B', 'E', 'Y')
('B', 'E', 'Z')


### Permutaciones y combinaciones

Funcionan igual que desde el punto de vista matemático. En el caso de las cominaciones, el parámetro longitud no es opcional.

In [None]:
seq = permutations( ['A','B','C'],3)
for item in seq:
  print( item )

('A', 'B', 'C')
('A', 'C', 'B')
('B', 'A', 'C')
('B', 'C', 'A')
('C', 'A', 'B')
('C', 'B', 'A')


In [None]:
seq = combinations( ['A','B','C'],2)
for item in seq:
  print( item )

('A', 'B')
('A', 'C')
('B', 'C')


In [None]:
seq = combinations_with_replacement( ['A','B','C'],2)
for item in seq:
  print( item )

('A', 'A')
('A', 'B')
('A', 'C')
('B', 'B')
('B', 'C')
('C', 'C')


### Otras funciones

#### cycle

Genera una secuencia que se repite indefinidamente:

In [None]:
seq = cycle( ['luis','ana','pablo'])
for i in range(10):

  print(next(seq))


luis
ana
pablo
luis
ana
pablo
luis
ana
pablo
luis


#### repeat
Repite una secuencia de forma indefinida

In [None]:
seq = repeat( ['luis','ana','pablo'])
for i in range(10):

  print(next(seq))

['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']
['luis', 'ana', 'pablo']


#### count

Genera una secuencia de forma indefinida especificando un punto de partida y un salto.

In [None]:
seq = count(1,3)
for i in range(10):

  print(next(seq))

1
4
7
10
13
16
19
22
25
28


### compress
Genera un objeto iterable de acuerdo a una máscara

In [None]:
datos = ['A', 'b', 'c', 'd', 'E']
mascara = [True, False, False, False, True]

seq = compress(datos,mascara)
for datos in seq:
  print (datos)



A
E


In [None]:
type (seq)

itertools.compress

## Funciones generador

Una función generador es una función que devuelve un objeto de tipo `generator` que puede ser utilizado para iterar a lo largo de una secuencia de valores.

Puedes pensarlo como una forma de generar iteradores de forma más sencilla.

Una función generador sólo responde ante una llamada de iteración!

Se define exactamente igual que una función, pero en lugar de devolver un valor mediante `return` se utiliza la palabra reservada `yield`. `yield`va a preservar el estado del generador y de las variables.

Un ejemplo:

In [None]:
def recorrer_saltando(inicio,fin,salto):
  actual = inicio
  print (f'actual: {actual}')
  while actual < fin:
    yield actual
    print('actualizo actual:')
    actual = actual + salto
    print (f'actual: {actual}')



Fijaos que tras `yield` se permite realizar la actualización posterior de actual. La presencia de `yield`en la función la convierte en un generador.

In [None]:
for e in recorrer_saltando(0,5,2):
  print (e)

actual: 0
0
actualizo actual:
actual: 2
2
actualizo actual:
actual: 4
4
actualizo actual:
actual: 6


In [None]:
for i in range (0,5,2):
  print (i)

0
2
4


**Ojo** En un bucle `for`no hemos tenido problemas con StopIteration. Al llamar sucesivamente a `next` finalmente sí hemos recibido una excepción.

**Nota**: Fijaos que con un generador, los datos se generan conforme se van a consumir, siendo más eficientes en memoria.

In [None]:
## Implementa un generador que replique el Iterador Anillo Ciclo


## Expresiones

En Python se pueden definir expresiones que devuelven un iterador. Por ejemplo:


In [None]:
milista = [1,2,3,4,5,6,7,0,3]

(elemento for elemento in milista)

<generator object <genexpr> at 0x7fdecacf19a0>

In [None]:
[elemento for elemento in milista]

[1, 2, 3, 4, 5, 6, 7, 0, 3]

In [None]:
(elemento for elemento in milista if elemento>5)

In [None]:
(elemento if elemento>5 else 'XX' for elemento in milista if elemento>5)

<generator object <genexpr> at 0x7af411fccd60>

Esta forma de definir un objeto que se puede recorrer es más eficiente que instanciar una lista o una colección en memoria, dado que la devolución del objeto se realizará en tiempo de ejecución.

In [None]:
milista = [1,2,3,4,5,6,7,0,3]

[elemento + 1 for elemento in milista]

[2, 3, 4, 5, 6, 7, 8, 1, 4]

In [None]:
generador = (elemento if elemento>5 else 'xx' for elemento in milista)
for e in generador:
  print (e)

xx
xx
xx
xx
xx
6
7
xx
xx


## Contenido extra: clases generador: un ejemplo con yield / from
Veamos un ejemplo con un Arbol:

In [None]:
class NodoArbol:
  def __init__(self, value):
              self._valor = value
              self._siguientes = []
  def __repr__(self):
    return 'Actual({!r})'.format(self._valor)

  def add_siguiente(self, node):
    self._siguientes.append(node)

  def __iter__(self):
   return iter(self._siguientes)

  def recorrer(self):
    yield self
    for otro in self:
      yield from otro.recorrer()
  # Example
root = NodoArbol(0)
child1 = NodoArbol(1)
child1.add_siguiente(NodoArbol(3))
child2 = NodoArbol(2)
child2.add_siguiente(NodoArbol(4))
root.add_siguiente(child1)
root.add_siguiente(child2)
for ch in root.recorrer():
  print (ch)

Actual(0)
Actual(1)
Actual(3)
Actual(2)
Actual(4)


Hemos usado `yield from`. Esta sentencia permite pasar el contexto de una iteración a otro. De esta forma, cuando el nodo ha sido visitado le pasa el testigo a su hijo para continuar el recorrido. Cuando termina, el testigo pasa al nodo siguiente del nivel del padre.

## Ventajas y desventajas del uso de generadores frente a otras estructuras:

1. En aplicaciones en las que la memoria es un problema a optimizar, el uso de generadores te permite no tener toda la estructura de datos en memoria.
2. Por el contrario, no existe tanta flexibilidad a la hora de manejar los datos: no existen operaciones específicas como append o remove, o si queremos acceder de nuevo a un dato hay que volver a generarlo.

# Introducción a la programación funcional


La idea de que existe tras la programación funcional es aplicar pequeñas expresiones en forma de funciones para realizar **transformaciones sobre los datos**. La programación funcional está presente en `frameworks` de procesamiento big data como `Hadoop o Spark`.

Si bien la combinación de funciones da lugar a un código más compacto y expresivo, pasar de un paradigma basado en objetos a la programación funcional no es siempre fácil.



### Lambda functions

Antes de empezar con los patrones u operaciones básicos con los que nos vamos a encontrar, conviene detenernos en las expresiones `lambda`.

Una expresión `lambda` es una forma de definir funciones de forma anónima y compacta en una única expresión.

La estructura que tienen es `lambda entradas: operacion que devuelve resultado`

In [None]:
lambda x: x + 2

<function __main__.<lambda>(x)>

es equivalente a:

In [None]:
def mifuncionlambda(x):
  return x + 2

mifuncionlambda

Una función lambda puede recibir argumentos. Por ejemplo:

In [None]:
(lambda x: x + 2)(10)

12

In [None]:
(lambda x, y, z: x + y + z)(1, 2, 3)

6

In [None]:
(lambda x, y: y)(9,10)


10

Como es una función, podemos también hacer cosas como:

#### Aspectos avanzados

1.  **Usar `args` o `kwargs`**

In [None]:
(lambda *args: sum(args))(3,4)

7

**2. HOF con funciones lambda**


In [None]:
def componer_funcion(f):
    return lambda x: f(x + 1)

funcion = componer_funcion(lambda x: x*2)
funcion(4)

10

**3. componer funciones lambda**

In [None]:
(lambda x: lambda y: x(y))(lambda x: x + 1)(3)

4

### Algun ejemplo adicional


In [None]:
(lambda x : x>=1)(2)

True

In [None]:
(lambda x, y, z: x + y - z)(2,4,5)

1

In [None]:
(lambda x, y : x + y)(8,7)

15




Existen tres patrones operaciones básicas, map, reduce, filter. Vamos a verlas:

### Map:
Aplica una función F a cada elemento x de una colección C:

$ \left\{ F(x): x \epsilon C\right\}$

In [None]:

def mas2(x):
  return x + 2

def menos2 (x):
  return x - 2


In [None]:

e = [1,3,4,9,21,231]
value = list(map(mas2,e))
print (value)

[3, 5, 6, 11, 23, 233]


In [None]:
## haced un mas dos con una función lambda

In [None]:

lista = [1,3,4,9,21,231]
value = list(map(lambda x : x + 2,lista))
print (value)

[3, 5, 6, 11, 23, 233]


### Filter:

Selecciona elementos de una colección de acuerdo a la condición especificada por una función:

$\left\{x \epsilon C\text{ if F(x)==True}\right\}$

In [None]:
#Devuelve una lista de elementos pra los cuales una función devuelve True

list(filter(lambda x : (x-1>2),[1,2,3,4,5]))

[4, 5]

In [None]:
### Haced lo mismo con una función

In [None]:
def mifiltro(x):
  return (x-1)>2

list(filter(mifiltro,[1,2,3,4,5]))

[4, 5]

### Reduce

Sirve para realizar agregaciones sobre los elementos de una lista, de dos en dos.

In [None]:
from functools import reduce

maximo = reduce((lambda x, y: max(x,y)), [1, 2, 3, 4])


In [None]:
maximo

4

### Ejemplos:




### Ejemplo 1: Aplicar un descuento sobre los periféricos cuyo precio sea múltiplo de 10


In [None]:
componentes = {'teclado':  ('logitec', 113),
          'raton': ('logitec', 90),
          'monitor': ('hp bang&olufsen', 985),
          'torre': ('mac studio', 3000),}



In [None]:
### qué es componentes: un diccionario donde los valores son tuplas
### qué piden:
#### 1. Un filtro: precio multiplo de 10
#### 2. Un descuento: esto es, una función


In [None]:
### Recordemos: si es un diccionario, podemos acceder a los elementos por clave o por valor
[k for k in componentes.values()]

[('logitec', 113),
 ('logitec', 90),
 ('hp bang&olufsen', 985),
 ('mac studio', 3000)]

In [None]:
filtrados = list(filter(lambda x: x[1] % 10 == 0, componentes.values()))
filtrados

[('logitec', 90), ('mac studio', 3000)]

In [None]:
descontados = zip([x[0] for x in filtrados],list(map(lambda x : x [1]*0.9, filtrados)))
list(descontados)

[('logitec', 81.0), ('mac studio', 2700.0)]


### Ejemplo 2: Sumar el precio de los periféricos cuyo precio sea múltiplo de 10

In [None]:
from functools import reduce

reduce ((lambda x,y: x + y) , list(map(lambda x: x[1], list(filter(lambda x: x[1] % 10 == 0, componentes.values())))))

3090

### Ejemplos adicionales



#### 1. Devuelve los elementos de aquellos divisible por 2 (ej (a,1))

In [None]:
lista = [1,2,3,18,5,6,7]
lista2 = ['A','B','C','D','E','F','G']



#### 2. Añadir un X a cada elemento de la lista anterior

['AX', 'BX', 'CX', 'DX', 'EX', 'FX', 'GX']

### 3. Devolver la suma acumulada de los

*   Elemento de lista
*   Elemento de lista

elementos que sean divisibles por 3

In [None]:
ejemplo

[(1, 'A'), (2, 'B'), (3, 'C'), (18, 'D'), (5, 'E'), (6, 'F'), (7, 'G')]

En este punto tengo una lista de tuplas. Para hacer la agregación, me interesa una lista de enteros. Por tanto, como estoy haciendo una transformación, utilizaré `map`

27

#### Ejercicio 4

Suma acumulada de los que son divisibles por 2

dict_values([2, 3, 5, 6, 7])

8

### Contenido extra: Pipes

Los `pipes` permiten encadenar funciones en un expresión. Con `reduce` podemos emular los `pipes`, teniendo en lugar de un iterable de datos, un `iterable` de funciones. Por ejemplo:

In [None]:
fns=(lambda x:x+2,lambda x:x*32,lambda x:x / 5)

reduce(lambda x,f:f(x),fns,3)

32.0