# Optimización del código


## Objetivos

* Reescribir llamadas a loops y map() como una list coprehension en Python
* Elegir entre comprensiones, loops y map()
* Potenciar tus comprensiones con lógica condicional
* Usar comprensiones para reemplazar filter()
* Perfilar el código para resolver preguntas de rendimiento

 ## Introducción 

En los primeros tiempos de la informática, programar exigía utilizar lenguajes muy próximos a la plataforma de ejecución. El código máquina o el lenguaje ensamblador permiten un control muy fino del proceso de ejecución: cómo se asignan los registros del procesador, cómo se almacenan los datos y se accede a la memoria, … Así es posible exprimir la máxima eficiencia de una plataforma, aunque el precio a pagar es la falta de portabilidad y el mayor coste de desarrollo y mantenimiento del código.

Afortunadamente, hoy en día podemos utilizar lenguajes de programación de alto nivel, que abstraen estos detalles de la plataforma y nos permiten ser más productivos resolviendo problemas más complejos en menos tiempo. Sin embargo, con esta transición a veces olvidamos que existen formas más optimas para realizar las tareas y muchas veces vemos que esto nos afecta hasta que ya todo está funcionando en producción, la idea de esta guía es recordarnos que hay algunas formas más optimas para realizar ciertas tareas, sin dejar atras la legibilidad del código.

### Usando list comprehensions
Estas proporcionan una forma concisa de crear listas. Se componen de dos corchetes que contienen una expresión seguida por una cláusula **for** o **if**. Las expresiones pueden ser cualquier cosa , lo que significa que podemos utilizarlo en todo tipo de objetos dentro de las listas.

El resultado será una nueva lista con el objeto creado a partir de la expresión en el contexto de las cláusulas **for** e **if** que le siguen.   
Esto podemos verlo expresado como pseudocódigo de la siguiente manera:

`new_list = [expression for item in iterable if conditional]`

que se traduce a código como:


`new_list = [expression(i) for i in list_of_items if filter(i)]`

el filtro nos ayudará a obtener unicamente los objetos que deseamos pero este puede omitirse si no es necesario.

Un ejemplo de uso sería el siguiente:

In [28]:
squares = [x**2 for x in range(10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

En este caso nuestra expression será el item actual de la iteración (**x**), y el iterable (**range(10)**) sin filtros o condicionales.

In [30]:
original_prices = [1.25, -9.45, 10.22, 3.78, -5.92, 1.16]
prices = [i if i > 0 else 0 for i in original_prices]
prices

[1.25, 0, 10.22, 3.78, 0, 1.16]

En este ejemplo, podemos notar que aplicamos una condición a la lista.
A demás de la facil lectura de este código podemos tener beneficios como la rapidéz.

### Usando Lambdas
Las funciones lambda también conocidas como abstracciones de lambda, tienen su origen en la lógica matemática y el cálculo de lambda, a diferencia de los lenguajes de programación imperativos que adoptan el modelo de computación basado en estados inventado por Alan Turing. Los dos modelos de computación, cálculo lambda y máquinas de Turing, se pueden traducir entre sí. Y esta equivalencia se conoce como la hipótesis de Church-Turing.
Los lenguajes funcionales heredan directamente la filosofía del cálculo lambda, adoptando un enfoque declarativo de programación que enfatiza la abstracción, la transformación de datos, la composición y la pureza (sin estado ni efectos secundarios). Ejemplos de lenguajes funcionales incluyen Haskell, Lisp o Erlang.  

Por el contrario, Turing Machine condujo a una programación imperativa que se encuentra en lenguajes como Fortran, C o Python.

El estilo imperativo consiste en programar con declaraciones, conduciendo el flujo del programa paso a paso con instrucciones detalladas. Este enfoque promueve la mutación y requiere administrar los estados.

Python no es inherentemente un lenguaje funcional, sin embargo varios conceptos de programación funcional fueron adoptados desde sus inicios en 1994 map(), filter(), reduce() y el operador lambda fue agregado un poco más tarde.

Operador Lambda:

In [25]:
# Imperativo:
def identidad(x):
    return x + 1
# Se traduce a Funcional como:
lambda x : x + 1


<function __main__.<lambda>(x)>

In [26]:
# (lambda x: x + 1)(2) = lambda 2: 2 + 1
#                   = 2 + 1
#                  = 3
#
#
#
y = 2
(lambda x: x + 1)(y)

3

### Usando map() objects
map() proporciona un enfoque alternativo que se basa en la programación funcional . Como parametros pasamos una función y un iterable, y map()creará un objeto. Este objeto contiene el resultado que obtendríamos al ejecutar cada elemento iterable a través de la función proporcionada.

Como ejemplo, consideremos una situación en la que necesitamos calcular el precio después de impuestos para una lista de transacciones:


In [4]:
lista_de_precios  =  [ 1.09 ,  23.56 ,  57.84 ,  4.56 ,  6.78 ] 
TAX_RATE  =  0.08 

def  get_price_with_tax ( lista_de_precios ): 
    return  lista_de_precios  *  ( 1  +  TAX_RATE ) 

precios_con_impuestos  =  map ( get_price_with_tax ,  lista_de_precios ) 
list( precios_con_impuestos )

[1.1772000000000002, 25.4448, 62.467200000000005, 4.9248, 7.322400000000001]

El resultado de este script almacena el objeto resultante en precios_con_impuestos. Podemos convertir fácilmente este objeto map en una lista usando list().

#### Ejercicios:  
1. considerando que podemos utilizar la función `str("""string_en_minusculas""").upper()` para convertir cualquier string en un texto en mayusculas,   utiliza un map para convertir `my_text = "Este es un texto Random"` a un texto completamente en maysculas y luego imprimirlo como resultado

In [16]:
# Solución:



2. Considerando que tenemos el siguiente objeto json `simple_dict` escribe una función que imprima el valor que contiene el key `"nombre"` usando lambda.

In [79]:
# Solución


'valeria'

3. Ahora que sucede si en vez de un solo objeto json, tenemos un listado de objetos json?

a continuación podemos ver una comparativa de los distintos métodos:

In [71]:
import random
import timeit
TAX_RATE = .08 
# Porque no podemos iterar sobre 100000 sin el range?
txns = [random.randrange(100) for _ in range(100000)]
def get_price(txn):
    return txn * (1 + TAX_RATE)

def get_prices_with_map():
    return list(map(get_price, txns))

def get_prices_with_lambda():
    # Esta linea sustituye a la función get_price
    get_price_lambda = lambda x : x * (1 + TAX_RATE) 
    
    result = [get_price_lambda(txn) for txn in txns]
    
    return result

def get_prices_with_comprehension():
    return [get_price(txn) for txn in txns]

def get_prices_with_loop():
    prices = []
    for txn in txns:
        prices.append(get_price(txn))
    return prices

# timeit es una función que nos ayuda a medir el tiempo de ejecución de un método
print("comprehension: ",timeit.timeit(get_prices_with_comprehension, number=100))
print("loop: ",timeit.timeit(get_prices_with_loop, number=100))
print("lambda: ", timeit.timeit(get_prices_with_lambda, number=100))
print("map: ", timeit.timeit(get_prices_with_map, number=100))




comprehension:  1.4422237819999282
loop:  1.8601072139999815
lambda:  1.5124189440002738
map:  1.2068358480000825


Como podemos notar en este caso en específico la opción más rapida es **map()**.

### Sort

El método Sort es inherente de Python por lo que podemos utilizarlo en muchos casos sin necesidad de importar bibliotecas, a continuación veremos algunos de los casos en los que se puede utilizar:

#### Ordenando listas simples


In [11]:
numbers = [3, 4, 2, 5, 9, 8, 6, 1, 7] 
  
# las ordenamos en orden ascendente
numbers.sort() 

numbers

[1, 2, 3, 4, 5, 6, 7, 8, 9]

#### Ordenando una lista de listas

##### Usando for loop y sort

In [7]:
my_input = [['Machine', 'London', 'Canada', 'France', 'Lanka'], 
         ['Spain', 'Munich'], 
         ['Australia', 'Mandi']] 
  
# ordenamos lista por lista dentro del for loop
for sublist in my_input: 
    sublist.sort() 
  
my_input # En este caso no necesitamos una nueva variable ya que el método sort se aplica directamente en la lista

[['Canada', 'France', 'Lanka', 'London', 'Machine'],
 ['Munich', 'Spain'],
 ['Australia', 'Mandi']]

##### Usando map

In [9]:
my_input = [['Machine', 'London', 'Canada', 'France', 'Lanka'], 
         ['Spain', 'Munich'], 
         ['Australia', 'Mandi']] 
  
# En este caso utilizamos map para acceder a cada item de las listas que están contenidas en la lista principal
my_output = list(map(sorted, my_input)) 
  
my_output

[['Canada', 'France', 'Lanka', 'London', 'Machine'],
 ['Munich', 'Spain'],
 ['Australia', 'Mandi']]

##### Usando lambda

In [8]:
my_input = [['Machine', 'London', 'Canada', 'France', 'Lanka'], 
         ['Spain', 'Munich'], 
         ['Australia', 'Mandi']] 
  
# en este caso lambda en conjunto con una list coprehension nos ayuda a accesar a la primera letra de cada item y ordenarla por medio de ella
my_output = [sorted(x, key = lambda x:x[0]) for x in my_input] 
  
my_output

[['Canada', 'France', 'London', 'Lanka', 'Machine'],
 ['Munich', 'Spain'],
 ['Australia', 'Mandi']]

#### Ordenando un diccionario

In [5]:
key_value = dict()     
   
# Inicializamos el diccionario  
key_value[2] = 56       
key_value[1] = 2 
key_value[5] = 12 
key_value[4] = 24
key_value[6] = 18      
key_value[3] = 323 
   
   
 # de esta forma lo ordenaremos en orden lexicográfico 
 # Para ordenarlo matematicamente hay que cambiar los valores por floats
result = sorted(key_value.items(), key = lambda kv:(kv[1], kv[0])) 
dict(result) # convertimos el listado de tuplas resultante en un dictionario nuevamente

# Que nos genera key_value.items() ?

{1: 2, 5: 12, 6: 18, 4: 24, 2: 56, 3: 323}

In [24]:
dict(map(reversed, result)) # podemos cambiar el key por el valor con el método "reversed" dentro de un map

{2: 1, 12: 5, 18: 6, 24: 4, 56: 2, 323: 3}

#### Ordenando una lista de diccionarios

In [27]:
lista_de_diccionarios = [{ "name" : "Nandini", "age" : 20},  
{ "name" : "Manjeet", "age" : 23 }, 
{ "name" : "Nikhil" , "age" : 19 }] 
  
# En este caso vamos a ordenarlos por la edad, para accesar a ese valor usaremos un lambda
sorted(lista_de_diccionarios, key = lambda i: i['age']) 

[{'name': 'Nikhil', 'age': 19},
 {'name': 'Nandini', 'age': 20},
 {'name': 'Manjeet', 'age': 23}]

#### Convirtiendo listas a dicccionarios

In [6]:
# Es más rapido hacerlo así? o con un for loop?
keys = ['a', 'b', 'c']
values = [1, 2, 3]
dictionary = dict(zip(keys, values))
dictionary

{'a': 1, 'b': 2, 'c': 3}

### CPU o RAM?

#### CPU
El procesador o CPU es un elemento esencial dentro de cualquier equipo que ejecuta todo tipo de tareas, realiza operaciones de enteros y de coma flotante y también efectúa accesos a la memoria RAM.

Podemos decir que todo pasa por el procesador y que el mismo se encarga de asignar tareas a otros componentes, como la tarjeta gráfica por ejemplo, aunque su importancia puede quedar parcialmente eclipsada por dicho componente en función del uso que vayamos a dar al equipo.

#### RAM
La memoria de acceso aleatorio, más conocida como memoria RAM por sus siglas en inglés, ejerce también una función vital, ya que sirve de *almacén temporal* para el sistema operativo y para todas las tareas y aplicaciones con las que estemos trabajando, evitando que el procesador tenga que volver a realizar ciertos trabajos ya que éstos quedan guardados en ella y se pueden recuperar en cualquier momento, siempre que no apaguemos el equipo.

##### Entonces en que casos necesitamos más RAM y en que casos más CPU?

La explicación más simplificada es que el CPU lo necesitamos para procesar datos como tal (transformar, hacer operaciones matemáticas, renderizar, etc) y la RAM la necesitamos para poder aplicar estas operaciones al mismo tiempo a una gran cantidad de datos, o para tener disponibles estos datos en el momento que los necesitamos sin ir de nuevo por ellos a la base de datos.  
Entonces, veamos cada caso con un ejemplo:

Suponiendo que queremos convertir una cadena de RNA a una proteína, primero, debemos obtener la cadena de RNA, suponiendo que lo hacemos desde una base de datos, estos datos son leídos y pasados a memoria RAM y una vez allí ya podemos aplicar la transformación de los datos a proteínas, este proceso lo realiza el CPU y finalmente los datos resultantes quedan de nuevo en memoria RAM (como proteína) hasta que los guardamos de nuevo en la base de datos.

Ahora bien, si nuestra cadena de RNA fuese, por ejemplo la cadena completa de un humano, entonces nuestra RAM tiene que ser lo suficientemente amplia para poder almacenar tanto los datos de RNA como el resultante de proteína si queremos hacerlo todo en una sola iteración y ya es el CPU con sus distintos cores quien se encargará de procesarlo, en el caso que no tengamos suficiente RAM deberíamos de accesar a la base de datos y obtener pedazos de la cadena para procesarlas por separado, lo cual tomaría mucho más tiempo.

Es aquí donde debemos decidir si necesitamos más RAM o más CPU y probablemente para algunas tareas nuestra computadora de escritorio no sea suficiente para que el código se ejecute en un tiempo razonable, o incluso puede que llene por completo la memoria RAM y ya no pueda seguir procesando los datos.

En el caso de la conversión de RNA a proteína, necesitabamos más RAM debido al tamaño de los datos pero poco CPU debido a que el procesamiento no es tan complejo, sin embargo cuando estamos entrenando un modelo de deep learning es más probable que necesitemos más CPU o GPU y no tanta RAM ya que lo que más se necesita son operaciónes matemáticas que deben resolverse.

## Highligts

* La RAM sirve para almacenar datos en memoria mientras que el CPU los procesa, cuanto necesitamos de cada uno depende del tipo de tareas que vamos a ejecutar.

* Para generar data inicial en una lista podemos hacer una multiplicación de la lista con una string con la cantidad de items que necesitamos por ejemplo:


In [11]:
mi_lista = ["a"] * 10
mi_lista

['a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a']

## Bibliografía

http://informatica.blogs.uoc.edu/2016/05/02/optimizacion-de-codigo-un-codigo-mas-eficiente/ Optimización de código: un código más eficiente 2016
        