<img src="img/viu_logo.png" width="200">

## 01MIAR - Advanced

![logo](img/python_logo.png)

*Ivan Fuertes / Franklin Alvarez*

# Estructuras de datos avanzadas

* Array.
* 2D Array.
* Lista enlazada (linked list).
* Pila (stack).
* Cola (queue).
* Cola de prioridad (heap).
* Tabla Hash.
* Grafo.

> Es importante elegir estructura de datos en base a qué operaciones queremos que se ejecuten de manera eficiente.

## Array

* Estructura contigua de memoria.
* Las *listas* de Python están implementas como arrays.
* Acceso aleatorio rápido a través de un índice.
    * Dirección de memoria + offset.

<img src="img/data_structures/array.png" width="800">

In [None]:
array = [0, 0, 0, 0, 0]
array[1] = 3
print(array)

## 2D Array

* Estructura contigua de memoria.
* Es un array de arrays.
* Sirve para representación de *matrices*. Por lo tanto, puede verse como una tabla, con sus filas y columnas.
* Acceso aleatorio rápido a través de 2 índices.

<img src="img/data_structures/2D_array.png" width="900">

Ejemplo: registros de temperatura por día.

In [None]:
registros = [[10, 13, 16, 11], [5, 6, 8, 6], [11, 11, 12, 12], [7, 11, 16, 15]]
print(registros[1][2]) #  Tercer registro del segundo día

In [None]:
# Mostrar todos los registros
for dia in registros:
    for registro in dia:
        print(registro, end = " ")
    print()

## Lista enlazada (Linked list)

* Similar a los arrays, pero los elementos no están en posiciones contiguas de memoria.
* Cada elemento es un nodo que contiene dos partes:
    * Un dato.
    * Un enlace al siguiente nodo de la lista.
* No permite acceso aleatorio en base a un índice.
* Inserciones y borrados más rápidos que en un array.

<img src="img/data_structures/linked_list.png" width="600">

Implementación a través de *deque* (double-ended queue).

In [None]:
from collections import deque

linked_list = deque('abcd')
print(linked_list)

linked_list.append('e')
print(linked_list)

linked_list.remove('b')
print(linked_list)

## Pila (Stack)

* Almacena items en orden Last-In/First-Out (LIFO).
* Es decir, los items se extraen en orden contrario al orden de inserción.
* Ejemplo de caso de uso: funcionalidad deshacer.

<img src="img/data_structures/stack.png" width="800">

Hay varias opciones de implementación

#### Pilas usando Listas

* *Push* con método *append*.

In [None]:
pila = []

pila.append('a')
pila.append('b')
pila.append('c')

print(pila)

print(pila.pop())
print(pila.pop())
print(pila.pop())

print(pila)

* Las listas están implementadas como un *array*.
* Dado que los arrays son bloques de memoria contiguos, la operación *push* puede ocasionalmente tener un coste elevado.
   * Esto es porque el array puede haberse quedado sin espacio. En este caso, Python internamente crea uno nuevo (más grande) y transfiere todos los elementos.

#### Pilas usando Deque

In [None]:
from collections import deque
pila = deque()

pila.append('a')
pila.append('b')
pila.append('c')

print(pila)

print(pila.pop())
print(pila.pop())
print(pila.pop())

print(pila)

* *Deque* está implementada como *lista enlazada*.
* La operación *pop* siempre tiene coste bajo.
* Para implementar una pila, *deque* es más apropiado.

## Cola (Queue)

* Almacena items en orden First-In/First-Out (FIFO).
* Es decir, los items se extraen en orden de inserción.
* Ejemplo de caso de uso: jobs de una impresora.

<img src="img/data_structures/queue.png" width="800">

#### Colas usando Deque

* *Enqueue* implementada como *append* y *dequeue* como *popleft*.
* *Deque* está implementada como *lista enlazada*.
* Ambas operaciones de las colas siempre tienen un coste bajo.
* Es muy mala idea implementar colas usando listas de Python (arrays), ya que una de las operaciones requerirá desplazar todos los elementos.

In [None]:
from collections import deque

q = deque()
q.append(1)
q.append(2)
q.append(3)

print(q)

print(q.popleft())
print(q.popleft())
print(q.popleft())

print(q)

## Cola de prioridad (heaps)

* Es como una cola, pero en lugar de extraer por orden de inserción, se extrae por orden de prioridad (en base a algún criterio de ordenación).
* Ejemplo de caso de uso: lista de tareas, donde quieres ir abordando la más urgente.


* Operaciones:
    * *insert*: inserta un elemento en la cola de prioridad.
    * *extract min/max*: extrae el elemento de mayor prioridad.

#### Colas de prioridad usando Heapq

* Implementación basada en *array*.
* En [este enlace](https://realpython.com/python-heapq-module/) podéis encontrar detalles de cómo se implementan colas de prioridad por medio de arrays.

In [None]:
import heapq

cola_prioridad = [3, 1, 9, 5]
print('Array original:', cola_prioridad)
heapq.heapify(cola_prioridad)
print('Tras heapify:', cola_prioridad)

heapq.heappush(cola_prioridad, 4)     # Insert
print('Tras insertar 4: ', cola_prioridad)

print('Pop devuelve:', heapq.heappop(cola_prioridad))  # Extract min
print('Tras pop:', cola_prioridad)

print('Pop devuelve:', heapq.heappop(cola_prioridad))  # Extract min
print('Tras pop:', cola_prioridad)

print('Pop devuelve:', heapq.heappop(cola_prioridad))  # Extract min
print('Tras pop:', cola_prioridad)

print('Pop devuelve:', heapq.heappop(cola_prioridad))  # Extract min
print('Tras pop:', cola_prioridad)

print('Pop devuelve:', heapq.heappop(cola_prioridad))  # Extract min
print('Tras pop:', cola_prioridad)

## Tabla Hash

* Un array convencional + una función hash que determina el índice de cada elemento.
* Aprovecha el acceso aleatorio de los arrays para soportar búsquedas muy eficientes.
* Resolución de colisiones.
    * Open addressing.
    * Separate chaining.

<img src="img/data_structures/hash_table.png" width="600">

Los conjuntos (sets) y diccionarios de Python se implementan como una Tabla Hash.

Ejemplo: mantener registro de personas que han acudido a un evento.

In [None]:
personas = set()

personas.add('Pablo Gil')
personas.add('Jose Perez')
personas.add('Beatriz Rodriguez')

print(personas)

print('Pablo Gil' in personas)
print('Sofia Navarro' in personas)

## Grafo

* Permiten representar redes (nodos relacionados entre sí por medio de aristas).
* Características:
    * Dirigidos vs no dirigidos.
    * Ponderados vs no ponderados.
* Gran multitud de aplicaciones: los nodos pueden representar cualquier cosa que sea de interés para nuestra aplicación.

<img src="img/data_structures/graph.png" width="900">

Ejemplo: Camino más cortos ([Algoritmo de Dijkstra](https://es.wikipedia.org/wiki/Algoritmo_de_Dijkstra)).

#### Implementación por medio de Lista de Adyacencia

* Una lista de listas enlazadas donde cada nodo del grafo se almacena junto a los vertices adyacentes.

In [None]:
grafo = {
    1 : [2, 3],
    2 : [5],
    3 : [5],
    4 : [6],
    5 : [4, 6],
    6 : []
}

print(grafo)

Mostrar los nodos de un grafo:

In [None]:
print(list(grafo.keys()))

Añadir nuevo nodo a un grafo:

In [None]:
def anyadir_nodo(nodo):
    if nodo not in grafo:
        grafo[nodo] = []

anyadir_nodo(7)
print(grafo)

Añadir nueva arista:

In [None]:
def anyadir_arista(nodo_origen, nodo_destino):
    if nodo_origen in grafo and nodo_destino not in grafo[nodo_origen]:
        grafo[nodo_origen].insert(0, nodo_destino)
        
anyadir_arista(6, 7)
print(grafo)

# Software Craftsmanship

* Movimiento que enfatiza la **excelencia técnica** como clave del éxito en la construcción de productos software.
* Nace como respuesta a:
   * Ingenieros de software que se centran más en el aprendizaje de nuevos frameworks y herramientas en lugar de buenas prácticas de ingeniería.
   * La percepción de que en la industria del software se valora más el trabajo de gestión que el trabajo técnico.
      * Se intenta ser productivo sin prestar atención a la excelencia técnica.

> **No se puede ser productivo si el código sobre el que trabajamos es de baja calidad.**

## Buenas prácticas de ingeniería software

#### Nombrado de variables

* Se puede incrementar mucho la legibilidad del código a través de variables con nombres descriptivos.
* Es desaconsejable el uso de "números mágicos": números que aparecen en el código sin explicación de su significado.

Compara:

In [None]:
class Employee:
    def pay(self, amount):
        pass
    
employee = Employee()

employee.pay(15 * 8)

In [None]:
hourly_rate = 15

employee.pay(hourly_rate * 8)

In [None]:
hours_per_day = 8

employee.pay(hourly_rate * hours_per_day)

In [None]:
total_amount = hourly_rate * hours_per_day

employee.pay(total_amount)

#### Comentarios

* Los comentarios son positivos para facilitar la comprensión del código, pero pueden perjudicar si se hace mal uso de ellos.
* Un comentario no debería usarse para explicar código ilegible. La solución es reescribir el código para que sea más legible.
* Los comentarios tienen el peligro de que pueden quedarse obsoletos y mentir acerca del código.

> **La única verdad acerca de un sistema software reside en el código fuente**.

Tipos de comentarios a evitar:

**Comentarios con información inapropiada**

* Es conveniente evitar comentarios que contengan información que se puede proporcionar fácilmente a través de otro medio.
* Este tipo de comentarios es difícil de mantener.

In [None]:
# Employee class.
# History of changes.
# 2021-02-23 - Pablo Pérez - implementation of pay method
# 2021-02-27 - Eva López - refactoring: split pay method in two.
# ....

class Employee:
    pass

**Comentario obsoleto**

* Cuando un comentario se queda obsoleto, miente y confunde en lugar de ayudar.
* Siempre que veamos un comentario obsoleto, lo mejor es eliminarlo, o al menos tratar de actualizarlo.

In [None]:
# Esta variable almacena el número total de empleados en la empresa
empleados_con_contrato_parcial = 32

**Comentario redundante**

* Los comentarios no deben repetir lo que ya diga el código de manera clara.
* Suelen aparecer cuando los comentarios son requeridos por algún tipo de convención o guía de estilo.

In [None]:
i = 0
i += 1  # Incrementa i 

# Esta función devuelve el número de empleados
def obtener_numero_empleados():
    pass

**Comentario mal escrito**

* Los comentarios ocupan espacio en el código. Cuando escribamos uno, debemos esforzarnos en que sea el mejor comentario que podamos escribir: bien redactado y sin faltas de ortografía.

**Código comentado**

* Debemos evitar dejar código comentado.
* El sistema de control de versiones recuerda todos los estados en los cuales nuestro código ha estado en el pasado.
* El código comentado se hace más y más irrelevante conforme pasa el tiempo.

#### Separación vertical

* Es importante que las variables se declaren cerca de su primer uso y no tengan una vida de cientos de líneas.
* Evitar declarar todas las variables al inicio de una función.
    * Da la sensación de que todas las variables se usan durante toda la función, lo cual no tiene porque ser cierto.
* Cuando los usos de una variable están separados, modificaciones en el medio pueden introducir errores.

#### Funciones

* Es conveniente escribir funciones *cohesivas*:
   * Cortas.
   * Enfocadas a realizar solo una labor, no muchas.
   * Nombres descriptivos.
   * Pocos parámetros.

**Responsabilidad única**

Compara:

In [None]:
def print_expenses():
    for expense in expenses:
        expensesStr = ""
        if((expense.type == "Breakfast" and expense.amount >= 15) or (expense.type == "Dinner" and expense.amount >= 30)):
            expenseStr += "X | "
        expenseStr += (expense.type + " | " + expense.description + " | " + expense.amount)
        print(expenseStr)

In [None]:
def is_overage(expense):
    return (expense.type == "Breakfast" and expense.amount >= 15) or (expense.type == "Dinner" and expense.amount >= 30)

overage_symbol = "X"

def print_expense(expense):
    print(expense.type + " | " + expense.description + " | " + expense.amount)
    
def print_expenses():
    for expense in expenses:
        if(is_overage(expense)):
            print(overage_symbol + " | ")
        print_expense(expense)

**Número de parámetros**

Cuando una función tiene muchos parámetros:

* Alto coste de mantenimiento:
   * Cualquier modificación de la lista de parámetros impacta a todos los que llaman a la función.
* Difícil lectura:
   * Entender tanto la firma de la función como cualquier llamada a la función requiere mucho esfuerzo mental.
   
¿Cual es estas dos invocaciones a función es más fácil de entender?

In [None]:
payment_service.deliver_pay_to(employee)

payment_service.deliver_pay_to(employee, "H_Emp", "SW Dept", 2150, True, False)

**Parámetros booleanos**

* Es conveniente evitar (en la medida de lo posible) los parámetros booleanos.
* Las funciones que reciben parámetros booleanos suelen hacer dos cosas: una para el caso 'True' y otra para el caso 'False'
* Suele ser mejor dividir la función en dos que hagan sólo una cosa cada una.

Compara:

In [None]:
def print_invoice(include_conditions):
    # ... Code to print invoice ...
    if(include_conditions):
        print_conditions()

# Invocaciones a la función        

print_invoice(True)
print_invoice(False)

In [None]:
def print_invoice():
    # ... Code to print invoice ...
    
def print_invoice_with_conditions():
    print_invoice()
    print_conditions()
    
# Invocaciones a las funciones
    
print_invoice_with_conditions()
print_invoice()

#### Encapsulación de condicionales

* Cuando una condición es compleja, es conveniente encapsularla en una función para hacer el código más legible.

Compara:

In [None]:
if printer != None and len(jobs_queue) > 0 and printer.get_status() != 2:
    # Print something

In [None]:
if printer_is_ready():
    # Print something

* Al encapsular condiciones, trata de evitar siempre nombres negativos. Expresar la negación de una función con nombre negativo (doble negación) es poco legible.

Compara:

In [None]:
if not printer_is_not_ready():
    # Do something

In [None]:
if printer_is_ready():
    # Do something

#### Argumentos selectores

* Evita argumentos que se utilicen para indicar desde fuera lo que una función debe hacer internamente.
* Los argumentos selectores:
   * Rompen la encapsulación de la función.
   * Son indicativos de que la función lleva a cabo más de una labor.
   * Tienden a generar nombres ambiguos.

Compara:

In [None]:
class Car:
    def do_action(self, action):
        if action == "Start":
            # Code to start car.
        elif action == "Stop":
            # Code to stop car.
        else:
            # Other action

In [None]:
class Car:
    def start(self):
        # Code to start car.
        
    def stop(self):
        # Code to stop car.

* Las funciones con muchas condiciones anidadas son difíciles de modificar sin introducir errores. Es más sencillo añadir nuevas funciones y dejar las que existen sin modificar.

#### Duplicación de código

* El código duplicado introduce dificultades de mantenimiento.
    * Cuando queremos actualizarlo, hay que modificar todas las partes donde el código duplicado aparece, lo que es costoso y propenso a erorres.
    
* Es conveniente crear abstracciones (variables, funciones o clases) para eliminar el código duplicado.

Compara:

In [None]:
def print_expenses():
    for expense in expenses:
        if(expense.is_overage()):
            print("X | " + expense.type + " | " + expense.description + " | " + expense.amount)
        print(expense.type + " | " + expense.description + " | " + expense.amount)

#### Consistencia

In [None]:
def expense_to_string(expense):
    return expense.type + " | " + expense.description + " | " + expense.amount

def print_expenses():
    for expense in expenses:
        if(expense.is_overage()):
            print("X | " + expense_to_string(expense))
        print(expense_to_string(expense))

* Sé consistente. Cuando hagas algo de una forma, hazlo siempre de la misma forma.
* No hacerlo introduce complejidad innecesaria.
* Al programar, especialmente al hacerlo en equipo, es importante definir una guía de estilo y seguirla en la medida de lo posible.

Compara:

In [None]:
class EmployeeRegistry:
    def add_employee(self, employee):
        pass
    
    def emp_remove(self, id):
        pass
    
    def _findEmp(self, id):
        pass

In [None]:
class EmployeeRegistry:
    def add_employee(self, employee):
        pass
    
    def remove_employee(self, id):
        pass
    
    def find_employee(self, id):
        pass

#### Preferencia polimorfismo sobre sentencias condicionales

* Normalmente, sentencias condicionales que se utilizan para seleccionar el tipo de un objeto se pueden reemplazar por polimorfismo.

Compara:

In [None]:
def calculate_area(figures):
    for figure in figures:
        if figure.type == "Circle":
            calculate_circle_area(figure)
        elif figure.type == "Rectangle":
            calculate_rectangle_area(figure)
        else:
            calculate_triangle_area(figure)

In [None]:
def calculate_area(figures):
    for figure in figures:
        figure.calculate_area()

En este ejemplo, podríamos tener una clase *Figure* y subclases para los diferentes tipos de figuras.

# Software Testing

## ¿Qué es el software testing? 

* Testing es la actividad de verificación de que el software funciona correctamente.
* Puede ser manual o automático.

#### Testing manual

* Una persona prueba manualmente que una aplicación hace lo que se espera.
    * Ejecución de *casos de prueba* especificados en un documento.
    * Realización de testing *exploratorio*.

Ejemplo de caso de prueba para una calculadora:

* Introducir los valores 4 y 5, ejecutar la acción multiplicar y comprobar que el resultado es 20.

#### Testing automático

* Los *casos de prueba* pueden automatizarse a través de código fuente.
    * Implementación de un "programa que prueba otro programa".


* Los tests automatizados son mucho más eficientes que los tests manuales ya que se pueden ejecutar las veces que queramos sin la intervención de un ser humano.

De aquí en adelante, se hace referencia, salvo que se especifique lo contrario, únicamente a tests automatizados, ya que son los que como programadores más valor nos van a aportar.

## Tipos de tests

Uno de los principales objetivos del testing es la **prevención** de bugs.

* *Tests unitarios*: verifican módulos del software de manera aislada.
* *Tests de aceptación*: verifican funcionalidad esperada por el usuario.
* *Tests de interfaz gráfica (UI)*: verifican que la aplicación, a través de su interfaz gráfica, funciona correctamente.

Además, también podemos probar el software de manera manual y exploratoria para **localización** de bugs que se nos hayan podido escapar.

<img src="img/testing/testing_pyramid.png" width="700">

Otra terminología que se puede encontrar dentro del campo del software testing:

* *Tests de integración*: prueban varios módulos unitarios de manera integrada.
* *Tests funcionales*: prueban funcionalidad que se espera de la aplicación. Es un término similar a tests de aceptación.
* *Tests no funcionales*: prueban requisitos no funcionales, como rendimiento, escalabilidad, etc.

## Estructura de un test automatizado

Ejemplo: comprobación de que una función 'eliminar_duplicados' elimina correctamente los duplicados de una lista.

#### Setup (test fixture)

* En este paso se crean de todos los objetos necesarios para ejecutar el test.

Ejemplo: creación de la lista [1, 2, 2, 2, 3, 4, 4]

#### Acción

* Invocación del código que queremos probar.

Ejemplo: invocación de la función 'eliminar_duplicados'

#### Verificación resultado

* Comprobación de que la acción que hemos invocado ha producido el resultado esperado.

Ejemplo: comprobación que la lista resultante tiene los elementos esperados, en este caso [1, 2, 3, 4].

#### Tear down

* Cada test automatizado debe dejar el sistema en el mismo estado que estaba antes de ejecutar el test.
* Así se evita que unos tests afecten los resultados de otros tests.
* En el paso de 'tear down' se eliminan de todos los recursos persistentes creados por el test (por ejemplo, ficheros o registros en una BD).

Ejemplo: no aplica en el ejemplo de la lista.

## Beneficios del testing automático

* Más eficiente que el testing manual, lo que conlleva una reducción de costes.
* Reducción del número de bugs (prevención vs localización).
* Incremento de **calidad**: permiten modificar el código para hacerlo más legible sin que tengamos miedo de introducir bugs.
   * Los tests proporcionan una **red de seguridad**.
* Facilitan la comprensión del sistema.
    * Los tests proporcionan **especificaciones ejecutables** del comportamiento esperado.
    * Estas especificaciones nos sirven como **ejemplos de código** que nos dicen cómo se debe usar el sistema.

## Test-Driven Development (TDD)

* Un proceso de desarrollo en el cual los tests se crean antes que el código del sistema (*test-first*).
* El código que desarrollamos va dirigido por los tests: cada test que añadimos representa una evolución del sistema.

Proceso:

1. Añadir test.
2. Ejecutar test. Debe fallar porque el código para que el test pase aun no existe.
3. Implementar código para que pase el test.
4. Ejecutar tests. Todos los tests implementados deberían pasar.
5. Mejorar la calidad del código (refactoring).
6. Repetir.

Más información [aquí](https://en.wikipedia.org/wiki/Test-driven_development).

## PyTest: Testing en Python

- [Pytest](https://docs.pytest.org/en/6.2.x/): framework de testing para Python.

Para hacerlo funcionar en Jupyter-Lab, es necesario instalar un módulo de [IPython](https://ipython.org/) llamado *ipytest*.

Simplemente ejecutar este comando en vuestro shell:
```
pip install ipytest
```

In [None]:
#Importación y autoconfiguración de ipyest

import ipytest
ipytest.autoconfig()

In [None]:
# Ejemplo de función a testear

def eliminar_duplicados(lista):
    r = []
    for i in range(len(lista)):
        if lista[i] not in r:
            r.append(lista[i])
    return r


# Versión refactorizada.
# Si reemplazais la implementación de 'eliminar_duplicados' por esta veréis que los tests siguen pasando sin problemas.
#
#    resultado = []
#    for item in lista:
#       if item not in resultado:
#           resultado.append(item)
#    return resultado

In [None]:
# Esta función implementa un test automático, pero este test no es invocado por el framework ya que no empieza por 'test_'

def eliminar_duplicados_devuelve_resultado_correcto(lista_con_duplicados, lista_esperada):
    # Setup
    # No necesario. Los datos de entrada a la función (lista_con_duplicados) representan la entrada del test.
    
    # Acción
    lista_obtenida = eliminar_duplicados(lista_con_duplicados)
    
    # Verificación resultado
    assert lista_obtenida == lista_esperada
    
    # Tear down
    # No es necesario en este ejemplo.

In [None]:
%%run_pytest[clean] -qq

# Esta función sí representa un test que es invocado por el framework, ya que su nombre comienza por 'test_' 
# Aquí se invoca nuestro test con diferentes valores de entrada.

def test_eliminar_duplicados():
    eliminar_duplicados_devuelve_resultado_correcto([], [])
    eliminar_duplicados_devuelve_resultado_correcto([5,5,5,5,5], [5])
    eliminar_duplicados_devuelve_resultado_correcto([3.5, 5,'a',5,'a', 5, 'b', 4.5, 3.5], [3.5, 5, 'a', 'b', 4.5])
    eliminar_duplicados_devuelve_resultado_correcto([5,5,2,3,3,1,1,1], [5,2,3,1])
    eliminar_duplicados_devuelve_resultado_correcto([1, 9, 1, 4, 7, 9, 0, 1], [1, 9, 4, 7, 0])

## El testing en el ciclo de vida del software

Dos ciclos de vida del software:
   
   * Desarrollo en cascada (waterfall).
   * Desarrollo ágil.

#### Ciclo en cascada

* Herencia de la revolución industrial.
  * Emula el desarrollo de productos físicos (casas, coches, puentes, etc.) en fases que se ejecutan de manera secuencial.
  * El testing es una etapa que se ejecuta únicamente al final del proceso.


* Los proyectos tienen una fecha de inicio y una fecha de fin, donde el alcance está prefijado de antemano y se elabora una planificación detallada.

* Fases:
  1. *Analisis*: análisis de los requisitos. Elaboración de uno o más documentos con las especificaciones de los requisitos que deberá cumplir el producto final.
  2. *Diseño*: diseño o especificación de la solución a un alto nivel de abstracción.
  3. *Implementación*: etapa de construcción del producto demandado por el cliente.
  4. *Test*: etapa de pruebas donde se verifica que el producto construido cumple con los requisitos especificados.
  5. *Mantenimiento*: fase de mantenimiento del producto, donde se realiza cualquier operación necesaria tras la entrega a cliente.

<img src="img/testing/waterfall.png" width="700">

**Problemas del ciclo en cascada**

* Intenta introducir certidumbre en un proceso altamente incierto como es el desarrollo de software.
  * Se puede tratar de planificar un proyecto de software en detalle, pero décadas de proyectos fracasados han demostrado que estas planificaciones detalladas nunca se cumplen.
* No da soporte a introducir cambios a mitad del proceso.
  * En la construcción de productos físicos, esto no es un problema, pero sí lo es en software que, por su naturaleza intangible, es fácil de cambiar.
* Clientes insatisfechos que no reciben el producto que esperaban.
* Centrado exclusivamente en el cumplimiento de plazos y contratos, no en la entrega de valor al cliente.
  * Orientado a proyecto, no a calidad del producto.

#### Desarrollo de software ágil

* Basado en **iteraciones** y en entregas frecuentes a cliente.
* El producto se construye de manera **incremental**.
* El cliente puede ver versiones funcionales del producto frecuentemente, proponer cambios y dar feedback, lo que incrementa el aporte de valor.
* En cada iteración se construye lo más prioritario.
* Centrado en la **excelencia técnica**, ya que no se pueden hacer entregas frecuentes si el código no es de calidad.
* Dado que la **calidad** es tan importante, el **testing** es una actividad que se realiza constantemente, no como una fase al final del desarrollo.
* Se suele realizar cierto nivel de planificación, pero a más corto plazo y es mucho más cambiante que en el modelo en cascada.
* La base es establecer una relación de **confianza** con el cliente.

Metodología: eXtreme Programming (XP).

<img src="img/testing/agile.png" width="950">

## Ejercicios

1. Escribe una función que reciba como entrada una lista de palabras que puede contener duplicados y devuelva como resultado una lista que contenga las mismas palabras pero sin duplicados. En este ejercicio, deberás utilizar la estructura de datos auxiliar más apropiada para resolver el problema; es decir, aquella que lleve a un algoritmo eficiente. No se permite hacer un casting para transformar la lista de entrada a un objeto de tipo *set* o *dictionary*.

2. Escribe una función que, dada una lista desordenada de números, utilice una cola de prioridad para devolver la lista de números ordenada.

3. Escribe una función que, dada una lista desordenada de números, utilice una cola de prioridad para indicar cual es la mediana (es decir, el elemento central si la lista estuviera ordenada). Si la longitud de la lista de entrada es un número par, entonces el algoritmo puede devolver cualquiera de las 2 medianas válidas.

4. Escribe una función que, dada una cadena de caracteres que puede incluir paréntesis '()' o corchetes '[]' compruebe si los paréntesis y corchetes aparecen de manera correcta, es decir, están balanceados. Ejemplo: tanto en '(aa(c))bb[a]' como en '([b])(aa)' los paréntesis y corchetes están balanceados; por lo tanto, la función devolverá *True*. En 'dd((abc[a)]' o en '[(a])' no lo están; por lo tanto, la función devolverá *False*. Pista: la estructura de datos *Pila* puede ser de gran ayuda para resolver este problema.

5. Este ejercicio consiste en simular el orden LIFO (last-in first-out) de las pilas usando dos colas. En el siguiente programa, hay definidas dos colas: cola_1 y cola_2. Estas son las únicas estructuras de datos auxiliares que se permite usar para almacenar información. Estas estructuras están declaradas como deques, pero únicamente se permite usar las operaciones de las colas: enqueue (método *append*) y dequeue (método *popleft*). También se permite consultar el número de elementos existentes, por ejemplo, para comprobar si una cola está vacía. El ejercicio consiste en completar las funciones que simulan el orden LIFO (*insertar_LIFO* y *extraer_LIFO*) de manera que se satisfagan los tests definidos en la sección Tests.

In [None]:
from collections import deque

# Estructuras de datos. Son las únicas permitidas en este programa.

cola_1 = deque()
cola_2 = deque()

# Funciones a completar.

def insertar_LIFO(elemento):
    # ...

def extraer_LIFO():
    # ...

# ------------ Tests ------------

insertar_LIFO(6)
insertar_LIFO(9)
insertar_LIFO(1)
insertar_LIFO(3)

print(extraer_LIFO()) # Debe mostrar 3
print(extraer_LIFO()) # Debe mostrar 1
print(extraer_LIFO()) # Debe mostrar 9

insertar_LIFO(5)
insertar_LIFO(8)

print(extraer_LIFO()) # Debe mostrar 8
print(extraer_LIFO()) # Debe mostrar 5
print(extraer_LIFO()) # Debe mostrar 6
print(extraer_LIFO()) # Debe mostrar 'None'

## Soluciones

In [None]:
# Ejercicio 1

def eliminar_duplicados(lista):
    objetos_ya_vistos = set()
    lista_sin_duplicados = []
    for objeto in lista:
        if objeto not in objetos_ya_vistos:
            lista_sin_duplicados.append(objeto)
        objetos_ya_vistos.add(objeto)
    return lista_sin_duplicados

print(eliminar_duplicados([1,2,1,3,4,1,3,5,2,1,5]))

In [None]:
# Ejercicio 2

import heapq

def heapsort(lista):
    cola_prioridad = []
  
    for elemento in lista:
         heapq.heappush(cola_prioridad, elemento) 
        
    lista_ordenada = []
    while len(cola_prioridad) > 0:
        elemento_extraido_de_cola = heapq.heappop(cola_prioridad)
        lista_ordenada.append(elemento_extraido_de_cola)
        
    return lista_ordenada


print(heapsort([6,10,1,4,9,16,2,5]))

In [None]:
# Ejercicio 3

import heapq

def obtener_mediana(lista):
    cola_prioridad = []
  
    for elemento in lista:
         heapq.heappush(cola_prioridad, elemento) 
        
    for _ in range(len(lista)//2 + 1):
        mediana = heapq.heappop(cola_prioridad)
        
    return mediana


print(obtener_mediana([6,10,1,4,9,16,2,5]))

In [None]:
# Ejercicio 4

from collections import deque

def match(c1, c2):
    return (c1 == '(' and c2 == ')') or (c1 == '[' and c2 == ']')

def esta_balanceado(s):
    pila = deque()
    for c in s:
        if c == '(' or c == '[':
            pila.append(c)
        elif c == ')' or c == ']':
            if len(pila) == 0 or not match(pila.pop(), c):
                return False
    return len(pila) == 0


print(esta_balanceado('(aa(c))bb[a]'))
print(esta_balanceado('([b])(aa)'))
print(esta_balanceado('dd((abc[a)]'))
print(esta_balanceado('[(a])'))

In [None]:
# Ejercicio 5

from collections import deque

# Estructuras de datos. Son las únicas permitidas en este programa.

cola_1 = deque()
cola_2 = deque()

# Funciones a completar.

def insertar_LIFO(elemento):
    intercambiar_elementos(cola_1, cola_2)
    cola_1.append(elemento)
    intercambiar_elementos(cola_2, cola_1)

def extraer_LIFO():
    try:
        return cola_1.popleft()
    except:
        return None

# Funciones auxiliares

def intercambiar_elementos(cola_origen, cola_destino):
    while len(cola_origen) > 0:
        cola_destino.append(cola_origen.popleft())
        
# ------------ Tests ------------

insertar_LIFO(6)
insertar_LIFO(9)
insertar_LIFO(1)
insertar_LIFO(3)

print(extraer_LIFO()) # Debe mostrar 3
print(extraer_LIFO()) # Debe mostrar 1
print(extraer_LIFO()) # Debe mostrar 9

insertar_LIFO(5)
insertar_LIFO(8)

print(extraer_LIFO()) # Debe mostrar 8
print(extraer_LIFO()) # Debe mostrar 5
print(extraer_LIFO()) # Debe mostrar 6
print(extraer_LIFO()) # Debe mostrar 'None'