# Estructuras de Datos

## Listas y diccionarios
Python esta fuertemente basado en listas, y practicamente se puede considerar un tipo básico dentro del lenguaje. Son equivalentes a los arrays de otros lenguajes de programacion. 
Además de las listas, python dispone de otra herramienta muy importante para el manejo de datos que son los diccionarios. Los diccionarios son contenedores relacionales, de manera que se guardan pares clave valor. De esta manera desde una clave se puede recuperar directamente el valor. Es equivalente a los mapas hash de otros lenguajes de programación.

###Listas

#### Slicing
El slicing es una técnica soportada por listas para recuperar rangos de elementos de la lista. En la sesion 1 vimos un ejemplo de esto con una cadena, que es un caso particular de una lista. 
Se puede recoger un elemento de una lista indicando el índice entre corchetes. La funcion len() devuelve el tamaño de la lista.
Para crear una lista se definen los elementos que la componen separados por comas y todo entre corchetes. Los elementos de una lista pueden ser de distintos tipos.

In [None]:
l = [1,2,3,"Hola"]
print(l[1])
print(l[:2])
print(l[0:1])
print(l[-1])
print(l[:-1])

2
[1, 2]
[1]
Hola
[1, 2, 3]


Es posible recuperar un subconjunto de una lista indicando con dos puntos ':' el rango de valores a recuperar. Cuando en una lista se utiliza como índice un número negativo, se interpreta a que se está accediendo desde el final de la lista. De esta manera el elemento -1 siempre será el último elemento. 

#### Bucles
Cuando dentro de un bucle for utilizamos la funcion range(), en verdad estamos recorriendo una lista de elementos. El bucle for siempre toma como control una lista. En ciertos contextos es necesario conocer el índice de la lista que se está recorriendo en el bucle. Esto se puede hacer mediante la funcion enumerate()

In [None]:
print(range(5))
print(range(2,6))
print(range(1,10,2))
l = [1,4,6,7,9]
for i in l:
  print(i)
for index,i in enumerate(l):
  print("Indice {0}: valor:{1}".format(index,i))

range(0, 5)
range(2, 6)
range(1, 10, 2)
1
4
6
7
9
Indice 0: valor:1
Indice 1: valor:4
Indice 2: valor:6
Indice 3: valor:7
Indice 4: valor:9


#### Operadores


| Operador | Explicacion |
|----------|-------------|
|l1 += [4]  | Añade un nuevo elemento 4 a l1|
|4 in l1   | Comprueba si 4 está en l1 |
|4 not in l1 | Comprueba si 4 no está en l1|
| l1 + l2  | Concatena l1 con l2 |
| l1 += l2 | Concatena l1 con l2 modificando l1 |
| l2 * 2 | Crea dos copias de l2 y las concatena |
| l2[1] | Obtiene el elemento 1 de la lista (empieza en 0) |
| l2[1:2] | Obtiene una subsecuencia de la posicion 1 a la 2 exclusive |
| del l1[0:2] | Elimina una subsecuencia de l1 |
| min(l2) | Obtiene el elemento más pequeño de l2 |
| max(l2) | Obtiene el elemento más grande de l2 |
| l1.count(4) | Cuenta las apariciones de 4 en l1 |

In [None]:
l1 = [1,2,3]
l1 +=[4]
print(l1)
del l1[2:-1]
print(l1)
l1 = l1 * 2
print(l1)

[1, 2, 3, 4]
[1, 2, 4]
[1, 2, 4, 1, 2, 4]


#### Comprension
La comprension de una lista consiste principalmente en poder aplicar una operación a cada uno de los elementos de la lista. La sintaxis es similar a la de un bucle for, pero se encierra en corchetes para indicar que el resultado también es una lista. Las funcinonalidades principales de la comprensión son la conversión y el filtrado.

In [None]:
l = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print([x for x in l if x % 2 == 0])
print([float(x) for x in l if x % 3 == 0])

[2, 4, 6, 8, 10]
[3.0, 6.0, 9.0]


###Diccionarios
Para crear un diccionario se utilizan las llaves {} de manera similar a los corchetes con las listas. También se puede utilizar la funcion dict() para construir diccionarios. Igual que con las listas, los diccionarios pueden contener elementos de distintos tipos. Cada elemento de un diccionario es un par clave-valor.

In [None]:
temperaturas = {"Ourense": 30, "Vigo":27, "Pontevedra":24}
print(temperaturas["Ourense"])
temperaturas["Ourense"]+=1
print(temperaturas["Ourense"])
print(temperaturas.get("Pontevedra"))
print(len(temperaturas))
print(temperaturas.get("Lugo"))
print(temperaturas["Lugo"])

30
31
24
3
None


KeyError: ignored

#### Bucles
Igual que con las listas, se puede recorrer un bucle for utilizando un diccionario. El diccionario tiene tres métodos que nos pueden ser interesantes para recorrer: keys(), items() y values(). Keys devuelve una lista con todas las claves, values devuelte una lista de los valores, e items dos listas con claves y valores. 

In [None]:
temperaturas = {"Ourense": 30, "Vigo":27, "Pontevedra":24}

for i in temperaturas.keys():
  print(i,temperaturas[i])

for i in temperaturas.values():
  print(i)

for i,j in temperaturas.items():
  print(i,j)

Ourense 30
Vigo 27
Pontevedra 24
30
27
24
Ourense 30
Vigo 27
Pontevedra 24


#### Operadores

| Operador | Explicacion |
|----------|-------------|
|d1[8] = 'i'  | Añade el par 9,i al diccionario|
|d1[8]  | Devuelve el valor asociado a la clave 9. Da un error si no existe|
|d1.get(8) | Devuelve el valor asociado a la clave 9. Devuelve none si no existe|
| 4 in d1  | Comprueba si 4 es una clave de d1 |
| d1 == d2 | Compara dos diccionarios |
| d1.clear() | Borra todos los elementos |
| del d1[1] | Elimina la clave 1 y su valor asociado |
| min(d2) | Obtiene la clave más pequeña de d2 |
| max(d2) | Obtiene la clave más grande de d2 |

In [None]:
temperaturas = {"Ourense": 30, "Vigo":27, "Pontevedra":24}
temperaturas2 = {"Ourense": 30, "Vigo":27, "Pontevedra":24}

print(temperaturas == temperaturas2)
temperaturas["Lugo"]= 28
print(temperaturas == temperaturas2)
print("Lugo" in temperaturas2)
del temperaturas2["Vigo"]
print(temperaturas2)
temperaturas.clear()
print(temperaturas)

True
False
False
{'Ourense': 30, 'Pontevedra': 24}
{}


##Tuplas y conjuntos
 

###Tuplas
Python permite el uso de secuencias de valores innmutables, que son las tuplas.
Al ser inmutables, las tuplas no permiten ni añadir ni borrar ni modificar elementos, pero si se pueden recoger slices de ellas. Las tuplas se pueden declarar mediante los paréntesis, o mediante el constructor *tuple()*

In [None]:
p0 = (5, 6) 
print(p0[0])
print(p0[1])
print(p0[-1])
print(len(p0))

5
6
6
2


| Operador | Explicacion |
|----------|-------------|
|4 in l1   | Comprueba si 4 está en l1 |
|4 not in l1 | Comprueba si 4 no está en l1|
| l1 + l2  | Concatena l1 con l2 |
| l2 * 2 | Crea dos copias de l2 y las concatena |
| l2[1] | Obtiene el elemento 1 de la tupla (empieza en 0) |
| l2[1:2] | Obtiene una subsecuencia de la posicion 1 a la 2 exclusive |
| del l1[0:-1:2] | Elimina una subsecuencia de l1, tomando elementos de dos en dos |
| min(l2) | Obtiene el elemento más pequeño de l2 |
| max(l2) | Obtiene el elemento más grande de l2 |
| l1.count(4) | Cuenta las apariciones de 4 en l1 |

### Conjuntos
Los conjuntos son también una secuencia de valores, pero con la condición añadida de que no se pueden repetir valores. Para crear un conjunto se utiliza el literal entre llaves {1}, o mediante el constructor set() y los elementos pueden ser de distinto tipo. No se puede crear un conjunto vacio mediante el constructor, ya que se construiría un diccionario vacío. 

In [None]:
s = {1,2,3}
print(1 in s)
print(len(s))

| Operador | Explicacion |
|----------|-------------|
|4 in s1  | Comprueba si 4 está en s1|
|s1-s2| Los elementos de s1 quitando los de s2|
|s1 \| s2 | Concatena los conjuntos|
| si & s2  | Elementos en ambos conjuntos |
| s1 ^ s2 | Elemenos no repetidos en ambos conjuntos |
| min(s1) | Elemento más pequeño |
| max(s1) | Elemento más grande |

Para poder recorrer un conjunto es necesario primero convertirlo en una lista. Si una lista se convierte a conjunto automáticamente se eliminan los elementos duplicados.

In [None]:
s = {1,2,3}
for i in list(s):
  print(i)
  
l = [1,2,1,3,2,3,1,3,2,4,3]
print(list(set(l)))

1
2
3
[1, 2, 3, 4]


## Problema
Crea la función interrogaClase que devuelva 2 listas: una de métodos y otra de atributos de una clase concreta (por ejemplo math).

In [None]:
import inspect
import math

def interrogaClase(m):
  l_attr = []
  l_methodes = []

  for i in inspect.getmembers(m):
    if inspect.ismethod(i[1]):
      l_methodes += i
    else:
      l_attr += i
  return l_attr,l_methodes


l_attr, l_methodes = interrogaClase(math)
print("METODOS: ")
print(l_methodes)
print("ATRIBUTOS: ")
print(l_attr)

METODOS: 
[]
ATRIBUTOS: 
['__doc__', 'This module provides access to the mathematical functions\ndefined by the C standard.', '__loader__', <class '_frozen_importlib.BuiltinImporter'>, '__name__', 'math', '__package__', '', '__spec__', ModuleSpec(name='math', loader=<class '_frozen_importlib.BuiltinImporter'>, origin='built-in'), 'acos', <built-in function acos>, 'acosh', <built-in function acosh>, 'asin', <built-in function asin>, 'asinh', <built-in function asinh>, 'atan', <built-in function atan>, 'atan2', <built-in function atan2>, 'atanh', <built-in function atanh>, 'ceil', <built-in function ceil>, 'copysign', <built-in function copysign>, 'cos', <built-in function cos>, 'cosh', <built-in function cosh>, 'degrees', <built-in function degrees>, 'e', 2.718281828459045, 'erf', <built-in function erf>, 'erfc', <built-in function erfc>, 'exp', <built-in function exp>, 'expm1', <built-in function expm1>, 'fabs', <built-in function fabs>, 'factorial', <built-in function factorial>, 'flo

# Excepciones

Las excepciones son objetos que interrupen el flujo del programa y que indican errores. Cuando se genera una excepción se sube por toda la pila del programa hasta que en alguna función se captura y se trata. Un ejemplo típico de excepción es la división entre 0.

In [None]:
class Calculadora:
  def __init__(self, op1, op2):
    self.op1 = op1
    self.op2 = op2

  @property
  def op1(self):
    return self.__op1

  @op1.setter
  def op1(self, x):
    self.__op1 = x

  @property
  def op2(self):
    return self.__op2

  @op2.setter
  def op2(self, x):
    self.__op2 = x 

  def divide(self):
    return self.op1 / self.op2

calc = Calculadora(5, 6)
print(calc.divide())
calc.op2 = 0
print(calc.divide())

0.8333333333333334


ZeroDivisionError: ignored

In [None]:
class Calculadora:
  def __init__(self, op1, op2):
    self.op1 = op1
    self.op2 = op2

  @property
  def op1(self):
    return self.__op1

  @op1.setter
  def op1(self, x):
    self.__op1 = x

  @property
  def op2(self):
    return self.__op2

  @op2.setter
  def op2(self, x):
    self.__op2 = x 

  def divide(self):
    if(self.op1 % self.op2 != 0):
      raise Exception("La division ha de ser entera")
    return self.op1 / self.op2

def main():
  try:
    calc = Calculadora(10, 2)
    print(calc.divide())
    calc.op2 = 9
    print(calc.divide())
  except ZeroDivisionError:
    print("Error: El divisor es 0")
  except :
    print("Error Inesperado")
  finally:
    print("Fin de ejecucion")

main()

5.0
Error Inesperado
Fin de ejecucion


### Aserciones
Las aserciones se utilizan para comprobar que cierta condición se cumple antes de proseguir. Cuando una aserción se cumple no pasa nada, pero si falla se lanza una excepcion del tipo AssertionError.

In [None]:
def divide(a, b):
  assert(b != 0)
  return a/b

try:
  num1 = int( input( "Valor: " ) )
  num2 = int( input( "Valor: " ) )
  print("Resultado: {0:5.2f}".format(divide(num1, num2)))
except AssertionError:
  print("\nERROR - divisor es cero" )
except (ValueError, NameError, KeyboardInterrupt):
  print("\nERROR - numbers needed" )
except Exception as exc:
  print("\nERROR – inesperado: '{0}'".format(exc))
finally:
  print( "\n" )

Valor: 0
Valor: 0

ERROR - divisor es cero




#Archivos
Para abrir un archivo en python se utiliza la funcion open(). El primer parámetro es una cadena, que representa el nombre del archivo. El segundo es el modo en el que abrir el archivo. Los modos son los siguientes: t-> texto, b-> binario, r-> lectura, w->escritura, a-> añadir al final. La función open devuelve un objeto de tipo archivo, sobre el que se pueden utilizar las funciones write() y read(). 

In [None]:
def escribe_archivo(nombre_archivo, datos):
  f = open(nombre_archivo, "wt")
  f.write(datos)
  f.close()

def lee_archivo(nombre_archivo):
  f = open(nombre_archivo, "r")
  return f.readlines()

File.readlines es muy cómodo ya que lee todo el archivo del tirón. Pero usarlo en proyectos grandes no suele ser muy buena práctica ya que carga todo el archivo en memoria. De la siguiente manera podemos ir cargando linea a linea del archivo en memoria. 

In [None]:
def lee_archivo(nombre_archivo):
  f = open(nombre_archivo, "r")
  toret = []
  for linea in f:
    toret.append(linea)
  return toret

La construcción with permite gestionar la apertura y cierre del archivo de forma automática. Esto evita que el programador tenga que utilizar la función close() y así se gestionen mejor los recursos del programa

In [None]:
# files
import os
def escribe_archivo(nombre_archivo, datos):
  with open(nombre_archivo, "wt") as f:
    f.write(datos)

def lee_archivo(nombre_archivo):
  with open(nombre_archivo, "r") as f:
    lineas = f.readlines()
  return lineas

if __name__ == "__main__":
  if not(os.path.isfile("datos.txt")):
    escribe_archivo("datos.txt", "Hola, mundo!")
  for l in lee_archivo("datos.txt"):
    print(l)

Hola, mundo!


Existen librerías que automatizan este proceso para los formatos de datos más habituales, como pueden ser el XML o el JSON.

# Problema
Escribe un programa que lea de un archivo de texto en formato darknet yolo y devuelva una lista de objetos etiquetaImagen. El archivo a leer se puede generar con la siguiente función.

In [23]:
import os
import re
import xml.etree.ElementTree as ET

class Punto:
  def __init__(self,x,y):
    self.__x = x
    self.__y = y
  
  def get_x(self):
    return self.__x
  
  def get_y(self):
    return self.__y

def escribe_archivo(nombre_archivo, datos):
  with open(nombre_archivo, "wt") as f:
    f.write(datos)

def lee_archivo(nombre_archivo):
  with open(nombre_archivo, "r") as f:
    lineas = f.readlines()
  return lineas

classes = {"bicycles":0, "cars":1, "motorbikes":2, "people":3}

class etiquetaImagen:

  @staticmethod
  def isVOC(path):
    pattern = ".*xml$"
    if  re.match(pattern, path):
      return True
    return False

  @staticmethod
  def leerXML(path):
    tree = ET.parse(path) 
    root = tree.getroot() 

    height = int(root.find("size")[0].text)
    width = int(root.find("size")[1].text)

    bbox_coordinates = []
    member = root.find("object")
    class_name = member[0].text # class name        
    #b-box coordinates
    xmin = int(member[4][0].text)
    ymin = int(member[4][1].text)
    xmax = int(member[4][2].text)
    ymax = int(member[4][3].text)
    #store data in list
    bbox_coordinates.append([class_name, xmin, ymin, xmax, ymax])
    return bbox_coordinates

  @staticmethod  
  def leerYOLO(path):
    l = lee_archivo(path)
    lista_caract = l.split(" ")

    bbox_coordinates = []
    class_name = classes[int(lista_caract[0])] # class name
    #b-box coordinates
    x_center_normalized = int(lista_caract[1])
    y_center_normalized = int(lista_caract[2])
    width = int(lista_caract[3])
    height = int(lista_caract[4])
    #store data in list
    bbox_coordinates.append([class_name, x_center_normalized, y_center_normalized, width, height])
    return bbox_coordinates

  def __init__(self, path):
    if  etiquetaImagen.isVOC:
      l = etiquetaImagen.leerXML(path)
      self.clase = l[0]
      self.height = l[4] - l[2] 
      self.width = l[3] - l[1]
      self.puntoMedioEtiqueta = Punto((l[3] + l[1])/2, (l[4] + l[2])/2)
    else:
      l = etiquetaImagen.leerYOLO(path)
      self.clase = l[0]
      self.height = l[4]
      self.width = l[3]
      self.puntoMedioEtiqueta = Punto(l[1]*l[3], l[2]*l[4])   #x_center = x_center_normalized * width

  @property
  def clase(self):
    return self.__clase
  
  @property
  def height(self):
    return self.__height

  @property
  def width(self):
    return self.__width
  
  @property
  def puntoMedioEtiqueta(self):
    return self.__puntoMedioEtiqueta

def escribe_Yolo():
  with open("tag_0001.txt", "wt") as f:
    f.write("""0 0.120343 0.323204 0.080882 0.200737
0 0.385539 0.283610 0.065196 0.173112
0 0.325000 0.645948 0.124510 0.404236
0 0.437990 0.610958 0.112255 0.389503
0 0.739706 0.424954 0.091176 0.256906
1 0.324020 0.437845 0.070588 0.267956
1 0.384559 0.459024 0.045588 0.282689
1 0.680637 0.337477 0.043627 0.197974""")

escribe_Yolo()

l = ""
for i in lee_archivo("tag_0001.txt"):
  l += i
listStringYolo = l.split('\n')

num = 0
for i in listStringYolo:
  escribe_archivo(str(num) + ".txt", listStringYolo[num])
  etiquetaImagen(str(num) + ".txt")
  num += 1

ParseError: ignored

# Problema
Escribe una función que a partir de una lista de conos etiquetaImagen devuelva una lista de la distancia a la que se encuentran dichos conos. Puedes asumir que las etiquetas están en formato darknet yolo y que los conos tienen el tamaño estándar para conducción autónoma definido por la FSG.

In [None]:
def listaDistancia(conos):  #228 mm×228 mm×325 mm
