# Tipos de Datos 2

Adicional a los tipos de datos básicos, python cuenta con tipos de datos compuestros, es decir, estructuras que contienen tipos de datos senillos para funciones específicas.

Dentro de los tipos  de datos compuestos podemos encontrar:

* Listas
* Diccionarios
* Tuplas
* Conjuntos 
* Otros casos

## Listas

Aunque en el notebook anterior se había explicado algunos conceptos de lista, se explicarán otras funciones importantes. 

In [None]:
# Inserción de registros en una posición:
lista = [1 , 2 , 3, 4]
lista.insert(2,"a")
print(lista)

In [None]:
# remueve un elemento dado su valor:
lista.remove("a")
print(lista)

In [None]:
#que pasa cuando hay varios elementos con el mismo valor?
lista = [1 , 2, 3 , 4 , 4, 5 , 4]
lista.remove(4)
print(lista)

In [None]:
lista = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10]

#Algunas funciones útiles adicionales

# POP: retira un elemento de la posición y lo devuelve
el = lista.pop(5)
print(lista)
print(el)
print()

# Si no se pone un elemento devuelve el último
el = lista.pop()
print(lista)
print(el)
print()

# COUNT: cuenta el numero de ocurrencias de un valor en la lista
print(lista.count(10))
print()

In [None]:
lista = [ 1 , 2 , 3 , 1 , 5 , 10 , 7 , 8 , 9 , 11]

# SORT: Ordena los elementos de una lista (puede ser en reversa)
lista.sort()
print( lista )
print()

lista.sort( reverse = True)
print( lista )
print()

# copia los valores de una lista 
# ambas expresiones son iguales!

lista2 = lista[:] # Usando slicing"
lista3 = lista.copy() 

print()
print(lista2)
print(lista3)

### List Comprehension

Python provee una forma concisa de crear listas.  La aplicación común es generar una lista donde cada elemento del resultado de una operación, que surge a partir de otras listas o a crear un subconjunto aplicando una condición.

Un List comprehension consiste en corchetes que contienen una expresión, seguida por una clausula for, luego cero o más sentencias de for o condicionales.

Suponga que se quiere calcular los cuadrados de una lista.  Generalmente uno podría usar un ciclo tipo for:


In [None]:
# range me genera una rango de enteros.  es un tipo de datos llamado iterable,
# la lista y los diccionarios tambien son iterables.

r1 = range(10)  # es lo mismo que decir range(0,10)

lista = []
for x in r1:
    lista.append(x*x)
    
print(lista)


Un list comprehension me permite ahorrar sintaxis en el desarrollo de listas.  La función anterior podría escribirse de la siguiente manera usando list comprehension:

In [None]:
lista = [ x*x for x in r1 ]
print(lista)

Se pueden definir sentencias más complejas para definir listas de tipos de datos más complejos:

In [None]:
a = [(x, y) for x in [1,2,3] for y in [3,1,4] if x != y]
a

A continuación se muestran muchos ejemplos de como utilizar list comprehension:

In [None]:
lista = [ 1 , 2 -4 , 8 , 9 , 10]

# Usa un filtro para quitar resultados negativos:
l1 = [ c for c in lista if c > 0]
print("l1: " + str(l1))

# aplica funciones a cada elemento de una lista
l2 = [ abs(c) for c in lista ]
print("l2: " + str(l2))

# crea una lista de tuplas, tipo valor , cuadrado
l3 = [ (c , c*c) for c in range(6)]
print("l3: " + str(l3))

# Aplana una matriz!
lista = [[1,2,3] , [4,5,6], [7,8,9]]
l4 = [num for elem in lista for num in elem]
print("l4: " + str(l4))

## Diccionarios

Los diccionarios son estructuras de datos los cuales se estructuran de forma llave - valor.  Es decir los datos que se almacenan estan almacenados bajo una llave (puede ser un entero, un string, u otro tipo de dato).   El valor puede ser cualquier tipo de datos, incluyendo otros diccionarios.

La forma de definir un diccionario vacio es:

dic = {}

In [None]:
#Definamos un diccionario y le introducimos valores:

dic = {}

dic["enero"] = 1
dic["febrero"] = 2
dic["marzo"] = 3

print(dic)

En el caso anterior, el nombre de los meses (en **string**) es la llave, y el valor es lo que ingresamos como el número del mes.  Para traer el valor de un diccionario para una llave específica, se hace referencvia de la siguiente manera:

In [None]:
# cual es el valor de marzo?
print(dic["marzo"])

Hay que tener cuidado con tratar de traer un valor de una llave que no existe.  Por ejemplo , si quisieramos traer el valor de junio en el ejemplo anterior:

In [None]:
#Esto genera el error de llave KeyError
print(dic["junio"])

Uno podría evitarse el KeyError, si no se está seguro que la llave que estamos utlizando exista en el diccionario, con la función **get**.  La función get me permite definir un valor por defecto a traer en el caso que la llave no exista:


In [None]:
# en este caso el valor por defecto es 13
v1 = dic.get("enero" , 13)
v2 = dic.get("junio" , 13)

print("Valor 1 es {0} , valor 2 es {1}".format(v1,v2))

Un diccionario también es un iterable, es decir, es una estructura de datos que puede ser iterada elemento por elemento.  El diccionario no se encuentra ordenado por lo que es importante tener esto en cuenta.

In [None]:
# También se pueden definir los diccionarios desde su creación mediante la siguiente sintaxis
# En este caso, la llave es el número, y el nombre el valor
labo = {
    1 : "lunes" ,
    2 : "martes" , 
    3 : "miércoles" ,
    4 : "jueves" ,
    5 : "viernes"
}

# Al ser iterable me permite definir lo siguiente (iteramos sobre las llaves del diccionario):
for k in labo:
    print("Dia {0} de la semana es {1}.".format( k , labo[k] ) )

print()    
# O usarlo en un list comprehension
print( [labo[k] for k in labo] )

In [None]:
# Usar la función pop me permite eliminar elementos del diccionario:
dic = { 1: "uno" , 2 : "dos" , 3 : "tres" }

dic.pop(3)
print(dic)

También existen **dict comprehensions** que permiten crear diccionarios a partir de llave-valor de una lista.  También aplicando la función dict:

In [None]:
numbs = [ 1 , 2 , 3 , 4]

# usando el constructor de diccionario aplicado a una lista de tuplas (llave-valor)
d1 = dict([ (a , a**3) for a in numbs])
print(d1)

#usando dict comprehension, note la sintaxis
d2 = { a : a**4 for a in numbs }
print(d2)

### Ejercicio

Use lo aprendido anteriormente tomar las estructuras definidas abajo y generar un nuevo diccionario con la combinación de todos los valores en el menor número de líneas:

In [None]:
a = { "lunes" : 1 , "martes" : 2, "miercoles" : 3 , "jueves" : 4 }
b = { "viernes" : 5 , "sabado" : 2, "domingo" : 7 }

c = #Escriba aqui su solución


## Tuplas

Una tupla es una serie de elementos separados por comas.  Son inmutables una vez creadas (a diferencia de las listas!).  cada elemento de la tupla puede ser cualquier tipo u otra tupla (pueden ser anidados:

In [None]:
# Creación de una tupla:
t = 1 , "segundo" , { "tres" : 3 } , [4,5,6]
print(t)

#Como miro el valor de una parte de la tupla?
print(t[0])

#miremos el elemento uno a uno
for i in range(len(t)):
    print("elemento {0}: {1}".format(i,t[i]))

In [None]:
# Una tupla  no se puede modificar
# Esto genera error:

t[4] = 10

In [None]:
# Pero los elementos mutables en una tupla si se pueden modificar:

t = 1 , 2 , [1,2,3]  # una lista es mutable

t[2].append(4)

print(t)

La sintaxis de la tupla permite lo que se llama **boxing** y **unboxing**, lo que permite definir una tupla a partir de los valores o variables independientes o definir variables a partir de los valores de una tupla.  Miremos cada caso:

In [None]:
# una operación de boxing es la definición que ya habíamos visto de la tupla
v1 = 1
v2 = "DiCAGI"
v3 = "tres"
t = v1 , v2 , v3

print(t)

In [None]:
# Una operación de Unboxing permite defirnir variables a partir de los valores de una tupla
vx , vy , vz = t

print(vx)
print(vy)
print(vz)

**MiniEjercicio:**:  Que pasa si no se asignan todas las variables en el unboxing?



In [None]:
# Mire que pasa si se asigna 1 , 2 , o 4 variables?

## Conjuntos

Un conjunto (_**SET**_) es un tipo de dastos, el cual es una colección de elementos **no** ordenada y sin elementos duplicados.   Su uso principal es para enconrar pertenencia en grupos o para eliminar elementos duplicados.  

Los conjuntos soportan operaciones matemáticas como unión, intersección, diferencia y diferencia simétrica.

In [None]:
# se pueden crear los conjuntos de dos formas.
# las siguientes sentencias son equivalentes:

s1 = {1 , 2, 3, 4 , 4 , 4 , 5}
s2 = set([1 , 2, 3, 4 , 4 , 4 , 5])

# Note que los elementos repetidos se eliminan
print( "s1={0}\ns2={1}".format(s1,s2))

In [None]:
# Se puede añadir elementos a un conjunto

s1 = { 1, 2, 3}
s1.add(2)
s1.add(2)
s1.add(4)
print(s1)

# y también eliminar elementos de un conjunto
s1.discard(2)
s1.discard(4)
print(s1)


Los conjuntos pueden tener distintos tipos, sin embargo solo permite aquellos que se puedan hashear.
Los tipos permitidos son:
*  Numeros (Enteros y float)
*  Strings
*  Tuplas

Los tipos **no** permitidos son:
*  Listas
*  Diccionarios
*  Otros conjuntos

In [None]:
#Los conjuntos pueden tener distintos tipos 
s1 = {1 , "tarjeta", 3, 4 , 4 , 4 , "consumo" , 25.3 , (2,3) }
print(s1)

#Aunque no pueden tener tipos no "hasheables"
# La siguiente sentencia genera ERROR
s2 = { 1 , 2 , {"k" : "v"} , [1,2,3] , {4,5,6} }

In [None]:
# Para demostrar pertenencia:
print( 1 in s1 )
print( 10 in s1 )

In [None]:
# Observe la diferencia de como se tratan los strings
s1 = set("cadenadecaracteres")
s2 = {"cadena" , "de" , "caracteres"}

print( "s1={0}\ns2={1}".format(s1,s2))

A continuación se describen las operaciones de conjuntos soportadas por los conjuntos, muy útiles para muchos casos:

In [None]:
s1 = { 1 , 2 , 4 ,2 , 5,  3 , 4 , 5 , 6 }
s2 = { 4 , 5, 6, 7}
print( "s1={0}\ns2={1}\n".format(s1,s2))
print( "Intersección (&): {0}".format( s1 & s2 ) )
print( "Diferencia (-): {0}".format( s1 - s2 ) )
print( "Unión (|): {0}".format( s1 | s2 ) )
print( "Diferencia Simétrica (^): {0}".format( s1 ^ s2 ) )


In [None]:
# también permite la creación por medio de SET comprehensions

a = {x for x in 'Another useful data type built into Python is the dictionary' if x not in 'dy'}
print(a)

**Ejercicio**
    
Tome la siguiente lista de tuplas, y trate de construir un algoritmo sencillo para calcular la similaridad entre establecimientos de comercio, su similaridad está basada en la cantidad de clientes comparten.

Usted cuenta con:
* Una tupla que tiene listas de clientes y establecimientos.
* El primer valor de la tupla es el nombre del establecimiento , el segundo es la edula del cliente
* Esta lista representa que puede haber clientes que van a varios establecimientos.

La similaridad entre establecimiento1 (e1) y establecimiento2 (e2) se mide de la siguiente manera:

sim = len(e1 & e2) / len( e1 | e2 )

Usted debe medir la similaridad de cada uno de los establecimientos contra los otros medidio con la cantidad de clientes que comparten (ver formula arriba).  

Puede utilizar cualquier tipo de dato y ciclos para llegar a su objetivo.

In [None]:
estabs_clientes =[
    ( "estab1" , 1) , ( "estab1" , 2) , ( "estab1" , 3) , ( "estab1" , 4) , ( "estab1" , 5) , ( "estab1" , 6) 
  , ( "estab2" , 4) , ( "estab2" , 5) , ( "estab2" , 6) , ( "estab2" , 7) , ( "estab2" , 8) , ( "estab2" , 9) 
  , ( "estab3" , 4) , ( "estab3" , 5) , ( "estab3" , 6) , ( "estab3" , 1) , ( "estab3" , 2) , ( "estab4" , 1) 
  , ( "estab4" , 4) , ( "estab4" , 5)     
]


###  ESCRIBA AQUI SU RESPUESTA
   
###

## Otras estructuras

En python existen algunos tipos de datos que son iterables y tienen funciones específicas.  Uno de los que ya habíamos visto es **range**, adicionalmente podemos encontrar **enumeration.

*  **Range**:  Genera una progresión aritmetica.  Esto permite iterar sobre dicho rango de números.
*  **Enumeration**: Es una función que permite agregar índices a una lista o iterable.

In [None]:
# Observe que un rango no es una lista.  es un objeto iterable
r = range(5)
print(r)

In [None]:
#un iterable sirve para iterar sobre el.
for i in r:
    print(i)

In [None]:
# Se pueden definir rangos que no empiecen de cero:
r = range (5,10)
print( [i for i in r] )

#  Adicionalmente puede definirse un "paso" como tercer parámetro
r = range(5,10,2)
print( [i for i in r] )

#  Y el paso puede ser negativo
r = range(-5,-16,-3)
print( [i for i in r] )

In [None]:
# antes de ejecutar piense que pasaría en los siguientes casos?

print( [i for i in range (5,10,-1)] )
print( [i for i in range (4,-13)] )
print( [i for i in range (-1,-6)] )

La enumeración es una facilidad que presenta el lenguaje para añadir indices a iterables

In [None]:
#definamos una función
def fEnum(tipo , iterable):
    print("tipo = " + str(tipo))
    for i , e in enumerate(iterable):
        print("Elemento {0} tiene valor {1}".format(i,e))
    print()  
    

La función anterior permite imprimir los elementos sobre cualquier iterable que se envíe.  A continuación se muestra como actua con distintos tipos de iterables

In [None]:
e = range(-3,-8,-2)
fEnum(type(e),e)

e = ( "a" , "b" , "c" , "c")
fEnum(type(e),e)

e = ["1","2",3,4]
fEnum(type(e),e)

e = {1 , 2, 3, 3, 3, 3 , 5}
fEnum(type(e),e)

e = { 1 : "uno" , "dos": 2 , "3" : 3}
fEnum(type(e),e)

e = "The Donner Party was a group of American pioneers."
fEnum(type(e),e)

In [None]:
# que pasa si no se envia un iterable?
e = 123.4
fEnum(type(e),e)