
# Conjuntos y Diccionarios

El mundo no está hecho de listas

* Sólo por el hecho de que es la primer estructura de datos que conoces no significa que sea la idónea para toda tarea

Esta notebook introduce otras dos estructuras de datos fundamentales
* Permiten crear programas más simples y eficientes

También es necesario analizar lo que "eficiente" realmente significa

## Conjuntos

Un conjunto es una colección desordenada de distintos artículos
* Desordenado: los artículos se buscan por valor, en lugar de locación
* Distinto: cualquier valor aparece máximo una vez

Fundamental en matemáticas, pero una idea en la mayoría de los lenguajes de programación

El tipo de datos para conjuntos está incorporado a Python 2.4 y versiones superiores
* Crea un nuevo conjunto invocando **set()**
* Posteriormente inserta y remueve valores, prueba los
elementos (test for membership), etc.


In [1]:
vowels = set()
lista=[]
for char in 'aieoeiaoaaeieou':
    vowels.add(char) 
    lista.append(char)
print(vowels)
print(lista)

{'a', 'e', 'i', 'u', 'o'}
['a', 'i', 'e', 'o', 'e', 'i', 'a', 'o', 'a', 'a', 'e', 'i', 'e', 'o', 'u']


In [2]:
print(set(lista)) # podemos crear un conjunto a partir de una lista!

{'a', 'e', 'i', 'u', 'o'}


### Operaciones con conjuntos

Al igual que otros objetos, los conjuntos poseen métodos
* Muchos de los cuales también se pueden expresar utilizando operadores

In [3]:
# Ejemplos de creación 
diez=set(range(10))
pares=set([0,2,4,6,8])
impares=set([1,3,5,7,9])
print("diez:",diez)
print("pares:",pares)
print("impare:",impares)

diez: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
pares: {0, 8, 2, 4, 6}
impare: {1, 3, 5, 9, 7}


In [4]:
#agregar un elemento
pares.add(10)
print("pares:",pares)

pares: {0, 2, 4, 6, 8, 10}


In [5]:
# diferencia de conjuntos
diez.difference(impares) # o diez-impares


{0, 2, 4, 6, 8}

In [6]:
# instersección de conjuntos
diez & pares # o diez.intersection(pares)


{0, 2, 4, 6, 8}

In [7]:
# pobrar si es subconjunto
diez <= pares # o diez.issubset(pares)

False

In [8]:
#  no es simétirica
print("diez es subconjunto de impares: ",  diez.issubset(impares))
print("impares es subconjunto de diez: ",  impares <= diez)

diez es subconjunto de impares:  False
impares es subconjunto de diez:  True


In [9]:
# probar si es superconjunto
print("diez es superconjubto de impares: ",  diez.issuperset(impares))
print("impares es superconjunto de diez: ",  impares >= diez)

diez es superconjubto de impares:  True
impares es superconjunto de diez:  False


In [10]:
# diferencia simétrica
diez.symmetric_difference(pares) # o diez^pares

{1, 3, 5, 7, 9, 10}

In [11]:
# union
pares|impares # o pares.union(impares)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

#### Ejemplo

Suponga que tiene una lista de listas, en la que cada sublista es un reporte de las aves observadas en un día determinado. Se desea tener la lista sólo de que aves fueron observadas, sin importar cuantas veces o el orden. ¿Cómo podemos obtener esa lista?

In [12]:
observaciones=[["Ganso Canadiense","Ganso Canadiense","Jaeger de cola larga","Ganso Canadiense"],
               ["Ganso de nieve","Ganso Canadiense","Ganso Canadiense","Fulmar Norteño"]]

In [13]:
oset=set()
for lista in observaciones:
    for ave in lista:
        oset.add(ave)
print(oset)

{'Fulmar Norteño', 'Ganso de nieve', 'Jaeger de cola larga', 'Ganso Canadiense'}


## Diccionarios

Suponiendo que se desea contar qué tan frecuentemente es vista cada especie de ave
 * No es posible almacenar (nombre, count) en el conjunto...
 * ...porque entonces no sería posible buscar la cuenta de una especie a menos que se conociera de qué especie se trata

Se podría retroceder a la lista de pares...
Mejor solución: almacenar datos extras con cada elemento del conjunto

Un **diccionario** asocia un valor con cada una de sus claves (keys)
 * Una colección mutable desordenada
 * También llamados mapas, hashes, y arreglos asociativos
 * Usualmente se visualizan como una tabla de dos columnas
 
 ![image.png](attachment:image.png)

### Creación e indizado

Crea un diccionario colocando pares clave/valor (key/value) dentro {}
* {'Newton':1642, 'Darwin':1809}

Los diccionarios vacíos se escriben {}
 * Para buscar el valor asociado con una clave se utiliza []

In [14]:
birthday = { 'Newton' : 1642, 'Darwin' : 1809 }
print("Darwin's birthday:", birthday['Darwin']) 
print("Newton's birthday:", birthday['Newton'])

Darwin's birthday: 1809
Newton's birthday: 1642


Sólo es posible accesar claves que estén presentes
 * Tal como no se puede indexar elementos de una lista que no existe

In [15]:
print("Tesla's birthday:", birthday['Tesla']) 

KeyError: 'Tesla'

### Actualización de valores

La asignación a una clave de diccionario:
* Crea una nueva entrada si la clave aún no existe en el diccionario
* Sobreescribe  el valor previo si la clave existe

In [None]:
birthday['Darwin'] = 1809 
birthday['Newton'] = 1942 # oops 
birthday['Newton'] = 1642
print(birthday)

Para remover una entrada se utiliza del d[k]

In [None]:
birthday = { 'Newton' : 1642, 'Darwin' : 1809, 'Turing':1912 }
del birthday['Turing']
print(birthday)

Sólo se pueden remover las entradas existentes actualmente

In [None]:
del birthday['Tesla']

Probar si una clave $k$ está en un diccionario $d$ utilizando $k$ in $d$
 * Una vez más, el comportanmiento de las listas es inconsistente, pero útil
 
*for k in d* itera las claves del diccionario (en lugar de sus valores)
* A diferencia de las listas, donde for itera los valores, en lugar de los índices

In [None]:
birthday = { 'Newton' : 1642, 'Darwin' : 1809, 'Turing':1912 }
for name in ["Newton","Tesla"]:
    if name in birthday:
        print(name,"nació en:",birthday[name])
    else:
        print("¿Quién es",name+"?")

## Métodos de diccionarios

![image.png](attachment:image.png)

### Ejemplos

In [None]:
birthday = { 'Newton' : 1642, 'Darwin' : 1809, 'Turing':1912 }
birthday["Curie"]=birthday.get("Curie",1867)
print(birthday)

### Ejercicio

Implemente una función que dada la lista de observaciones de aves regrese un diccionario con las siguientes características

1. Las claves deben ser los nombres de las aves
2. Los valores el número de veces que se ha visto cada ave

### Formato de cadenas
En python es posible formatear cadenas de forma similar que en $c$ o $c++$ utilizando %s

In [None]:
planeta= "Marte"
luna1,luna2="Deimos","Phobos"
formato= "el planeta rojo es %s"
# esto simplifica el uso de print!
print(formato %planeta) 
print("%s tiene dos lunas: %s y %s" %(planeta,luna1,luna2))

### Formatos soportados
![image.png](attachment:image.png)

El formateo de cadenas complejas puede resultar difícil de entender
 * Especialmente si un valor requiere u5lizarse varias veces
 * En lugar de una tupla (tuple), "%" puede tomar un diccionario como su argumento

Utilice *%(varname)s* dentro del formato de una cadena para identificar lo que se va a sustituir

In [None]:
birthday = { 'Newton' : 1642, 'Darwin' : 1809, 'Turing' : 1912}
entry = '%(name)s: %(year)s'
for (name, year) in birthday.items():
    temp = {'name' : name, 'year' : year}
    print(entry %temp)

In [None]:
birthday = { 'Newton' : 1642, 'Darwin' : 1809, 'Turing' : 1912}
entry = 'El nacimiento de  %(name)s fue en el año de %(year)s'
for (name, year) in birthday.items():
    temp = {'name' : name, 'year' : year}
    print(entry %temp)

### Argumentos por clave utilizando diccionarios

In [None]:
def settings(titulo,**kwargs): 
    print("titulo:%s" %titulo)
    for key in kwargs:
        print("%s:%s" %(key,kwargs[key]))

In [None]:
settings("sin argumentos extra")

In [None]:
settings("colores",rojo=1.0,verde=0.5,azul=0.7)

Los **\*\*** antes de *kwargs* significan "Agregue cualquier algumento extra por clave en un diccionario, y asígnelo a kwargs"
* Permite crear funciones que pueden manejar argumentos arbitrariamente

### Argumentos por posición

Puede hacer algo similar con argumentos extra posicionalesl (sin nombre)

In [None]:
def suma(*valores):
    r=0
    for v in valores:
        r+=v
    return r

In [None]:
print("suma un solo valor:",suma(3))
print("suma ningún valor: %s" %suma())
print("suma multiples valores: %s" %suma(1,2,3,4))

El **\*** antes de values significa "Agrega argumentos sin nombre extra en una tupla, y asígnala a valores”
* Cada función  puede tener máximo un argumento **\***  por función

### Ayuda

Para descubir las funciones que tiene un objeto
* **dir(obj)** Lista los atributos y méodos de un objeto
* **help(obj)**, **help(obj.metodo)**, **help(obj.attr)** imprime la dicumentación

In [22]:
x={"a":1,"b":2}
dir(x)

['__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [26]:
help(x.__hash__) #Atributo

Help on NoneType object:

class NoneType(object)
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.
 |  
 |  __repr__(self, /)
 |      Return repr(self).



In [28]:
help(x.get) #metodo

Help on built-in function get:

get(...) method of builtins.dict instance
    D.get(k[,d]) -> D[k] if k in D, else d.  d defaults to None.



In [29]:
help(dict)

Help on class dict in module builtins:

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)
 |  
 |  Methods defined here:
 |  
 |  __contains__(self, key, /)
 |      True if D has a key k, else False.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |