<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2015 Karim Pichara - Christian Pieringer. Todos los derechos reservados.</font>
</p>

## Sets

Los `set`s son un contenedor útil cuando tenemos que asegurar que los objetos no estén repetidos en la estructuras. Por ejemplo, en una lista de canciones pueden existir muchas canciones asociadas al mismo artista, si queremos generar una lista de todos los artistas en la librería buscándolos en la lista de canciones, tendríamos que preocuparnos de ir chequeando para cada canción nueva si ya incluímos al artista o no. Esto podría ser más fácil usando `set`s, ya que la estructura se encarga de mantener sólo una copia de cada elemento, a pesar de que lo agreguemos nuevamente (tal como en la unión de conjuntos).

En Python los `set`s pueden contener cualquier objeto *hashable*, es decir, un objeto cuyo valor obtenido luego de aplicar una función de hash no cambia a lo largo de su vida. Recordar que los objetos hashables son los que pueden ser usados como *keys* en diccionarios, por lo mismo deben ser inmutables. 

In [1]:
lista_canciones = [("Uptown Funk", "Mark Ronson"),
           ("Thinking Out Loud", "Amy Wadge "),
           ("Sugar", "Maroon 5"),
           ("Patterns In The Ivy", "Opeth"),
           ("Take Me To Church", "Hozier"),
           ("Style", "Taylor Swift"),
           ("Love Me Like You Do", "Ellie Goulding")]

artistas = set()

for cancion, artista in lista_canciones:
    artistas.add(artista)

print(artistas)

{'Mark Ronson', 'Taylor Swift', 'Opeth', 'Ellie Goulding', 'Amy Wadge ', 'Maroon 5', 'Hozier'}


Podemos también construir `set`s directamente usando llaves, los elementos deben estar separados por coma:

In [2]:
canciones = {'Style', 
             'Uptown Funk', 
             'Take Me To Church', 
             'Sugar', 
             'Thinking Out Loud', 
             'Patterns In The Ivy', 
             'Love Me Like You Do'}

print(canciones)

print("Sugar" in canciones)

for artista in artistas:
    print("{} toca buena música".format(artista))


{'Love Me Like You Do', 'Take Me To Church', 'Patterns In The Ivy', 'Thinking Out Loud', 'Sugar', 'Style', 'Uptown Funk'}
True
Mark Ronson toca buena música
Taylor Swift toca buena música
Opeth toca buena música
Ellie Goulding toca buena música
Amy Wadge  toca buena música
Maroon 5 toca buena música
Hozier toca buena música


Notar que cuando imprimimos el set los items **no** están con el mismo orden que los ingresamos, ya que al igual que en los diccionarios, los `set`s **no** mantienen ningún orden adentro de la estructura. Ambos usan una estructura basada en funciones de hash por un tema de eficiencia. Por esta razón, en los `set`s **no** podemos usar un índice para buscar sus elementos. Si, podemos construir una lista directamente desde un set:

In [3]:
ordenada = list(artistas)
ordenada.sort()
print(ordenada)

['Amy Wadge ', 'Ellie Goulding', 'Hozier', 'Mark Ronson', 'Maroon 5', 'Opeth', 'Taylor Swift']


Los `set`s nos ofrecen los mismos métodos relativos a las operaciones matemáticas de conjuntos:

In [4]:
mis_artistas = {'Hozier', 'Opeth', 'Ellie Goulding', 'Mark Ronson', 'Taylor Swift'}
artistas_album = {'Maroon 5', 'Taylor Swift', 'Amy Wadge'}

print("Todos: {}".format(mis_artistas.union(artistas_album)))
print("Ambos: {}".format(artistas_album.intersection(mis_artistas)))

# Conjunto de objetos que están en un conjunto o en el otro pero no en ambos
print("Cualquiera pero no ambos: {}".format(mis_artistas.symmetric_difference(artistas_album)))  

Todos: {'Mark Ronson', 'Taylor Swift', 'Opeth', 'Ellie Goulding', 'Maroon 5', 'Hozier', 'Amy Wadge'}
Ambos: {'Taylor Swift'}
Cualquiera pero no ambos: {'Mark Ronson', 'Opeth', 'Ellie Goulding', 'Maroon 5', 'Amy Wadge', 'Hozier'}


Los métodos usados en la celda anterior retornan el mismo resultado independiente de qué ```set``` llama a qué ```set```, por ejemplo, ```mis_artistas.union(artistas_album)``` da el mismo resultado que ```artistas_album.union(mis_artistas)```. Hay otros métodos en los cuales si importa cuál es el set que realiza el llamado al método, por ejemplo, ```issubset()``` y ```issuperset()```. Otro ejemplo es el método ```difference()```, que retorna los objetos que están en el ```set``` que llama al método (por ejemplo, ```set1.difference(set2)```) pero que no están en el set pasado como argumento (en el ejemplo, en `set2`).

In [5]:
mis_artistas = {'Opeth', 'Ellie Goulding', 'Mark Ronson', 'Taylor Swift'}
bandas = {"Opeth", "Guns N' Roses"}

print("mis_artistas es a bandas:")
print("issuperset: {}".format(mis_artistas.issuperset(bandas)))
print("issubset: {}".format(mis_artistas.issubset(bandas)))
print("difference: {}".format(mis_artistas.difference(bandas)))
print("-"*20)
print("bandas es a mis_artistas:")
print("issuperset: {}".format(bandas.issuperset(mis_artistas)))
print("issubset: {}".format(bandas.issubset(mis_artistas)))
print("difference: {}".format(bandas.difference(mis_artistas)))


mis_artistas es a bandas:
issuperset: False
issubset: False
difference: {'Taylor Swift', 'Ellie Goulding', 'Mark Ronson'}
--------------------
bandas es a mis_artistas:
issuperset: False
issubset: False
difference: {"Guns N' Roses"}
