## Estudio de aplicaciones a grupo de investigación

**Propósito:** Se pretende estudiar el uso de: conjuntos, listas, tuplas y diccionarios en Python.

Usted apoya las labores del grupo de investigación al que pertenece, donde actualmente estan recibiendo candidaturas para nuevos miembros. La información se almacena en un archivo de Word que es actualizado cada vez que se recibe una nueva postulación. Hasta ahora, solo se han recibido 4 postulaciones.

Se le solicita apoyo para hacer un estudio preliminar sobre los intereses en común que tienen los postulantes, así como organizar los datos para futuros análisis

## Análisis de afinidades

A continuación se muestra la información de los cuatro postulantes:

* **Dr. Hannah Parker**:
    - Topology
    - Applied mathematics
    - Number theory
* **Dr. Tim Neely**:
    - Statistics
    - Labor economics
    - Applied mathematics
    - Medieval literature
* **Dr. Matt Harford**:
    - Software development
    - Statistics
    - Applied mathematics
    - Number theory
* **Dr. Mithuna Patel**:
    - Quantum mechanics
    - General relativity
    - Quantum computing
    
Se creará en primera instancia un objeto de Python para almacenar las preferencias de cada uno de ellos

In [None]:
hannah_parker_interests = {"topology", "applied mathematics", "number theory"}
tim_neely_interests = {"statistics", "labor economics", "applied mathematics", "medieval literature"}
matt_harford_interests = {"software development", "statistics", "applied mathematics", "number theory"}
mithuna_patel_interests = {"quantum mechanics", "general relativity"}

Este primer arreglo se conoce como conjunto (set). Tiene como característica que los elementos que lo componen son únicos y estan contenidos entre llaves ({}).

In [None]:
# Intentar agregar un interés ya existente en uno de los conjuntos

hannah_parker_interests.add("topology")
print(hannah_parker_interests) # Se puede ver como no se agrega ese valor, ya existía !

In [None]:
mithuna_patel_interests.add("quantum computing")
mithuna_patel_interests # Como el valor no existía previamente si se agrega

Los Sets son de gran utilidad para comparar colecciones de items a partir de pruebas lógicas. Por ejemplo, si se desea saber cuales interéses tienen en común nuestros académicos, entonces se usa la intersección de conjuntos. En la figura que se muestra la intersección corresponde al área sobreada.

<img src="data/images/intersection_two.png" style="width: 150px;" />

La intersección de dos conjuntos (sets) en Python se hace con el operador `&`

~~~Python
A & B
~~~


In [None]:
# Intereses compartidos por Matt y Hannah

hannah_parker_interests & matt_harford_interests 

### Ejercicio 1

Encuentre los intereses compartidos Dr Tim Neely y Dr Matt Harford. ¿Existe algún interes conjunto para todos los aspirantes?

#### Respuesta

In [None]:
## Intereses entre Tim y Matt

tim_neely_interests & matt_harford_interests

In [None]:
# Intereses conjuntos para los aspirantes
hannah_parker_interests & tim_neely_interests & matt_harford_interests & mithuna_patel_interests

set( ) es un conjunto vacío, es decir, no hay ningún interés compartido por los aspirantes :(
Para hacer más evidente este hecho se hace uso de la función `len( )` para conocer la longitud del conjunto

In [None]:
intereses = hannah_parker_interests & tim_neely_interests & matt_harford_interests & mithuna_patel_interests
print(len(intereses))

Los aspirantes a excepción de Mithuna comparten el interés por las matemáticas aplicadas, pero ¿que intereses tiene Mithuana que no tengan los demás? 

Es posible dar respuesta usando la diferencia de conjuntos, así:

In [None]:
mithuna_patel_interests - matt_harford_interests # Esto es: Intereses de Mithuna que no tiene Matt

In [None]:
matt_harford_interests - mithuna_patel_interests # Esto es: Intereses de Matt que no tiene Mithuna

In [None]:
tim_neely_interests

Este hecho es más visible y claro con la siguiente figura:

<img src="data/images/set_difference_1.png" style="width: 150px;"/>
<img src="data/images/set_difference_2.png" style="width: 150px;"/>

Ahora, nosotros sabemos que D Tim Neely está interesado 'labor economics', 'medieval literature', 'statistics', mientras Dr Hannah Parker está ineteresada en teoría de numéros y topología. Luego, existen intereses que no son compartidos por ambos investigadores:

* `labor economics`
* `medieval literature`
* `statistics`
* `number theory`
* `topology`

Esto se llama **Diferencia simétrica** entre dos conjuntos y resulta por la unión de ambas diferencias. En el siguiente diagrama se evidencia este conceptop

<img src="data/images/symmetric_difference.png" style="width: 150ppx;"/>

En python se usa `^` para determinar esta diferencia simétrica

In [None]:
matt_harford_interests ^ tim_neely_interests # Muestra los elementos que no están en ambos conjuntos

Por último, se desearía saber cuales son los intereses de los aspirantes, o en otras palabras, se desea conocer la unión de los conjuntos. La unión indica la inclusión de todos los elementos que están en cualquiera de los conjuntos. Graficamente se representa como:

<img src="data/images/union.png" style="width: 150ppx;"/>

 o en caso de no tener intersecciones
 
<img src="data/images/union_disjoint.png" style="width: 150ppx;"/> 

A nivel de código se usa el operador `|`

In [None]:
hannah_parker_interests | tim_neely_interests | matt_harford_interests | mithuna_patel_interests

## Detalles de contacto

Los aplicantes suministraron información sobre su número de contacto y correos en orden de prioridad, por lo que ahora no es suficiente codificar la información como hasta ahora sino que se hacen uso de **listas**

Las listas son creadas de manera similar a los conjuntos, pero teniendo presente una serie de diferencias notables:

* Las listas se crean usando el operador `[]`
* Se admiten valores repetidos
* Se pueden almacenar variables de diferente tipo, incluso otras listas

Los detalles de contacto para los cuatro académicos son:

* **Dr. Hannah Parker**:
    - Phone: +1 978-385-3123, +1 610-684-1514
    - Email: hannahp@unk.edu, hannah7897@gmail.com
* **Dr. Tim Neely**:
    - Phone: +1 503-831-5725, +1 530-832-3841
    - Email: tim@mij.edu, neelo@outlook.com
* **Dr. Matt Harford**:
    - Phone: +44 07872-179187, +44 01279-877139
    - Email: statistics@nru.ac.uk, mattharx@yahoo.co.uk
* **Dr. Mithuna Patel**:
    - Phone: +61 (08)87150531, +61 (08)90881262
    - Email: mithuna.patel@nua.edu.au, pattmit66@gmail.com
 

In [None]:
# Creación de lista para teléfono de Hannah

hannah_parker_phones = ["+1 978-385-3123", "+1 610-684-1514"]
hannah_parker_emails = ["hannahp@unk.edu", "hannah7897@gmail.com"]
hannah_parker_phones

Para acceder a los elementos de una lista se recuerda que se puede hacer usando corchetes. La posición empieza a ser contada apartir de 0

In [None]:
hannah_parker_phones[0] # primera posición

### Ejercicio 2

Almacene en una lista el contacto para los demás académicos y acceda al segundo número

In [None]:
tim_neely_phones = ["+1 503-831-5725", "+1 530-832-3841"]
tim_neely_emails = ["tim@mij.edu", "neelo@outlook.com"]
matt_harford_phones = ["+44 07872-179187", "+44 01279-877139"]
matt_harford_emails = ["statistics@nru.ac.uk", "mattharx@yahoo.co.uk"]
mithuna_patel_phones = ["+61 (08)87150531", "+61 (08)90881262"]
mithuna_patel_emails = ["mithuna.patel@nua.edu.au", "pattmit66@gmail.com"]

El siguiente paso consiste en consolidar estas listas en un solo directorio. Para esto, se pueden anidar listas dentro de otras listas, así:

In [None]:
hannah_parker = [hannah_parker_phones, hannah_parker_emails, hannah_parker_interests]
tim_neely = [tim_neely_phones, tim_neely_emails, tim_neely_interests]
matt_harford = [matt_harford_phones, matt_harford_emails, matt_harford_interests]
mithuna_patel = [mithuna_patel_phones, mithuna_patel_emails, mithuna_patel_interests]

# Inspección para hannah_parker
hannah_parker

Como se puede ver, la información de Hannah está almacenada en una lista compuesta por dos listas y un conjunto para los intereses. 

In [None]:
# Crear un único directorio con la información conjunta

directory = [
    hannah_parker,
    tim_neely,
    matt_harford,
    mithuna_patel
]

Se ha creado una única lista para todos los aspirantes, por lo que para acceder a ellos se haría en función de la posición tomada en la lista, de la misma manera que si se quisiera acceder al teléfono, correo o interés. Por ejemplo, para acceder al correo de tim se haría algo así:

In [None]:
directory[1][1][0] # Primer correo de contacto

## Haciendo el directorio más amigable para el usuario

El directorio que se ha creado si bien reune la información de todos los aspirante, sin embargo para realizar una consulta se vuelve en algo tedioso y complejo al precisar conocimiento sobre la manera en que se ha organizado la información.

Una alternativa para sobrellevar este percance es con el uso de diccionarios. Los diccionarios son un arreglo que incluye el uso de llaves, liberando de la necesidad de conocer la posición de un elemento. Los diccionarios no permiten tener llaves duplicadas, pero si se pueden duplicar los valores asignándolos a diferentes llaves. Los diccionarios son mutables (se pueden modificar) sin necesidad de recrear desde cero el arreglo.

Para nuestro caso, un diccionario que resulta útil es:

In [None]:
directory_dict ={
    "hannah_parker":{ # La llave es hannah_parker y los valores son otro diccionario
        "phones":hannah_parker_phones,
        "emails":hannah_parker_emails,
        "interests":hannah_parker_interests,
    },
    "tim_neely":{
        "phones":tim_neely_phones,
        "emails":tim_neely_emails,
        "interests":tim_neely_interests,
    },
    "matt_harford":{
        "phones":matt_harford_phones,
        "emails":matt_harford_emails,
        "interests":matt_harford_interests,
    },
    "mithuna_patel":{
        "phones":mithuna_patel_phones,
        "emails":mithuna_patel_emails,
        "interests":mithuna_patel_interests,
    },
}

### Ejercicio 3

Acceda en el diccionario a los intereses de Hannah

In [None]:
directory_dict["hannah_parker"]["interests"]

## Comentarios finales para conjuntos, listas, diccionarios y tuplas

Posiblemente lo visto en este caso es algo superficial para todo lo que abarca el manejo de estructuras de datos en Python. Augunos consejos y funciones a tener en cuenta se muestran a continuación.

### Métodos para conjuntos

* Inicialización de un conjunto: my_set = {1, 2, 3}
* Inicialización de un conjunto vacío: my_set = set()
* Unión: A | B
* Intersección: A & B
* Diferencia simétrica: A ^ B (Valores que no están en ambos conjuntos)
* Diferencia: A - B, B - A (Esta operación no es conmutativa)
* Prueba de pertenencia (membresía): item in A
* Agregar un elemento al conjunto: my_set.add(item)
* Eliminar un elemento del conjunto: my_set.remove()
* Vaciar el conjunto: my_set.clear()
* Conocer el tamaño del conjunto: len(my_set)

Los conjuntos tienen como ventaja no permitir valores repetidos, por lo que se pueden utilizar para remover los duplicados de una lista y almacenar el resultado en una nueva lista

### Métodos para listas

* Las listas se representan mediante corchetes ([])
* Inicialización de una lista: my_list = [1, 2, 3]
* Inicialización de una lista vacía: my_list = [ ]
* Añadir un elemento a una lista: my_list.append(item)
* Añadir una lista al final de otra lista: my_list.extend(second_list)
* Recuperar un elemento de la lista: my_list[posición]
* Recuperar un fragmento de la lista: my_list[posición inicial:posición final]
* Remover un elemento basado en el valor: my_list.remove(value) # Remueve el primer elemento con el valor buscado
* Remover un valor basado en la posición: del my_list[posición]
* Remover y recuperar un valor a la vez de una lista: my_list.pop([posición])
* Vaciar una lista: my_list.clear()
* Mostrar el índice del primer elemento que tiene un valor dado: my_list.index(value)
* Contar el número de veces que un valor está en una lista: my_list.count(value)
* Ordenar los valores de la lista: my_list.sort() (En orden descendente se incluye el argumento reverse=True)
* Revertir el orden de los elementos en la lista: my_list.reverse()
* Obtener una copia de una lista: my_list.copy()
* Conocer el tamaño de la lista: len(my_list)
* Prueba de pertenencia (membresía): item in A

### Métodos para tuplas

Las tuplas son arreglos similares a las listas con la particularidad de no poder ser modificadas (inmutables). Su creación se hace usando paréntesis (`( )`)

* Creación de una tupla: my_tuple = (1, 2, 3)
* Creación de una tupla vacía: my_tuple = ()
* Creación de una tupla con un solo valor: my_tuple = ("Valor",)    # Detallar que se añade una coma. La coma define la tupla
* Recuperar un valor de la tupla: my_tuple[posición]
* Recuperar un fragmento de la tupla: my_tuple[posición inicial:posición final] 
* Repetir múltiples veces una tupla: my_tuple * veces_a_repetir
* Conocer el tamaño de la tupla: len(my_tuple)
* Prueba de pertenencia (membresía): item in my_tuple
* Concatenar dos tuplas: tuple_1 + tuple_2

### Métodos para diccionarios

Los diccionarios como arreglo de datos tienen la particularidad de asignar claves a valores para facilitar la organización y acceso a elementos específicos. No se permite que se repitan las claves

* Creación de un diccionario: {"key":value, "key_2":value_2}
* Acceder a los valores de una clave determinada: my_dict["key"] alternativamente my_dict.get("key")
* Eliminar un elemento del diccionario en base a una clave: del my_dict["key"]
* Acceder a las claves del diccionario: my_dict.keys() alternativamente list(my_dict())
* Remplazar o crear un valor: my_dict["key"] = value
* Vaciar un diccionario: my_dict.clear()
* Remover y recuperar un valor a la vez de un diccionario: my_dict.pop("key")

Para obtener mayor información sobre las estucturas de datos se puede referir a la [documentación](https://docs.python.org/3/tutorial/datastructures.html) de Python.