<img src = "https://drive.google.com/uc?export=view&id=1zD1_7Y4Ejud8OsuQb49rHGfl9qhihAh5" alt = "Encabezado MLDS" width = "100%">  </img>

# **Lenguaje de programación Python - Parte 1**
---
<img src = "https://www.python.org/static/community_logos/python-logo-inkscape.svg" alt = "Python Logo" width = "70%">  </img>



*Python* es un lenguaje de programación diseñado para permitir escribir código rápido, legible y compatible con múltiples plataformas. A su alrededor existe una enorme comunidad científica, que lo apoya con diversas librerías y módulos especializados que lo hacen muy popular en el área de la ciencia de datos.

En este recurso se presentarán las ideas básicas para aprender a escribir y ejecutar código *Python* desde las bases fundamentales. En las siguientes semanas se presentarán distintos módulos que expanden su funcionalidad, por lo que es importante que esté seguro de comprender y reforzar los conceptos antes de continuar.

Este material no constituye un manual de referencia completo de *Python* o un curso de programación de computadores en general. Si usted no tiene experiencia programando en *Python*, se recomienda que revise primero otros materiales de los **recursos adicionales** listados al final de este documento.

Es importante tener en cuenta la versión de *Python* utilizada en el desarrollo de estos recursos. En particular, este recurso está escrito y probado en la versión *Python* 3.6.9. Utilizar una versión distinta puede variar el resultado de la ejecución de algunos ejemplos.

In [None]:
!python --version

## **1. Comentarios**
---

Al trabajar con un lenguaje de programación, un software (un intérprete o un compilador) analiza la sintaxis de un texto escrito por el programador para generar código que pueda ser ejecutado por la máquina. Si algo no corresponde con las reglas del lenguaje, se le indica al programador por medio de errores qué pudo salir mal.

Un concepto muy útil y extremadamente común en los lenguajes de programación es la capacidad de usar comentarios dentro del código. Para esto, se usa una sintaxis especial que le indica al interprete que ignore secciones de texto específicas, que puede usar el programador para describir su código.

En esta guía, se usarán estos comentarios para describir los conceptos presentados.

> **Nota:** Técnicamente las expresiones con la notación con tres comillas `'''` no son comentarios validos de *Python*, pero en la mayoría de casos se comportan de manera similar y se pueden utilizar como tal.



In [None]:
# Este texto es ignorado por el intérprete.

# No importa lo que se escriba después del símbolo 
# Todo es ignorado (/.-+?\...), pero solo en la misma línea.

'''
Si se necesita, se pueden
usar comentarios en múltiples líneas
usando 3 comillas al principio
y al final de la sección que se busca ignorar.

Presione Shift + Enter para ejecutar la celda de código.
'''
print("¡Bienvenido al programa de formación MLDS!")
print("Este fragmento no es ignorado.") # Este fragmento está en la misma línea y SI es ignorado.

## **2. Entrada y salida**
---
Los programas escritos en *Python* y los entornos de ejecución (como *Google Colab*) permiten al usuario interactuar de formas distintas. El usuario introduce información en forma de archivos, datos en la nube, o acciones de periféricos como el teclado y ratón, y los entornos de ejecución ejecutan el programa de *Python*. En consecuencia, le devuelven al usuario una respuesta en forma de texto, imagen o contenidos interactivos complejos.

Antes de empezar, conocerá las acciones de entrada y salida más comunes. Estas son las funciones de **entrada y salida de texto**. Las más comunes y más útiles en los primeros pasos del aprendizaje del lenguaje son las funciones **`input`** y **`print`**. Las funciones en *Python* funcionan como las funciones matemáticas y se revisarán en detalle más adelante. Por ahora, es suficiente con saber que estas pueden recibir uno o más parámetros, ejecutan código y retornan un resultado. Las funciones **`input`** y **`print`** vienen por defecto con *Python*.

Cuando se ejecuta **`input`** la consola de *Python* espera que se le entregue texto, que puede escribir con su teclado o pegar del portapapeles, y luego hacer algo con este, como almacenarlo para más adelante. Por otro lado, **`print`** escribirá en consola texto almacenado previamente, ya sea almacenado en una variable (más acerca de ellas en la sección 3) o escrito explícitamente dentro del código.

En el ejemplo presentado a continuación se le pide al usuario su nombre, lo almacena en una variable y luego imprime en pantalla una bienvenida personalizada.

**Nota:** Las **funciones**, **variables** y **cadenas de texto** se verán en detalle más adelante en este material. Recuerde verificar que se está usando el *kernel* de *Python 3* para obtener el resultado esperado.

In [None]:
nombre = input('Hola. ¿Cómo te llamas?\n')

In [None]:
print(f'¡Te damos la bienvenida a la Universidad Nacional de Colombia, {nombre}!')

## **3. Variables**
---

Una variable es un espacio de memoria en el que se pueden almacenar valores o datos para reutilizarlos o modificarlos en el código. A diferencia de otros lenguajes de programación, *Python* es **débilmente tipado**. Esto quiere decir que para almacenar un dato en una variable, no se requiere definir de antemano qué tipo de dato va a representar, simplificando la definición de variables para escribir código rápidamente.

Las variables son declaradas con nombres definidos por el programador, y se le asignan valores con el símbolo **`=`**. Los nombres permitidos para variables en *Python* deben cumplir las siguientes condiciones.

1.   Deben estar compuestos por números del 0-9, caracteres alfabéticos en mayúscula o minúscula (A-Z y a-z) y por el símbolo `_`. 
2.   Si tienen un número, no puede ser el primer carácter.

Los nombres de variables distinguen entre mayúsculas y minúsculas. **`var`** y  **`VAR`** se interpretan como variables distintas.

> **IMPORTANTE**: En la misma ejecución en un *notebook* se preserva entre celdas el valor asignado a una variable.


En *Python* existen algunas convenciones consideradas buenas prácticas a la hora de escribir código en este lenguaje. Una de ellas es la forma de asignar nombres a variables y funciones. Se recomienda escribir palabras en minúscula separadas por una barra al piso `_`. 

> **Ejemplo: `calcular_intervalo`**



In [None]:
a = 100
print(a)

In [None]:
a = 'Python'
print(a)

In [None]:
# Si no ha cambiado la instancia de ejecución (por ejemplo, al actualizar la página)
# el valor de la variable a se preserva entre celdas.
print(a)

In [None]:
print(nombre) # Esta variable había sido creada en el ejemplo anterior.

## **4. Tipos de dato y operadores**
---

El tipo de un dato es un atributo que determina qué operaciones se pueden realizar y qué valores puede tomar. Estos pueden ser números, listas, texto, entre otros. En *Python*, los tipos de dato no son definidos explícitamente, pero siempre están presentes en las variables que declaramos y es necesario tenerlos en cuenta. En particular, el tipo de dato define las operaciones válidas entre datos del mismo tipo. Estas operaciones están definidas con el uso de símbolos llamados **operadores**.

Para conocer el tipo de dato de una variable, se usa la función **`type`**.


### **4.1. Cadenas de texto**
---


Un tipo de dato muy importante es el de las cadenas de texto. Estas cadenas permiten almacenar en un mismo dato texto con cualquier cantidad de caracteres. Las cadenas de texto en *Python 3* permiten el uso de caracteres de la codificación [Unicode](https://home.unicode.org/). Estas secuencias de caracteres se conocen como **strings** y pueden asignarse a variables como con valores numéricos. Para definir una cadena de texto, se rodea el texto con comillas simples `'` o comillas dobles `"`.

In [None]:
'cadena con comilla simple'

In [None]:
"cadena con comillas dobles"

El caracter \ sirve como caracter de escape para poder incluir caracteres especiales dentro de las cadenas. Por ejemplo:

In [None]:
'uso del caracter de escape para escribir el caracter de comilla simple \' dentro de una cadena definida con comilla simple'

In [None]:
"en este caso no es necesario usarlo ' porque estamos usando comilla doble"

Las cadenas se pueden almacenar en variables, así:

In [None]:
s = '   ¡La ciencia de datos es divertida!   '

In [None]:
print(s)

Algunos operadores de los usados para valores numéricos también sirven al operar con *strings* pero con utilidad distinta:


*  Concatenación `+`. 
*  Repetición `*`. 
*  Formato `%`. 

In [None]:
print(s + nombre)

In [None]:
print(s*3)

Para utilizar variables dentro de cadenas de texto definidas se utilizan varios métodos. Estos son:

1.   **Concatenación:** Se pueden componer cadenas de texto concatenando con el símbolo `+` varias subcadenas. Para variables numéricas que no son de tipo *string* por defecto se debe utilizar la función `str(variable)` para evitar errores de incompatibilidad de tipos. 
 > **Ejemplo:** `"Quedan " + str(num) + " minutos."`

2.   **Operador `%` de formato:** En sus inicios, *Python* incluía formato de cadenas de texto al estilo del lenguaje de programación C. Para esto, se define el valor y su formato dentro de la cadena, y se utiliza el operador **`%`** para definir la variable a la que se da el formato. Si se da formato a varios valores se usan tuplas como la variable de entrada. Este método no es recomendado por inconsistencias en su operación, pero es posible que lo encuentre en materiales en la web. En la documentación de *Python* se recomienda utilizar la función **`format()`** o *f-strings*.
 >**Ejemplo:** `"Quedan %d minutos." % num`

3.   **Función `format()`:** Las cadenas de texto tienen el método **`.format()`**, que permite reemplazar fragmentos encerrados en llaves curvadas **`{}`** por variables de cualquier tipo pasadas como parámetros de la función. 
 > **Ejemplo:** `"Quedan {} minutos.".format(num)`

4.   **_f-strings_:** Desde la versión de *Python* $3.6$ en adelante, se puede usar el carácter **`f`** como prefijo de una cadena de texto para interpretar los fragmentos encerrados en llaves curvadas **`{}`** como fragmentos de código de forma directa.
 >**Ejemplo:** `f"Quedan {num} minutos."`

In [None]:
# El .4f indica que la cadena utiliza solo 4 dígitos decimales.

print('%.4f' % 3.141592653589793)

In [None]:
num = 100

print("Quedan " + str(num) + " minutos.")
print("Quedan %d minutos." % num)
print("Quedan {} minutos.".format(num))
print(f'Quedan {num} minutos.')

In [None]:
print('{:.4f}'.format(3.141592653589793))

Para conocer muchas otras formas de dar formato consulte el siguiente [enlace](https://pyformat.info/).

Además de las operaciones por defecto, las cadenas de texto cuentan con la posibilidad de ejecutar funciones directamente. Por ejemplo, siendo **`s`** una variable con un **`string`**:

*  **`s.lower()`** : Retorna la cadena con todos los caracteres alfabéticos en minúscula.
*  **`s.upper()`** : Retorna la cadena con todos los caracteres alfabéticos en mayúscula.
*  **`s.replace(a, b)`** : Reemplaza las subcadenas iguales a la cadena **`a`** con el valor de la cadena **`b`**.
*  **`s.strip()`** : Retorna la cadena con todos los espacios en blanco al principio y al final removidos.
*  **`s.islower()`** : Determina si la cadena está compuesta solo por caracteres en mayúscula.
*  **`s.isupper()`** : Determina si la cadena está compuesta solo por caracteres en mayúscula.
*  **`s.isdigit()`** : Determina si la cadena está compuesta solo por dígitos del 0 al 9.
*  **`s.isalpha()`** : Determina si la cadena está compuesta solo por caracteres alfabéticos.


Como estos, existen muchos [métodos](https://www.w3schools.com/python/python_ref_string.asp) que se pueden ejecutar en cadenas de texto con utilidades distintas.

In [None]:
print(s)

In [None]:
print(s.lower())

In [None]:
print(s.upper())

In [None]:
print(s.replace('a', 'i'))

In [None]:
print(s.strip())

In [None]:
print(s.islower())
print('a'.islower())

In [None]:
print(s.isupper())
print('HOLA'.isupper())

In [None]:
print(s.isdigit())
print('123'.isdigit())

In [None]:
print(s.isalpha())
print('Palabra'.isalpha())

### **4.2. Valores y operadores numéricos**
---

Es el tipo de dato más común, y seguramente el que más vamos a usar en este módulo. Corresponde a valores que representan valores numéricos. En *Python*, los valores numéricos pueden ser de tres formas:

*   Números enteros. **(int)**
*   Números decimales. **(float)**
*   Números complejos. **(complex)**


In [None]:
a = 10     	      #int
print(a)
print(type(a))

In [None]:
a = -1089 	      #int - Se pueden escribir números negativos con el símbolo ‘-’
print(a)
print(type(a))

In [None]:
a = 10.2  	      #float
print(a)
print(type(a))

In [None]:
a = 1e100 	      #float - Esta sintaxis representa notación científica.
print(a)
print(type(a))

In [None]:
a = 1j            #complex
print(a)
print(type(a))

In [None]:
a = 1 + 0.2j      #complex
print(a)
print(type(a))


Existen varios operadores matemáticos para estos valores numéricos. Estos son:

*   Adición:  `+`
*   Substracción: `-`
*   Multiplicación: `*`
*   División: `/`
*   Módulo o residuo: `%`
*   Exponenciación: `**`
*   División y función piso: `//`

Además, se pueden usar paréntesis para escribir operaciones compuestas y modificar la precedencia de los operadores.



In [None]:
print(f'-10 + 4.0 = { -10 + 4.0 }')     # Adición

In [None]:
print(f'100j - 0.1j = {100j -  0.1j}')    # Substracción

In [None]:
print(f'1e-100 * 0.2 = {1e-100 *  0.2}')	        # Multiplicación

In [None]:
print(f'0.001 / 2 = {0.001 / 2}')	   # División

In [None]:
print(f'15 % 2 = {15 %  2}')	     # Módulo - No es un operador válido para números complejos
# El operador módulo indica el residuo de la división entera
# En este caso, la división entera da como resultado 7 y su residuo es 1

In [None]:
print(f'14 % 2 = {14 % 2}')	     # Módulo
# En este caso, la división entera da como resultado 7 y su residuo es 0

In [None]:
print(f'2 ** 3 = {2   **  3}')	   # Exponenciación

In [None]:
print(f'15 // 2 = {15  //  2}')   # División y función piso - No es un operador válido para números complejos

In [None]:
#Las operaciones compuestas se definen con paréntesis.

-500 + 100*(20 // 2 ** 3)

### **4.3. Valores y operadores lógicos**
---

Otro tipo de dato importante es el **booleano**, que representa un valor lógico de verdad. Puede tomar únicamente estos dos valores:

*  Verdadero: `True`
*  Falso: `False`


En *Python*, a diferencia de otros lenguajes de programación, las primitivas lógicas son escritas con la primera letra en mayúscula.

Además de con el uso de las dos primitivas lógicas (**`True`** y **`False`**), se pueden obtener valores lógicos con la evaluación de expresiones con **operadores relacionales**. Estos son:

*   Igual que. 			`==`
*   Distinto que. 		`!=`
*   Mayor que. 		`>`
*   Menor que. 		 `<`
*   Mayor o igual que. `>=`
*   Menor o igual que. `<=`

In [None]:
# Operadores de comparación de datos numéricos. 
print(-10  ==  4.0)  # Igual que. 	    

In [None]:
print(-10  !=  4.0) 	# Distinto que.

In [None]:
print(-10  >   4.0)  # Mayor que.   

In [None]:
# También sirven con datos que tienen orden, como el orden alfanumérico de las cadenas de texto.
print('Hola' < 'Hola a todos')

In [None]:
print(-10  <   4.0)  # Menor que.    

In [None]:
print(-10  >=  4.0)  # Mayor o igual que.   

In [None]:
print(-10  <=  4.0)  # Menor o igual que. 

También existen operadores lógicos usados para expresiones booleanas compuestas. Estos son:

*   AND lógico. 		**`and`**
*   OR lógico. 		  **`or`**
*   NOT. negación. 	**`not`**

In [None]:
# Operadores de datos lógicos:

a = True
b = False

In [None]:
print(a and b)   #AND lógico. 			

In [None]:
print(a or b)	   #OR lógico. 			

In [None]:
print(not a)		 #Negación

In [None]:
# Operaciones compuestas

print( (a and b) or (not b) )

Además de estos operadores, se puede usar el operador **`is`**, que valida la identidad de un objeto. Para entender esto, tenemos que por su parte el operador **`==`** valida la igualdad de contenido de un objeto, mientras que el operador **`is`** valida si dos objetos, además de ser iguales en contenido, contienen la misma referencia en memoria, es decir, valida si son el mismo objeto. Si los valores son primitivas numéricas o lógicas el operador **`is`** retornará **`True`**.

In [None]:
# Operador is

print('Operador is')
a = 1.0
b = 1

print(a is b) # No tienen el mismo tipo de dato y por lo tanto son objetos distintos.
print(a == b) # Contienen el mismo valor al verificar su igualdad.

## **5. Colecciones**
---

Las colecciones son tipos de datos que permiten almacenar múltiples valores en una misma variable. Las distintas maneras en que se organizan estos datos para su lectura y escritura se conocen como **estructuras de datos**. *Python* tiene 3 estructuras definidas como primitivas por defecto del lenguaje, que pueden ser definidas con sintaxis especial. Para estructuras más complejas, se suele recurrir a la [librería estándar de Python](https://docs.python.org/3/library/) o librerías especializadas como [NumPy](https://numpy.org/) y [Pandas](https://pandas.pydata.org/) que estudiaremos posteriormente.

### **5.1. Listas**
---
Las listas son el tipo de colección más común. Son estructuras de datos ordenadas con longitud variable. Esto quiere decir, que tras su declaración se pueden agregar o eliminar elementos específicos de su contenido. Además, estos elementos ocupan una posición definida secuencialmente, siendo el primer elemento el que ocupa la posición **`0`**.

Existen dos formas de declarar listas en *Python*:
*   Con llaves cuadradas. &nbsp;&nbsp; **Ejemplo:** `l = []`
*   Con la función **`list`**. &nbsp;&nbsp;&nbsp;&nbsp; **Ejemplo:** `l = list()`

En el momento de su definición, se pueden definir valores por defecto, separados por coma. 


In [None]:
l = [1, 2, 3, 4, 5]
print(l)
type(l)

El tipo de dato de sus elementos no tiene porqué ser el mismo. Por ejemplo:

In [None]:
l = [1, 'Hola', 4.5]
print(l)
type(l)

Incluso, una lista puede almacenar otras listas anidadas:

In [None]:
l = [1, 2.5, [4, 5, 6, 7], "Fin"]
print(l)
type(l)

Se pueden realizar operaciones entre listas mediante algunos operadores. Es importante tener en cuenta los tipos de dato, pues símbolos como estos funcionan de manera distinta en relación al tipo de dato que manejan. Estos operadores básicos son:

*   **Concatenación `+`**: Al aplicar este operador, se agregan los elementos de la segunda lista al final de la primera.
*   **Repetición `*`**: Al aplicar este operador, se repiten los elementos la cantidad de veces expresada en el segundo operando.

In [None]:
l_a = [1, 2, 3]
l_b = ['a', 'b', 'c']

In [None]:
# Concatenación
print(l_a + l_b)

In [None]:
# Repetición
print(l_a * 3)

 Una vez se declara una lista, su contenido puede variar mediante métodos predeterminados. Estos son algunos de los métodos más comunes para ejecutar en listas:

 *  **`l.append(e)`** : Agrega el elemento **`e`** al final de la lista.
 *  **`l.remove(e)`** : Elimina la primera aparición del elemento **`e`** de la lista.
 *  **`l.insert(i, e)`** : Agrega el elemento **`e`** a la lista en la posición **`i`**.
 *  **`l.pop(i)`** : Elimina y retorna el elemento en la posición **`i`**.
 *  **`l.sort()`** : Ordena los elementos de menor a mayor. Con el argumento **`reverse = True`** se puede indicar el orden contrario.

*  **`l.clear()`**: Vacía la lista.
*  **`l.index(e)`**: Retorna la posición del elemento **`e`**.
*  **`l.copy()`**: Crea y retorna una copia de la lista.


In [None]:
lista = ['c', 'a', 'b', 'x']

In [None]:
lista.append('d')
print(lista)

In [None]:
lista.insert(0 , 'e')
print(lista)

In [None]:
lista.sort()
print(lista)

In [None]:
lista.remove('d')
print(lista)

In [None]:
# Otra forma de eliminar un elemento de la lista por su índice
del lista[4]

In [None]:
eliminado = lista.pop(1) # Elimina un elemento por su índice y retorna su valor
print(lista)
print(eliminado)

In [None]:
print(lista.index('e')) # El primer elemento tiene el índice 0

In [None]:
copia = lista.copy()
print(copia)

In [None]:
print(lista == copia) # True - contienen los mismos elementos
print(lista is copia) # False - son objetos diferentes

In [None]:
lista.clear()
print(lista)
print(copia)

Para reasignar el valor de un elemento de la lista:

In [None]:
copia[1] = 'Nuevo valor'
print(copia)

El operador **`in`** es muy utilizado para saber si un elemento pertenece a una lista:

In [None]:
'x' in copia

In [None]:
'e' in copia

Además de con métodos, los elementos contenidos en una lista pueden ser accedidos por medio de su índice o posición en la lista. Para esto se usa la sintaxis de llaves cuadradas `[` y `]`. Dentro de las llaves se indica el índice o el rango de elementos que se desea retornar o modificar, siendo el primer elemento el del índice $0$. Las formas de usar estos índices es la siguiente:

*   **`l[i]`**: Se retorna el elemento en la posición **`i`**.
* **`l[-i]`**: Si se indican elementos negativos el conteo de la posición se hace desde el final de la lista.
*   **`l[a:b]`**: Se retornan los elementos desde la posición **`a`** (incluida) hasta la posición **`b`** (excluida).
*   **`l[a:b:n]`**: Se retornan los elementos desde la posición **`a`** (incluida) hasta la posición **`b`** (excluida), dando saltos cada **`n`** elementos.


In [None]:
lista = [1, 2, 3, 4, 5, 6, 7, 8]

In [None]:
print(lista[0]) # El elemento en el índice 0 es el de la primera posición.

In [None]:
print(lista[-1]) # El elemento en la posición -1 es el último de la lista.

In [None]:
print(lista[0:3])

In [None]:
print(lista[0:7:2])

In [None]:
print(lista[:3]) # Si no se agrega el inicio, Python lo interpreta como el inicio de la lista.

In [None]:
print(lista[3:]) # Si no se agrega el final, Python lo interpreta como el final de la lista.

In [None]:
print(lista[::-1]) #Se pueden omitir ambos. Si el paso es negativo, se realiza la iteración desde el final.

Esto mismo aplica cuando tenemos listas anidadas:

In [None]:
anidada = [1, 2, [3, 4], 5]

In [None]:
anidada[2]

In [None]:
anidada[2][1]

In [None]:
anidada = [1, 2, 3, [4, 5, ['objetivo']], 10]

In [None]:
anidada[3]

In [None]:
anidada[3][2]

In [None]:
anidada[3][2][0]

Las cadenas de texto pueden interpretarse como listas de caracteres. Se pueden usar las operaciones con índices de las listas para trocear subcadenas de texto directamente.

In [None]:
s = "Análisis y Visualización de Datos con Python - UNAL"

In [None]:
s[0]

In [None]:
s[3]

In [None]:
s[38:44]

In [None]:
s[38:]

In [None]:
s[:25]

In [None]:
s[-4:]

In [None]:
s[:]

In [None]:
s[::-1]

In [None]:
s = 'Amo la pacífica paloma'
print(s[::-1])

In [None]:
s = 'Exsxtxex xmxexnxsxaxjxex xexsxtxáx xoxcxuxlxtxox'
s[0::2]

### **5.2. Tuplas**
---

Las tuplas son casi idénticas a las listas. La única diferencia importante entre ambos tipos de dato es que las tuplas son **inmutables**. Esto quiere decir que una vez que son declaradas, no es posible modificar sus valores. Una variable con una tupla puede recibir valores distintos, pero los elementos particulares de la tupla son inalterables en toda la ejecución del programa.

Las tuplas son declaradas con la sintaxis de paréntesis `(` y `)`, separando los elementos con comas `,`. Al igual que con las listas, los tipos de dato de los elementos de una tupla pueden ser distintos.


In [None]:
tupla = (1, 2, 3)

In [None]:
tupla

In [None]:
tupla[0]

In [None]:
#tupla[0] = 'Nuevo valor' # las tuplas son inmutables, no se puede reasignar. 
# ¡Cuidado! Obtendrá un error si se ejecuta

In [None]:
tupla

Podrían contener varios tipos de dato:

In [None]:
t = ( 0, [1,2,3], 'cadena')
print(t)

Las tuplas son particularmente útiles como valores de retorno de funciones. Gracias a ellas, se pueden definir valores de retorno separados por coma y luego, al llamar la función, desestructurar los valores en variables distintas. La definición de funciones se verá más adelante en el material.

### **5.3. Conjuntos**
---

*Python* permite la definición directa de conjuntos con la sintaxis de llaves curvadas `{`y `}`, con elementos separados por comas `,`. Los conjuntos son colecciones de datos sin orden. Las operaciones definidas en conjuntos corresponden en su mayoría a aquellas del concepto matemático de conjunto. Los elementos no se indexan, sino que se añaden o eliminan directamente. Después, se puede validar si un elemento pertenece o no a un conjunto. Si se desea declarar un conjunto vacío, se tiene que usar la función **`set()`**.


In [None]:
{1, 2, 3}

In [None]:
{1, 2, 3, 1, 2, 1, 2, 3, 3, 3, 3, 2, 2, 2, 1, 1, 2}

In [None]:
s = {1, 2, 3}
print(s)

In [None]:
# Conjunto construido a partir de una lista
set([1, 1, 1, 2, 2, 6, 6, 2, 8, 1, 3])

In [None]:
# Conjunto vacío.
s = set()
print(s)

Algunas de las operaciones definidas en conjuntos son.

*   **`s.add(e)`** : Añade el elemento **`e`** al conjunto **`s`**. Si ya existe un elemento igual no ocurre nada.
*   **`s.remove(e)`** : Elimina el elemento **`e`** del conjunto **`s`**. Si no existe, arroja un error.
*   **`s.discard(e)`** : Elimina el elemento **`e`** del conjunto **`s`**. Si no existe no ocurre nada.
*   **`s.pop()`** : Elimina y retorna un elemento aleatorio del conjunto **`s`**.
*   **`s.clear()`** : Vacía el conjunto.
*   **`s.copy()`** : Retorna una copia del conjunto **`s`**.


In [None]:
s.add('a')
s.add('b')
s.add('a')
s.add('c')
print(s)

In [None]:
s.remove('c') # Si el elemento no está en el conjunto, arroja un error.
print(s)

In [None]:
s.discard('c') # Si el elemento no está en el conjunto, ignora la operación.
print(s)

In [None]:
print(s.pop())
print(s)

Además, se definen algunos métodos específicos para realizar operaciones entre conjuntos. Para dos conjuntos **`a`** y **`b`** se definen:

*  **`a.difference(b)`** : Retorna un conjunto con los elementos que están en **`a`** pero no en **`b`**.
*  **`a.intersection(b)`** : Retorna un conjunto con los elementos que están tanto en **`a`** como en **`b`**.
*  **`a.union(b)`** : Retorna un conjunto con los elementos que están en **`a`** y los que están en **`b`**.
*  **`a.symmetric_difference(b)`** : Retorna un conjunto con los elementos que están en **`a`** o en **`b`**, pero no en ambos.

* **`a.issuperset(b)`** : Evalúa si el conjunto **`a`** contiene todos los elementos del conjunto **`b`**.
*  **`a.issubset(b)`** : Evalúa si todos los elementos del conjunto **`a`** pertenecen al conjunto **`b`**.
*  **`a.isdisjoint(b)`** : Evalúa si los conjuntos **`a`** y **`b`** son disyuntos. Es decir, si ninguno de sus elementos pertenece al otro conjunto.

In [None]:
a = { 'a', 'b', 'c', 'd', 'e', 'f', 'g'}
b = { 'a' ,'b', 'c', 'd', 'e', 'x'}

In [None]:
a.difference(b)

In [None]:
a.intersection(b)

In [None]:
a.union(b)

In [None]:
a.symmetric_difference(b)

In [None]:
a.issuperset(b)

In [None]:
a.issubset(b)

In [None]:
a.isdisjoint(b)

### **5.4. Diccionarios**
---
Los diccionarios son una estructura de datos sin orden, como los conjuntos, de **pares clave-valor**. Las claves que se definen son únicas y permiten consultar los valores almacenados en el diccionario directamente usando la clave en vez de una posición. Al igual que con los conjuntos, se declaran con la notación de llaves curvadas `{` y `}` con parejas **`clave : valor`** separadas por coma.

In [None]:
clave = 'clave' #Cualquier objeto inmutable, como cadenas, números o tuplas.
valor = 'valor'
diccionario = {
                 clave : valor,
                 clave + '1' : valor + '1'
              }

print(diccionario)

Para acceder a los elementos de un diccionario se utiliza una sintaxis similar a la utilizada en listas y tuplas con llaves cuadradas `[` y `]`.  Dentro de las llaves se indica la clave asociada, que puede ser cualquier tipo de dato inmutable como valores numéricos, tuplas, o cadenas de texto. Las claves solo pueden estar asociadas a un elemento, por lo que al asignar valores a una clave previamente ocupada se sobreescribe el valor anterior.

In [None]:
d = {}

d['a'] = 'a'
d[(0,1)] = 'tupla'

print(d)

In [None]:
d = {100:'elemento 1',
     'clave2':2000}
     
print(d)

In [None]:
#d[0]
#Saldrá un error. Por eso está comentado. 
#Los diccionarios no se indexan numéricamente, sino por sus claves y en este caso 0 no es una clave válida. 

In [None]:
d[100]

In [None]:
d['clave2']

In [None]:
d

In [None]:
d = {'k1':[1, 2, 3, 4, 5], 'k2': 'Hola'}

In [None]:
d['k1']

In [None]:
lista = d['k1']

In [None]:
lista

In [None]:
lista[3]

In [None]:
d['k1'][3]

In [None]:
# un diccionario anidado dentro de otro diccionario
d = {'k1':{
          '1a' : [1, 2, 3, 10]
           }
     }

In [None]:
d['k1']

In [None]:
d['k1']['1a']

In [None]:
d['k1']['1a'][3]

In [None]:
d = {'k1':10, 'k2':20, 'k3':1, 'k4': 'hola'}

Los diccionarios también tienen funciones especiales muy utilizadas. Siendo **`d`** un diccionario:

*  **`d.keys()`** : Retorna una lista con las claves.
*  **`d.values()`** : Retorna una lista con los valores.
*  **`d.items()`** : Retorna una lista de tuplas con los pares **`(clave, valor)`**.

>**IMPORTANTE:** El orden en que se almacenan/retornan los elementos no siempre será el mismo.


In [None]:
d.keys()

In [None]:
d.values()

In [None]:
d.items()

En el siguiente [enlace](https://www.w3schools.com/python/python_dictionaries.asp) puede consultar muchas más funciones de utilidad al trabajar con diccionarios. 

## **Recursos adicionales**
---

*  [*Python* 3: documentación oficial.](https://docs.python.org/3/)
*  [How to Think Like a Computer Scientist: Interactive Edition.](https://runestone.academy/runestone/books/published/thinkcspy/index.html)
*  [Profesor Fabio González - Programación de Computadores](https://sites.google.com/a/unal.edu.co/prog-comp-2019-2/)
* [CodeCademy - Learn Python 3](https://www.codecademy.com/learn/learn-python-3)
*  [Kaggle - Python](https://www.codecademy.com/learn/learn-python-3)
*  [MIT (edX) - Introduction to Computer Science and Programming Using Python](https://www.edx.org/es/course/introduction-to-computer-science-and-programming-7)
*  [Python for everyone](https://www.py4e.com/)

## **Créditos**
---

* **Profesor:** [Felipe Restrepo Calle](https://dis.unal.edu.co/~ferestrepoca/)
* **Asistentes docentes:**
  - Alberto Nicolai Romero Martínez
  - Miguel Angel Ortiz Marín

**Universidad Nacional de Colombia** - *Facultad de Ingeniería*