# **Lenguaje de programación Python**
---
<img src = "https://www.python.org/static/community_logos/python-logo-inkscape.svg" alt = "Python Logo" width = "70%">  </img>



*Python* es un lenguaje de programación diseñado para permitir escribir código rápido, legible y compatible con múltiples plataformas. A su alrededor existe una enorme comunidad científica, que lo apoya con diversas librerías y módulos especializados que lo hacen muy popular en el área de la ciencia de datos.

En este recurso se presentarán las ideas básicas para aprender a escribir y ejecutar código *Python* desde las bases fundamentales. En las siguientes semanas se presentarán distintos módulos que expanden su funcionalidad, por lo que es importante que esté seguro de comprender y reforzar los conceptos antes de continuar.

Este material no constituye un manual de referencia completo de *Python* o un curso de programación de computadores en general. Si usted no tiene experiencia programando en *Python*, se recomienda que revise primero otros materiales de los **recursos adicionales** listados al final de este documento.

## **1. Comentarios**
---

Al trabajar con un lenguaje de programación, un software (un intérprete o un compilador) analiza la sintaxis de un texto escrito por el programador para generar código que pueda ser ejecutado por la máquina. Si algo no corresponde con las reglas del lenguaje, se le indica al programador por medio de errores qué pudo salir mal.

Un concepto muy útil y extremadamente común en los lenguajes de programación es la capacidad de usar comentarios dentro del código. Para esto, se usa una sintaxis especial que le indica al interprete que ignore secciones de texto específicas, que puede usar el programador para describir su código.

En esta guía, se usarán estos comentarios para describir los conceptos presentados.

> **Nota:** Técnicamente las expresiones con la notación con tres comillas `"""` no son comentarios validos de *Python*, pero en la mayoría de casos se comportan de manera similar y se pueden utilizar como tal.



In [1]:
# Este texto es ignorado por el intérprete.

# No importa lo que se escriba después del símbolo 
# Todo es ignorado (/.-+?\...), pero solo en la misma línea.

"""
Si se necesita, se pueden
usar comentarios en múltiples líneas
usando 3 comillas al principio
y al final de la sección que se busca ignorar.

Presione Shift + Enter para ejecutar la celda de código.
"""
print("¡Bienvenido al programa de formación MLDS!")
print("Este fragmento no es ignorado.") # Este fragmento está en la misma línea y SI es ignorado.

¡Bienvenido al programa de formación MLDS!
Este fragmento no es ignorado.


## **2. Entrada y salida**
---
Los programas escritos en *Python* y los entornos de ejecución (como *Google Colab*) permiten al usuario interactuar de formas distintas. El usuario introduce información en forma de archivos, datos en la nube, o acciones de periféricos como el teclado y ratón, y los entornos de ejecución ejecutan el programa de *Python*. En consecuencia, le devuelven al usuario una respuesta en forma de texto, imagen o contenidos interactivos complejos.

Antes de empezar, conocerá las acciones de entrada y salida más comunes. Estas son las funciones de **entrada y salida de texto**. Las más comunes y más útiles en los primeros pasos del aprendizaje del lenguaje son las funciones **`input`** y **`print`**. Las funciones en *Python* funcionan como las funciones matemáticas y se revisarán en detalle más adelante. Por ahora, es suficiente con saber que estas pueden recibir uno o más parámetros, ejecutan código y retornan un resultado. Las funciones **`input`** y **`print`** vienen por defecto con *Python*.

Cuando se ejecuta **`input`** la consola de *Python* espera que se le entregue texto, que puede escribir con su teclado o pegar del portapapeles, y luego hacer algo con este, como almacenarlo para más adelante. Por otro lado, **`print`** escribirá en consola texto almacenado previamente, ya sea almacenado en una variable (más acerca de ellas en la sección 3) o escrito explícitamente dentro del código.

En el ejemplo presentado a continuación se le pide al usuario su nombre, lo almacena en una variable y luego imprime en pantalla una bienvenida personalizada.

**Nota:** Las **funciones**, **variables** y **cadenas de texto** se verán en detalle más adelante en este material. Recuerde verificar que se está usando el *kernel* de *Python 3* para obtener el resultado esperado.

In [2]:
nombre = input("Hola. ¿Cómo te llamas?\n")

In [3]:
print(f"¡Te damos la bienvenida a la Universidad Nacional de Colombia, {nombre}!")

¡Te damos la bienvenida a la Universidad Nacional de Colombia, Santiago!


## **3. Variables**
---

Una variable es un espacio de memoria en el que se pueden almacenar valores o datos para reutilizarlos o modificarlos en el código. A diferencia de otros lenguajes de programación, *Python* es **débilmente tipado**. Esto quiere decir que para almacenar un dato en una variable, no se requiere definir de antemano qué tipo de dato va a representar, simplificando la definición de variables para escribir código rápidamente.

Las variables son declaradas con nombres definidos por el programador, y se le asignan valores con el símbolo **`=`**. Los nombres permitidos para variables en *Python* deben cumplir las siguientes condiciones.

1.   Deben estar compuestos por números del 0-9, caracteres alfabéticos en mayúscula o minúscula (A-Z y a-z) y por el símbolo `_`. 
2.   Si tienen un número, no puede ser el primer carácter.

Los nombres de variables distinguen entre mayúsculas y minúsculas. **`var`** y  **`VAR`** se interpretan como variables distintas.

> **IMPORTANTE**: En la misma ejecución en un *notebook* se preserva entre celdas el valor asignado a una variable.


En *Python* existen algunas convenciones consideradas buenas prácticas a la hora de escribir código en este lenguaje. Una de ellas es la forma de asignar nombres a variables y funciones. Se recomienda escribir palabras en minúscula separadas por una barra al piso `_`. 

> **Ejemplo: `calcular_intervalo`**



In [4]:
a = 100
print(a)

100


In [5]:
a = "Python"
print(a)

Python


In [6]:
# Si no ha cambiado la instancia de ejecución (por ejemplo, al actualizar la página)
# el valor de la variable a se preserva entre celdas.
print(a)

Python


In [7]:
print(nombre) # Esta variable había sido creada en el ejemplo anterior.

Santiago


## **4. Tipos de dato y operadores**
---

El tipo de un dato es un atributo que determina qué operaciones se pueden realizar y qué valores puede tomar. Estos pueden ser números, listas, texto, entre otros. En *Python*, los tipos de dato no son definidos explícitamente, pero siempre están presentes en las variables que declaramos y es necesario tenerlos en cuenta. En particular, el tipo de dato define las operaciones válidas entre datos del mismo tipo. Estas operaciones están definidas con el uso de símbolos llamados **operadores**.

Para conocer el tipo de dato de una variable, se usa la función **`type`**.


### **4.1. Cadenas de texto**
---


Un tipo de dato muy importante es el de las cadenas de texto. Estas cadenas permiten almacenar en un mismo dato texto con cualquier cantidad de caracteres. Las cadenas de texto en *Python 3* permiten el uso de caracteres de la codificación [Unicode](https://home.unicode.org/). Estas secuencias de caracteres se conocen como **strings** y pueden asignarse a variables como con valores numéricos. Para definir una cadena de texto, se rodea el texto con comillas simples `"` o comillas dobles `"`.

In [8]:
"cadena con comilla simple"

'cadena con comilla simple'

In [9]:
"cadena con comillas dobles"

'cadena con comillas dobles'

El caracter \ sirve como caracter de escape para poder incluir caracteres especiales dentro de las cadenas. Por ejemplo:

In [10]:
"uso del caracter de escape para escribir el caracter de comilla simple \" dentro de una cadena definida con comilla simple"

"uso del caracter de escape para escribir el caracter de comilla simple ' dentro de una cadena definida con comilla simple"

In [11]:
'en este caso no es necesario usarlo " porque estamos usando comilla doble'

"en este caso no es necesario usarlo ' porque estamos usando comilla doble"

Las cadenas se pueden almacenar en variables, así:

In [12]:
s = "   ¡La ciencia de datos es divertida!   "

In [13]:
print(s)

   ¡La ciencia de datos es divertida!   


Algunos operadores de los usados para valores numéricos también sirven al operar con *strings* pero con utilidad distinta:


*  Concatenación `+`. 
*  Repetición `*`. 
*  Formato `%`. 

In [14]:
print(s + nombre)

   ¡La ciencia de datos es divertida!   Santiago


In [15]:
print(s*3)

   ¡La ciencia de datos es divertida!      ¡La ciencia de datos es divertida!      ¡La ciencia de datos es divertida!   


Para utilizar variables dentro de cadenas de texto definidas se utilizan varios métodos. Estos son:

1.   **Concatenación:** Se pueden componer cadenas de texto concatenando con el símbolo `+` varias subcadenas. Para variables numéricas que no son de tipo *string* por defecto se debe utilizar la función `str(variable)` para evitar errores de incompatibilidad de tipos. 
 > **Ejemplo:** `"Quedan " + str(num) + " minutos."`

2.   **Operador `%` de formato:** En sus inicios, *Python* incluía formato de cadenas de texto al estilo del lenguaje de programación C. Para esto, se define el valor y su formato dentro de la cadena, y se utiliza el operador **`%`** para definir la variable a la que se da el formato. Si se da formato a varios valores se usan tuplas como la variable de entrada. Este método no es recomendado por inconsistencias en su operación, pero es posible que lo encuentre en materiales en la web. En la documentación de *Python* se recomienda utilizar la función **`format()`** o *f-strings*.
 > **Ejemplo:** `"Quedan {} minutos.".format(num)`

3.   **Función `format()`:** Las cadenas de texto tienen el método **`.format()`**, que permite reemplazar fragmentos encerrados en llaves curvadas **`{}`** por variables de cualquier tipo pasadas como parámetros de la función. 
 >**Ejemplo:** `"Quedan %d minutos." % num`

4.   **_f-strings_:** Desde la versión de *Python* $3.6$ en adelante, se puede usar el carácter **`f`** como prefijo de una cadena de texto para interpretar los fragmentos encerrados en llaves curvadas **`{}`** como fragmentos de código de forma directa.
 >**Ejemplo:** `f"Quedan {num} minutos."`

In [16]:
# El .4f indica que la cadena utiliza solo 4 dígitos decimales.

print("%.4f" % 3.141592653589793)

3.1416


In [17]:
num = 100

print("Quedan " + str(num) + " minutos.")
print("Quedan %d minutos." % num)
print("Quedan {} minutos.".format(num))
print(f"Quedan {num} minutos.")

Quedan 100 minutos.
Quedan 100 minutos.
Quedan 100 minutos.
Quedan 100 minutos.


In [18]:
print("{:.4f}".format(3.141592653589793))

3.1416


Para conocer muchas otras formas de dar formato consulte el siguiente [enlace](https://pyformat.info/).

Además de las operaciones por defecto, las cadenas de texto cuentan con la posibilidad de ejecutar funciones directamente. Por ejemplo, siendo **`s`** una variable con un **`string`**:

*  **`s.lower()`** : Retorna la cadena con todos los caracteres alfabéticos en minúscula.
*  **`s.upper()`** : Retorna la cadena con todos los caracteres alfabéticos en mayúscula.
*  **`s.replace(a, b)`** : Reemplaza las subcadenas iguales a la cadena **`a`** con el valor de la cadena **`b`**.
*  **`s.strip()`** : Retorna la cadena con todos los espacios en blanco al principio y al final removidos.
*  **`s.islower()`** : Determina si la cadena está compuesta solo por caracteres en mayúscula.
*  **`s.isupper()`** : Determina si la cadena está compuesta solo por caracteres en mayúscula.
*  **`s.isdigit()`** : Determina si la cadena está compuesta solo por dígitos del 0 al 9.
*  **`s.isalpha()`** : Determina si la cadena está compuesta solo por caracteres alfabéticos.


Como estos, existen muchos [métodos](https://www.w3schools.com/python/python_ref_string.asp) que se pueden ejecutar en cadenas de texto con utilidades distintas.

In [19]:
print(s)

   ¡La ciencia de datos es divertida!   


In [20]:
print(s.lower())

   ¡la ciencia de datos es divertida!   


In [21]:
print(s.upper())

   ¡LA CIENCIA DE DATOS ES DIVERTIDA!   


In [22]:
print(s.replace("a", "i"))

   ¡Li ciencii de ditos es divertidi!   


In [23]:
print(s.strip())

¡La ciencia de datos es divertida!


In [24]:
print(s.islower())
print("a".islower())

False
True


In [25]:
print(s.isupper())
print("HOLA".isupper())

False
True


In [26]:
print(s.isdigit())
print("123".isdigit())

False
True


In [27]:
print(s.isalpha())
print("Palabra".isalpha())

False
True


### **4.2. Valores y operadores numéricos**
---

Es el tipo de dato más común, y seguramente el que más vamos a usar en este módulo. Corresponde a valores que representan valores numéricos. En *Python*, los valores numéricos pueden ser de tres formas:

*   Números enteros. **(int)**
*   Números decimales. **(float)**
*   Números complejos. **(complex)**


In [28]:
a = 10  #int
print(a)
print(type(a))

10
<class 'int'>


In [29]:
a = -1089  #int - Se pueden escribir números negativos con el símbolo ‘-’
print(a)
print(type(a))

-1089
<class 'int'>


In [30]:
a = 10.2  #float
print(a)
print(type(a))

10.2
<class 'float'>


In [31]:
a = 1e100  #float - Esta sintaxis representa notación científica.
print(a)
print(type(a))

1e+100
<class 'float'>


In [32]:
a = 1j  #complex
print(a)
print(type(a))

1j
<class 'complex'>


In [33]:
a = 1 + 0.2j  #complex
print(a)
print(type(a))

(1+0.2j)
<class 'complex'>



Existen varios operadores matemáticos para estos valores numéricos. Estos son:

*   Adición:  `+`
*   Substracción: `-`
*   Multiplicación: `*`
*   División: `/`
*   Módulo o residuo: `%`
*   Exponenciación: `**`
*   División y función piso: `//`

Además, se pueden usar paréntesis para escribir operaciones compuestas y modificar la precedencia de los operadores.



In [34]:
print(f"-10 + 4.0 = {-10 + 4.0}")  # Adición

-10 + 4.0 = -6.0


In [35]:
print(f"100j - 0.1j = {100j - 0.1j}")  # Substracción

100j - 0.1j = 99.9j


In [36]:
print(f"1e-100 * 0.2 = {1e-100 * 0.2}")  # Multiplicación

1e-100 * 0.2 = 2e-101


In [37]:
print(f"0.001 / 2 = {0.001 / 2}")  # División

0.001 / 2 = 0.0005


In [38]:
print(f"15 % 2 = {15 % 2}")  # Módulo - No es un operador válido para números complejos
# El operador módulo indica el residuo de la división entera
# En este caso, la división entera da como resultado 7 y su residuo es 1

15 % 2 = 1


In [39]:
print(f"14 % 2 = {14 % 2}")  # Módulo
# En este caso, la división entera da como resultado 7 y su residuo es 0

14 % 2 = 0


In [40]:
print(f"2 ** 3 = {2 ** 3}")  # Exponenciación

2 ** 3 = 8


In [41]:
print(f"15 // 2 = {15 // 2}")  # División y función piso - No es un operador válido para números complejos

15 // 2 = 7


In [42]:
#Las operaciones compuestas se definen con paréntesis.

-500 + 100*(20 // 2 ** 3)

-300

### **4.3. Valores y operadores lógicos**
---

Otro tipo de dato importante es el **booleano**, que representa un valor lógico de verdad. Puede tomar únicamente estos dos valores:

*  Verdadero: `True`
*  Falso: `False`


En *Python*, a diferencia de otros lenguajes de programación, las primitivas lógicas son escritas con la primera letra en mayúscula.

Además de con el uso de las dos primitivas lógicas (**`True`** y **`False`**), se pueden obtener valores lógicos con la evaluación de expresiones con **operadores relacionales**. Estos son:

*   Igual que. 			`==`
*   Distinto que. 		`!=`
*   Mayor que. 		`>`
*   Menor que. 		 `<`
*   Mayor o igual que. `>=`
*   Menor o igual que. `<=`

In [43]:
# Operadores de comparación de datos numéricos.
print(-10 == 4.0)  # Igual que.

False


In [44]:
print(-10 != 4.0)  # Distinto que.

True


In [45]:
print(-10 > 4.0)  # Mayor que.

False


In [46]:
# También sirven con datos que tienen orden, como el orden alfanumérico de las cadenas de texto.
print("Hola" < "Hola a todos")

True


In [47]:
print(-10 < 4.0)  # Menor que.

True


In [48]:
print(-10 >= 4.0)  # Mayor o igual que. 

False


In [49]:
print(-10 <= 4.0)  # Menor o igual que.

True


También existen operadores lógicos usados para expresiones booleanas compuestas. Estos son:

*   AND lógico. 		**`and`**
*   OR lógico. 		  **`or`**
*   NOT. negación. 	**`not`**

In [50]:
# Operadores de datos lógicos:

a = True
b = False

In [51]:
print(a and b)  #AND lógico.

False


In [52]:
print(a or b)  #OR lógico.

True


In [53]:
print(not a)  #Negación

False


In [54]:
# Operaciones compuestas

print( (a and b) or (not b) )

True


Además de estos operadores, se puede usar el operador **`is`**, que valida la identidad de un objeto. Para entender esto, tenemos que por su parte el operador **`==`** valida la igualdad de contenido de un objeto, mientras que el operador **`is`** valida si dos objetos, además de ser iguales en contenido, contienen la misma referencia en memoria, es decir, valida si son el mismo objeto. Si los valores son primitivas numéricas o lógicas el operador **`is`** retornará **`True`**.

In [55]:
# Operador is

print("Operador is")
a = 1.0
b = 1

print(a is b)  # No tienen el mismo tipo de dato y por lo tanto son objetos distintos.
print(a == b)  # Contienen el mismo valor al verificar su igualdad.

Operador is
False
True


## **5. Colecciones**
---

Las colecciones son tipos de datos que permiten almacenar múltiples valores en una misma variable. Las distintas maneras en que se organizan estos datos para su lectura y escritura se conocen como **estructuras de datos**. *Python* tiene 3 estructuras definidas como primitivas por defecto del lenguaje, que pueden ser definidas con sintaxis especial. Para estructuras más complejas, se suele recurrir a la [librería estándar de Python](https://docs.python.org/3/library/) o librerías especializadas como [NumPy](https://numpy.org/) y [Pandas](https://pandas.pydata.org/) que estudiaremos posteriormente.

### **5.1. Listas**
---
Las listas son el tipo de colección más común. Son estructuras de datos ordenadas con longitud variable. Esto quiere decir, que tras su declaración se pueden agregar o eliminar elementos específicos de su contenido. Además, estos elementos ocupan una posición definida secuencialmente, siendo el primer elemento el que ocupa la posición **`0`**.

Existen dos formas de declarar listas en *Python*:
*   Con llaves cuadradas. &nbsp;&nbsp; **Ejemplo:** `l = []`
*   Con la función **`list`**. &nbsp;&nbsp;&nbsp;&nbsp; **Ejemplo:** `l = list()`

En el momento de su definición, se pueden definir valores por defecto, separados por coma. 


In [56]:
l = [1, 2, 3, 4, 5]
print(l)
type(l)

[1, 2, 3, 4, 5]


list

El tipo de dato de sus elementos no tiene porqué ser el mismo. Por ejemplo:

In [57]:
l = [1, "Hola", 4.5]
print(l)
type(l)

[1, 'Hola', 4.5]


list

Incluso, una lista puede almacenar otras listas anidadas:

In [58]:
l = [1, 2.5, [4, 5, 6, 7], "Fin"]
print(l)
type(l)

[1, 2.5, [4, 5, 6, 7], 'Fin']


list

Se pueden realizar operaciones entre listas mediante algunos operadores. Es importante tener en cuenta los tipos de dato, pues símbolos como estos funcionan de manera distinta en relación al tipo de dato que manejan. Estos operadores básicos son:

*   **Concatenación `+`**: Al aplicar este operador, se agregan los elementos de la segunda lista al final de la primera.
*   **Repetición `*`**: Al aplicar este operador, se repiten los elementos la cantidad de veces expresada en el segundo operando.

In [59]:
l_a = [1, 2, 3]
l_b = ["a", "b", "c"]

In [60]:
# Concatenación
print(l_a + l_b)

[1, 2, 3, 'a', 'b', 'c']


In [61]:
# Repetición
print(l_a * 3)

[1, 2, 3, 1, 2, 3, 1, 2, 3]


 Una vez se declara una lista, su contenido puede variar mediante métodos predeterminados. Estos son algunos de los métodos más comunes para ejecutar en listas:

 *  **`l.append(e)`** : Agrega el elemento **`e`** al final de la lista.
 *  **`l.remove(e)`** : Elimina la primera aparición del elemento **`e`** de la lista.
 *  **`l.insert(i, e)`** : Agrega el elemento **`e`** a la lista en la posición **`i`**.
 *  **`l.pop(i)`** : Elimina y retorna el elemento en la posición **`i`**.
 *  **`l.sort()`** : Ordena los elementos de menor a mayor. Con el argumento **`reverse = True`** se puede indicar el orden contrario.

*  **`l.clear()`**: Vacía la lista.
*  **`l.index(e)`**: Retorna la posición del elemento **`e`**.
*  **`l.copy()`**: Crea y retorna una copia de la lista.


In [62]:
lista = ["c", "a", "b", "x"]

In [63]:
lista.append("d")
print(lista)

['c', 'a', 'b', 'x', 'd']


In [64]:
lista.insert(0 , "e")
print(lista)

['e', 'c', 'a', 'b', 'x', 'd']


In [65]:
lista.sort()
print(lista)

['a', 'b', 'c', 'd', 'e', 'x']


In [66]:
lista.remove("d")
print(lista)

['a', 'b', 'c', 'e', 'x']


In [67]:
# Otra forma de eliminar un elemento de la lista por su índice
del lista[4]

In [68]:
eliminado = lista.pop(1)  # Elimina un elemento por su índice y retorna su valor
print(lista)
print(eliminado)

['a', 'c', 'e']
b


In [69]:
print(lista.index("e"))  # El primer elemento tiene el índice 0

2


In [70]:
copia = lista.copy()
print(copia)

['a', 'c', 'e']


In [71]:
print(lista == copia)  # True - contienen los mismos elementos
print(lista is copia)  # False - son objetos diferentes

True
False


In [72]:
lista.clear()
print(lista)
print(copia)

[]
['a', 'c', 'e']


Para reasignar el valor de un elemento de la lista:

In [73]:
copia[1] = "Nuevo valor"
print(copia)

['a', 'Nuevo valor', 'e']


El operador **`in`** es muy utilizado para saber si un elemento pertenece a una lista:

In [74]:
"x" in copia

False

In [75]:
"e" in copia

True

Además de con métodos, los elementos contenidos en una lista pueden ser accedidos por medio de su índice o posición en la lista. Para esto se usa la sintaxis de llaves cuadradas `[` y `]`. Dentro de las llaves se indica el índice o el rango de elementos que se desea retornar o modificar, siendo el primer elemento el del índice $0$. Las formas de usar estos índices es la siguiente:

*   **`l[i]`**: Se retorna el elemento en la posición **`i`**.
* **`l[-i]`**: Si se indican elementos negativos el conteo de la posición se hace desde el final de la lista.
*   **`l[a:b]`**: Se retornan los elementos desde la posición **`a`** (incluida) hasta la posición **`b`** (excluida).
*   **`l[a:b:n]`**: Se retornan los elementos desde la posición **`a`** (incluida) hasta la posición **`b`** (excluida), dando saltos cada **`n`** elementos.


In [76]:
lista = [1, 2, 3, 4, 5, 6, 7, 8]

In [77]:
print(lista[0])  # El elemento en el índice 0 es el de la primera posición.

1


In [78]:
print(lista[-1])  # El elemento en la posición -1 es el último de la lista.

8


In [79]:
print(lista[0:3])

[1, 2, 3]


In [80]:
print(lista[0:7:2])

[1, 3, 5, 7]


In [81]:
print(lista[:3])  # Si no se agrega el inicio, Python lo interpreta como el inicio de la lista.

[1, 2, 3]


In [82]:
print(lista[3:])  # Si no se agrega el final, Python lo interpreta como el final de la lista.

[4, 5, 6, 7, 8]


In [83]:
print(lista[::-1])  #Se pueden omitir ambos. Si el paso es negativo, se realiza la iteración desde el final.

[8, 7, 6, 5, 4, 3, 2, 1]


Esto mismo aplica cuando tenemos listas anidadas:

In [84]:
anidada = [1, 2, [3, 4], 5]

In [85]:
anidada[2]

[3, 4]

In [86]:
anidada[2][1]

4

In [87]:
anidada = [1, 2, 3, [4, 5, ["objetivo"]], 10]

In [88]:
anidada[3]

[4, 5, ['objetivo']]

In [89]:
anidada[3][2]

['objetivo']

In [90]:
anidada[3][2][0]

'objetivo'

Las cadenas de texto pueden interpretarse como listas de caracteres. Se pueden usar las operaciones con índices de las listas para trocear subcadenas de texto directamente.

In [91]:
s = "Análisis y Visualización de Datos con Python - UNAL"

In [92]:
s[0]

'A'

In [93]:
s[3]

'l'

In [94]:
s[38:44]

'Python'

In [95]:
s[38:]

'Python - UNAL'

In [96]:
s[:25]

'Análisis y Visualización '

In [97]:
s[-4:]

'UNAL'

In [98]:
s[:]

'Análisis y Visualización de Datos con Python - UNAL'

In [99]:
s[::-1]

'LANU - nohtyP noc sotaD ed nóicazilausiV y sisilánA'

In [100]:
s = "Amo la pacífica paloma"
print(s[::-1])

amolap acifícap al omA


In [101]:
s = "Exsxtxex xmxexnxsxaxjxex xexsxtxáx xoxcxuxlxtxox"
s[0::2]

'Este mensaje está oculto'

### **5.2. Tuplas**
---

Las tuplas son casi idénticas a las listas. La única diferencia importante entre ambos tipos de dato es que las tuplas son **inmutables**. Esto quiere decir que una vez que son declaradas, no es posible modificar sus valores. Una variable con una tupla puede recibir valores distintos, pero los elementos particulares de la tupla son inalterables en toda la ejecución del programa.

Las tuplas son declaradas con la sintaxis de paréntesis `(` y `)`, separando los elementos con comas `,`. Al igual que con las listas, los tipos de dato de los elementos de una tupla pueden ser distintos.


In [102]:
tupla = (1, 2, 3)

In [103]:
tupla

(1, 2, 3)

In [104]:
tupla[0]

1

In [105]:
# tupla[0] = "Nuevo valor"  # las tuplas son inmutables, no se puede reasignar. 
# ¡Cuidado! Obtendrá un error si se ejecuta

TypeError: 'tuple' object does not support item assignment

In [106]:
tupla

(1, 2, 3)

Podrían contener varios tipos de dato:

In [107]:
t = (0, [1, 2, 3], "cadena")
print(t)

(0, [1, 2, 3], 'cadena')


Las tuplas son particularmente útiles como valores de retorno de funciones. Gracias a ellas, se pueden definir valores de retorno separados por coma y luego, al llamar la función, desestructurar los valores en variables distintas. La definición de funciones se verá más adelante en el material.

### **5.3. Conjuntos**
---

*Python* permite la definición directa de conjuntos con la sintaxis de llaves curvadas `{`y `}`, con elementos separados por comas `,`. Los conjuntos son colecciones de datos sin orden. Las operaciones definidas en conjuntos corresponden en su mayoría a aquellas del concepto matemático de conjunto. Los elementos no se indexan, sino que se añaden o eliminan directamente. Después, se puede validar si un elemento pertenece o no a un conjunto. Si se desea declarar un conjunto vacío, se tiene que usar la función **`set()`**.


In [108]:
{1, 2, 3}

{1, 2, 3}

In [109]:
{1, 2, 3, 1, 2, 1, 2, 3, 3, 3, 3, 2, 2, 2, 1, 1, 2}

{1, 2, 3}

In [110]:
s = {1, 2, 3}
print(s)

{1, 2, 3}


In [111]:
# Conjunto construido a partir de una lista
set([1, 1, 1, 2, 2, 6, 6, 2, 8, 1, 3])

{1, 2, 3, 6, 8}

In [112]:
# Conjunto vacío.
s = set()
print(s)

set()


Algunas de las operaciones definidas en conjuntos son.

*   **`s.add(e)`** : Añade el elemento **`e`** al conjunto **`s`**. Si ya existe un elemento igual no ocurre nada.
*   **`s.remove(e)`** : Elimina el elemento **`e`** del conjunto **`s`**. Si no existe, arroja un error.
*   **`s.discard(e)`** : Elimina el elemento **`e`** del conjunto **`s`**. Si no existe no ocurre nada.
*   **`s.pop()`** : Elimina y retorna un elemento aleatorio del conjunto **`s`**.
*   **`s.clear()`** : Vacía el conjunto.
*   **`s.copy()`** : Retorna una copia del conjunto **`s`**.


In [113]:
s.add("a")
s.add("b")
s.add("a")
s.add("c")
print(s)

{'a', 'b', 'c'}


In [114]:
s.remove("c")  # Si el elemento no está en el conjunto, arroja un error.
print(s)

{'a', 'b'}


In [115]:
s.discard("c")  # Si el elemento no está en el conjunto, ignora la operación.
print(s)

{'a', 'b'}


In [116]:
print(s.pop())
print(s)

a
{'b'}


Además, se definen algunos métodos específicos para realizar operaciones entre conjuntos. Para dos conjuntos **`a`** y **`b`** se definen:

*  **`a.difference(b)`** : Retorna un conjunto con los elementos que están en **`a`** pero no en **`b`**.
*  **`a.intersection(b)`** : Retorna un conjunto con los elementos que están tanto en **`a`** como en **`b`**.
*  **`a.union(b)`** : Retorna un conjunto con los elementos que están en **`a`** y los que están en **`b`**.
*  **`a.symmetric_difference(b)`** : Retorna un conjunto con los elementos que están en **`a`** o en **`b`**, pero no en ambos.

* **`a.issuperset(b)`** : Evalúa si el conjunto **`a`** contiene todos los elementos del conjunto **`b`**.
*  **`a.issubset(b)`** : Evalúa si todos los elementos del conjunto **`a`** pertenecen al conjunto **`b`**.
*  **`a.isdisjoint(b)`** : Evalúa si los conjuntos **`a`** y **`b`** son disyuntos. Es decir, si ninguno de sus elementos pertenece al otro conjunto.

In [117]:
a = {"a", "b", "c", "d", "e", "f", "g"}
b = {"a" ,"b", "c", "d", "e", "x"}

In [118]:
a.difference(b)

{'f', 'g'}

In [119]:
a.intersection(b)

{'a', 'b', 'c', 'd', 'e'}

In [120]:
a.union(b)

{'a', 'b', 'c', 'd', 'e', 'f', 'g', 'x'}

In [121]:
a.symmetric_difference(b)

{'f', 'g', 'x'}

In [122]:
a.issuperset(b)

False

In [123]:
a.issubset(b)

False

In [124]:
a.isdisjoint(b)

False

### **5.4. Diccionarios**
---
Los diccionarios son una estructura de datos sin orden, como los conjuntos, de **pares clave-valor**. Las claves que se definen son únicas y permiten consultar los valores almacenados en el diccionario directamente usando la clave en vez de una posición. Al igual que con los conjuntos, se declaran con la notación de llaves curvadas `{` y `}` con parejas **`clave : valor`** separadas por coma.

In [125]:
clave = "clave"  #Cualquier objeto inmutable, como cadenas, números o tuplas.
valor = "valor"
diccionario = {
   clave : valor,
   clave + "1" : valor + "1"
   }

print(diccionario)

{'clave': 'valor', 'clave1': 'valor1'}


Para acceder a los elementos de un diccionario se utiliza una sintaxis similar a la utilizada en listas y tuplas con llaves cuadradas `[` y `]`.  Dentro de las llaves se indica la clave asociada, que puede ser cualquier tipo de dato inmutable como valores numéricos, tuplas, o cadenas de texto. Las claves solo pueden estar asociadas a un elemento, por lo que al asignar valores a una clave previamente ocupada se sobreescribe el valor anterior.

In [126]:
d = {}

d["a"] = "a"
d[(0, 1)] = "tupla"

print(d)

{'a': 'a', (0, 1): 'tupla'}


In [127]:
d = {
    100 : "elemento 1",
    "clave2" : 2000
    }

print(d)

{100: 'elemento 1', 'clave2': 2000}


In [128]:
# d[0]
# Saldrá un error. Por eso está comentado. 
# Los diccionarios no se indexan numéricamente, sino por sus claves y en este caso 0 no es una clave válida. 

KeyError: 0

In [129]:
d[100]

'elemento 1'

In [130]:
d["clave2"]

2000

In [131]:
d

{100: 'elemento 1', 'clave2': 2000}

In [132]:
d = {"k1" : [1, 2, 3, 4, 5], "k2": "Hola"}

In [133]:
d["k1"]

[1, 2, 3, 4, 5]

In [134]:
lista = d["k1"]

In [135]:
lista

[1, 2, 3, 4, 5]

In [136]:
lista[3]

4

In [137]:
d["k1"][3]

4

In [138]:
# un diccionario anidado dentro de otro diccionario
d = {"k1" : {"1a" : [1, 2, 3, 10]}}

In [139]:
d["k1"]

{'1a': [1, 2, 3, 10]}

In [140]:
d["k1"]["1a"]

[1, 2, 3, 10]

In [141]:
d["k1"]["1a"][3]

10

In [142]:
d = {"k1" : 10, "k2" : 20, "k3" : 1, "k4" : "hola"}

Los diccionarios también tienen funciones especiales muy utilizadas. Siendo **`d`** un diccionario:

*  **`d.keys()`** : Retorna una lista con las claves.
*  **`d.values()`** : Retorna una lista con los valores.
*  **`d.items()`** : Retorna una lista de tuplas con los pares **`(clave, valor)`**.

>**IMPORTANTE:** El orden en que se almacenan/retornan los elementos no siempre será el mismo.


In [143]:
d.keys()

dict_keys(['k1', 'k2', 'k3', 'k4'])

In [144]:
d.values()

dict_values([10, 20, 1, 'hola'])

In [145]:
d.items()

dict_items([('k1', 10), ('k2', 20), ('k3', 1), ('k4', 'hola')])

En el siguiente [enlace](https://www.w3schools.com/python/python_dictionaries.asp) puede consultar muchas más funciones de utilidad al trabajar con diccionarios. 

## **6. Control de flujo**
---

*Python* es un lenguaje que depende del uso de espacios e indentación para el reconocimiento de bloques de código. Cada línea de texto es una sentencia que es ejecutada de manera secuencial. Hasta el momento, se han presentado valores, operadores y funciones que se ejecutan de esta manera, línea por línea. Existen distintas palabras reservadas que permiten emplear ordenes no secuenciales para la ejecución de las sentencias de código. Estas se conocen como **estructuras de control de flujo**.



### **6.1. Expresiones condicionales `if`, `else` y `elif`**
---

La estructura **`if`** es la estructura condicional, común en muchos lenguajes de programación. Permite definir bloques de código que solo se ejecutan cuando se cumple una condición definida como valor lógico **(Ver sección 4.2).**
Solo con el **`if`**, se decide si un bloque se ejecuta o no. Se usa la siguiente sintaxis: 

In [146]:
"""
if condicion :
   bloque
"""

# Código que evalúa si un dato es un número, y si lo es, si es positivo.

x = input()
if x.isnumeric():
  # <---- El bloque de código debe estar correctamente indentado. 
  # <---- Por lo general se hace con 2 espacios en blanco (o con el tabulador).
  if int(x) > 0:
    # <---- Si se define un if anidado dentro de otro, se debe respetar la indentación.
    # <---- La indentación se acumula.
    print(f"{x} es un número positivo.")

2 es un número positivo.


In [147]:
if (10 > 2):  # Condición verdadera - se ejecutará el bloque identado
  print("Si")

Si


In [149]:
if 100 < 20:  # Condición falsa - no se ejecutará el bloque identado
  print("Primero")
  print("Segundo")
print("Tercero")  # Esta sentencia siempre se ejecutará porque está por fuera del if (no está identada)

Tercero



 Si se desea ejecutar algo en código en caso de que la condición no se cumpla, y solo si no se cumple, se usan las estructuras **`else`** y **`elif`**. **`else`** permite definir bloques de código como alternativa a una evaluación falsa de la condición de un **`if`**. 
 


In [150]:
"""
if condicion :
   bloque 1
else:
   bloque 2
"""

# Código que evalúa si un dato es un número entero, y si lo es, si es par o impar.

x = input()

if x.isdigit():
  if int(x) % 2 == 0:
    print(f"{x} es un número par.")
  else:
    # <--- La indentación del else está al mismo nivel que la del if al que corresponde.   
    print(f"{x} es un número impar.")
else:
  # <--- La indentación del else está al mismo nivel que la del if al que corresponde.   
  print(f"{x} NO es un número entero.")

3 es un número impar.


 
 
 Por su parte, **`elif`** permite definir otra condición que evaluar antes de ejecutar el código, que sólo se evalúa si la primera condición no su cumple.


In [151]:
"""
if condicion1 :
   bloque 1
elif condicion2:
   bloque 2
else:
   bloque 3
"""

# Código para evaluar si un dato es un número entero, y si lo es, evaluar si es divisible por 2, 3, 5 o por ninguno.

x = input()
if x.isdigit():
  if int(x) % 2 == 0:
    print(f"{x}  es divisible por 2.")
  elif int(x) % 3 == 0:
    # <--- La indentación del elif también está al mismo nivel del if original.   
    print(f"{x} es divisible por 3.")
  elif int(x) % 5 == 0:
    # <--- En cada uno de los elif declarados.
    print(f"{x} es divisible por 5.")
  else:
    # <--- El else también está igualmente indentado, y debe ser el último bloque.   
    print(f"{x} NO es divisible por 2, 3 o 5.")
else:
  print(f"{x} NO es un número entero.")

11 NO es divisible por 2, 3 o 5.


Finalmente, existe una versión simplificada para la asignación de valores a variables dependiendo de una condición lógica. Esto se conoce como **operador ternario** y se puede declarar en una sola línea de código.

In [152]:
# Asignación condicional usando if else
condicion = False

if condicion:
  a = "Sí"
else:
  a = "No"
print(a)

#Asignación condicional con operador ternario

a = "Sí" if condicion else "No"
print(a)

No
No


### **6.2. Bucles (ciclos) `while`**
---
Con las expresiones condicionales se puede producir bifurcaciones en el orden en que se ejecutan los bloques de código. Sin embargo, en ocasiones es necesario repetir un bloque un número indeterminado de veces. Para esto se definen los bucles, que permiten repetir bloques de código varias veces.  El primero de estos bucles es el bucle condicional **`while`**. 

El **`while`** funciona como una expresión **`if`**, con la diferencia que el bloque definido dentro de una expresión **`while`** se repite indefinidamente mientras una condición lógica se cumpla. Para evitar bucles infinitos y que el programa no se detenga, es necesario que dentro del **`while`** se altere alguna variable que componga la condición lógica, y que esta pueda conducir a un resultado **`False`** en algún momento de la ejecución.

In [153]:
# Código para llenar una lista con números enteros menores que 5 elevados al cuadrado, empezando en 0.
l = []
i = 0
while i < 5:
  # <---- El bloque de código dentro de un while también debe estar correctamente indentado.
  l.append(i * i)
  print(i * i)
  i = i + 1
# <---- A partir de aquí, el código escrito está por fuera del bucle while.
print(l)

0
1
4
9
16
[0, 1, 4, 9, 16]


In [154]:
# Código para llenar lista del cuadrado de números enteros menores que 5, empezando en 4 y retrocediendo hasta 0.
l = []
i = 4
while i >= 0:
  # <---- El bloque de código dentro de un while también debe estar correctamente indentado.
  l.append(i * i)
  i = i - 1
print(l)

[16, 9, 4, 1, 0]


In [155]:
i = 1
while i < 5:
  print("i es igual a: {}".format(i))
  i = i + 1

i es igual a: 1
i es igual a: 2
i es igual a: 3
i es igual a: 4


Para bucles más complejos, suele ser necesario saltar iteraciones dadas condiciones específicas, o simplemente acabar con el bucle de manera anticipada sin evaluar la condición inicial. Esto se puede lograr con las palabras reservadas **`continue`** y **`break`**. 
* **`continue`** permite saltarse el fragmento de código restante de la iteración y evaluar la siguiente. 
* **`break`** permite acabar el bucle y continuar con el código justo después.

In [156]:
i = 0
while (True):  # Usar con PRECAUCIÓN. Una expresión como esta puede producir un bucle infinito.
  i += 1  # Cambiar el objeto para que la condición evaluada también varíe.
  
  if (i == 2):
    continue  # Lo que resta del bucle no se ejecuta si se añade un continue.
  
  print(i)
  if (i > 5):
    break  # El bucle termina inmediatamente.

print("Fuera del bucle")

1
3
4
5
6
Fuera del bucle


### **6.3. Bucles (ciclos) `for`**
---
Es muy común iterar sobre los elementos de una colección y realizar operaciones sobre cada uno. Para esto se utiliza el bucle de iteración **`for`**, que como su nombre lo indica, permite iterar sobre un objeto **`iterable`**, como colecciones o generadores, y ejecutar un bloque de código para cada uno de ellos. Estos bucles van acompañados por el operador **`in`**, que define la pertenencia de un elemento en una colección. Usar **`for`** permite declarar el elemento al inicio de cada iteración. Se define con la siguiente sintaxis:


In [157]:
"""
for elemento in iterable:
  bloque...
"""
iterable = [1, "a", [10, 20, 30]]  # Las listas son iterables

for i in iterable:
  # <---- El bloque de código dentro del for también debe estar correctamente indentado.
  print(i)
# <---- A partir de aquí, el código escrito está por fuera del bucle for.
print("Fin")

1
a
[10, 20, 30]
Fin


#### **6.3.1. Función `range`**
---

La función generadora **`range`** es muy usada junto a los bucles **`for`**. Con esta, se define un **rango** de valores numéricos en un objeto de tipo **`range`**, que no almacena en memoria todos los elementos, sino que genera el siguiente en cada iteración.

Esta función puede aceptar hasta tres parámetros. Conforme los acepta se interpretan así:

1.  **`range(final)`:** Elementos del 0 al **`final`**, de uno en uno. El número **`final`** no se incluye.
2.  **`range(inicio, final)`:** Elementos del **`inicio`** (incluido) al **`final`** (excluido), de uno en uno.

3.  **`range(inicio, final, paso)`:** Elementos del **`inicio`** (incluido) al **`final`** (excluido), dando pasos de tamaño **`paso`**.

In [158]:
# range estándar

print("range(5)")
l = []
for i in range(5):
  l.append(i)

print(l)

range(5)
[0, 1, 2, 3, 4]


In [159]:
# range con inicio y final

print("\nrange(20, 24)")
l = []
for i in range(20, 24):
  l.append(i)

print(l)


range(20, 24)
[20, 21, 22, 23]


In [160]:
# range con paso

print("\nrange(1, 8, 2)")
l = []
for i in range(1, 8, 2):
  l.append(i)

print(l)


range(1, 8, 2)
[1, 3, 5, 7]


In [161]:
# range con paso negativo

print("\nrange(8, 1, -2)")
l = []
for i in range(8, 1, -2):
  l.append(i)

print(l)


range(8, 1, -2)
[8, 6, 4, 2]


#### **6.3.2. Comprensión de listas**
---

El patrón usado en el ejemplo anterior de llenar elementos de una lista iterando en un bucle **`for`** es muy común. Es por esto que *Python* define una sintaxis especial y simplificada para estos casos. Esto se conoce como **comprensión de listas** y puede realizarse en una misma línea.

Es un tipo de declaración de listas, con un **`for`** interno que define los elementos a iterar y un **`if`** opcional para filtrar los elementos con una condición. 

En el siguiente vídeo se explica paso por paso la equivalencia de los conceptos usados con esta nueva y útil sintaxis.

In [162]:
cubos = [x ** 3 for x in range(10)]
print(cubos)

[0, 1, 8, 27, 64, 125, 216, 343, 512, 729]


In [163]:
# Usando for e if
l = []
for x in range(5):
  if x % 2 == 0:
    l.append(x*x)
print(l)

[0, 4, 16]


In [164]:
# Usando comprensión de listas con condicional
l = [x * x for x in range(5) if x % 2 == 0]
print(l)

[0, 4, 16]


In [165]:
# Usando comprensión de listas con operador ternario en la expresión.
l = [("par" if x % 2 == 0 else "impar") for x in range(5)]
print(l)

['par', 'impar', 'par', 'impar', 'par']


In [166]:
multiplos_tres_y_cinco = [x for x in range(1, 100) if x % 3 == 0 and x % 5 == 0]
print(multiplos_tres_y_cinco)

[15, 30, 45, 60, 75, 90]


#### **6.3.3. Comprensión de conjuntos y diccionarios**
---
Además de la comprensión de listas, se pueden definir conjuntos y diccionarios por medio de comprensión. Este método se define con los operadores de llaves curvadas `{` y `}`. Para los diccionarios, la expresión ubicada al inicio de la definición de la comprensión usa la notación **`clave : valor`**.

In [167]:
#Comprensión de conjuntos
productos = {x * y for x in range(6) for y in range(6)}
print(productos)

{0, 1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 15, 16, 20, 25}


In [168]:
#Comprensión de diccionarios
cuadrados = {str(x) : x * x for x in range(11)}
print(cuadrados)

{'0': 0, '1': 1, '2': 4, '3': 9, '4': 16, '5': 25, '6': 36, '7': 49, '8': 64, '9': 81, '10': 100}


## **7. Funciones**
---

Las funciones, también conocidas como rutinas o procedimientos, son fragmentos de código definidos para ejecutarse cuando son llamados desde otras partes del código. Se pueden definir con parámetros de entrada y valores de retorno, siendo ambos opcionales. 

*  Con los parámetros de entrada se puede pasar el valor contenido en una o varias variables, que sea usado dentro de la función para ejecutar su fragmento.

* Con los valores de salida se puede retornar al código que hace el llamado de la función un valor, en donde puede finalmente ser almacenado en una variable o usado directamente. 

A diferencia de la noción matemática de función, en *Python* las funciones pueden tener efectos secundarios y no retornar siempre el mismo resultado. Estos efectos son aquellos que, como el uso de operaciones de entrada y salida, operaciones con números aleatorios o cambios en el estado global del programa, pueden afectar el resultado devuelto por la función para los mismo parámetros de entrada. 

### **7.1. Definición de Funciones**
---

En *Python*, las funciones se definen con la palabra reservada **`def`** de la siguiente forma:

In [169]:
def mi_funcion(argumento_1, argumento_2):
  """
  Esta es la documentación de la función. Toma dos parámetros y retorna dos salidas.

  Parámetros (argumentos):
  argumento_1: ...
  argumento_2: ...

  Retorna una tupla con dos valores: el primero es un conjunto, el segundo es una lista ...
  """
  
  #El nombre de la función puede ser cualquiera que respete las reglas para definición de variables.
  #Los argumentos de entrada se indican separados por coma entre paréntesis, justo después del nombre de la función

  #El bloque de código de la función está indentado como al usar if, while y for.
  
  salida_1 = {argumento_1, argumento_2} # Conjunto de argumentos de entrada.
  salida_2 = [argumento_1, argumento_2] # Lista de argumentos de entrada.


  # Al separar con comas se retorna una tupla con los valores retornados.
  # Pueden tener cualquier tipo de dato.

  return salida_1, salida_2

In [170]:
# Llamado a la función
mi_funcion(2, 3)

({2, 3}, [2, 3])

In [171]:
help(mi_funcion) # Para ver la documentación de la función (si la tiene)

Help on function mi_funcion in module __main__:

mi_funcion(argumento_1, argumento_2)
    Esta es la documentación de la función. Toma dos parámetros y retorna dos salidas.
    
    Parámetros (argumentos):
    argumento_1: ...
    argumento_2: ...
    
    Retorna una tupla con dos valores: el primero es un conjunto, el segundo es una lista ...



Cuando se retornan varios valores en forma de tupla como resultado de una función, *Python* permite desempaquetar los valores de la tupla en variables distintas directamente.

In [172]:
def suma_y_resta(a, b):
  return a + b, a - b

Para esto, se separan las variables con coma en la asignación a partir de la función.

In [173]:
suma, resta = suma_y_resta(5, 4)

print(suma)
print(resta)

9
1


Los argumentos de la función pueden definirse como parámetros opcionales. Para esto, se define el valor que tendrá la variable por defecto si no es pasada en el llamado de la función. Esta definición se realiza en la definición de los parámetros con el símbolo `=`.

Además de esto, se pueden pasar como argumentos variables específicas con el nombre dado en su definición. Esto añade flexibilidad a la forma de definir y utilizar funciones.

In [174]:
def potencia(base = 2, exponente = 1):
  #La base por defecto es 2.
  #El exponente por defecto es 1.
  return base ** exponente

In [175]:
potencia(4, 3)

64

In [176]:
# Si hay varios argumentos opcionales, se interpretan de manera secuencial de acuerdo a la posición de su definición
# En este caso, el primer argumento es "base", por lo que al aceptar solo 1 argumento "exponente" toma su valor por defecto.
potencia(15)

15

In [177]:
# Ambos argumentos toman su valor por defecto
potencia()

2

In [178]:
# Si se define explícitamente el argumento que se pasa, no es necesario considerar la posición de los argumentos.
potencia(exponente = 8)

256

Una alternativa al trabajar con tuplas es utilizar como última variable de la tupla una variable que tome como valor todos los elementos restantes. Este tipo de variable se especifica con un asterisco, **`*d`**, indicando que el resultado es una lista en vez de un valor: 

In [179]:
(a, b, c, *d) = (1, 2, 3, 4, 5, 6)
print(a, b, c)
print(d)

1 2 3
[4, 5, 6]


Lo anterior es útil cuando tenemos que definir funciones con un número de parámetros variables:

In [180]:
def funcion_parametros_variables(a, b, *c):
  print(a, b)
  for i in c:
    print("-> " + str(i))

funcion_parametros_variables(10, 20, 30)

10 20
-> 30


In [181]:
funcion_parametros_variables(10, 20, 30, 40, 50, 1000)

10 20
-> 30
-> 40
-> 50
-> 1000


In [182]:
funcion_parametros_variables(10, 20)

10 20


In [183]:
def devuelve_varios():
  return 1, 2, 3, 6, 90

a, b, *c = devuelve_varios()
print(a)
print(b)
print(c)


1
2
[3, 6, 90]


### **7.2. Expresiones `lambda`**
---

En *Python* las funciones son un tipo de dato más. Pueden ser asignadas a variables y pasadas como parámetros a otras funciones. Cuando se usa la palabra reservada **`def`** para la definición de variables, se realiza la asignación de una variable con el nombre de la función definida con el objeto **`function`** creado.



In [184]:
def inverso(parámetro):
  return str(parámetro)[::-1]

In [185]:
print(inverso(106))

print(inverso)

601
<function inverso at 0x114c0eef0>


Existe un tipo de declaración de funciones especial, usado para la definición de variables anónimas en usa sola línea. Esto se consigue con el operador **`lambda`**, que define una sintaxis simplificada para la definición de funciones cortas. Para esto, en la misma línea se escriben los argumentos y valores de retorno separados por el símbolo **`:`**. Si son múltiples valores de entrada o salida se pueden separan adicionalmente por coma **`,`**.

In [186]:
sumar_uno = lambda x : x + 1
print(sumar_uno(2))

3


In [187]:
cuadrado = lambda x : x * x
print(cuadrado(2))

4


In [188]:
# No es obligatorio asignar lambdas a una variable. 
# Pueden ejecutarse directamente si se encierran entre paréntesis.

(lambda x: x.upper())("abc")

'ABC'

In [189]:
# Se aceptan varios argumentos de entrada y valores de salida en un mismo lambda
# Los valores de salida se deben encerrar en un paréntesis para que se interpreten como una tupla.

intervalo = lambda base, margen : (base - margen, base + margen)

intervalo(3, 0.5)

(2.5, 3.5)

### **7.3. Función `map`**
---

Existen muchas funciones que vienen por defecto con *Python* y que se pueden ejecutar cuando se desee. Estas también tienen el comportamiento de objetos **`function`** y pueden ser usadas directamente como argumento.

Esta forma de tratar funciones es la base del paradigma de la programación funcional, que es soportado por *Python*. 

Una de las funciones más importantes que nace de este paradigma es la función **`map`**. Esta función permite iterar una colección y producir otra colección obtenida al ejecutar una función sobre cada uno de sus elementos.


In [190]:
# En este ejemplo se busca leer una secuencia de números
# y convertirla de cadena de texto a tipo de dato numérico.
entrada = "100 1 2 3 200 333"
#La función split separa por espacios en blanco la cadena obtenida dejándola en forma de lista.
entrada = entrada.split() 

# Se busca aplicar la función int a cada valor de la entrada y convertir su tipo de dato.
entrada_mapeada = map(int, entrada) 

print(entrada_mapeada)

<map object at 0x114c2f650>


La función **`map`** genera objetos iterables de tipo **`map`**.
Si se quiere almacenar en una lista, se puede usar la función **`list`**.
De lo contrario, es posible iterar sobre el objeto **`map`** en un bucle.

In [191]:
list(entrada_mapeada)

[100, 1, 2, 3, 200, 333]

In [192]:
s = "123456"
for elemento in map(int, s):
  print(f"Valor: {elemento} Tipo: {type(elemento)}")

Valor: 1 Tipo: <class 'int'>
Valor: 2 Tipo: <class 'int'>
Valor: 3 Tipo: <class 'int'>
Valor: 4 Tipo: <class 'int'>
Valor: 5 Tipo: <class 'int'>
Valor: 6 Tipo: <class 'int'>


Ahora con una expresión lambda:

In [193]:
lista = [1, 2, 3, 4, 5]
print(lista)

[1, 2, 3, 4, 5]


In [194]:
list(map(lambda item: item ** 2, lista))

[1, 4, 9, 16, 25]

### **7.4. Función `filter`**
---

Otra función importante de la programación funcional es la función **`filter`**. Esta permite seleccionar elementos de una colección que cumplan con una condición. Esta condición se expresa como una función que retorna un valor lógico a partir de cada elemento de la colección.

In [195]:
lista = list(range(5))
lista = list(filter(lambda x : x % 2 == 0, lista))

print(lista)

[0, 2, 4]


In [196]:
mayúsculas = list(filter(lambda c : c.isupper(), "MmAiYnÚúSsCcUuLlAa"))

print(mayúsculas)

['M', 'A', 'Y', 'Ú', 'S', 'C', 'U', 'L', 'A']


Al trabajar con **`string`** se suele necesitar volver a unir los elementos en una sola cadena de texto. Con la función **`join`** es posible unir elementos de una lista en una cadena de texto, separando los elementos con el contenido de la cadena que llama el método. Si no se desea tener separadores, se puede usar una cadena vacía.

In [197]:
",".join(mayúsculas)

'M,A,Y,Ú,S,C,U,L,A'

In [198]:
"".join(mayúsculas)

'MAYÚSCULA'

## **8. Carga de Archivos en *Python***
---
*Python* permite cargar archivos de dos maneras. La primera permite cargar archivos planos en formatos como *json*, *csv* entre otros. La segunda permite cargar objetos de *Python*, que han sido serializados y almacenados previamente en disco duro.

### **8.1. Formatos de archivo**
---

Dentro de los sistemas de información existen distintos tipos de formatos en los que los datos pueden ser almacenados y transmitidos. Dos de los más comunes hoy en día son los formatos CSV y JSON.

El formato [CSV](https://es.wikipedia.org/wiki/Valores_separados_por_comas) (del inglés comma-separated values) es un tipo de documento en formato abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por comas. A continuación puede ver un ejemplo de este formato:

```
Año,Marca,Modelo,Descripción,Precio
1997,Ford,E350,"ac, abs, moon",3000.00
1999,Chevy,Venture,Extended Edition,4900.00
1999,Chevy,Venture,"Extended Edition, Very Large",5000.00
1996,Jeep,Grand Cherokee,"MUST SELL! air, moon roof, loaded",4799.00
```

El formato [JSON](https://es.wikipedia.org/wiki/JSON) es un formato de texto sencillo para el intercambio de datos basado en la notación de objetos y listas del lenguaje *JavaScript*, muy similar a la notación de diccionarios de *Python*.

 A continuación podemos ver un ejemplo:

```
{
    "json": {
        "clave": "valor",
        [
         "valor1",
         "valor2",
         "valor3",
        ]
    }
}
```

### **8.2. Crear y leer un archivo de texto**
---

Si se trata de un archivo con un formato simple de texto, se puede utilizar la función **`open`** de *Python* para cargar y examinar su contenido.

In [202]:
#Creación del archivo de texto
!echo "Formación MLDS" > ejemplo.txt
!echo "Análisis y visualización de datos con Python" >> ejemplo.txt

In [203]:
#Listar archivos
!ls

01_lenguaje_de_programacion_python.ipynb
02_libreria_numerica_de_python_numpy.ipynb
NBK_Taller_guiado_de_Python_Parte_2.ipynb
NBK_Taller_guiado_de_Python_Parte_3.ipynb
ejemplo.txt


In [204]:
#Cargar/leer archivos de texto
with open("ejemplo.txt") as f:
  data = f.readlines()
data

['Formación MLDS\n', 'Análisis y visualización de datos con Python\n']

El resultado es una lista de las líneas del archivo en forma de lista de *Python*. A continuación cargaremos un archivo de texto que contiene las obras de *Shakespeare*. El archivo será cargado como una lista de cadenas de texto, donde cada elemento corresponde a una línea del archivo de texto.

In [205]:
with open("shakespeare.txt") as f:
  data = f.readlines()

In [206]:
type(data)

list

In [207]:
len(data)

124614

In [208]:
data[:15]

['1609\n',
 '\n',
 'THE SONNETS\n',
 '\n',
 'by William Shakespeare\n',
 '\n',
 '\n',
 '\n',
 '                     1\n',
 '  From fairest creatures we desire increase,\n',
 "  That thereby beauty's rose might never die,\n",
 '  But as the riper should by time decease,\n',
 '  His tender heir might bear his memory:\n',
 '  But thou contracted to thine own bright eyes,\n',
 "  Feed'st thy light's flame with self-substantial fuel,\n"]

### **8.3. Cargando JSON**
---
Existen otras funciones para la carga de archivos especiales. En este ejemplo cargaremos dos *datasets* usando el módulo **`json`** de la librería estándar de *Python*. El primero contiene información básica acerca de algunos restaurantes en *Nueva York* y el segundo contiene información relevante de la serie Juego de Tronos.

In [209]:
import json
from pprint import pprint

with open('restaurantes.json') as data_file:
  data = json.load(data_file)

**`restaurantes.json`** es una lista de diccionarios.

In [210]:
data[:5]

[{'name': 'Cheesecake Factory', 'cuisine': 'American', 'id': 1},
 {'name': 'Shokolaat', 'cuisine': 'American', 'id': 2},
 {'name': 'Gordon Biersch', 'cuisine': 'American', 'id': 3},
 {'name': 'Crepevine', 'cuisine': 'American', 'id': 4},
 {'name': 'Creamery', 'cuisine': 'American', 'id': 5}]

In [211]:
data[4]['name']

'Creamery'

In [212]:
data[4]['cuisine']

'American'

Cargamos el dataset **`game_of_thrones.json`** y examinamos su contenido.

In [213]:
with open('game_of_thrones.json') as data_file:    
    data = json.load(data_file)

El *dataset* consiste en un diccionario, cuyas claves corresponden a diferentes atributos de la serie.

In [214]:
print (data.keys())

dict_keys(['id', 'url', 'name', 'type', 'language', 'genres', 'status', 'runtime', 'premiered', 'officialSite', 'schedule', 'rating', 'weight', 'network', 'webChannel', 'externals', 'image', 'summary', 'updated', '_links', '_embedded'])


También alberga información de cada capítulo hasta el año $2017$ en la variable **`_embedded`**.

In [215]:
print (len(data['_embedded']['episodes']))

67


In [216]:
pprint(data['_embedded']['episodes'][0]['name'])

'Winter is Coming'


### **8.4. Cargando CSV**
---
A continuación, cargaremos un archivo con datos separados por el caracter **`|`**. Corresponden a datos personales de usuarios de una red social de calificación de películas.

Para cargar archivos **`csv`** podemos usar el módulo del mismo nombre de la librería estándar de *Python*. En las próximas utilizaremos este tipo de archivo con una librería especial para el manejo de tablas.

In [217]:
import csv
with open('user-data.csv', 'r') as csvfile:
    user_data = csv.reader(csvfile, delimiter='|')
    data = list(user_data)

Explorando la variable **`data`**, encontramos que cada registro corresponde a un usuario. La información allí mostrada corresponde a un identificador único, edad, género, ocupación y *zip code*. Esta variable es cargada en forma de una lista de listas.

In [218]:
data[:5]

[['1', '24', 'M', 'technician', '85711'],
 ['2', '53', 'F', 'other', '94043'],
 ['3', '23', 'M', 'writer', '32067'],
 ['4', '24', 'M', 'technician', '43537'],
 ['5', '33', 'F', 'other', '15213']]

### **8.5. Cargando Pickle**
---

[***Pickle***](https://wiki.python.org/moin/UsingPickle) nos permite serializar gran parte de los objetos que nos encontraremos trabajando con *Python*. Sin embargo, existen elementos como clases, funciones y métodos que no pueden ser almacenados usando *Pickle*. Cuando se almacene una instancia de una clase, *Pickle* no almacenará la clase del objeto, sino una cadena de caracteres que identifique a qué clase pertenece el objeto. 

A continuación usaremos el conjunto de datos de usuarios de un sitio de revisión de películas y almacenaremos los primeros cinco usuarios usando *Pickle*. Posteriormente los cargaremos usando también *Pickle*.

Ahora cargamos el archivo *pickle* con el módulo del mismo nombre de la siguiente manera:

In [219]:
import pickle
user_data = pickle.load(open("user_data.pkl", "rb"))

In [220]:
user_data

[['939', '26', 'F', 'student', '33319'],
 ['940', '32', 'M', 'administrator', '02215'],
 ['941', '20', 'M', 'student', '97229'],
 ['942', '48', 'F', 'librarian', '78209'],
 ['943', '22', 'M', 'student', '77841']]

## **Recursos adicionales**
---

*  [*Python* 3: documentación oficial.](https://docs.python.org/3/)
*  [How to Think Like a Computer Scientist: Interactive Edition.](https://runestone.academy/runestone/books/published/thinkcspy/index.html)
*  [Profesor Fabio González - Programación de Computadores](https://sites.google.com/a/unal.edu.co/prog-comp-2019-2/)
* [CodeCademy - Learn Python 3](https://www.codecademy.com/learn/learn-python-3)
*  [Kaggle - Python](https://www.codecademy.com/learn/learn-python-3)
*  [MIT (edX) - Introduction to Computer Science and Programming Using Python](https://www.edx.org/es/course/introduction-to-computer-science-and-programming-7)
*  [Python for everyone](https://www.py4e.com/)

## **Créditos**
---

* **Profesor:** [Felipe Restrepo Calle](https://dis.unal.edu.co/~ferestrepoca/)
* **Asistentes docentes:**
  - Alberto Nicolai Romero Martínez
  - Miguel Angel Ortiz Marín

**Universidad Nacional de Colombia** - *Facultad de Ingeniería*