# **Introducción a Python para Análisis de Datos**
## Capítulo 1: Python Base
---
**Autor:** Juan Martin Bellido  

**Descripción**  
*En este primer notebook exploraremos las operaciones más elementales que debemos aprender de Python. El foco aquí está en aprender lo básico antes comenzar a utilizar este lenguaje de programación para el análisis de datos. Utilizaremos únicamente sintaxis propia de Python base, es decir, disponible en el lenguaje de forma nativa.*  

**¿Feedback? ¿comentarios?** Por favor compártelo conmigo escribiéndome por [LinkedIn](https://www.linkedin.com/in/jmartinbellido/)  

**Material Adicional**
* [Comandos Jupyter Notebook](https://datawizards.es/contenido/codigo-para-analisis-de-datos/guias/comandos-rapidos-jupyter)
* [Sintaxis Markdown](https://datawizards.es/contenido/codigo-para-analisis-de-datos/guias/sintaxis-markdown)


## INDICE
---
1. Introducción a objetos en Python
2. Estructuras de datos
3. Funciones vs. métodos
4. Operadores
5. Básicos de programación
6. Ejercicios




Convenciones utilizadas en este documento
> 👉 *Esto es una nota u observación*

> ⚠️ *Esto es una advertencia*

# 1. Introducción a objetos en Python
---



### Comentar código

Es habitual que los lenguajes de programación contengan opcionar para "comentar código". Esto es, que permitan añadir texto al código a modo de anotaciones sin que este afecte la ejecución del mismo.

> 👉 Hablamos de *comentar código* cuando incorporemos notas en una celda de tipo código. En un entorno de tipo Jupyter Notebook, también tenemos la opción de crear celdas de tipo texto. En entornos de tipo IDEs (la alternativa a Jupyter Notebook), esto no es posibole y comentar código es la única forma de añadir anotaciones.  

Para comentar código en Python, simplemente añadimos un símbolo de # (almohadilla). Cualquier caracter después de # y en la misma línea de código quedará comentado y dejará de tenerse en cuenta en la ejecucución de nuestro código.

> 👉 Observar cómo el texto cambia automáticamente de color al detectase que se trata de una anotación. Esto es un recurso propio del entorno y orientado a mejorar la legibilidad de nuestro código.


In [None]:
# esto es una anotación
1 + 1 # esto también es una anotación, a partir de la # (pero no antes)

2

### Declarar objetos

Python es un *lenguaje orientado a objetos*. Esto significa que podemos guardar información en objetos (*variables*) que se almacenarán en nuestro entorno de forma temporal y podremos invocar según precisemos.

> 👉 Utilizamos los términos *objeto* y *variable* de forma indistinta  

> ⚠️ Los objetos declarados se perderán únicamente al reiniciar nuestro entorno o al explícitamente eliminarlos  

Para declarar un objeto, simplemente asignamos un nombre para nuestra variable (el nombre no debe contener espacios) seguido de un símbolo = (igual) con la información que busquemos almacenar en esta.


In [None]:
# a continuación, un ejemplo sencillo de cómo podemos definir un objeto y luego invocarlo
my_name = "Martin" # definimos un objeto y almacenamos texto

Tras declarar un objeto, podremos invocarlo simplemente ejecutando el nombre de la variable.

In [None]:
my_name  # invocamos objeto

'Martin'

> ⚠️ Los nombres de los objetos no pueden tener espacios, tampoco comenzar con números (ej. 1_nombre)  

### Consultar variables declaradas
Una desventaja de un entorno de tipo Jupyter Notebook (vs. IDEs) es que no contempla una opción que permita visualizar los objetos declarados. Para poder hacerlo, podemos utilizar el comando *%whos* de Jupyter Notebook.

> 👉 Este comando NO es Python, sino una función propia de Jupyter Notebook (nuestro entorno). La característica de este tipo de comandos (denominados "magic commands") es que siempre comienzan con el símbolo % (porcentaje)


In [None]:
# cosultando variables declaradas en nuestro entorno
%whos # esto NO es Python, se trata simplemente de un comando propio de Jupyter Notebook ("magic commands")

No variables match your requested type.


### Eliminar variables declaradas
Utilizamos el comando *del* para eliminar explícitamente variables declaradas. Tras hablerlas eliminado se borrarán de memoria y no podremos invocarlas.


> 👉 Eliminar variables que ya no necesitemos nos permite liberar memoria y es una buena práctica al escribir código  

> ⚠️ Tras eliminar un objeto no podremos invocarlo; si intentamos hacerlo resultará en error

In [None]:
# eliminamos de memoria la variable previamente declarada
del my_name


Podemos eliminar más de un objeto en la misma línea de código utilizando la siguiente sintaxis
```
del obj_1, obj_2, obj_3
```

### Tipos de objeto
Python contempla de forma nativa varios tipos de objetos. Para análisis de datos, nos enfocaremos únicamente en cuatro tipos.

*  *Numéricos enteros (integer)*
*  *Numéricos con decimales (float)*
*  *Texto (string)*
*  *Booleanos o lógicos (boolean)*  

La función *type()* permite consultar el tipo de objeto de una variable.

```
type(obj)
```



In [None]:
# declaramos un objeto de tipo integer
numeric_obj = 2
type(numeric_obj)

int

In [None]:
# declaramos un objeto de tipo float
numeric_obj = 1.2
type(numeric_obj)

float

> ⚠️ Para cualquier input de tipo texto debemos siempre utilizar comillas; estas pueden ser simples o dobles 

In [None]:
# declaramos un objeto de tipo texto
string_obj = "Python" # siempre usamos comillas para inputs de tipo texto, da igual si son simples o dobles
type(string_obj)

str

> ⚠️ Los booleanos pueden ser o bien verdaderos (True) o falsos (False). Al declararlo la primer letra debe ir en mayúsculas

In [None]:
# declarmos un objeto booleano
bool_obj = True
type(bool_obj)

bool

### Consideraciones al definir objetos de tipo string
Podemos combinar comillas simples y dobles para poder incluir comillas dentro de nuestro input de tipo texto.

In [None]:
# al definir objetos de tipo string, debemos siempre utilizar comillas
# las comillas pueden ser dobles ("") o simples ('')
string_obj = "Python"
stirng_obj = 'Python'

In [None]:
# podemos combinar comillas, en caso de necesitarlo
string_obj = "El libro se titula 'Ficciones', de Jorge Luis Borges"
string_obj = 'El libro se titula "Ficciones", de Jorge Luis Borges'

# 2. Estructuras de datos básicas
---
En todos los ejemplos anteriores, hemos declarados variables que contienen un único elemento. Python contempla distintas estructuras que permiten almacenar múltiples elementos bajo un mismo objeto. Podemos entender una estructura de datos simplemente como un contenedor que nos permite almacenar múltiples elementos.

> 👉 Siempre que almacenemos más de un elemento bajo el mismo objeto, estaremos usando una estructura de datos

Python contempla de forma nativa cuatro estructuras de datos, cada uno de ellos con características y tratamiento propio. 

*   *Lists*
*   *Dictionaries*
*   *Tuples*
*   *Sets*

> 👉 Por fuera de estas cuatro estructuras de datos básicas, existen estructuras adicionales que han sido incorporadas por medio de librerías, es decir, funcionalidades que no son parte del código fuente de Python. En concreto, en análisis de datos utilizamos principalmente DataFrames (tablas de datos) que han sido incorporadas por la libraría *Pandas*.









### Lists
Los *lists* son estructuras *indexadas* que permiten almacenar elementos de cualquier tipo. Se trata de la estructura más sencilla y utilizada, dentro de aquellas disponibles en Python base. 

> 👉 Que una estructura sea *indexada* significa que Python no solamente almacena la información que allí depositemos, sino también *la posición específica que ocupa cada elemento dentro de la estructura*  

> ⚠️ Python indexa al cero. Esto significa que el 0 es la primer posición para este lenguaje de programación  

Para declarar un list utilizamos la siguiente sintaxis

```
my_list = [1,2,3]
```



In [None]:
# declaramos un list
my_list = [1,"a",3,False,5]
my_list

[1, 'a', 3, False, 5]

In [None]:
# corroboramos que nuestro objeto almacena un list
type(my_list)

list

In [None]:
# los lists pueden incluso contener otras estructuras como elementos
my_list_v2 = [100,"cien",my_list]
my_list_v2

[100, 'cien', [1, 'a', 3, False, 5]]

In [None]:
# la característica principal de un list es que los elementos almacenados se encuentran indexados
# esto significa que cada elemento en un list contiene un número único que nos permite invocarlo
# nota importante: Python indexa al 0 (el 0 es el primer valor)
my_list_v2[0]

100

In [None]:
# otra ventaja, es que podemos modificar un elemento, simplemente conociendo su posición
# modificamos un elemento dentro del list
my_list_v2[0] = 101
my_list_v2

[101, 'cien', [1, 'a', 3, False, 5]]

### Dictionaries
En ocasiones, nos interesa poder invocar elementos en nuestra estructura a partir de valores que hayamos asignado y no según su posición.

Los *dictionaries* son estructuras que permiten almacenar elementos bajo una lógica *key-pair*. Se trata de estructuras no indexadas, donde los elementos allí depositados son invocados según un valor *key* asignado.


> ⚠️ Los *dictionaries* no admiten valores *key* duplicados y los elementos almacenados no mantienen un orden ni se encuentran indexados; los valores (*pair*) se invocan utilizando el *key*.

Para declarar un dictionary utilizamos la siguiente sintaxis

```
my_dic = {
  key_1:value_1,
  key_2:value_2,
  key_3:value_3
}
```


In [None]:
# declaramos dic
my_dic = {
  "code": "Python",
  "lecturer": 'Juan Martin Bellido',
  "is_practical": True,
  "number_students":3,
  "student_names":["Maria","Juan","Jose"] # utilizamos un list aquí, ya que estamos proporcionando más de un elemento
}

# invocamos dic
my_dic

{'code': 'Python',
 'lecturer': 'Juan Martin Bellido',
 'is_practical': True,
 'number_students': 3,
 'student_names': ['Maria', 'Juan', 'Jose']}

In [None]:
# corroboramos que nuestro objeto almacena un dic
type(my_dic)

dict

In [None]:
# invocamos elemento en dic utilizando su valor "key"
my_dic['lecturer']

'Juan Martin Bellido'

In [None]:
# reemplazamos un elemento almacenado
my_dic['student_names'] = ["Maria","Juan","Jose","Pepe"]
my_dic

{'code': 'Python',
 'lecturer': 'Juan Martin Bellido',
 'is_practical': True,
 'number_students': 3,
 'student_names': ['Maria', 'Juan', 'Jose', 'Pepe']}

In [None]:
# podemos utilizar el método .keys() para obtener los valores key en nuestro dic
# un "método" es similar a una función, ver sección 4 para más detalles
my_dic.keys()

dict_keys(['code', 'lecturer', 'is_practical', 'number_students', 'student_names'])

### Tuples
---
Los *tuples* son estructuras indexadas similares a las *list*, pero con una diferencia fundamental: son *inmutables*. Esto significa que, tras declarar un tuple, no podremos modificar elementos en el depositados.

> ⚠️ La única forma de modificar un tuple, es volver a declararlo

Para declarar un tuple utilizamos la siguiente sintaxis
```
my_tuple = (1,2,"c")
```


In [None]:
# declaramos un tupple y lo invocamos
my_tuple = (2,1,"Python",True)
my_tuple

(2, 1, 'Python', True)

In [None]:
# corroboramos que nuestro objeto almacena un tuple
type(my_tuple)

tuple

In [None]:
# invocamos el elemento que ocupa la tercer posición en nuestro tupple (recordemos que Python indexa al cero)
my_tuple[2]

'Python'

> ⚠️ La celda a continuación dará intencionalmente error como resultado. Esto se debe a que no podemos editar un elemento en un tuple tras ser declarado

In [None]:
# Intentamos modificar un elemento en el tupple, pero esto nos dará error
## como hemos anticipado, los tupples son inmutables
my_tuple[1] = 3 # esto generará error

TypeError: ignored

### Sets
Por último, nos queda la estructura menos utilizada, por tanto la menos importante. Los *sets* son estructuras no indexadas, inmutables (idem tuples) y no ordenadas. La ventaja de un set es que nos asegura almacenar valores únicos (no duplicados). Por otro lado, a diferencia del resto de estructuras, no contempla la opción de invocar elementos individuales dentro de la estructura.

> ⚠️ No podremos invocar elementos individuales dentro de la estructura. Esta estructura no indexa, tampoco contempla valores "key" que nos permitan realizar la tarea

Para definir un set utilizamos la siguiente sintaxis

```
my_set = {1,2,"c"}
```

In [None]:
# declaramos un set y lo invocamos
my_set = {1,10,10,10,0,5,'b','c','a','a'} # introducidmos valores repetidos
my_set # al invocarlo, observamos que mantiene solo valores únicos

{1, 5, 'a', 'c'}

In [None]:
# corroboramos que nuestro objeto almacena un set
type(my_set)

set

> ⚠️ La celda a continuación dará intencionalmente error como resultado. Esto se debe a que no podemos invocar un elemento en un set por su posición

In [None]:
# confirmamos que no son estructuras indexadas
my_set[2] # esto dará error

# 3. Funciones vs. métodos
---
Una característica curiosa de Python es la distinción entre *funciones* y *métodos*. En un sentido amplio, podríamos hablar de ambas como "funciones"; se trata de código que invocamos para realizar una tarea específica. 

Utilicemos como ejemplo la función *type()*, previamente utilizada. Detrás de esta función hay código, al cual a priori no podemos acceder (y francamente no nos interesa hacerlo). Invocamos esta función porque conocemos la tarea específica que realiza. Por otro lado, para poder actuar, la función espera un input, en este caso el nombre de un objeto declarado en nuestro entorno.

Sintaxis genérica de una función (propiamente dicha)

```
function_name(parameter_1, parameter_2, ...)
```


*¿Qué son los métodos?*

Los métodos son funciones que están *asociadas a una clase o tipo de información específica*. Mientas las funciones (propiamente dichas) son amplias y permiten ser utilizadas con cualquier tipo de objeto, los métodos únicamente operan con el tipo de objeto para el cual han sido diseñados.

La sintaxis en un método cambia

```
object.method_name(parameter_1, parameter_2, ...)
```

> ⚠️ En un método, a diferencia de una función, comenzamos siempre con el nombre del objeto

Como ejemplo de un método, hemos presentado en la sección anterior el método *.keys()*. En este caso, hablamos de un método específico para *dictionaries* y que no tendría sentido para otro tipo de estructuras.



### Operaciones avanzadas con lists
Los *lists* son las estructuras de datos de Python base más utilizadas. A continuación, utilizaremos métodos y funciones para introducir algunas operaciones útiles al trabajar con este tipo de estructuras.

El método *.append()* nos permite añadir un elemento a un list de forma dinámica, es decir, sin tener que volver a declarar el objeto. En este caso, el nuevo elemento se añadirá siempre en la última posición.

In [None]:
# declaramos un list
city_list = ['Madrid','Barcelona','Paris','Buenos Aires']

In [None]:
# utilizamos el método .append()
city_list.append('Milan')

In [None]:
# invocamos list
city_list

['Madrid', 'Barcelona', 'Paris', 'Buenos Aires', 'Milan']

El método *.insert()* es similar al anterior, pero este nos permite especificar la posición que queremos que ocupe el nuevo elemento.

In [None]:
# utilizamos el método .insert() para añadir un nuevo objeto en la lista, especificando su posición dentro de la estructura
city_list.insert(0,'Berlin') # lo introducimos en la primer posición (0)

In [None]:
# Invocamos la lista
city_list

['Berlin', 'Madrid', 'Barcelona', 'Paris', 'Buenos Aires', 'Milan']

Podemos utilizar *del* para eliminar elementos en lista según su posición.

In [None]:
# podemos remover objetos en una list, en función de su posición
del city_list[1] # removemos el segundo objeto

In [None]:
# invocamos list para observar cambios
city_list

['Berlin', 'Barcelona', 'Paris', 'Buenos Aires', 'Milan']

En ocasiones, nos resulta más cómodo remover elementos según su valor. El método .remove() nos permite hacer esto en un list.


In [None]:
# eliminamos elemento según valor
city_list.remove('Milan')

In [None]:
# invocamos list para observar cambios
city_list

['Berlin', 'Barcelona', 'Paris', 'Buenos Aires']

¿Cuántos elementos tiene almacenados mi lista? Podemos utilizar la función *len()* para consultar esta información.

In [None]:
# utilizamos la función len() para consultar cantidad de elementos almacenados en un list
len(city_list)

4

# 4. Operadores
---
En programación, los operadores son símbolos específicos que permiten hacer comparaciones y realizar manipulaciones. 

Existen varios tipos, en análisis de datos nos enfocaremos en los siguientes:

*   *Operadores aritméticos*: permiten realizar operaciones matemáticas (ej. suma, división, etc.)
*   *Operadores de comparación*: contrastan objetos y comparan valores, arrojando siempre como resultado  True/False
*   *Operadores lógicos*: se utilizan para combinar pruebas lógicas

### Operadores aritméticos

| Operator 	|   Description  	|
|----------	|:--------------:	|
| +        	| addition       	|
| -        	| subtraction    	|
| *        	| multiplication 	|
| /        	| division       	|
| **  	| exponentiation 	|

<br/>


In [None]:
# declaramos dos objetos numéricos
obj_1 = 10
obj_2 = 5

In [None]:
# utilizamos un operador aritmético para realizar una operación matemática
obj_1/obj_2

2.0

In [None]:
# realizamos otra operación
obj_1-obj_2

5

### Operadores de comparación

| Operator  	|        Description       	|
|-----------	|:------------------------:	|
| <         	| less than                	|
| <=        	| less than or equal to    	|
| >         	| greater than             	|
| >=        	| greater than or equal to 	|
| ==        	| exactly equal to         	|
| !=        	| not equal to             	|

<br/>


In [None]:
# declaramos dos objetos numéricos
obj_1 = 10
obj_2 = 5

In [None]:
# utilizamos operadores de comparación para testear una condición
obj_1 > 8

True

In [None]:
# otro ejemplo
obj_1 == obj_2

False

### Operadores lógicos

| Operator  	|        Description       	|
|-----------	|:------------------------:	|
| x and y    	| se cumplen condiciones X e Y                    	|
| x or y    	| se cumple  condiciones X o Y                   	|
| not x     	| negamos la condición X   	|

<br/>


In [None]:
# declaramos dos objetos numéricos
obj_1 = 10
obj_2 = 5

In [None]:
# comprobamos si se cumple alguna de las dos condiciones
obj_1 > 8 or obj_2 > 8 # "objeto 1 es mayor a 8 u objeto 2 es mayor a 8"

True

In [None]:
# comprobamos si se cumplen ambas condiciones simultáneamente
obj_1 > 8 and obj_2 > 8 # "objeto 1 es mayor a 8 y objeto 2 es mayor a 8"

False

In [None]:
# negamos una condición
not obj_1 > 8

False

### Operador IN

El operador *in* permite comprobar si un valor se encuentra contenido en un list.

In [None]:
# definimos una list
city_list = ['Madrid','Barcelona','Paris','Buenos Aires']

In [None]:
# ¿incluye el valor 'Madrid'? 
'Madrid' in city_list

True

In [None]:
# ¿incluye el valor 'New York'?
'New York' in city_list

False

# 5. Básicos de programación
---

### Expresiones condicionales

Una *expresión condicional* es una serie de pruebas lógicas con respuestas pre definidas en caso de que la condición se cumpla.

> 👉 Para realizar prueba lógicas (testear condiciones) utilizamos siempre operadores de comparación

Sintaxis básica
```
if (cond):
  respuesta si la condición se cumple 
```

Sintaxis ampliada
```
if (cond):
  respuesta si la condición se cumple 
elif (cond):
  respuesta si la condición se cumple 
...
else: 
  respuesta si ninguna de las condiciones anteriores se cumple
```

> ⚠️ En caso de tener múltiples condiciones, estas se irán testeando en orden. La primera condición en cumplirse activará la respuesta

In [None]:
# creamos una condición para comprobar si el objeto contiene un número positivo
obj = 10 # creamos un objeto

if obj > 0:                         # condición 1: testear si el objeto es positivo
  print("number is positive")       # print() despliega un mensaje

# nótese que no hemos especifico una respuesta en caso de que la condición no se cumpla

number is positive


In [None]:
# vamos a expandir la prueba anterior
obj = -10 # creamos un objeto

if obj > 0:                         # condición 1: ¿el número es mayor a 0?
  print("number is positive")       # respuesta a condición 1
elif obj == 0:                      # condición 2: ¿el número es 0?
  print("number is 0")              # respuesta a condición 2
else:                               # condición 3: ninguna de las condiciones anteriores se cumple
  print("number is negative")       # respuesta a condición 3

number is negative


### Iteraciones
Las iteraciones se articulan por medio de bucles (*loops*), estas son secuencias de instrucciones que se ejecutan un número determinado de veces.

*¿Qué determina la cantidad de ejecuciones en un bucle?*

La cantidad de ejecuciones depende del tipo específico de bucle
*   *For loop*: el bucle se repite tantas veces como la cantidad de elementos en una estructura (usualmente lists)
*   *Do while*: el bucle se ejecuta siempre y cuando una condición se mantenga cierta

Estos dos tipos de bucles son opciones típicamente disponibles en cualquier lenguaje de programación. Adicionalmente, Python incorpora una forma simplificada de realizar iteraciones: los *comprehension lists*.

#### For loops

Sintaxis básica
```
my_list = [x,y,z .. n]
for i in my_list:
  print(i)
```

> 👉 El valor de nuestro objeto iterable cambia en cada ciclo

In [None]:
# ejemplo de for loop
my_list = ["a","b","c","d","e"] # creamos un list
for x in my_list: # esto se puede leer: por cada elemento x en "my_list", realizar la siguiente tarea
  print(x)

# este for loop tiene 5 iteraciones, ya que hay 5 elementos en nuestra lista
# x adquiere el valor de cada elemento en nuestra lista

a
b
c
d
e


If we want to iterate for a given large number of times (e.g. 100 times); we can use the range() function to avoid manually creating a data structure with a large number of objects stored (e.g. 100 objects).

En ocasiones, podemos querer iterar un número específico de veces (por ejemplo 100 veces). La función range() nos evita el trabajo de crear manualmente un list con x elementos (ej. 100).

```
range(start,end)
```


In [None]:
# iteramos 10 veces
for value in range(1,11):
  print(value)

1
2
3
4
5
6
7
8
9
10


#### While loops
En un *while loop*, el bucle continúa mientras una condición se cumpla.

```
while (cond):
  proceso
```

> 👉 El número de iteraciones no está pre establecido, dado que no depende de la cantidad de elmentos en una estructura

> ⚠️ Debemos tener cuidado de evitar bucles infinitos. En tal caso, nos veremos obligados a reiniciar el entorno



In [None]:
my_object = 10                # creamos un objeto
while my_object <= 25:        # estabecemos una condición
  print(my_object)            
  my_object = my_object + 1   # sumamos 1 en cada iteración 


10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25


#### Comprehension lists
Python contempla esta opción como alternativa para realizar iteraciones simples en una única línea de código.

```
[expression(element) for element in list]
```

In [None]:
# vamos a construir un bucle que multiplica cada elemento en un list por dos
[x*2 for x in range(1,11)]

[2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

# 6. Ejercicios
---

> 👉 Puedes encontrar las soluciones a los ejercicios [aquí](https://nbviewer.org/github/jmartinbellido/Python-Curso-Introductorio/blob/main/Capitulo%201%20Ejercicios.ipynb)

### Ejercicio #1
Debajo hay un list que contiene nombres de comida. Crear un *for loop* donde se despliegue "I love ... (cada elemento en el list)"

Resultado esperado:  
I love pizza  
I love sushi  
I love paella  
I love tapas  

> 👉 Puedes concatenar texto facilmente uniendo inputs de tipo texto con un operador +




In [None]:
# ejemplo de concatenar texto
my_name = 'Martin'
print('Mi nombre es ' + my_name)

Mi nombre es Martin


In [None]:
# utiliza el siguiente list para realizar el ejercicio
food_list = ['pizza','sushi','paella','tapas']

### Ejercicio #2
A continuación, presentamos otro list que contiene comida. Repetir el ejercicio anterior, esta vez evitar desplegar los elementos "onions" y "garlic" (sin editar el list). 

In [None]:
food_list = ['pizza','sushi','onion','paella','garlic','tapas']