# ÍNDICE
# **ISDI Repsol D4D/D4B**
# [Guía] Introducción a Python para Análisis de Datos - Preparación Individual
---
Este *notebook* ha sido elaborado como material práctico de preparación individual a los asistentes a las sesiones introductorias en Python del Programa Repsol D4D/D4B.

### ÍNDICE DE CONTENIDO
1. IMPORTAR LIBRERÍAS
2. DEFINIR UN OBJETO
3. TIPOS DE OBJETO
4. ESTRUCTURAS DE DATOS
5. OPERADORES
6. (OPCIONAL) BÁSICOS DE PROGRAMACIÓN

### Profesor: Juan Martin Bellido (jmbelldo@isdi.education)

# IMPORTAR LIBRERÍAS
---
Python es un lenguaje de programación *open-source* y *colaborativo*. Por tanto, está abierto a que cualquier persona cree y comparta nuevas funcionalidades. Las funcionalidades están agrupadas en *paquetes* o *librerías* que debemos instalar (una única vez) e importar cada vez que querramos utilizarlas.

Muchas librerías populares suelen estar pre-instaladas en nuestros entornos, por tanto únicamente necesitamos importarlas. Para importar una librería, utilizamos la siguiente sintaxis,

```
import (library) as (tag)
```

In [None]:
import pandas as pd

En caso de necesitar instalar una librería, lo recomendable es que lo hagamos directamente desde el navegador de Anaconda; esto aplica únicamente en caso de estar trabajando desde en un entorno local (ej. ordenador personal). En caso de estar trabajando desde un entorno cloud, probablemente debamos instalar la librería desde el *commmand line* (avanzado).

# DEFINIR UN OBJETO
---
Python es un *lenguaje orientado a objetos*, al igual que la mayoría de lenguajes de programación modernos. Esto significa que podemos definir objetos (o *variables*) que se almacenarán en nuestro entorno de forma temporal y podremos invocar según lo necesitemos. 

*Nota: los objetos que definamos se perderán únicamente al explícitamente eliminarlos o al reiniciar nuestro entorno.*

Para definir un objeto utilizamos la siguiente sintaxis,

```
new_object = X (data to be stored)
```


In [None]:
# A continuación, un ejemplo sencillo de cómo podemos definir un objeto y luego invocarlo
nombre = "Martin" # definimos un objeto y almacenamos texto
print("Hola " + nombre) # utilizamos la función print() y utilizamos el objeto previamente definido

Hola Martin


# TIPOS DE OBJETO
---
Python reconoce varios tipos de objetos (variables),
*  *Numéricos (números)*
*  *Alfanuméricos (texto)*
*  *Lógicos (verdadero/ falso)*


In [None]:
# Los objetos de tipo numéricos pueden ser (i) "int" (enteros) o (ii) "float" (con decimales)
numeric_obj = 2
type(numeric_obj)

int

In [None]:
numeric_obj = 1.2
type(numeric_obj)

float

In [None]:
# Los objetos alfanuméricos son definidos como "str"
string_obj = "Repsol D4D"
type(text_obj)

str

In [None]:
# Por último, Python reconoce también el tipo de variable booleana ("bool")
bool_obj = True
type(bool_obj)

bool

# ESTRUCTURAS DE DATOS BÁSICAS
---
Python contempla distintos formatos de almacenamiento de datos, cada uno de ellos con características y tratamiento propio. 

Las estructuras de datos básicos son cuatro (en orden de prioridad según su uso para análisis de datos),
*   *Lists*
*   *Dictionaries*
*   *Tuples*
*   *Sets*

Existen estructuras adicionales que han sido incorporadas por medio de librerías, es decir, funcionalidades que no son parte del código base de Python. En concreto, en análisis de datos utilizamos DataFrames (tablas de datos) que han sido incorporadas por la libraría *Pandas*. Aprenderamos a trabajar con DataFrames en clase a lo largo del curso.









### Lists
---
Los *lists* son estructuras unidimensionales que permiten almacenar varios tipos de variables (objetos). Cada elemento almacenado en un list se encuentra indexado.

Para definir un vector utilizamos la siguiente sintaxis,

```
my_list = [1,2,3]
```



In [None]:
# Definimos una lista
my_list = [1,"a",3,False,5]
my_list

[1, 'a', 3, False, 5]

In [None]:
# Las listas pueden contener a su vez otras listas como elementos
my_list_v2 = [100,"cien",my_list]
my_list_v2

[100, 'cien', [1, 'a', 3, False, 5]]

In [None]:
# La característica principal de un list es que los elementos almacenados se encuentran indexados
## esto significa que cada elemento en un list contiene un número único que nos permite invocarlo
## nota importante: Python indexa al 0 (el 0 es el primer valor)
my_list_v2[0]

100

In [None]:
# Modificamos un elemento dentro del list
my_list_v2[0] = 101
my_list_v2

[101, 'cien', [1, 'a', 3, False, 5]]

### Dictionaries
---
Los *dictionaries* son estructuras unidimensionales que permiten almacenar objetos bajo una lógica *key-pair*. Los *dictionaries* no admiten valores *key* duplicados y los elementos almacenados no mantienen un orden ni se encuentran indexados; los valores (*pair*) se invocan utilizando el *key*.

Para definir un vector utilizamos la siguiente sintaxis,

```
my_dic = {
  key_1:value_1,
  key_2:value_2,
  key_3:value_3
  }
```


In [None]:
# Definimos un diccionario
my_dic = {
  "escuela": "ISDI",
  "programa": "Repsol D4D",
  "año": 2021,
  "es curso de Python": True,
  "asistentes":["Maria","Juan","Jose"]
}

# Invocamos el diccionario y verificamos que no mantiene el orden establecido al ser definido
my_dic

{'asistentes': ['Maria', 'Juan', 'Jose'],
 'año': 2021,
 'es curso de Python': True,
 'escuela': 'ISDI',
 'programa': 'Repsol D4D'}

In [None]:
# Consultamos el valor para un elemento del diccionario, invocándolo con su valor "key"
my_dic['programa']

'Repsol D4D'

In [None]:
# Reemplazamos el valor para un elemento del diccionario
my_dic['asistentes'] = ["Maria","Juan","Jose","Pepe"]
my_dic

{'asistentes': ['Maria', 'Juan', 'Jose', 'Pepe'],
 'año': 2021,
 'es curso de Python': True,
 'escuela': 'ISDI',
 'programa': 'Repsol D4D'}

### Tuples
---
Los *tuples* son estructuras unidimensionales similares a las *list*, con la diferencia de que son inmutables; esto significa que no pueden ser modificadas tras haberse definido.

```
my_tupple = (1,2,"c")
```


In [None]:
# Definimos un tupple y lo invocamos
my_tupple = (2,1,"c","a")
my_tupple

(2, 1, 'c', 'a')

In [None]:
# Seleccionamos un elemento en nuestra tupple
my_tupple[1]

2

In [None]:
# Intentamos modificar un elemento en el tupple, pero esto nos dará error
## como hemos anticipado, los tupples son inmutables
my_tupple[1] = 3 # esto generará error

TypeError: ignored

### Sets
---
Los *sets* son estructuras unidimensionales similares a las *list* y *tuples*, pero con las siguientes diferencias,
*   no permiten almacenar elementos duplicados;
*   los elementos no están indexados; y
*   no se puede manipular el orden de los elementos.

Para definir un set utilizamos la siguiente sintaxis,

```
my_set = {1,2,"c"}
```

In [None]:
my_set = {1,10,0,5,'b','c','a'} # definimos un set
my_set  # lo invocamos, verificamos que el orden de los elementos es distinto al que hemos establecido

{0, 1, 10, 5, 'a', 'b', 'c'}

In [None]:
# A continuación, verificamos que efectivamente un set no permite la indexación
my_set[2] # esto dará error

TypeError: ignored

# OPERADORES
---
En programación, los operadores son símbolos específicos que permiten hacer comparaciones y realizar manipulaciones.

*   *Operadores aritméticos*: permiten realizar operaciones matemáticas
*   *Operadores de comparación*: contrastan objetos y comparan valores, arrojando un resultado true/false
*   *Operadores lógicos*: se utilizan para realizar pruebas lógicas sobre condiciones, arrojando un resultado true/false




### Operadores aritméticos
---


| Operator 	|   Description  	|
|----------	|:--------------:	|
| +        	| addition       	|
| -        	| subtraction    	|
| *        	| multiplication 	|
| /        	| division       	|
| **  	| exponentiation 	|

In [None]:
# Operadores aritméticos
## definimos dos objetos numéricos
obj_1 = 10
obj_2 = 5

In [None]:
# Test 1
obj_1/obj_2

2.0

In [None]:
# Test 2
obj_1-obj_2

5

### Operadores de comparación
---

| Operator  	|        Description       	|
|-----------	|:------------------------:	|
| <         	| less than                	|
| <=        	| less than or equal to    	|
| >         	| greater than             	|
| >=        	| greater than or equal to 	|
| ==        	| exactly equal to         	|
| !=        	| not equal to             	|


In [None]:
# Operadores aritméticos
## definimos dos objetos numéricos
obj_1 = 10
obj_2 = 5

In [None]:
# Test 1
## comprobar si objeto 1 es mayor a 8
obj_1 > 8

True

In [None]:
# Test 2
## comprobar si objeto 1 es igual a objeto 2
obj_1 == obj_2

False

### Operadores Lógicos
---

| Operator  	|        Description       	|
|-----------	|:------------------------:	|
| x and y    	| se cumplen condiciones X e Y                    	|
| x or y    	| se cumple  condiciones X o Y                   	|
| not x     	| negamos la condición X   	|


In [None]:
# Operadores aritméticos
## definimos dos objetos numéricos
obj_1 = 10
obj_2 = 5

In [None]:
# Test 1
## comprobar si se cumple alguna de las dos condiciones
obj_1 > 8 or obj_2 > 8 # "objeto 1 es mayor a 8 u objeto 2 es mayor a 8"

True

In [None]:
# Test 2
## comprobar si se cumplen ambas condiciones
obj_1 > 8 and obj_2 > 8 # "objeto 1 es mayor a 8 y objeto 2 es mayor a 8"

False

In [None]:
# Test 3
## negando una condición
not obj_1 > 8

False

# (OPCIONAL) BÁSICOS DE PROGRAMACIÓN
---
Existen ciertas funcionalidades básicas presentes en todo lenguaje de programación. Su uso no es estrictamente necesario para el análisis de datos, pero resulta útil para la automatización de procesos,
*   *Expresiones condicionales*
*   *Loops (bucles)*

### Expresiones condicionales
---
Una expresión condicional es una serie de pruebas lógicas con respuestas predefinidas. Se componen siempre de al menos una condición lógica, pero pueden tener tantas como se desee.

Sintaxis básica,
```
if (condición lógica):
  respuesta si se cumple
```

Sintaxis completa,
```
if (condición lógica):
  respuesta si se cumple
elif (condición lógica adicional):
  respuesta si se cumple
else: 
  respuesta si ninguna otra condición se cumple
```

In [None]:
# Creamos una condición IF que nos permite comprobar si un número (depositado en un objeto) es positivo
obj = 10 # definimos un objeto

if obj > 0:                         # condición 1: si el objeto es positivo
  print("El número es positivo")    # la función print() permite desplegar texto

## no hemos establecido respuesta en caso de que la condición no se cumpla

El número es positivo


In [None]:
# Creamos una condición IF que nos permite comprobar si un número (depositado en un objeto) es positivo, negativo o cero
obj = -10 # definimos un objeto

if obj > 0:                         # condición 1: si el objeto es positivo
  print("El número es positivo")    # la función print() permite desplegar texto
elif obj == 0:                      # condición 2: si el objeto es cero
  print("El número es cero")
else:                             # condición 3: si el resto no se cumple
  print("El número es negativo")


El número es negativo


### Loops (bucles)
---

*   *For loop*: el bucle se repetirá tantas veces como la cantidad de elementos en un vector predefinido
*   *Do while*: el bucle se repetirá siempre y cuando se cumpla una condición

En un *for loop*, establecemos una respuesta que se repetirá tantas veces como elementos en un vector (list) determinado. La variable que definamos en el loop adoptará el valor de cada elemento en el vector.

Sintaxis básica,
```
vector = [1,2,3]
for i in vector:
  print(i)
```

In [None]:
my_vector = ["a","b","c","d","e"] # definimos un vector
for x in my_vector: # creamos una variable "letra" (X, en este caso) que tomará el valor de cada elemento en el vector
  print(x)

a
b
c
d
e


En un *while loop*, establecemos una condición y una respuesta que se repetirá siempre y cuando la condición se mantega se mantenga verdadera. 

```
while (condición):
  respuesta
```
Nota: debemos tener cuidado no crear while loops infinitos, en tal caso tendremos que reiniciar el entorno.


In [None]:
my_object = 10 # definimos un objeto
while my_object <= 25:      # la condición es que el valor del objeto se mantenga menor o igual a 25
  print(my_object)            # desplegamos el valor del objeto en cada repetición
  my_object = my_object + 1   # sumamos 1 al valor del objeto


10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
