# Taller Introducción a Python - Cardif

## Contenido
1. [Introducción](#intro)
2. [Datos](#datos)
    1. [Variables](#variables)
    2. [Transformación de variables](#tvariables)
    3. [Operaciones entre variables](#ovariables)
    4. [Tipos de Datos](#tdatos)
        1. [Listas](#listas)
        2. [Tuples](#tuples)
        3. [Diccionarios](#diccionarios)
3. [Programación Funcional](#funcional)
    1. [Funciones](#funciones)
    2. [Funiones Anónimas (Lambda)](#lambda)
4. [Estructuras de Control](#econtrol)
    1. [Condicionales](#condicionales)
    2. [Ciclos Determinados](#ciclos1)
    3. [Ciclos Indeterinados](#ciclos2)
    4. [List Comprehension](#lists)
5. [Programación Orientada a Objetos](#clases)
6. [Librerías](#librerias)
7. [Numpy](#numpy)
8. [Pandas](#pandas)

![python.png](attachment:python.png)

## 1. Introducción <a name="intro"></a>

Python es un lenguaje de programación ampliamente utilizado en las aplicaciones web, el desarrollo de software, la ciencia de datos y el machine learning (ML). Los desarrolladores utilizan Python porque es eficiente y fácil de aprender, además de que se puede ejecutar en muchas plataformas diferentes. El software Python se puede descargar gratis, se integra bien a todos los tipos de sistemas y aumenta la velocidad del desarrollo.

Los beneficios de Python incluyen los siguientes:

- Los desarrolladores pueden leer y comprender fácilmente los programas de Python debido a su sintaxis básica similar a la del inglés. 
- Python permite que los desarrolladores sean más productivos, ya que pueden escribir un programa de Python con menos líneas de código en comparación con muchos otros lenguajes.
- Python cuenta con una gran biblioteca estándar que contiene códigos reutilizables para casi cualquier tarea. De esta manera, los desarrolladores no tienen que escribir el código desde cero.
- Los desarrolladores pueden utilizar Python fácilmente con otros lenguajes de programación conocidos, como Java, C y C++.
- La comunidad activa de Python incluye millones de desarrolladores alrededor del mundo que prestan su apoyo. Si se presenta un problema, puede obtener soporte rápido de la comunidad.
- Hay muchos recursos útiles disponibles en Internet si desea aprender Python. Por ejemplo, puede encontrar con facilidad videos, tutoriales, documentación y guías para desarrolladores.
- Python se puede trasladar a través de diferentes sistemas operativos de computadora, como Windows, macOS, Linux y Unix.

¿Cuáles son las características de Python?

Las características siguientes del lenguaje de programación Python lo hacen único:

- **Un lenguaje interpretado**: Python es un lenguaje interpretado, lo que significa que ejecuta directamente el código línea por línea. Si existen errores en el código del programa, su ejecución se detiene. Así, los programadores pueden encontrar errores en el código con rapidez.
- **Un lenguaje fácil de utilizar**: Python utiliza palabras similares a las del inglés. A diferencia de otros lenguajes de programación, Python no utiliza llaves. En su lugar, utiliza sangría. 
- **Un lenguaje tipeado dinámicamente**: Los programadores no tienen que anunciar tipos de variables cuando escriben código porque Python los determina en el tiempo de ejecución. Debido a esto, es posible escribir programas de Python con mayor rapidez.
- **Un lenguaje de alto nivel**: Python es más cercano a los idiomas humanos que otros lenguajes de programación. Por lo tanto, los programadores no deben preocuparse sobre sus funcionalidades subyacentes, como la arquitectura y la administración de la memoria.
- **Un lenguaje orientado a los objetos**: Python considera todo como un objeto, pero también admite otros tipos de programación, como la programación estructurada y la funcional.

## 2. Datos <a name="datos"></a>

### 2.1. Variables <a name="variables"></a>

In [3]:
x = 3
type(x)

int

In [4]:
x = 2.5
type(x)

float

In [5]:
x = 'Hola Mundo'
type(x)

str

In [6]:
x = True
type(x)

bool

### 2.2. Transformación de Variables <a name="tvariables"></a>

Si queremos transformar un tipo de dato a otro, hacemos:

In [7]:
x = 2.5
type(x)

float

In [8]:
x = int(x)
type(x)

int

In [9]:
x

2

In [10]:
x = str(x)
type(x)

str

In [11]:
int(x)

2

### 2.3. Operaciones entre variables <a name="ovariables"></a>

In [12]:
x = 2
y = 3
x + y #Suma

5

In [13]:
x * y #Multiplicacion

6

In [14]:
x / y #Division

0.6666666666666666

In [15]:
x ** y #Potencia

8

In [16]:
x % y #Residuo de una división 

2

In [17]:
x // y #Modulo de una división

0

También existen operados lógicos como:

In [18]:
1 == 1 #Probar si dos elementos son iguales

True

In [19]:
2 > 1 #Probar si un elemento es mayor al otro

True

In [20]:
2 < 1 #Probar si un elemento es menor al otro

False

In [21]:
2 != 4 #Probar si un elemento es diferente de otro

True

In [22]:
1 == 1 and 2 > 1 #Utilizamos and (o &) para probar si las dos condiciones son ciertas al tiempo

True

In [23]:
1 == 1 or 2 < 1 #Utilizamos or (o |) para probar si alguna de las dos condiciones se cumple

True

#### 2.3.1. Strings

Los strings tambien se pueden operar. Si se suman, lo que hace es concatenar las dos cadenas de texto y si se multiplica, lo que hace es repetir el texto

In [24]:
x = 'Hola '
y = 'Mundo'
x + y

'Hola Mundo'

In [25]:
'Hola' + y

'HolaMundo'

In [26]:
x * 5

'Hola Hola Hola Hola Hola '

Los strings son los tipos de datos mas "complejos" de Python, tienen varios metodos dedicados a ellos. 

In [27]:
test_string = ' Mi nombre es X '

El método `replace` nos permite reemplazar una cadena de texto por otra. Por ejemplo, reemplazemos X por nuestro nombre

In [28]:
test_string.replace('X', 'Nicolás')

' Mi nombre es Nicolás '

El método `strip` nos permite eliminar espacios blancos que puedan haber al inicio o final del string

In [29]:
test_string.strip()

'Mi nombre es X'

El método `split` nos permite separar el string espeificando el separador

In [30]:
test_string.split()

['Mi', 'nombre', 'es', 'X']

In [31]:
test_string = ' Mi,nombre,es,X '
test_string.split(',')

[' Mi', 'nombre', 'es', 'X ']

Tambien podemos normalizar nuestro string, pasandolo todo a mayúscula con el método `upper`, todo a minúscula con el método `lower` o poner únicamente la primera letra en mayúscula con el método `title`

In [32]:
test_string = ' Mi nombre es X '
test_string.upper()

' MI NOMBRE ES X '

In [33]:
test_string.lower()

' mi nombre es x '

In [34]:
test_string.title()

' Mi Nombre Es X '

En muchas ocasiones vamos a querer generar cadenas de texto que puedan ser parametrizables, que sea sencillo de cambiar dependiendo del resultado de una operación o una función sin tener que cambiar el código manualmente. Vimos como concatenar cadenas de texto, pero existen alternativas mas eficientes y mas elegantes, en código

In [35]:
nombre = 'Nicolas'
print('Mi nombre es', nombre)

Mi nombre es Nicolas


También podemos formatear strings mediante el operador `%`. Esto es lo que se conoce como el modo viejo de trabajar con strings en Python

In [36]:
print('Mi nombre es %s' %nombre)

Mi nombre es Nicolas


Como pueden ver despues del '%' va la letra s, esto le dice a python, primero done reemplazar la variable dentro del string y segundo, que aquello que vamos a reemplazar es un string. 

Si quisieramos reemplazar un numero podríamos '%' seguido de f

In [37]:
edad = 27
print('Tengo %.0f años' %edad)

Tengo 27 años


Si en un solo string se quisieran reemplazar mas de una cosa, tambien puede hacerse

In [38]:
print('Mi nombre es %s y tengo %s años' % (nombre, edad))

Mi nombre es Nicolas y tengo 27 años


Con esta manera de formatear también se le pueden asginar variables a lo que se quiere reemplazar

In [39]:
print('Mi nombre es %(name)s y tengo %(age)s años' % {'name': nombre, 'age': edad})

Mi nombre es Nicolas y tengo 27 años


Así como hay un método viejo, también hay un metodo nuevo para trabajar con strings y este es mediante el comando `format`

In [40]:
print('Mi nombre es {}'.format(nombre))

Mi nombre es Nicolas


Con `format` en lugar de utilizar el porcentaje como indicativo del lugar donde reemplazar el valor deseado utilizamos con los corchetes `{}`. Este método tiene la ventaja de que siempre es igual, sin importar si queremos reemplazar números, strings o cualquier tipo de datos.

In [41]:
print('Tengo {} años'.format(edad))

Tengo 27 años


Si en un solo string se quisieran reemplazar mas de una cosa, tambien puede hacerse

In [42]:
print('Mi nombre es {} y tengo {} años'.format(nombre, edad))

Mi nombre es Nicolas y tengo 27 años


Con esta manera de formatear también se le pueden asginar variables a lo que se quiere reemplazar

In [43]:
print('Mi nombre es {name} y tengo {age} años'.format(name = nombre, age = edad))

Mi nombre es Nicolas y tengo 27 años


El método `format` puede llegar a causar un código un poco feo de leer cuando se tienen muchos parámetros, por esto Python 3.6 introdujo algo llamado *Literal String Interpolation* que permite no solo formatear strings, sino tambien ejecutar código dentro del texto. Esto lo logra mediante lo que se conocen `f-strings`.


In [44]:
print(f'Mi nombre es {nombre}')
print(f'Tengo {edad} años, el próximo año tendré {edad + 1} años')

Mi nombre es Nicolas
Tengo 27 años, el próximo año tendré 28 años


Tal y como su nombre lo indica, los `f-strings` son strings predecidos por una `f`, sin esta `f` el código no se ejecuara correctamente

In [45]:
print('Mi nombre es {nombre}')

Mi nombre es {nombre}


### 2.4. Tipos de Datos <a name="tdatos"></a>

#### 2.4.1. Listas <a name="listas"></a>

Las listas son objetos de python usados para guardas distintos valores en una sola variable. Se crean utilizando corchetes cuadrados `[]`. Las listas son objetos ordenados, mutables, admiten duplicados y pueden guardar valores de distinto tipo.

In [46]:
mi_lista = [1, 2, 3, 'Hola']

Para acceder a un valor dentro de una lista, le pasamos la posicion. Muy importante tener en cuenta que en python las posiciones comienzan en 0

In [47]:
mi_lista[0], mi_lista[1], mi_lista[2]

(1, 2, 3)

Para agregar datos a una lista ya creada usamos `append`

In [48]:
mi_lista.append(4)
mi_lista

[1, 2, 3, 'Hola', 4]

Para eliminar datos de una lista usamos `pop` y la posicion del elemento que queremos eliminar. Tambien podemos usar `remove` y el valor que queremos eliminar

In [49]:
mi_lista.pop(0) #En pop pasamos la posicion del elemento a eliminar
mi_lista

[2, 3, 'Hola', 4]

In [50]:
mi_lista.remove(2) #en remove pasamos el valor del elemento a eliminar
mi_lista

[3, 'Hola', 4]

Si quiero seleccionar varios valores de una lista debo pasar los indices correspondientes, por ejemplo: Si quiero los dos primeros elementos:

In [51]:
mi_lista = [1, 2, 3, 'Hola']
mi_lista[0:2]

[1, 2]

El primer valor denota la posicion de inicio y el segundo la posicion de fin. El primer indice es inclusivo y el segundo es exclusivo

In [52]:
mi_lista[:3]

[1, 2, 3]

In [53]:
mi_lista[1:]

[2, 3, 'Hola']

Tambien podemos usar indices negativos para extraer elementos de atras hacia adelante

In [54]:
mi_lista[-1]

'Hola'

In [55]:
mi_lista[-3:-1]

[2, 3]

#### 2.4.2. Tuples <a name="tuples"></a>

Al igual que las listas, los tuples se utilizan para guardar varios elementos dentro de una unica variable. Se crean utilizando parentesis `()`. Son objetos ordenados e inmutables

In [56]:
mi_tuple = (1, 2, 3, 'Hola')
mi_tuple

(1, 2, 3, 'Hola')

Los tuples no pueden cambiarse una vez son creados, el hecho de que sean inmutables implica que no se pueden agregar o eliminar elementos

In [57]:
mi_tuple.append(4) 

AttributeError: 'tuple' object has no attribute 'append'

Para poder acceder a los elementos individuales de un tuple, hacemos el mismo procedimiento que para las listas: pasamos la posicion del elemento que queremos entre corchetes cuadrados

In [58]:
mi_tuple[0]

1

#### 2.4.3 Diccionarios <a name="diccionarios"></a>

Los diccionarios son utilizados para guardar valores en "pares". Cada valor tendra su llave correspondiente. Los diccionarios son colecciones ordenadas, mutables y no aceptan duplicados en las llaves. Se construyen con corchetes `{}`

In [59]:
mi_dicc = {'Nombre': ['Nicolas', 'Henry', 'Liza', 'Tatiana'], 'Edad': [26, 26, 24, 25], 'Area': 'Analytics', 'Cargos': ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']}
mi_dicc

{'Nombre': ['Nicolas', 'Henry', 'Liza', 'Tatiana'],
 'Edad': [26, 26, 24, 25],
 'Area': 'Analytics',
 'Cargos': ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']}

Podemos listar las llaves del diccionario y sus valores

In [60]:
mi_dicc.keys()

dict_keys(['Nombre', 'Edad', 'Area', 'Cargos'])

In [61]:
mi_dicc.values()

dict_values([['Nicolas', 'Henry', 'Liza', 'Tatiana'], [26, 26, 24, 25], 'Analytics', ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']])

In [62]:
mi_dicc.items()

dict_items([('Nombre', ['Nicolas', 'Henry', 'Liza', 'Tatiana']), ('Edad', [26, 26, 24, 25]), ('Area', 'Analytics'), ('Cargos', ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4'])])

Si queremos acceder a un elemento particular, le pasamos al diccionario la llave

In [63]:
mi_dicc['Nombre']

['Nicolas', 'Henry', 'Liza', 'Tatiana']

In [64]:
mi_dicc['Edad']

[26, 26, 24, 25]

In [65]:
len(mi_dicc) #Numero de llaves de un diccionario, tambien funciona para listas

4

## 3. Programación Funcional <a name="funcional"></a>

### 3.1. Funciones <a name="funciones"></a>

Una funcion es un bloque de código que solo se ejecuta o corre cuando es llamado. En general empiezan con `def` y terminan con `return`

In [66]:
def HolaMundo():
    res = 'Hola Mundo'
    return print(res)

In [67]:
HolaMundo()

Hola Mundo


Podemos pasarle argumentos a la función colocandolos dentro del parentesis. Se pueden poner tantos argumentos como se quiera, solo se deben separar por coma.

In [68]:
def suma(x, y):
    res = x + y
    return res

In [69]:
suma(2, 3)

5

También se puede definir parámetros no obligatorios, que tengan valores por defecto

In [70]:
def suma(x, y, z = 5):
    res = x + y + z
    return res

In [71]:
suma(2, 3)

10

Siempre y cuando no se especifique el tercer argumento, Python lo tomará como su valor base (en este caso 5). Si se quiere usar otro valor diferente, basta con especificarlo al llamar la función

In [72]:
suma(2, 3, 1)

6

### 3.2. Funciones Anónimas (Lambda) <a name="lambda"></a>

Basicamente, una función lambda es una función, como las que vimos anteriormente, excepto que no tiene nombre (por eso son anonimas) y está contenida en una única linea de código.

Una función lambda evalua una expresión dada una seria de argumento (tal y como una función normal). 

Una función lambda evalúa una expresión para una serie de argumentos dados (tal y como una función normal). Se le da a la función un valor (argumento) y luego se le proporciona la operación a realizar (expresión). El comando lambda debe ir en primer lugar y los dos puntos (:) separan el argumento y la expresión. 
```python
lambda argumento: expresion
```

In [73]:
lambda x: x + 12

<function __main__.<lambda>(x)>

In [74]:
(lambda x: x + 12)(1)

13

Las funciones Lambda son buenas para operaciones lógicas simples y faciles de entener. También, son de gran tuilidad cuando se requiere una función que solo se ejecutara una vez. Son particularmente útiles al ser conbinadas con metodos como `map` o `filter`

`map()` es una función que viene por defecto en python y su sintaxis es
```python
map(funcion, iterable) 
```
Esto devuelve el iterable modificado, donde cada valor del iterable original fue cambiado basado en la función que se aplico.

Por ejemplo, definamos una lista y sumemosle 12 a cada valor.

In [75]:
mi_lista = [1, 2, 3]
list(map(lambda x: x + 12, mi_lista))

[13, 14, 15]

Por otr lado, `filter()` es también una función base de Python y tiene la sintaxis:
```python
filter(funcion, iterable) 
```

Esto devuelve el iterable filtrado de acuerdo a la función porporcionada. 

Por ejemplo, saquemos únicamente los números pares de la lista anterior.

In [76]:
list(filter(lambda x: x%2 == 0, mi_lista))

[2]

## 4. Estructuras de Control <a name="econtrol"></a>

### 4.1. Condicionales (If, Elif, Else) <a name="condicionales"></a>

In [77]:
x = 1
if x == 1:
    print('El numero es 1')

El numero es 1


In [78]:
x = 0
if x == 1:
    print('El numero es 1')
else:
    print('El numero no es 1')

El numero no es 1


In [79]:
x = 1
if x == 1:
    print('El numero es 1')
elif x == 2:
    print('El numero es 2')
elif x == 3:
    print('El numero es 3')

El numero es 1


### 4.2. Ciclos Determinados <a name="ciclos1"></a>

In [80]:
for i in range(4):
    print(i)

0
1
2
3


In [81]:
mi_lista = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(mi_lista)
mi_lista = list(range(11))
print(mi_lista)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [82]:
for pos in range(len(mi_lista)):
    print('El número es: '+ str(mi_lista[pos]))

El número es: 0
El número es: 1
El número es: 2
El número es: 3
El número es: 4
El número es: 5
El número es: 6
El número es: 7
El número es: 8
El número es: 9
El número es: 10


In [83]:
for elem in mi_lista:
    print('El número es: '+ str(elem))

El número es: 0
El número es: 1
El número es: 2
El número es: 3
El número es: 4
El número es: 5
El número es: 6
El número es: 7
El número es: 8
El número es: 9
El número es: 10


In [84]:
for elem in mi_lista:
    if elem % 2 == 0:
        print(elem)

0
2
4
6
8
10


In [85]:
for key, value in mi_dicc.items():
    print(key, ':', value)

Nombre : ['Nicolas', 'Henry', 'Liza', 'Tatiana']
Edad : [26, 26, 24, 25]
Area : Analytics
Cargos : ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']


### 4.3. Ciclos Indeterminados <a name="ciclos2"></a>

Con los ciclos indeterminados podemos correr una serie de instrucciones mientras una condicion se cumpla

In [86]:
x = 0
while x < 5:
    x = x + 1 #x +=1
    print(x)

1
2
3
4
5


Podemos interrumpir los ciclos con el comando `break`, independientemente de si no ha terminado o la condicion sigue cumpliendose

In [87]:
x = 0
while x < 5:
    x = x + 1 #x +=1
    if x == 3:
        break
    print(x)

1
2


Con el comando `continue` podemos saltarnos o parar una iteracion del ciclo

In [88]:
x = 0
while x < 5:
    x = x + 1 #x +=1
    if x == 3:
        continue
    print(x)

1
2
4
5


### Bonus: List Comprehension <a name="lists"></a>

Imaginen queremos crear una lista con los valores del diccionario que creamos anteriormente. Podemos iterar sobre los valores e ir agregando los valores a una lista

In [89]:
mi_lista = []
for value in mi_dicc.values():
    mi_lista.append(value)
mi_lista

[['Nicolas', 'Henry', 'Liza', 'Tatiana'],
 [26, 26, 24, 25],
 'Analytics',
 ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']]

Pero hay una manera mas compacta de hacerlo en python y es con las denominadas lists comprehensions. Estas son basicamente ciclos con una sintaxis un poco mas corta que nos ayudan a crear listas.

In [90]:
mi_lista = [value for value in mi_dicc.values()]
mi_lista

[['Nicolas', 'Henry', 'Liza', 'Tatiana'],
 [26, 26, 24, 25],
 'Analytics',
 ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']]

## 5. Programación orientada a objetos <a name="clases"></a>

Python es un lenguaje de programación orientado a objetos. Practiamente todo en Python es un objeto, con sus propiedades y métodos. Una clase es un objeto "constructor", mas o menos un plano para crear objetos.

Creemos una clase muy básica con un propiedad llamada valor que sea igual a 10

In [91]:
class Mi_Clase():
    valor = 10
    nombre = 'Hola'

In [92]:
Mi_Clase.valor

10

Este ejemplo es algo muy simple, que rara vez sera util en la vida real. 

Para crear clases de verdad debemos familiarizarnos con el metodo `__init__()`. Todas las clases de Python tienen un método `__init__()` que se ejecuta cada vez que son creadas. `__init__()` se utiliza para asignar valores y propiedades que son necesarias para que la clase se ejecute correctamente y deben garantizarse una vez son creadas.

In [93]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age

In [94]:
Persona = Person('Nicolas', 27)

In [95]:
print(Persona.name)
print(Persona.age)

Nicolas
27


Como ven el primer parametro del método o función `__init__` es `self`. Este parámetro hace referencia al estado actual de la clase y se usa para acceder a variables que pertenecen a la clase. No tiene  que llamarse self (esto es simplemente una convención) pueden llamarlo de la manera que quieran, pero debe ser **siempre** el primer parámetro de cualquier función en la clase.

In [96]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
    def introduce(self):
        print(f'Hola, mi nombre es {self.name} y tengo {self.age} años')
        
    def age_in_x(self, n_years):
        new_age = self.age + n_years
        print(f'En {n_years} años tendré {new_age}')

In [97]:
Persona = Person('Nicolas', 27)
Persona.introduce()
Persona.age_in_x(10)

Hola, mi nombre es Nicolas y tengo 27 años
En 10 años tendré 37


Puedo definir varias instancias de una misma clase, con atributos y propiedades diferentes, simplemente basta con asignarlas a variables distintas.

In [98]:
Persona_1 = Person('Nicolas', 27)
Persona_2 = Person('Liza', 26)

In [99]:
Persona_1.introduce()

Hola, mi nombre es Nicolas y tengo 27 años


In [100]:
Persona_2.introduce()

Hola, mi nombre es Liza y tengo 26 años


## 6. Librerías <a name="librerias"></a>

Para poder usar librerías en python debemos importarlas para esto usamos el comando `import` seguido del nombre de la librería que queremos. 
```python 
import libreria 
```
Es muy importante que la librería que queremos debe estar instalada, de lo contrario el comando nos devolvera un error.

Si queremos instalar una librería podemos hacerlo directamente desde jupyter usando la sintaxis: 

```python 
!pip install libreria
```

Desde el computador de cardif debemos especificar el proxy para poder instalar paquetes:


```python 
!pip install libreria --proxy="https://UID:PWD@ncproxy1.co.xcd.net.intra:8080" libreria
```
Donde UID es su uid y PWD es la contraseña del equipo


**No olviden el `!`**

Despues de instalarla ya podemos importarla sin problema

## 7. Numpy (Numerical Python) <a name="numpy"></a>

In [101]:
import numpy as np

In [102]:
array = np.array([1,2,3,4])
array.shape

(4,)

In [103]:
array

array([1, 2, 3, 4])

In [104]:
matrix = np.array([[1,2,3,4], [5,6,7,8]])
matrix

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

`shape` nos devuelve las dimensiones del arreglo

In [105]:
matrix.shape

(2, 4)

`np.arange(n)` nos devuelve un arreglo secuencial con n posiciones

In [106]:
array = np.arange(10)
array

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

`reshape()` nos permite cambiar las dimensiones del arreglo. Mucho cuidado porque si las dimensiones que queremos son incompatibles, nos devolvera un error.

In [107]:
array.reshape(2,5)

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [108]:
array.reshape(5,2)

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

Podemos combinar arrays de manera horizontal o vertical, para crear matrices o arreglos mas grandes con los comandos `hstack` y `vstack`, respectivamente

In [109]:
array_1 = np.array([1, 2, 3])
array_2 = np.array([4, 5, 6])

np.vstack([array_1, array_2])

array([[1, 2, 3],
       [4, 5, 6]])

In [110]:
np.hstack([array_1, array_2])

array([1, 2, 3, 4, 5, 6])

Se pueden usar los arrays para hacer operacion elemento a elemento de manera similar a como se hacen en python normal

In [111]:
array_1 + array_2

array([5, 7, 9])

In [112]:
array_1 * array_2

array([ 4, 10, 18])

Tambien podemos usar numpy para una multitud de operaciones matematicas

In [113]:
np.mean(array_1)

2.0

In [114]:
np.sum(array_1)

6

In [115]:
np.max(array_1)

3

In [116]:
np.argmax(array_1)

2

Puedo hacer las mismas operaciones por fila o columna en arreglos multidimensionales. Para esto es necesario pasar un argumento "index" a la función

![Ejes.PNG](attachment:Ejes.PNG)

In [117]:
array_3 = np.vstack([array_1, array_2])
array_3

array([[1, 2, 3],
       [4, 5, 6]])

In [118]:
np.mean(array_3, axis = 1)

array([2., 5.])

In [119]:
np.mean(array_3, axis = 0)

array([2.5, 3.5, 4.5])

De la misma manera que con las listas puedo extraer elementos especificos de los arreglos. En corchetes cuadrados especifico la posicion del valor que quiero

In [120]:
array = np.arange(20)**2
array

array([  0,   1,   4,   9,  16,  25,  36,  49,  64,  81, 100, 121, 144,
       169, 196, 225, 256, 289, 324, 361])

In [121]:
array[2]

4

Podemos definir rangos de valores con dos puntos `:`

In [122]:
array[2:5]

array([ 4,  9, 16])

In [123]:
array[2:]

array([  4,   9,  16,  25,  36,  49,  64,  81, 100, 121, 144, 169, 196,
       225, 256, 289, 324, 361])

Números negativos para contar desde atrás

In [124]:
array[-2]

324

Se puede utilizar doble dos puntos para indicar tamaño de "paso"

In [125]:
array[0:20:2]

array([  0,   4,  16,  36,  64, 100, 144, 196, 256, 324])

Puedo tambien filtrar el arreglo

In [126]:
array[array > 10]

array([ 16,  25,  36,  49,  64,  81, 100, 121, 144, 169, 196, 225, 256,
       289, 324, 361])

Para arreglos multidimensionales pasamos las n posiciones que ubican el valor que me interesa

In [127]:
array_3

array([[1, 2, 3],
       [4, 5, 6]])

In [128]:
array_3[1,2]

6

In [129]:
array_4 = array.reshape(5,4)

In [130]:
array_4

array([[  0,   1,   4,   9],
       [ 16,  25,  36,  49],
       [ 64,  81, 100, 121],
       [144, 169, 196, 225],
       [256, 289, 324, 361]])

In [131]:
array_4[-1, ::2]

array([256, 324])

Para conocer mas acerca de las funcionalidades de numpy podemos visitar la <a href="https://numpy.org/">documentación </a>

Numpy es una de las librerías mas eficiente de Python, debido a que esta construida sobre código C, que tiende a ser mucho mas rapido que Python. Siempre que sea posible deben intentar usar las funcionalidades de numpy para trabajar con grandes volumenes de datos. Intenten no usar ciclos sino funciones vectorizadas de numpy!

Veamos un ejemplo muy simple. Imaginen tenemos un arreglo de 1000 x 3 números y queremos encontrar la raiz cuadrada del mismo.

In [132]:
array =  np.random.random((1000, 3))

En numpy es muy sencillo, usamos el comando `np.sqrt()`

In [133]:
%timeit np.sqrt(array)

1.42 µs ± 9.69 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


Si quisieramos hacer lo mismo en Python puro, deberíamos recorrer todo el arreglo y a cada posición sacarle la raíz.

In [134]:
def raiz(array):
    filas = array.shape[0]
    cols = array.shape[1]
    new_array = np.zeros((filas, cols))
    for i in range(filas):
        for j in range(cols):
            new_array[i, j] = array[i, j] ** (1/2)
    return new_array

In [135]:
%timeit raiz(array)

1.07 ms ± 5.09 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


En numpy, la operación duró 3.99 µs, mientras que en Python puro duró 1.9 ms. La implementación de Numpy es casi 1000 veces mas rápida que la de Python.

Una de las razones por las que Python base es considerablemente mas lento que los lenguajes de progrmación es por el tipo de compilación que utiliza. Numba es un compilador JIT que busca transformar código de Python y numpy a lenguaje de máquina optimizado, mejorando en gran medida su tiempo de ejecución. 

En python podemos usar numba, simplemente importando la librería.

In [136]:
from numba import jit

Para transformar nuestro codigo con numba, basta con agregar el decorador `@jit` antes de la función correspondiente. Hagamos la prueba con nuestra función de raiz, definida enteriormente.

In [137]:
@jit(nopython = True)
def raiz_numba(array):
    filas = array.shape[0]
    cols = array.shape[1]
    new_array = np.zeros((filas, cols))
    for i in range(filas):
        for j in range(cols):
            new_array[i, j] = array[i, j] ** (1/2)
    return new_array

In [138]:
%timeit raiz_numba(array)

The slowest run took 4.85 times longer than the fastest. This could mean that an intermediate result is being cached.
5.87 µs ± 4.96 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)


Únicamente cambiando la manera en que se compila nuestro código desde numba logramos hacer nuestro código casi 1000 veces mas rapido. Cabe resaltar que aún usando numba, no se supera la velocidad de procesamiento de la vectorización de numpy.

## 7. Pandas <a name="pandas"></a>

In [139]:
import pandas as pd

### 7.1. Series <a name="series"></a>

Si queremos obtener mas información o ayuda de un comando particular podemos usar el signo de interrogación `?` antes del comando

In [140]:
?pd.Series

In [141]:
mi_lista

[['Nicolas', 'Henry', 'Liza', 'Tatiana'],
 [26, 26, 24, 25],
 'Analytics',
 ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']]

Para crear una serie lo hacemos con el comando `pd.Series`

In [142]:
pd.Series(mi_lista)

0         [Nicolas, Henry, Liza, Tatiana]
1                        [26, 26, 24, 25]
2                               Analytics
3    [Cargo 1, Cargo 2, Cargo 3, Cargo 4]
dtype: object

In [143]:
mi_dicc

{'Nombre': ['Nicolas', 'Henry', 'Liza', 'Tatiana'],
 'Edad': [26, 26, 24, 25],
 'Area': 'Analytics',
 'Cargos': ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']}

In [144]:
mi_serie = pd.Series(mi_dicc)

In [145]:
mi_serie

Nombre         [Nicolas, Henry, Liza, Tatiana]
Edad                          [26, 26, 24, 25]
Area                                 Analytics
Cargos    [Cargo 1, Cargo 2, Cargo 3, Cargo 4]
dtype: object

In [146]:
mi_serie.loc['Nombre']

['Nicolas', 'Henry', 'Liza', 'Tatiana']

In [147]:
mi_serie.iloc[0]

['Nicolas', 'Henry', 'Liza', 'Tatiana']

### 7.2. DataFrames <a name="df"></a>

In [148]:
?pd.DataFrame

Puedo crear dataframes desde listas

In [149]:
mi_lista

[['Nicolas', 'Henry', 'Liza', 'Tatiana'],
 [26, 26, 24, 25],
 'Analytics',
 ['Cargo 1', 'Cargo 2', 'Cargo 3', 'Cargo 4']]

Para crear un dataframe lo hacemos con el comando `pd.DataFrame`

In [145]:
pd.DataFrame(pd.Series(mi_lista), columns = ['col_1'])

Unnamed: 0,col_1
0,"[Nicolas, Henry, Liza, Tatiana]"
1,"[26, 26, 24, 25]"
2,Analytics
3,"[Cargo 1, Cargo 2, Cargo 3, Cargo 4]"


Desde diccionarios

In [146]:
pd.DataFrame(mi_dicc)

Unnamed: 0,Nombre,Edad,Area,Cargos
0,Nicolas,26,Analytics,Cargo 1
1,Henry,26,Analytics,Cargo 2
2,Liza,24,Analytics,Cargo 3
3,Tatiana,25,Analytics,Cargo 4


In [147]:
pd.DataFrame(mi_dicc).transpose()

Unnamed: 0,0,1,2,3
Nombre,Nicolas,Henry,Liza,Tatiana
Edad,26,26,24,25
Area,Analytics,Analytics,Analytics,Analytics
Cargos,Cargo 1,Cargo 2,Cargo 3,Cargo 4


O la manera mas común de hacerlo es importando datos externos desde un excel o un csv con los comandos `pd.read_excel` o `pd.read_csv`

In [148]:
df = pd.read_csv('Datos_Taller.csv', sep = ';')

Con el comando `head` podemos ver las primeras etradas del dataframe y con `tail` las últimas

In [149]:
df.head()

Unnamed: 0,Marca,Carretera,MPG
0,1,1,1397
1,2,1,1537
2,3,1,1263
3,4,1,1402
4,5,1,1473


In [150]:
df.tail()

Unnamed: 0,Marca,Carretera,MPG
85,2,3,1946
86,3,3,1664
87,4,3,1929
88,5,3,2266
89,6,3,1871


`shape` nos permite ver las dimensiones del dataframe

In [151]:
df.shape

(90, 3)

`columns` nos devuelve una lista con el nombre de las columnas de nuestro dataframe

In [152]:
df.columns

Index(['Marca', 'Carretera', 'MPG'], dtype='object')

Los valores nulos o vacíos se cargan a pandas como:
```python 
None 
```

Si quisieramos saber cuantos valores vacíos tenemos en cada columna podemos hacerlo con `isna()` y `sum()`

In [153]:
df.isna().sum()

Marca        0
Carretera    0
MPG          0
dtype: int64

Para conocer los tipos de variable que es cada columna podemos usar el comando `dtypes`

In [154]:
df.dtypes

Marca         int64
Carretera     int64
MPG          object
dtype: object

Como podemos ver la variable MPG la esta guardando como un `string` apesar de ser un número, esto se debe a que el número tiene la coma como separador de decimal en lugar del punto. Para volerla un número podemos hacerlo de dos maneras:

1. La manera mas sencilla es especificarle a pandas que nuestro archivo .csv original utiliza la coma como separador decimal con el argumento `decimal` del comando `pd.read_csv`

```python 
df = pd.read_csv('Datos_Taller.csv', sep = ';', decimal = ',')
```

2. La segunda manera consiste en aprovechar que actualmente la columna es un string y reemplazar el texto. Es decir, vamos a reemplazar las comas por puntos y luego lo transformaremos a número. Esto lo haremos con los comandos `str`(que le dice a pandas que queremos tratar esta serie como string y `replace` que utilizamos para reemplazar una cadena de texto por otra

In [155]:
df['MPG'] = df['MPG'].str.replace(',', '.')
df['MPG'] = df['MPG'].astype(float)

In [156]:
df.dtypes

Marca          int64
Carretera      int64
MPG          float64
dtype: object

`describe` nos devuelve estadísticas descriptivas básicas

In [157]:
df.describe()

Unnamed: 0,Marca,Carretera,MPG
count,90.0,90.0,90.0
mean,3.5,2.0,16.746111
std,1.717393,0.821071,3.44283
min,1.0,1.0,10.12
25%,2.0,1.0,14.395
50%,3.5,2.0,16.51
75%,5.0,3.0,18.9275
max,6.0,3.0,26.03


Podemos crear nuevas columnas de manera muy facil

In [158]:
df['New_Col'] = df['Marca'] * df['Carretera']

Para eliminar una columna usamos el comando `drop()`. Usamos `axis = 1` para decirle a pandas que es una columna e `inplace = True` para decirle que queremos sobreescribir el df original

In [159]:
df.drop('New_Col', axis = 1, inplace = True) 

Los dataframes podemos filtrarlos de acuerdo a valores específicos de una o más de sus columnas

In [160]:
df[df['Carretera'] == 2]

Unnamed: 0,Marca,Carretera,MPG
30,1,2,11.14
31,2,2,10.12
32,3,2,12.41
33,4,2,12.42
34,5,2,11.89
35,6,2,18.78
36,1,2,15.7
37,2,2,14.57
38,3,2,16.32
39,4,2,16.66


De este dataframe resultante, si quiero extraer este elemento como debo llamarlo mediante `iloc` y `loc`?

|Marca | Carretera | MPG |
| :----: | :----:| :-----: |
|   3|       2       | 12.41 |

In [161]:
df[df['Carretera'] == 2].loc[32]

Marca         3.00
Carretera     2.00
MPG          12.41
Name: 32, dtype: float64

In [162]:
df[df['Carretera'] == 2].iloc[2]

Marca         3.00
Carretera     2.00
MPG          12.41
Name: 32, dtype: float64

Con pandas también podemos hacer manejos de datos un poco mas avanzados como agrupaciones mediante el comando `groupby()`

In [163]:
df.groupby('Carretera')['MPG'].mean()

Carretera
1    16.951000
2    14.921667
3    18.365667
Name: MPG, dtype: float64

Para conocer mas acerca de las funcionalidades de pandas podemos visitar la <a href="https://pandas.pydata.org/docs/index.html">documentación </a>