# Secciones
- [Tipaje dinámico](#dynamically_typed)
- [Control de Flujo](#control_flow)
- [Indentaciones](#whitespace_Formatting)
- [Ciclos](#cycles)
- [Colecciones](#colections)
- [Listas](#lists)
- [Slicing](#slicing)
- [Tuples](#tuples)
- [Diccionarios](#dictionaries)
- [Sets](#sets)
- [Funciones](#functions)
- [Módulos](#modules)
- [NumPy](#numPy)

<a id='dynamically_typed'></a>
# Tipaje dinámico

Python es un lenguaje con tipaje dinámico, en el que no es requisito declarar el tipo de la variable. El tipaje de la variable es revisado en tiempo de ejecución por el intérprete de Python.

In [1]:
age = 23
name = 'Jacob'
money = 100.50
employed = False
compNum = 2+3j

print("Age type", type(age))
print("Name type", type(name))
print("Money type", type(money))
print("Employed type", type(employed))
print("CompNum type", type(compNum))

Age type <class 'int'>
Name type <class 'str'>
Money type <class 'float'>
Employed type <class 'bool'>
CompNum type <class 'complex'>


Python es un lenguaje fuertemente tipado, en el que las variables están asociados a un tipo y hacer operaciones que no coinciden con el tipo ocasiona errores, por ejemplo:

In [2]:
try:
    print(age + name)
except TypeError:
    print("Error: Python is strongly typed")

Error: Python is strongly typed


In [3]:
try:
    print(str(age) + name)
except TypeError:
    print("Python is strongly typed")

23Jacob


<a id='control_flow'></a>
# Control de flujo
El flujo de ejecución en Python puede ser modificado utilizando la cláusala __if__, la cual puede ser acompañada de __elif__ y __else__ . Por ejemplo:

In [4]:
x = int(input("Input a number "))
if x < 0:
    print("x is negative")
elif x % 2:
    print("x is positive and odd")
else:
    print("x is even and non-negative")

Input a number 42
x is even and non-negative


<a id='whitespace_Formatting'></a>
# Indentaciones
Múltiples _statements_ que se ejecutan de forma continúa se les conoce como bloques.

Python utiliza la indentación para delimitar bloques de código.

El uso de indentaciones otorga un estilo legible a Python, no obstante hay que ser cuidadosos en cómo delimitamos los bloques, ya que una incorrecta indentación ocasionará el siguiente error.

In [5]:
match_result = 'victory'
if(match_result == 'victory'):
    print("GG WP")
    print(":)")
elif (match_result == 'draw'):
    print("Rematch?")
else:    
print("Unlucky")
print(":(")

IndentationError: expected an indented block (<ipython-input-5-c4b697a93ec3>, line 8)

Para arreglarlo es sólo cuestión de indentar apropiadamente el último bloque:

In [6]:
match_result = 'victory'
if(match_result == 'victory'):
    print("GG WP")
    print(":)")
elif (match_result == 'draw'):
    print("Rematch?")
else:    
    print("Unlucky")
    print(":(")

GG WP
:)


<a id='cycles'></a>
# Ciclos

El ciclo __for__ en Python es utilizado para repetir un bloque de código, el número de repeticiones está en función de una expresión iterable.

*target* es una variable que controla el ciclo, la cual toma el valor de un elemento del *iterable* hasta que termina de iterarlo, en cada iteración se ejecuta el cuerpo del for, por ejemplo:

In [7]:
for letter in "Cloud9":
    print("give me a", letter, "...")

give me a C ...
give me a l ...
give me a o ...
give me a u ...
give me a d ...
give me a 9 ...


Al igual que los __if__ *statments* los bloques de código en los ciclos son delimitados por las indentaciones:

In [8]:
for i in ['A','B']:  
    print(i)                    #first line in "for i" block  
    for j in [1,2]:  
        print(j)                #first line in "for j" block  
        print(j+1)              #last line in "for j" block  
    print(i)                    #last line in "for i" block  
print("END")  

A
1
2
2
3
A
B
1
2
2
3
B
END


Iterar sobre una secuencia de números es común en Python, por ello existen funciones inherentes en el lenguaje, como __range__

__range(x)__ regresa una lista de números consecutivos del 0 (incluido) al _x_ (excluido)

__range(x,y)__ regresa una lista de números consecutivos de la _x_ (incluido) al _y_ (excluido)

__range(x,y,step)__ regresa una lista de números de la _x_ (incluido) al _y_ (excluido), en donde cada elemento adyacente en la lista está seperado por una cantidad _step_

In [9]:
for i in range(5,10,2):
    print(i)

5
7
9


<a id='colections'></a>
# Colecciones
Python cuenta con 4 colecciones inherentes, las cuales sirven para agrupar datos:

- _List_ es una colección ordenada y modificable, permite elementos duplicados.
- _Tuple_ es una colección ordenada y no modificable, permite elementos duplicados.
- _Dictionary_ es una colección no ordenada, modificable, indexada y no permite elementos duplicados.
- _Set_ es una colección ordenada no indexada y no permite elementos duplciados.

<a id='lists'></a>
# Listas

- _List_ es una colección ordenada y modificable, permite elementos duplicados.

Para declarar una lista se utilizan los [] y se engloban los elementos deseados, por ejemplo:

In [10]:
char_list = ['A','B','C','D','E','F']
heterogenous_list = ["string", 3, True]
list_of_lists = [char_list, heterogenous_list, []]
colors = ['red','green','blue','yellow','white','black']

print(heterogenous_list)

['string', 3, True]


Cada elemento de la lista se puede referenciar mediante su índice, por ejemplo:

In [11]:
print("First element: ", colors[0])

First element:  red


Los elementos de las listas se pueden accesar por su respectivo índice:

![Image of index](https://railsware.com/blog/wp-content/uploads/2018/10/positive-indexes.png)

En muchas instancias, vamos a requerir accesar al último o penúltimo elemento de la lista, para acceder a ello se utilizan índices negativos, por ejemplo para referenciar al elemento ´black´ utilizaríamos el índice -1

![Image of negative_index](https://railsware.com/blog/wp-content/uploads/2018/10/negative-indexes.png)

El contenido de las listas se puede modificar utilizando el operador de asignación __=__

In [12]:
colors[-2] = 'pink'
colors

['red', 'green', 'blue', 'yellow', 'pink', 'black']

Para revisar si un elemento existe en una lista, se puede usar el operador __in__, por ejemplo:

In [13]:
print("Is red on colors?", 'red' in colors)
print("Is gold in colors?", 'gold' in colors)

Is red on colors? True
Is gold in colors? False


Para agregar elementos a una lista, se puede hacer de las siguientes formas:

In [14]:
x = [1,2,3]
x.append(4)
x

[1, 2, 3, 4]

In [15]:
x += [5,6,7]
x

[1, 2, 3, 4, 5, 6, 7]

In [16]:
x.extend([8,9,10])
x

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

<a id='slicing'></a>
# Slicing a list

Una funcionalidad muy relevante de las listas es el _slicing_ , la cual nos permite referenciar a sublistas dentro de la lista. Una sublista es generada mediante el uso de corchetes [] como sufijo en el nombre de la lista. 

Hay 3 argumentos que pueden ser utilizados dentro de los corchetes para definir la sublista, \[start,stop,step\] 

La variable start indica el índice del primer elemento de la sublista. Stop indica el último índice de la sublista, el elemento de dicho índice no es parte de la sublista generada. Step indica el incremento o decremento del índice entre cada elemento que se toma.

Por ejemplo, a partir de una lista de número podemos referenciar una sublista de la siguiente forma

In [17]:
nums = [10, 20, 30, 40, 50, 60, 70, 80, 90]
some_nums = nums[2:7]  
print(some_nums)

[30, 40, 50, 60, 70]


![Image of slicing](https://railsware.com/blog/wp-content/uploads/2018/10/first-slice.png)

Las operaciones de slicing se pueden resumir en los siguientes puntos:

- id[start:stop] # items from index start through index stop-1
- id[start:] # items from index start through the rest of the array
- id[:stop] # items from the beginning through index stop-1
- id[:] # copy of the whole array
- id[start:stop:step] # items from index start through index stop-1, each index is incremented or decremented by the amount step

In [18]:
char_list = ['A','B','C','D','E','F']

In [19]:
print("First 3 elements", char_list[:3])
print("After third to end", char_list[3:])
print("Middle slice", char_list[1:3])
print("Taking all but the last 2", char_list[:-2])
print("Take every 2nd element of a list", char_list[::2])
print("Negative steps to reverse the list", char_list[::-1])

First 3 elements ['A', 'B', 'C']
After third to end ['D', 'E', 'F']
Middle slice ['B', 'C']
Taking all but the last 2 ['A', 'B', 'C', 'D']
Take every 2nd element of a list ['A', 'C', 'E']
Negative steps to reverse the list ['F', 'E', 'D', 'C', 'B', 'A']


Slicing es una herramienta fundamental para la ciencia de datos, revisen el siguiente tutorial dinámico para afianzar su conocimiento de listas
https://www.oreilly.com/learning/how-do-i-use-the-slice-notation-in-python

<a id='tuples'></a>
# Tuples

_Tuple_ es una colección ordenada y no modificable, permite elementos duplicados.

Para la creación de los tuples, es sólo necesario hacer una enumeración de elementos separados por comas, por convención es recomendado poner dicha enumeración entre paréntesis.

In [20]:
my_tuple = (1,2,3)
other_tuple = 3,4

try:
    my_tuple[1] = 7
except TypeError:
    print("Cannot modify a tuple!!!")

Cannot modify a tuple!!!


El operador __in__ también funciona en tuples para verificar si un elemento pertenece a los tuples.

In [21]:
my_tuple = ('a','p','p','l','e')
print('a' in my_tuple)
print('b' in my_tuple)

True
False


# Slicing a tuple

El _slicing_ también puede ser aplicado a los tuple y sigue la misma convenciones que en las listas.

In [22]:
my_tuple = ('p','r','o','g','r','a','m')
my_tuple[1:4]

('r', 'o', 'g')

In [23]:
my_tuple[:-1]

('p', 'r', 'o', 'g', 'r', 'a')

<a id='dictionaries'></a>
# Diccionarios

_Dictionary_ es una colección no ordenada, modificable, indexada y no permite elementos duplicados.

Los diccionarios hacen un mapea de objetos con llaves, por lo que un elemento del diccionario es un par de llave-objeto. 

Para generar un diccionario, se enumeran elementos (par llave:objeto) separados por comas, dicha enumeracion va entre brackets {}

In [24]:
grades = {'Jose':92, 'Maria':95, 'Claudia':87 }      # Dictionary with three items and string keys
d1 = { 1:2, 3:4 }                    # Dictionary with two items and integer keys

Para referenciar un valor del diccionario, sólo se requiere utilizar la llave asociada a él:

In [25]:
grades['Jose']

92

Si una llave aparece más de una vez en el diccionario, sólo permanecerá el último elemento con esa llave

In [26]:
grades = {'Jose':92, 'Maria':95, 'Claudia':87, 'Jose': 99 }
grades['Jose']

99

Para agregar un nuevo elemento al diccionario se utiliza el operador de asignación __=__ , se debe indicar cuál será la llave de dicho elemento, por ejemplo:

In [27]:
grades['Carlos'] = 100
grades

{'Jose': 99, 'Maria': 95, 'Claudia': 87, 'Carlos': 100}

El operador __in__ también funciona en los diccionarios para verificar si una __llave__ está presente en el diccionario.

In [28]:
print("Is Jose in grades?", 'Jose' in grades)
print("Is Veronica in grades?", 'Veronica' in grades)

Is Jose in grades? True
Is Veronica in grades? False


Los atributos del diccionario pueden ser accesados de la siguiente forma:

In [29]:
print("Number of students", len(grades))
print("Keys ", grades.keys())
print("Values ", grades.values())
print("Items ", grades.items())

Number of students 4
Keys  dict_keys(['Jose', 'Maria', 'Claudia', 'Carlos'])
Values  dict_values([99, 95, 87, 100])
Items  dict_items([('Jose', 99), ('Maria', 95), ('Claudia', 87), ('Carlos', 100)])


Para eliminar un elemento del diccionario, se utiliza __del__ :

In [30]:
try:
    del grades['Carlos']
except KeyError:
    print("No Carlos in grade")
grades

{'Jose': 99, 'Maria': 95, 'Claudia': 87}

Para eliminar todo el diccionario se utiliza __clear()__

In [31]:
grades.clear()

<a id='sets'></a>
# Sets

_Set_ es una colección ordenada no indexada y no permite elementos duplciados.

Los sets se crean a partir de una enumeración de elementos separados por comas, dicha enumeración va entre brackets {}

También se pueden crear mediante set()

In [32]:
thisset = {"apple", "banana", "cherry"}
thisset

thatset = set()

El operador __in__ también funciona en los sets para verificar si un elemento está presente en el set.

In [33]:
print("banana" in thisset)
print("pizza" in thisset)

True
False


In [34]:
thatset.add(1)
thatset.add(2)
thatset.add(2)
print(thatset)

{1, 2}


<a id='functions'></a>
# Funciones

La palabra reservada __def__ marca el inicio del encabezado de la funcion. 

A las funciones se les pueden pasar parámetros, los cuales son enlistados entre los paréntesis. 

Los dos puntos marcan el fin del encabezado de la función.

Opcionalmente se puede inculir un docstring como descripción de la función.

Los *statements* que conforman el cuerpo de la función deben estar indentados.

Opcionalmente la función puede regresar un valor a través de un __return__ *statement*

In [35]:
def to_celsius(Fahrenheit):
    '''Converts from Fahrenheits to Celsius'''
    Celsius = (Fahrenheit - 32) * 5.0 / 9.0
    return Celsius

In [36]:
to_celsius(40)

4.444444444444445

<a id='modules'></a>
# Módulos

Ciertas funcionalidades no están incluidas de forma default en Python, estas requieren ser importadas. Para tener acceso a dichas funcionalidades, se puede importar directamente el módulo como:

In [37]:
import re

num_regex = re.compile("[0-9]+", re.I)

En este ejemplo el módulo __re__ contiene las funciones y constantes para utilizar expresiones regulares en Python. Para accesar a las funciones se utiliza el prefijo __re.__ seguido del nombre de la función o constante.

Otra forma de importar funcionalidades adicionales es mediante el uso de un alias, por ejemplo:

In [38]:
import math as m

m.pi

3.141592653589793

En este caso el contenido del módulo de math es accesado utilizando el prefijo __m.__ seguido de la función o constante. 

Cuando se requiere sólo unas cuantas funcionalidades del módulo se pueden importar explícitamente y utilizar sin algún prefijo, por ejemplo:

In [39]:
from collections import defaultdict
lookup = defaultdict(int)

<a id='numPy'></a>
# NumPy

Paquete para realizar cálculo __num__érico en __py__thon.

Los objetos en NumPy son arreglos multidimensionales llamados ndarray. 

In [40]:
import numpy as np

# Un ndarray se puede generar a partir de una lista y sus elementos se pueden accesar con la notacición de brackets []
a = np.array([1, 2, 3])
print(type(a))
print(a[0])

<class 'numpy.ndarray'>
1


In [41]:
# El rango de un ndarray indica la cantidad de dimensiones y el atributo shape regresa un tuple con el tamaño
# del arreglo en cada dimensión

b = np.array([[1,2,3],[4,5,6]])
print(b.shape)

(2, 3)


In [42]:
# Formas adicionales de generar ndarrays

# Crea un arreglo de 0s
a = np.zeros((2,2))
print(a)

[[0. 0.]
 [0. 0.]]


In [43]:
# Crea un arreglo de unos
b = np.ones((1,2))
print(b)

[[1. 1.]]


In [44]:
# Crea un arreglo de una constante
c = np.full((3,3),4)
c

array([[4, 4, 4],
       [4, 4, 4],
       [4, 4, 4]])

In [45]:
# Crea un arreglo de valores aleatorios

e = np.random.random((4,4))
e

array([[0.71668274, 0.14649812, 0.94526065, 0.68955514],
       [0.0975748 , 0.70983866, 0.45924757, 0.25461039],
       [0.50203422, 0.503797  , 0.61374795, 0.75293021],
       [0.61738558, 0.56750149, 0.82173727, 0.9848689 ]])

Las técnicas de slicing también aplican para los ndarray.

In [46]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
a[:2,1:]

array([[2, 3, 4],
       [6, 7, 8]])

Numpy cuenta con las operaciones básicas de matemáticas para sus objetos

In [47]:
x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)

print('Elementwise sum \n', x + y)
print('Elementwise difference \n', x - y)
print('Elementwise product \n', x * y)
print('Elementwise division \n', x / y)
print('Elementwise square root \n', np.sqrt(x))
print('Matrix product \n', np.dot(x,y))

Elementwise sum 
 [[ 6.  8.]
 [10. 12.]]
Elementwise difference 
 [[-4. -4.]
 [-4. -4.]]
Elementwise product 
 [[ 5. 12.]
 [21. 32.]]
Elementwise division 
 [[0.2        0.33333333]
 [0.42857143 0.5       ]]
Elementwise square root 
 [[1.         1.41421356]
 [1.73205081 2.        ]]
Matrix product 
 [[19. 22.]
 [43. 50.]]


NumPy es utilizado en las ciencias de datos debido a su velocidad para realizar operaciones matemáticas

In [4]:
import time
import sys

SIZE = 1000000
l1 = range(SIZE)
l2 = range(SIZE)
a1=np.arange(SIZE)
a2=np.arange(SIZE)

start = time.time()
result = [(x+y) for x,y in zip(l1,l2)]
print("python list took: ",(time.time()-start)*1000)

start= time.time()
result = a1 + a2
print("numpy took: ", (time.time()-start)*1000)

python list took:  196.81668281555176
numpy took:  16.983747482299805


In [7]:
print(result[:3])

[0 2 4]


In [8]:
result[:3]

array([0, 2, 4])