# Fundamentos de programación en Python
1. Lenguaje de programación orientado a objetos
2. Objetos en Python
3. Indexando y algunos comandos básicos
4. Operaciones

## 1. Lenguaje de programación orientado a objetos
### Lenguaje de Programación Orientado a Objetos (OOP) o Programación Funcional (FP)
OOP y FP son diferentes paradigmas para alcanzar un objetivo a través de la programación.

> OOP: Un paradigma de programación basado en el concepto de "objetos", que son estructuras que contienen datos en forma de campos, a menudo conocidos como atributos; y código, en forma de procedimientos, a menudo conocidos como métodos.
[wikipedia](https://en.wikipedia.org/wiki/Object-oriented_programming)

> FP: Un paradigma de programación, un estilo de construcción de estructuras y elementos del código, que trata al programa como evaluación de funciones matemáticas, evitando así, el cambio de estados y datos mutables.
[wikipedia](https://en.wikipedia.org/wiki/Functional_programming)

En cualquier programa hay dos componentes principales: *datos* y *comportamientos*. OOP reúne a los datos y sus comportamientos asociados en una única ubicación (llamada "objeto"). En cambio, FP mantiene los datos y sus comportamientos por separado.

Interesante artículo comparando OOP y FP [here](https://www.tutorialspoint.com/functional_programming/functional_programming_introduction.htm)

### Ejemplos
* OOP: lenguajes más populare como Python, R, Matlab, Julia, Fortran, Ruby, ...

* FP: Mathematica, Ruby,...

## 2. Objectos en Python
Python es un lenguaje OOP. Todo en Python es un objeto que puede ser mutable o inmutable. Estos objetos son:

Los objetos se pueden identificar con el comando *type()* y *id()*

**Nota**: *las variables no tienen que declararse antes de ser usadas*

### 2.1. Boolean
Una declaración lógica verdadera/falsa

In [None]:
a = 2 > 3
b = 5 == 10
c = 2 <= 4
d = "aa" == "aa"
print(a, b, c, d)

Python identifica las variables segun su tipo

In [None]:
print(type(a))

Estos son objetos inmutables ya que Python asigna la misma ubicación de memoria a un boolean

In [None]:
print(id(a))
print(id(a) == id(b))

### 2.2. Integer and float
Los números pueden ser enteros (sin decimales) o flotantes (decimales de doble precisión).

In [None]:
a = 1
b = 1
print(f'{a} {b}')
print(f'Las variables a es tipo {type(a)} y b es tipo {type(b)}')
print(f'a es el del mismo tipo que b? {type(a) == type(b)}')
print(f'Tiene el mismo id? {id(a) == id(b)}')
print(f'El id de a es {id(a)} y el id de b es {id(b)}')

In [None]:
a = 1
b = 1.0
print(f'{a} {b}')
print(f'Las variables a es tipo {type(a)} y b es tipo {type(b)}')
print(f'a es el del mismo tipo que b? {type(a) == type(b)}')
print(f'Tiene el mismo id? {id(a) == id(b)}')
print(f'El id de a es {id(a)} y el id de b es {id(b)}')

### 2.3. Strings
Un String es una secuencia de caracteres.

In [None]:
a = "Python"
b = "Python"
print(f'a es {a} y b es {b}')
print(f'La variable a es de tipo {type(a)}')
print(f'Tiene el mismo id? {id(a) == id(b)}')
print(f'El id de a es {id(a)} y el id de b es {id(b)}')

### 2.4. List
Una secuencia mutable de objetos.

In [None]:
a = [[1,2,3], [4, 5, 6]]
print(a)
a = [[1,2,3], [4, 5]]
print(a)
a = [[1,2,3], [4, 5], "hola"]
print(a)

In [None]:
a = [1, 2, 3]
b = [3, 2, 1]
print(f'Las listas se pueden agregar unas a otras: {a + b}')

#Algunos metodos de las listas
a.append(4)
print(f'Se pueden agregar valores usando el metodo append: {a}')
a.remove(4)
print(f'Se puede eliminar los valores usando el metodo remove: {a}')
b.sort()
print(f'Tambien se pueden ordenar las listas: {b}')

### 2.5. Tuple
Una secuencia inmutable de objetos.

In [None]:
a = (1, 2, 3)
b = (3, 2, 1)
print(f'Las tuplas tambien se pueden agregar unas a otras: {a + b}')

#Al ser objetos inmutables, estas no tienen los mismos metodos que las listas
#Las tuplas solo cuentan con 2 metodos
print(f'Podemos contar las veces que un elemento de la tupla se repite: {a.count(2)}')
print(f'Y podemos averiguar el indice de un valor dentro de la tupla: {a.index(1)}')

Entonces, ¿para qué uso tuples en vez de listas? Se usan porque los tuples ocupan mucho menos espacio en la computadora. Si sabes que no vas a necesitar cambiar nada es más eficiente usar tuples.

Las listas se pueden convertir en tuplas y las tuplas en listas

In [None]:
a = (1,'a',2,'a',1)
b = list(a)
c = tuple(b)
print(f'Ahora "b" es una lista {b} = {type(b)}')
print(f'Y "c" es una tupla {c} = {type(c)}')

### 2.6. Set
Una secuencia ordenada mutable que no tiene elementos repetidos.

In [None]:
a = {1,1,1,1,2,3,4,5,6,6,7}
print(f'Al poner los valores entre corchetes solo dejara los valores unicos que existan {a}')

In [None]:
a = {1,1,1,1,2,3,4,5,6,6,7}
print(f'Se puede convertir a lista {list(a)}')
print(f'Tambien se puede convertir a tupla {tuple(a)}')
print(f'Y puede ser un set otra vez {set(a)}')

### 2.7. Dictionary
Mapeo asociativo mutable
1. Identificador único *key*
2. Creado con {}
3. Cada campo tiene el formato "key: values"

In [None]:
a = {'University': 'ULIMA', 'City':'Lima', 'Programs':['Economics','Others']}
print(a, type(a))

In [None]:
#Podemos acceder a las keys del diccionario
a.keys()

In [None]:
#Accedemos a los valores que contiene el key
a['Programs']

In [None]:
#Podemos actualizar el diccionario
a['Programs'] = ['Economics', 'Administration', 'Engineering', 'Others']
print(a)

## 3. Indexación y algunos comandos básicos
1. Indexación
2. ```rango()```
4. ```len()```
5. ```input()```

### 3.1. Indexación

* La ordenación de elementos en cualquier arreglo comienza en **0**

* Obtener el índice de un elemento: ```list.index(elemento)```

In [None]:
list1 = ['Python is so cool!', 'right?', 2, 'Is this the 3rd or the 4th element?', 2**(1/2)]
print('Python is so cool! se encuentra en la posicion:', list1.index('Python is so cool!'))

* Extraer el valor asociado al índice: ```list[index]```
    
* Extraer una secuencia de elementos: ```list[a:n]``` (elementos desde 'a' hanta 'n-1')

* Extraer una secuencia de todos los elementos a la derecha: ```list [a:]``` (elementos desde 'a')
    
* Extraer una secuencia de todos los elementos a la izquierda: ```list [:n]``` (elemtos hasta 'n-1')

In [None]:
print(list1[0])
print(list1[0:3])
print(list1[1:])
print(list1[:3])

In [None]:
#Python tambien trabaja con indices negativo
print(list1[1:-2])

### 3.2. len() y range()
```len(list)```: tamaño de 'list'

```range(a:n)```: crea una lista de enteros entre 'a' y 'n-1'

In [None]:
print(f'El total de elementos en list1 es {len(list1)}')

In [None]:
#range(start, stop, step) El unico valor obligarotio es "stop"
rango_1 = [*range(10)]
rango_2 = [*range(1, 10)]
rango_3 = [*range(1, 10, 2)]
print(rango_1)
print(rango_2)
print(rango_3)

## 4. Operaciones

### 4.1. Operadores numéricos
* ```+``` para adición

* ```-``` para sustracción

* ```*``` para multiplicación

* ```/``` para división 

* ```//``` omite el resto en una división

* ```%``` devuelve el resto de una división

* ```**``` para potencias

* ```()``` asigna prioridades diferentes a las convencionales en el orden de ejecución de operaciones

In [None]:
print(25 + 4)
print(25 - 4)
print(25 * 4)
print(25 / 3)
print(25 // 3)
print(25 % 3)
print(25 ** 3)
print((25 * 3) + (4 * 5))

## 5. Funciones
Las funciones (o definiciones) son bloques dentro de un script que determinan un comportamiento para variables de entrada y reporta variables de salida.

Sintaxis:

```python
def Nombre_de_definición( variables_de_entrada )
    # ...
    transformaciones_sobre_variables_de_entrada
    determinación_de_variables_de_salida
    # ...
    return variables_de_salida
```

In [None]:
#Una funcion que retorne el cuadrado de un numero
def cuadrado(x):
    x = x ** 2
    return x

In [None]:
x = cuadrado(5)
print(x)

In [None]:
#Las funciones si son cortas podrian definirse en una sola linea
def cuadrado(x): return x ** 2

In [None]:
x = cuadrado(5)
print(x)

## 6. Funciones Lambda
Si una función es lo suficientemente sencilla, podría escribirse en una sola línea
```python
f = lambda x: f(x)
```

In [None]:
cuadrado = lambda x: x ** 2

In [None]:
x = cuadrado(5)
print(x)

# Declaraciones condicionales y bucles

## 7. Condicional
Se evalúa una secuencia de código si un booleano es verdadero

* Declaración ```if ... elif ... else```

    Sintaxis
    
    ```python
if condición:
    declaraciones(s)
elif:              # opcional (abreviatura de 'else if')
    declaraciones(s) # opcional
else:              # opcional
    declaraciones(s) # opcional
    ```
    
    **Nota**: Se requiere *sangrado*
    
    Sintaxis alternativa: declaraciones cortas de una sola linea
    
    ```python
if condición: declaración
    ```


Ejemplo:

In [None]:
a = float(input('Select a number between 0 to 10: '))
print('You selected ',a)
IsRound  = a % int(a) == 0 #Si el numero es un entero, no deberia tener decimales
IsEven   = a % 2 == 0 #Vereficamos si el numero es par
if IsRound and IsEven:
    print('The number you selected is even')
elif IsRound and not IsEven:
    print('The number you selected is odd')
else:
    print('The number you selected is not integer')

* Usar un diccionario para una declaración condicional

     Ejemplo: crear una rutina que escriba un número entero entre 0 y 5
    
     Primero usemos declaraciones ```if ... else```

In [None]:
a = float(input('Select a round number between 1 to 5: '))
IsRound  = a % int(a) == 0
IsMore0  = a >= 0
IsLess5  = a <= 5
if IsRound and IsMore0 and IsLess5:
    print(f'Escogiste {a}, esta dentro del rango!')
    a = int(a)
    if a == 1:
        print('Uno')
    elif a == 2:
        print('Dos')
    elif a == 3:
        print('Tres')
    elif a == 4:
        print('Cuatro')
    else:
        print('Cinco')        
else:
    print(f'Escogiste {a}, no esta dentro del rango o no es un numero entero!')

In [None]:
"""
Function to convert number into string
Switcher is dictionary data type here
"""


def numbers_to_strings(argument):
    switcher = {
        0: "Cero",
        1: "Uno",
        2: "Dos",
        3: "Tres",
        4: "Cuatro",
        5: "Cinco",
    }

    """
    get() method of dictionary data type returns
    value of passed argument if it is present
    in dictionary otherwise second argument will
    be assigned as default value of passed argument
    """
    return switcher.get(argument, "No existe en la función")

In [None]:
print(numbers_to_strings(10))

## 8. Loops

1. Loop definidos:

    Los límites son conocidos antes de inicializar el bucle
    
    Declaración: ```for loop```
    
    Sintaxis
    
```python 
for x in lista_de_x:
    statements(x)
```
    
    Ejemplo:
    
    Imprimir la suma acumulada de enteros entre 0 y 5

In [None]:
x = 0
for i in range(10):
    x += i
    print(f'{i} : {x}')

2. Loop indefinidos:
    
    Los limites no son conocidos antes de inicializar el bucle.
    
    * Loop truncado ```for```
    
        Syntax:
        
        ```python
for x in lista_de_x:
    statement(x)
    if condition:
        statement(x)
        break
        ```
        
        Ejemplo:
        
        La aproximación de Taylor de $\exp(x)$ es
        
        $$\exp(x)\approx 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \frac{x^4}{4!} + ...$$
        
        escriba un programa para calcular el orden mínimo aproximado de manera que la aproximación de $\exp(x)$ sea precisa hasta el sexto decimal

In [None]:
from math import exp
a = float(input('Please, introduce a real number: '))
target = exp(a)
ToL    = 1e-7
apower = 1
afactorial = 1
for order in range(10000):
    if order == 0:
        appr = 1
    else:
        apower = apower*a
        afactorial = afactorial*order
        appr = appr + apower/afactorial
    if abs(target-appr)<ToL:
        break

min_order = order
print('For x =', a,'the minimum order of approximation to have an accuracy of 6 digits is ', min_order)
print('exp(%2.6f) = %2.7f' %(a,target))
print('app(%2.6f) = %2.7f' %(a,appr))

* Loop ```While```:
    
    Syntax
    
    ```python
while condition:
    statements
    ```
    
    Ejemplo: el mismo ejercicio de arriba

In [None]:
import math
a = float(input('Please, introduce a real number: '))
target = math.exp(a)
apower = 1
afactorial = 1
order  = 0
cond   = True
ToL    = 1e-7
while cond:
    if order==0:
        appr = 1
    else:
        apower = apower*a
        afactorial = afactorial*order
        appr = appr + apower/afactorial
        
    order += 1
    cond = abs(target-appr)>=ToL
    

min_order = order-1
print('For x =', a,'the minimum order of approximation to have an accuracy of 6 digits is ', min_order)
print('exp(%2.6f) = %2.7f' %(a,target))
print('app(%2.6f) = %2.7f' %(a,appr))

#### Extra

In [None]:
import os
os.chdir('C:/Users/fceva/Documents/Introduccion a Python')

words = open('words.txt', 'r').read().split()
print(len(words))
words

In [None]:
count = 0
palindromos = []
for word in words:
    if word == word[::-1]:
        palindromos.append(word)
        count += 1

print(f'En total hay {count} palindromos en la lista')
print(palindromos)

In [None]:
palindromos = [i for i in words if i == i[::-1]]
print(f'En total hay {len(palindromos)} palindromos en la lista')
print(palindromos)

# Uso de módulos


Estos son algunos de los paquetes principales:

* [NumPy](http://www.numpy.org/): módulo básico necesario para gran parte del trabajo numérico, permite trabajar con matrices numéricas (vectores o matrices)
* [Scipy](https://scipy.org/scipylib/index.html): métodos numéricos y herramientas adicionales para complementar NumPy, como rutinas para la integración numérica y optimización
* [Matplotlib](https://matplotlib.org/): una libreria de trazado 2D de Python que implementa una variedad de formatos impresos y entornos interactivos en todas las plataformas
* [Ipython](http://ipython.org/): Arquitectura para la informática interactiva (utilizada por Jupyter)
* [Sympy](https://www.sympy.org/en/index.html): SymPy es una libreria de matemática simbólica.
* [Pandas](http://pandas.pydata.org/): proporciona estructuras de datos de alto rendimiento y herramientas de análisis de datos fáciles de utilizar.

Instalación: escriba su terminal

```python -m pip install --user numpy scipy matplotlib ipython pandas sympy nose```

Instalación: Desde anaconda

```conda install numpy scipy matplotlib ipython pandas sympy nose```

## Nosotros revisaremos:
1. Numpy
2. Pandas
3. Matplotlib


## 1. NumPy
Crear la matriz $a=\left[\begin{matrix} 1 & 2 \\ 3 & 4 \end{matrix}\right]$ con el código básico de Python y calcule $2*a$, ¿qué sucede?

In [None]:
a = [[1, 2],[3, 4]]
print(a)
print(a[0])
print(a[1])
print(a[0][0])
print(a[1][1])

In [None]:
print(2 * a)

In [None]:
import numpy as np

In [None]:
a = np.array(a)
print(a)
print(type(a))

In [None]:
print(2 * a)

$2*a$ devuelve una multiplicación de matriz con escalar

* Indexación con NumPy: ```arreglo[filas,columnas]```

In [None]:
print(a[0,1])
print(a[0,:])
print(a[:,1])

### Algunas operaciones con NumPy

ver [aquí](https://docs.scipy.org/doc/numpy/user/quickstart.html) para más ejemplos
    
ver [aquí](https://docs.scipy.org/doc/numpy/user/numpy-for-matlab-users.html) si está familiarizado con la sintaxis de Matlab / quizás R
    
* Transponer

In [None]:
print(f'Matriz a: \n {a}')
print(f'Transpuesta: \n {a.T}')

* Producto matricial

In [None]:
print(f'Matriz a = \n {a}')

v = np.array([2,3])
print(f'Vector v = {v}') #vector columna

m = np.array([[5,6],[7,8]])
print(f'Matriz m = \n {m} ')

d = np.dot(a, m)
print(f'a x m = \n {d}')

e = np.array([[2],[3]])
print(f'e = \n {e}')

z = np.dot(v, a)
print(f'v x a = \n {z} ')

p= np.dot(a, e)
print(f'a x e = \n {p}')

In [None]:
print(a.shape)

In [None]:
b = e.T
print(e)
print(e.shape)
print(b)
print(b.shape)

* Operaciones elemento por elemento:
        
    '+', '-', ' * ' and '/' calculan operaciones elemento por elemento
        
__Note__: A diferencia de matlab, '$*$' y '$/$' no representan operaciones matriciales (la sintaxis equivalente en Matlab es '$.*$' y '$./$')

In [None]:
print(f'La matriz a es: \n {a}')
print(f'La matriz m es: \n {m}')

print(f'\n a + m: \n {a + m}')

print(f'\n a - m: \n{a - m}')

print(f'\n a * m: \n {a * m}')

print(f'\n a / m: \n {a / m}')

* Operaciones escalares matriciales:
    
     ' + ', ' - ', ' * ', ' * * ' y ' / ' entre una matriz y un escalar devuelve cada elemento de la matriz cuando esa operación se aplica con el escalar

In [None]:
print(f'a: \n {a}')
print(f'a + 2: \n {a + 2}')
print(f'a ** 2: \n {a ** 2}')

* Algunas herramientas de álgebra lineal

     Resolver por $x$ en $a x = m$
    
     En álgebra lineal debería ser así: $x= a^{-1} m $
    
     Computacionalmente, es generalmente ineficiente calcular el inverso de una matriz. Numpy proporciona un solucionador que evita el cálculo de la inversa para este caso, que es ```linalg.solve```

In [None]:
print(f'Solve for "x" in "a x = m"')
x = np.linalg.solve(a,m)
print(x)
print('Verify: "a x - m = 0"')
print(np.dot(a,x) - m)

### Distribuciones y realizaciones
Puede encontrar la lista de distribuciones compatibles en Numpy [aquí](https://docs.scipy.org/doc/numpy-1.15.0/reference/routines.random.html)

* Establecer una semilla
    
    Las semillas son importantes para replicabilidad, si se configura una semilla antes de generar realizaciones de una distribución, siempre puedes obtener los mismos resultados
    
    Las definiciones aleatorias en numpy son subdefiniciones, podemos seguir escribiendo ```np.random.(definición)``` o importar solo el segmento ```numpy.random```

Ejemplos:

In [None]:
MatUnif0 = np.random.rand(5,2) 
print(MatUnif0)

In [None]:
MatUnif1 = np.random.rand(5,2)
print(MatUnif1)

In [None]:
#Fijamos una semilla o seed
np.random.seed(123)

In [None]:
MatUnif0 = np.random.rand(5,2) 
print(MatUnif0)

In [None]:
MatUnif1 = np.random.rand(5,2)
print(MatUnif1)

* Realizaciones de una distribución normal

In [None]:
MatNorm = np.random.randn(5, 2)
print(MatNorm)

* Extraer muestras de una distribución Gumbel

In [None]:
loc=0
scale=1
size=(5,2)
MatGum = np.random.gumbel(loc,scale,size)
print(MatGum)

* Remuestreo

    Muchas aplicaciones econométricas requieren remuestreo de datos (por ejemplo, Bootstrap), veamos cómo podemos remuestrear observaciones al azar con NumPy.

* Remuestreo con reemplazo:
    
     Crear una matriz y asumir que contiene observaciones de 2 variables con 5 individuos. La información por persona está en las filas, mientras que las variables están en columnas.

In [None]:
nrows = 5
ncols = 2
MatNorm = npr.randn(nrows,ncols)
print(MatNorm)

Sólo deberíamos remuestrear individuos; por lo tanto, solo las filas deben remuestrearse con reemplazo: use ```npr.choice```

In [None]:
newrow = npr.choice(nrows, nrows)
#el primer nrows es para indicarle hasta qué número de índice va 'n-1' porque toma en cuenta el 0
#el segundo nrows es para decirle cuántos espacios genero
print(newrow)

In [None]:
ResampledMatNorm = MatNorm[newrow,:]
print(ResampledMatNorm)

* Remuestreo sin reemplazo: si el remuestreo debe hacerse sin reemplazo, use la opción ```replace = False``` de` `` npr.choice```

In [None]:
newrow = npr.choice(nrows, nrows, replace=False)
print(newrow)

In [None]:
ResampledMatNorm = MatNorm[newrow,:]
print(ResampledMatNorm)

## 2. Pandas
Pandas permite leer varios tipos de archivos, por ejemplo: Excel, Csv, Stata, SPSS, etc

Pueden ver la documentación [aqui](https://pandas.pydata.org/docs/user_guide/index.html#user-guide)

In [None]:
import pandas as pd

#### Creación de objetos

In [None]:
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
print(type(s))

In [None]:
dates = pd.date_range('2020-01-01', periods = 6)

In [None]:
#Tambien podemos pasar numpy arrays como valores a pandas y crear una dataframe
df = pd.DataFrame(np.random.rand(6, 4), index = dates, columns = ['A', 'B', 'C', 'D'])
df

In [None]:
df2 = pd.DataFrame({'A': 1.,
                    'B': pd.Timestamp('20130102'),
                    'C': pd.Series(1, index=list(range(4)), dtype='float32'),
                    'D': np.array([3] * 4, dtype='int32'),
                    'E': pd.Categorical(["test", "train", "test", "train"]),
                    'F': 'foo'})
df2

In [None]:
#Veamos un poco de data real
import pandas_datareader as web #Una libreria que permite descargar el precio de las acciones y esta basado en Pandas

data = web.get_data_yahoo('TSLA', '2015-01-01')
data

In [None]:
type(data)

#### Viendo la data

In [None]:
data.head()

In [None]:
data.tail()

In [None]:
#Podemos convertir la data a Numpy tambien
data.head().to_numpy()

In [None]:
print(data.info())

In [None]:
print(data.describe())

* Accediendo a la data. Podemos acceder de 3 formas:
    - Slicing
    - Usando los nombres
    - Usando los indices

In [None]:
#Slicing
data[0:3]

In [None]:
#Label
data.loc[:, ['Open', 'Close', 'Adj Close']]

In [None]:
data.iloc[:, [2, 3, 5]]

In [None]:
#Podemos usar Boleans para filtrar la data
data[data['Open'] > 50]

#### Algunas operaciones con Pandas

In [None]:
print(data['Adj Close'].mean()) #La media del precio de cierre

In [None]:
print(data['Adj Close'].std()) #La desviacion estandar del precio de cierre

In [None]:
print(data['Adj Close'].var()) #La varianza del precio de cierre

* Aplicar una funcion ```apply```

    Ejemplo:

    $$ Normalization: X' = \frac{X - X_{min}}{X_{max} - X_{min}}$$

    escriba un programa para calcular el orden mínimo aproximado de manera que la aproximación de $\exp(x)$ sea precisa hasta el sexto decimal

In [None]:
df3 = data.copy()
for i in df3.columns:
    max_value = df3[i].max()
    min_value = df3[i].min()
    df3[i] = df3[i].apply(lambda x: (x - min_value) / (max_value - min_value))

In [None]:
df3

#### Unir bases de datos

In [None]:
data2 = web.get_data_yahoo('AMZN', '2015-01-01')

In [None]:
data3 = pd.concat([data, data2], keys = ['TSLA', 'AMZN'])
data3

In [None]:
left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                     'A': ['A0', 'A1', 'A2', 'A3'],
                     'B': ['B0', 'B1', 'B2', 'B3']})
left

In [None]:
right = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                      'C': ['C0', 'C1', 'C2', 'C3'],
                      'D': ['D0', 'D1', 'D2', 'D3']})
right

In [None]:
result = pd.merge(left, right, on='key')
result

Tambien podemos agrupar la data segun un criterio

In [None]:
emergentes = pd.read_csv('Panel_Emergentes.csv')
emergentes

In [None]:
#Se puede poner cualquier metodo que funcione con pandas
print(emergentes.groupby('pais').mean())

#### Pandas incluye Matplotlib dentro

In [None]:
peru = emergentes[emergentes['pais'] == 'PERU']
peru.head()

In [None]:
peru['Periodo'] = pd.date_range('2005-01-01', '2019-07-01', freq = 'Q')
peru.set_index('Periodo', inplace = True)
peru.tail()

In [None]:
peru['GDP'].plot()

## 3. Matplotlib
Figuras en 2d y 3d generalmente se realizan con el módulo matplotlib.

**Nota 1**: *Muchos de estos comandos de trazado son muy similares a los de Matlab.*


Siga este [enlace](https://matplotlib.org/gallery.html) para obtener más información (al hacer clic en una figura se muestran los comandos necesarios para crearla)

Un simple ejemplo

1. Importar el módulo:

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline 
# La última línea de arriba me permite mostrar figuras en jupyter
# no se requiere en una rutina con código sólo *python*

2. Tracemos $ y = \sin(x) $ y $ y = - \sin(x) $ en un solo gráfico

In [None]:
x = np.linspace(0, 10, 500) # similar a 'range(500)/50'
dashes = [10, 5, 100, 5]  # 10 points on, 5 off, 100 on, 5 off

fig, ax = plt.subplots()
line1, = ax.plot(x, np.sin(x), '--', linewidth=2,label='Guiones establecidos retroactivamente')
line1.set_dashes(dashes)
line2, = ax.plot(x, -1 * np.sin(x), dashes=[30, 5, 10, 5],label='Guiones establecidos proactivamente')
ax.legend(loc='lower right')
plt.show()

3. Tracemos un histograma con datos simulados.

In [None]:
np.random.seed(0)
mu = 200
sigma = 25
x = npr.normal(mu, sigma, size=100)

fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(8, 4))

ax0.hist(x, 20, density=1, histtype='stepfilled', facecolor='g', alpha=0.5)
ax0.set_title('escalonado')

# Cree un histograma proporcionando los bordes de las contenedores (espaciados desigualmente).
bins = [100, 150, 180, 195, 205, 220, 250, 300]
ax1.hist(x, bins, density=1, histtype='bar', rwidth=0.8)
ax1.set_title('contenedores desiguales')

fig.tight_layout()
plt.show()

4. BoxPlots

In [None]:
plt.boxplot(data['Adj Close'])
plt.title('BoxPlot del Precio de Cierre de Tesla')
plt.show()

5. Graficos combinados

In [None]:
data['10_MA'] = data['Adj Close'].rolling(window = 10).mean()
data['20_MA'] = data['Adj Close'].rolling(window = 20).mean()
data.dropna(inplace = True)

In [None]:
fig, ax = plt.subplots(2, 2, figsize = (20, 10))
ax = ax.flatten()

ax[0].plot(data['Adj Close'])
ax[0].set_title('Precio de Cierre de Tesla')

ax[1].plot(data['Adj Close'])
ax[1].set_title('Ultimos 30 dias de precios')
ax[1].set_xlim(data.index[-30], data.index[-1])
ax[1].set_ylim(250, 650)

ax[2].plot(data['Adj Close'].pct_change().dropna())
ax[2].set_title('Retornos del precio de cierre')

ax[3].plot(data['10_MA'], color = 'r')
ax[3].plot(data['20_MA'], color = 'b')
ax[3].set_title('Medias Moviles a 10 y 20 dias')

plt.show()

In [None]:
with plt.style.context('ggplot'):
    plt.figure(figsize = (20, 10))
    ax1 = plt.subplot2grid(shape = (2, 2), loc = (0, 0), rowspan = 1, colspan = 1)
    ax2 = plt.subplot2grid(shape = (2, 2), loc = (0, 1), rowspan = 1, colspan = 1)
    ax3 = plt.subplot2grid(shape = (2, 2), loc = (1, 0), rowspan = 1, colspan = 2)

    ax1.plot(data['Adj Close'])
    ax1.set_title('Precio de Cierre de Tesla')

    ax2.plot(data['Adj Close'].pct_change().dropna())
    ax2.set_title('Retornos del precio de cierre')

    ax3.plot(data['10_MA'], color = 'r')
    ax3.plot(data['20_MA'], color = 'b')
    ax3.set_title('Medias Moviles a 10 y 20 dias')
    ax3.set_xlim(data.index[-30], data.index[-1])
    ax3.set_ylim(250, 650)

    plt.show()

## Stock Screener

In [None]:
import datetime as dt
import matplotlib.dates as mdates
import matplotlib.ticker as mticker
from mplfinance.original_flavor import candlestick_ohlc

In [None]:
MA1 = 10
MA2 = 30

def rsi_func(prices, n = 14):
    deltas = np.diff(prices)
    seed = deltas[:n+1]
    down = -seed[seed < 0].sum() / n
    up = seed[seed >= 0].sum() / n
    rs = up / down
    
    rsi = np.zeros_like(prices)
    rsi[:n] = 100. - 100. / (1 + rs)
    
    for i in range(n, len(prices)):
        delta = deltas[i-1]
        if delta > 0:
            upval = delta
            dwval = 0.
        else:
            upval = 0
            dwval = -delta

        up = (up * (n-1) + upval) / n    
        down = (down * (n-1) + dwval) / n
        rs = up / down
        rsi[i] = 100. - 100. / (1 + rs) 
    return rsi
        
def moving_average(values, window):
    weight = np.repeat(1.0, window) / window
    smas = np.convolve(values, weight, 'valid')
    return smas #como un numpy array

def exp_mov_avg(values, window):
    weights = np.exp(np.linspace(-1., 0., window))
    weights /= weights.sum()
    a = np.convolve(values, weights, mode = 'full')[:len(values)]
    a[:window] = a[window]
    return a

def get_macd(x, slow = 26, fast = 12):
    '''
    macd line = 12 ema - 26 ema
    signal line = 9 ema of the macd line
    histogram = macd line - signal line
    '''
    emaslow = exp_mov_avg(x, slow)
    emafast = exp_mov_avg(x, fast)
    return emaslow, emafast, emafast - emaslow

def graph_stock():
    
    stock = (str(input('Ingresa una accion: '))).upper()
  
    start = dt.datetime(2019,1,1)
    end = dt.datetime.now()
    stock_price_url = web.DataReader(stock, 'yahoo', start, end)
    
    closep = stock_price_url['Adj Close']
    highp = stock_price_url['High']
    lowp = stock_price_url['Low']
    openp = stock_price_url['Open']
    volume = stock_price_url['Volume']
    date = mdates.date2num(closep.index)
    
    x = 0
    y = len(date)
    candle = []
    
    while x < y:
        append_me = date[x], openp[x], highp[x], lowp[x], closep[x], volume[x]
        candle.append(append_me)
        x += 1
            
    ma1 = moving_average(closep, MA1)
    ma2 = moving_average(closep, MA2)    
    startp = len(date[MA2-1:])
    
    fig = plt.figure(facecolor = '#07000d', figsize = (20, 10))
    
    ax1 = plt.subplot2grid((6,4),(1,0), rowspan = 4, colspan = 4, facecolor = '#07000d')     
    candlestick_ohlc(ax1, candle[-startp:], width = 0.4, colorup ='g', colordown = 'r')
    
    ax1.plot(date[-startp:], ma1[-startp:], label = str(MA1) + ' MA')
    ax1.plot(date[-startp:], ma2[-startp:], label = str(MA2) + ' MA')
    
    ax1.grid(True, color = '#515151')
    ax1.xaxis.set_major_locator(mticker.MaxNLocator(10))
    ax1.xaxis.set_major_formatter(mdates.DateFormatter('%Y-%m'))
    ax1.yaxis.label.set_color('w')
    ax1.yaxis.set_major_locator(mticker.MaxNLocator(prune = 'upper'))
    ax1.spines['bottom'].set_color('#5998ff')
    ax1.spines['top'].set_color('#5998ff')
    ax1.spines['right'].set_color('#5998ff')
    ax1.spines['left'].set_color('#5998ff')
    ax1.tick_params(axis = 'x', colors = 'w')
    ax1.tick_params(axis = 'y', colors = 'w')   
    plt.ylabel('Precio y Volumen')
 
     
    ax0 =plt.subplot2grid((6,4),(0,0), rowspan = 1, colspan = 4, facecolor = '#07000d', sharex = ax1)
    rsi = rsi_func(closep)
    ax0.plot(date[-startp:], rsi[-startp:], label = 'RSI')
    ax0.axhline(70, color = '#8f2020')   
    ax0.axhline(30, color = '#386d13')
    ax0.fill_between(date[-startp:], rsi[-startp:], 70, where = rsi[-startp:] >= 70, facecolor = '#8f2020', edgecolor = '#8f2020')
    ax0.fill_between(date[-startp:], rsi[-startp:], 30, where = rsi[-startp:] <= 30, facecolor = '#386d13', edgecolor = '#386d13')
    ax0.spines['bottom'].set_color('#5998ff')
    ax0.spines['top'].set_color('#5998ff')
    ax0.spines['right'].set_color('#5998ff')
    ax0.spines['left'].set_color('#5998ff')
    ax0.yaxis.label.set_color('w')
    ax0.set_yticks([30, 70])
    ax0.tick_params(axis = 'x', colors = 'w')
    ax0.tick_params(axis = 'y', colors = 'w')
    plt.ylabel('RSI') 
    
    VolumeMin = 0
    ax1v = ax1.twinx()
    ax1v.fill_between(date[-startp:], VolumeMin, volume[-startp:], alpha = 0.4)
    ax1v.axes.yaxis.set_ticklabels([]) 
    ax1v.grid(False)
    ax1v.spines['bottom'].set_color('#5998ff')
    ax1v.spines['top'].set_color('#5998ff')
    ax1v.spines['right'].set_color('#5998ff')
    ax1v.spines['left'].set_color('#5998ff')
    ax1v.set_ylim(0, 3 * volume.max())
    ax1v.tick_params(axis = 'x', colors = 'w')
    ax1v.tick_params(axis = 'y', colors = 'w')
    
   
    ax2 = plt.subplot2grid((6,4),(5,0), rowspan = 1, colspan = 4, facecolor = '#07000d', sharex = ax1)     
    nslow = 26
    nfast = 12
    nema = 9
    
    emaslow, emafast, macd = get_macd(closep)
    ema9 = exp_mov_avg(macd, nema)
    
    ax2.plot(date[-startp:], macd[-startp:], lw = 2, label = 'MACD')
    ax2.plot(date[-startp:], ema9[-startp:], lw = 1, label = 'EMA')
    ax2.fill_between(date[-startp:], macd[-startp:] - ema9[-startp:], 0, facecolor = '#5998ff', edgecolor = '#5998ff', alpha = 0.4)  
    ax2.spines['bottom'].set_color('#5998ff')
    ax2.spines['top'].set_color('#5998ff')
    ax2.spines['right'].set_color('#5998ff')
    ax2.spines['left'].set_color('#5998ff')
    ax2.tick_params(axis = 'x', colors = 'w')
    ax2.tick_params(axis = 'y', colors = 'w')   
    plt.ylabel('MACD', color = 'w')
    ax2.yaxis.set_major_locator(mticker.MaxNLocator(nbins = 8, prune = 'upper'))

    for label in ax2.xaxis.get_ticklabels():
      label.set_rotation(45)    
    
    plt.setp(ax0.get_xticklabels(), visible = False)      
    plt.setp(ax1.get_xticklabels(), visible = False)
    plt.subplots_adjust(left = 0.12, right = 0.95, top = 0.93, bottom = 0.19, wspace = 0.2, hspace = 0.0)
    plt.xticks(fontsize = 10)
    plt.yticks(fontsize = 10)
    plt.suptitle('Analisis tecnico de ' + stock, color = 'w')
    plt.xlabel('Tiempo', color = 'w')
    
    ax0.legend()
    leg0 = ax0.legend(loc = 2, ncol = 2, prop = {'size':10})
    leg0.get_frame().set_alpha(0.4)
    ax1.legend()
    leg1 = ax1.legend(loc = 2, ncol = 2, prop = {'size':10})
    leg1.get_frame().set_alpha(0.4)
    ax2.legend()
    leg2 = ax2.legend(loc = 3, ncol = 3, prop = {'size':10})
    leg2.get_frame().set_alpha(0.4)    
    plt.show()

In [None]:
graph_stock()