# Clase 0: Introducción a Python con Jupyter Notebook

by Benjamín Oliva & Omar Alfaro

## Opciones para tomar este curso

Como se ha discutido previamente, para fines de este curso centraremos nuestros ejemplos prácticos en el uso de _python_. 

Actualemnte existen diferentes y muy variados ambientes (frameworks) de trabajo para utilizar _notebooks_, nuestra recomendación se centra en el uso de:
* _anaconda_ / _Jupyter Notebook_
* _google colab_
* _Visual Studio Code_

Sin embargo, si el alumno conoce previamente otro framework en el cual se sienta más cómodo trabajando, es libre de utilizarlo; tomando en cuenta que los trabajos finales, idealmente, serán entregados en notebooks de python. 

En caso de  preferir anaconda es necesario utilizar [este manual](https://drive.google.com/file/d/1TSaPYLA-x5olHz27CB8gY6mqtpqzoaP5/view?usp=sharing) donde se explica paso a paso como instalar.

### I. Muy breve introducción a __Google Colab__

Colab nos permite trabajar compilar código de _python_ sin la necesidad de realizar instalaciones en el entorno local de la máquina. Es suficiente contar con una cuenta de google y usar esta misma para trabajar en nuestros notebooks. Es recomendable esta opción cuando la computadora personal se pudiera ver limitada por sus capacidades de cálculo. Aparte, tiene la bondad de alojar los notebooks de trabajo en la cuenta de Google Drive personal.

Para visualizar los notebooks en colab, basta con seguir estos pasos:

1.- Agregar [esta extensión](https://chrome.google.com/webstore/detail/open-in-colab/iogfkhleblhcpcekbiedikdehleodpjo)

2.- Abrir el notebook en el [github del curso](https://github.com/benjov/Econometria-II-2023)

3- Click en la extensión Open in Colab

Otra opción es

1.- Abrir [colab](https://colab.research.google.com/)

2.- Selecccionar Github

3.- Pegar la liga del curso y seleccionar la clase en que estaremos trabajando

### II. Muy breve introducción a git y github

Git es un sistema de control de versiones, lo cual en programación es de gran utilidad ya que nos permite guardar la historia de completa de un archivo y poder regresar a una version anterior en el momento que lo necesitemos. Github es la posibilidad de conectar al mundo nuestros proyectos y facilitar el trabajo colaborativo mediante la sintaxis de Git.

Para los usuarios de Windows es necesario descargar e instalar *[Git](https://git-scm.com/downloads)*. En caso de que utilicen mac es necesario abrir la terminal ("Control + Option + Shift + T”) y escribir "*git --version*"


![Languages](https://github.com/benjov/Econometria-II-2024/blob/main/Clase_intro_ToolBox/git_flow.png?raw=1)

#### Comandos básicos en la terminal

* pwd (nos señala la ruta actual de trabajo)
* clear (borra el historial de comandos)
* ls (list files)
* cd (change directory)
* mkdir (crea una carpeta con el nombre que se indique)
* rm (Borra archivos)

#### Comandos básicos en Git

* git config --global user.name "Pongan su nombre" <- comando para cambiar el nombre
* git config --global user.email "Pongan su correo" <- comando para poner el correo electrónico de una cuenta de github


#### Haciendo una copia local del repositorio de la clase

* Paso 1: abrir la terminal o git bash
* Paso 2: con _cd_ ir a la carpeta en que queremos copiar el repo de la clase
* Paso 3: _git clone_ https://github.com/benjov/Econometria-II-2025

#### Actualizando el repositorio de la clase

* Paso 1: abrir la terminal o git bash
* Paso 2: con _cd_ ir a la carpeta donde se encuentra el repo clonado
* Paso 3: _git pull origin master_

## 1.- Motivación: ¿Por qué aprender python?

![Languages](https://graffersid.com/wp-content/uploads/2022/08/data-from-Statista.png)

![Popularity](https://github.com/benjov/Econometria-II-2024/blob/main/Clase_intro_ToolBox/languages.png?raw=1)

### Cómo las grandes empresas utilizan Python

Una buena parte de las posibilidades de trabajo con __python__ se concentran en desarrollo de *IOT*, *IA*, *Backend* y *Data Science*.

* [Netflix](https://netflixtechblog.com/python-at-netflix-86b6028b3b3e)
* [Uber](https://eng.uber.com/tech-stack-part-one-foundation/)
* [Spotify](https://engineering.atspotify.com/2013/03/how-we-use-python-at-spotify/)
* [Instagram](https://instagram-engineering.com/web-service-efficiency-at-instagram-with-python-4976d078e366)

### Historia de python

http://python-history.blogspot.com/2009/01/brief-timeline-of-python.html

## 2.- Introducción a la programación con python

In [None]:
print("Hello world!")

### Semántica y Sintaxys

Los lenguajes de programación contienen ciertas palabras "clave" que son fundamentales para escribir instrucciones
 - and                      - del                    - global                - not                     - with
 - as                       - elif                   - if                    - or                      - yield
 - asser                    - else                   - import                - pass                    - False
 - break                    - except                 - in                    - raise                   - True
 - class                    - finally                - is                    - return                  - None
 - continue                 - for                    - lambda                - try
 - def                      - from                   - nonlocal              - while

Por otro lado también existen las funciones

- abs()                     - delattr()              - hash()                - memoryview()            - set()

- all()                     - dict()                 - help()                - min()                   - setattr()

- any()                     - dir()                  - hex()                 - next()                  - slice()

- ascii()                   - divmod()               - id()                  - object()                - sorted()

- bin()                     - enumerate()            - input()               - oct()                   - staticmethod()

- bool()                    - eval()                 - int()                 - open()                  - str()

- breakpoint()              - exec()                 - isinstance()          - ord()                   - sum()

- bytearray()               - filter()               - issubclass()          - pow()                   - super()

- bytes()                   - float()                - iter()                - print()                 - tuple()

- callable()                - format()               - len()                 - property()              - type()

- chr()                     - frozenset()            - list()                - range()                 - vars()

- classmethod()             - getattr()              - locals()              - repr()                  - zip()

- compile()                 - globals()              - map()                 - reversed()              - _ _import_ _()

- complex()                  - hasattr()             - max()                 - round()



La combinación _correcta_ de funciones y de palabras clave construyen la lista de instrucciones que queremos que se realicen. 

Es también importante considerar que Python es _"case sensitive"_, lo que significa que en cualquier parte del código la diferenciación entre minusculas y mayúsculas es fundamental.

### Operadores matemáticos

* Suma y resta

In [None]:
print(5+5-2)

* Multiplicación y división

In [None]:
print(7*8/2)

* Potencia

In [None]:
print((5**5)**(1/2))

* La parte entera de una división

In [None]:
509//5

* La parte residual de una división

In [None]:
509%5

### Operadores lógicos

* Exactamente igual

In [None]:
print(4 == 4.5)

* Distinto

In [None]:
print(4 != 4.5)

* Mayor/menor o igual que

In [None]:
print(4 >= 4.5)

* Menor/mayor que

In [None]:
print(4<4)

* Union

In [None]:
print("Azul"!="Verde" or 2+2==5)

* Interseccion

In [None]:
print("Azul"!="Verde" and 2+2==5)

* Complemento

In [None]:
print(not 2+2==5)

### Tipos de datos

* String: cadenas de texto

In [None]:
a = "123"
print(a)
type(a)

* Interger: numeros enteros

In [None]:
a = 450
print(type(a))

* Float: numeros decimales

In [None]:
a = 3.1416
print(type(a))

* Boolean: comunmente son los resultados de aplicar operadores logicos

In [None]:
a = "Python" < "python"
print(a)
type(a)

In [None]:
print(c+d)

In [None]:
print(type('c+d'))

### Asignaciones

Para asignar información a un objeto, utilizamos el operador que nos ayuda a hacer declaraciones _"="_

In [None]:
a = "Estoy asignando un string"
# variable = valor
print(a)

 #### Algunas reglas para elegir el nombre de variables

 * No utilizar palabras clave o funciones que python ya tiene asignados
 * No usar espacios en los nombres de las variables
 * El nombre de las variables debe comenzar con una letra o con un guión bajo "_"


In [None]:
VAR_PIB_2020 = -0.089

In [None]:
_VAR_INPC = 0.032

In [None]:
_VAR_INPC

### Tipos de secuencias

Las secuencias son basicamente lo que nos permite agrupar datos dentro de una misma variable

* Tupla: no modificable, puede contener distintos tipos de datos. Se generan poniendo conjuntos de datos entre paréntesis _'()'_

In [None]:
x = (10,"miércoles", 2021, "marzo")

x

In [None]:
type(x)

* Lista: a diferencia de las tupla, las listas pueden son modificables, esto quiere decir que se les puede agregar nuevos datos. Se generan poniendo conjutos de datos entre corchetes _'[]'_ o utlizando la función list().

In [None]:
x = [22, "miércoles", 2022, "febrero"]

x

In [None]:
type(x)

In [None]:
x.append("Econometría II") #sintaxys para agregar elementos

x

Los Corchetes son de gran ayuda para acceder a partes especificias de una lusta o tupla

In [None]:
x[0]

Al utilizar la suma entre dos listas, el resultado es una lista que concatena ambas listas

In [None]:
[1,3,5,7,11,13] + [5,7]

Al utilizar la multiplicación en una lista, el resultado es la repetición de _n_ veces esa lista

In [None]:
[1,3,5,7]*3

* Diccionarios

Los diccionarios son colecciones que contienen datos que se encuentran relacionados

In [None]:
Sesiones = { "Semana 1":"Repaso parte 1", 
             "Semana 2":"Repaso parte 2", 
             "Semana 3":"Introducción a Python" }

Sesiones

### Funciones, estructuras de control y librerias

Las funciones y estructuras de control son elementos dentro de los lenguajes de programacion que nos ayudan a sistematizar tareas repetitivas o que constantemente usaremos.

In [None]:
lista = [1,2,3,4,5,6,7,8,9,10]

lista

In [None]:
max(lista)

In [None]:
lista.append(11)

In [None]:
lista

¿Qué métodos puedo aplicarle a un objeto de Python?

La forma más inmedianta de saberlo es con _dir()_

In [None]:
dir(lista)

In [None]:
max(lista)

In [None]:
lista.__class__

En caso de que las funciones que vienen precargadas en python no sean suficiente, siempre existe la posibilidad de crear nuestras propias funciones

In [None]:
#
def saludar_alumno():
    alumno = input("Hola, ¿cuál es tu nombre? ")
    mensaje = str ("Buenos días, " + str(alumno) + ". Espero que disfrutes este curso.")
    #Esto se conoce como "identation" (sangría)
    return mensaje

In [None]:
saludar_alumno()

In [None]:
def pregunta_zoomestre():
    respuesta = input("¿Extrañas las clases en línea? (Sí/No)")
    respuesta = respuesta.upper()
    respuesta = respuesta.replace("Í", "I")
    if respuesta == "SI":
        msj = "Nosotros también. Pero estamos afortunadamente puedes tomar la clase desde donde gustes, aunque nos sentiremos felices de verte en el salón de clases"
    elif respuesta == "NO":
        msj = "Te entiendo, el café zapatista por las mañanas hace la vida más fácil."
    else:
        msj = "Lo siento, no estabamos preparados para esa respuesta"
    return  msj

In [None]:
pregunta_zoomestre()

### Bucles

* while

In [None]:
x = 10

while x>0:
    print(str(x) + " es un número positivo ")
    x=x-1

* _for_ and _if_

In [None]:
numbers = range(10)

for num in numbers:
    if num>5:
        print(str(num) + " mayor a 5 ")
    elif  num==5:
        print(str(num) + " es igual a 5 ")
    else:
        print(str(num) + " es menor a 5 ")

### Librerias

Las librerias son basicamente un esfuerzo colectivo por evitar que nos esforcemos por solucionar o desarrollar cuestiones que se encuentran resueltas. Son fundamentales para ayudarnos a realizar nuestro cometido, en un medio colaborativo es muy probable (principalmente cuando se es principiante) que alguien ya haya solucionado un problema al que nosotros nos enfrentamos, y en este tipo de ambientes de softwere libre es muy común que se haya decidido compartirla solución con la comunidad. A continuacion algunas de las librerias primordiales para trabajar en python.

#### _Numpy_

es una librería que nos permite realizar operaciones matemáticas de alto nivel y es de gran ayuda para realizar operaciones complejas de manera amable

In [None]:
#! pip install numpy
import numpy as np

In [None]:
normal_dist = np.random.normal(2,1,100)

In [None]:
np.log(normal_dist)

##### Arrays
Los array son un tipo de objeto que puede contener datos acomodados como lo que nosotros conocemos como matrices

In [None]:
lista = [1,3,5,7]
x = np.array(lista)
x

#### Pandas
Pandas es una extensión de numpy. Se trata de una de las librerías más utilizadas de python, dado el gran poder de manipulación de datos que permite en los objetos de tipo _data frame_.

In [None]:
import pandas as pd

## 3.- Ejemplo práctico: Francis Galton y la regresión a la media

“Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un
grado menor.”

$\hat{Y} = \hat{\beta}_{0} + \sum \limits _{j=1} ^{p} X_{j}\hat{\beta}_{j}$

Lectura de la base de datos

In [None]:
import pandas as pd

In [None]:
url = "https://josephsalmon.eu/enseignement/TELECOM/MDI720/datasets/Galton.txt"
df = pd.read_csv(url, sep = "\t")
df.head(10)

In [None]:
df.tail(6)

In [None]:
type(df)

Convertimos la altura de pulgadas a centimetros

In [None]:
df.Kids

In [None]:
df[['Father', 'Mother', 'Height']] = df[['Father', 'Mother', 'Height']]*2.54
df.head(10)

In [None]:
df.iloc[2:4]

### Matplotlib and seaborn

_Matplotlib_ y _Seaborn_ son de las librerías más utilizadas para la visualización de datos

In [None]:
import matplotlib.pyplot as plt
plt.style.use('ggplot')
import seaborn as sns

In [None]:
sns.pairplot(df, hue='Gender')
plt.show()

In [None]:
import numpy as np

X = np.array(df[["Father", "Mother"]])

Y = df["Height"]

In [None]:
X

In [None]:
Y

In [None]:
Unos = np.ones(len(Y))
Unos

In [None]:
#Unos = np.ones(len(Y))
X_m = np.array([Unos, X[:,0], X[:,1]]).T
X_m

Obtenermos los estimadores mediante la multiplicación de matrices

$\hat{\beta} = (X^TX)^{-1}X^TY$

In [None]:
beta_hat = np.linalg.inv(X_m.T.dot(X_m)).dot(X_m.T).dot(Y)

In [None]:
X_m.T.dot(Y)

$\hat{\beta} = [\hat{\beta}_0, \hat{\beta}_1,\hat{\beta}_2]$

In [None]:
beta_hat

In [None]:
56.666 + 0.37 * 176 + 0.28 * 165

$\hat{Y}_i = \hat{\beta}_i*X_i+u_i$

In [None]:
y_hat = X_m.dot(beta_hat)
e_hat = y_hat-Y
e_hat.sum()

$Var({\hat\beta})= \sigma^2(X^TX)^{-1}$

$\mathbf{e}'\mathbf{e}/(n-K) = \hat{\sigma}^2$

In [None]:
sigma_2_hat = np.dot( np.transpose(e_hat), e_hat )/(len(e_hat) - len(beta_hat))

In [None]:
Var_beta_hat = np.diag( sigma_2_hat * np.linalg.inv(X_m.T.dot(X_m)) ) ** 0.5

In [None]:
Var_beta_hat

In [None]:
beta_hat / Var_beta_hat

### MCO con la librería statsmodel

In [None]:
### MCO con la librería statsmodel
import statsmodels.api as sm

X_m = sm.add_constant(X)

estimacion = sm.OLS(Y,X_m)
est2 = estimacion.fit()
print(est2.summary())

In [None]:
sns.jointplot(x="Mother", y="Height", data=df, kind='reg')
sns.jointplot(x="Father", y="Height", data=df, kind='reg')

## 4.- Resumen de la sesión

* Revisamos como clonar el repo de la clase y el modo en que lo pueden actualizar cada que sea necesario así como la manera en que podemos seguir el curso sin necesidad de instalar programas en la computadora personal.
* Motivos importantes para aprender python y aplicaciones principales
* Algunos de los elementos más básicos de python
    - Operadores matemáticos y lógicos
    - Tipos de objetos y asignaciones
    - Tipos de secuencias de datos
    - Funciones, estructuras de control y librerías
* Ejemplo práctico para llegar a la solución de mínimos cuadrados ordinarios con la librería numpy y statsmodels

## 5.- Recursos para aprender Python

### Cursos

* Python for Everybody (Coursera & Michigan)
* Statistics with Python (Coursera & Michigan)
* Python for Data Science (Coursera & Michigan)
* Certificado profesional de Ciencia de datos (IBM)


### Libros

 * Python for everybody
 * Think python

### Recomendaciones

* Saber programar en gran medida es saber leer errores, no se asusten por equivocarse. Aprendan de sus errores, suena muy trillado pero para programar es esencial
* Buscar el error en _stack overflow_ siempre es de gran ayuda
* Hagan proyectos colaborativos, aprovechen la oportunidad de aprender haciendo en equipo.

## 6.- Extra: solucion de problemas con python

Planteamiento: en un tablero de ajedrez de 4x4 colocar 4 reinas de tal modo que no se hagan daño entre sí  

![NQueens](https://github.com/benjov/Econometria-II-2024/blob/main/Clase_intro_ToolBox/StepsNQueens04.png?raw=1)

¿De qué manera podemos solucionar el problema para N =8)

![8Queens](https://github.com/benjov/Econometria-II-2024/blob/main/Clase_intro_ToolBox/queens_attack_patterns.png?raw=1)

In [None]:
from itertools import permutations

N=8
sol=0
cols = range(N)
for combo in permutations(cols):
    if N==len(set(combo[i]+i for i in cols))==len(set(combo[i]-i for i in cols)):
        sol += 1
        print('Solution '+str(sol)+': '+str(combo)+'\n')
        print("\n".join(' o ' * i + ' X ' + ' o ' * (N-i-1) for i in combo) + "\n\n\n\n")