# Intro a Python, SQL y Git

### 1. Intro a Python

Python es uno de los lenguajes de programación más populares para DS y ML. Fue creado por Guido van Rossum quien lo publicó en 1991.

Por qué usamos Python?

- Tiene una sintaxis simple, similar al Inglés
- Nos permite realizar las mismas tareas que otros lenguajes con menos líneas de código
- Es un lenguaje interpretado, lo que nos permite testear rápidamente
- Tiene una gran comunidad que crea y mantiene librerías que nos van a simplificar la vida

#### 1.1 Sintáxis

##### Indentación
Indentación se refiere a los espacios en blanco al principio de una línea de código.

Python, a diferencia de otros lenguajes de programación, se basa en la indentación para definir bloques de código

In [None]:
# Para usar un if correctamente debemos respetar la indentación:
if 1 > 0:
    print("True") # La indentación le indica a Python que este bloque de código está un nivel más abajo que el previo

In [None]:
# Si no la respetamos, nos va a arrojar un error
if 1 > 0:
print("True")

##### Creación de variables
Para crear una variable simplemente le asignamos un valor:

In [None]:
x = 5
y = 1
print("x =", x, "; y =", y)

##### Comentarios
Los comentarios son muy importantes en programación para que otros entiendan nuestro código (esto incluye a su yo del futuro)\
Para insertar comentarios en su código simplemente usen el signo ```#```:

In [None]:
# Este es un comentario

#### 1.2 Tipos de dato y Operadores

##### Numéricos

En Python tenemos dos tipos de datos numéricos básicos ```int```, para números enteros, y ```float```, para números decimales.

Los operadores básicos que tenemos para trabajar con números son:
- ```+```: Suma
- ```-```: Resta
- ```*```: Multiplicación
- ```/```: División
- ```**```: Potenciación
- ```//```: Cociente
- ```%```: Módulo (o resto)

Podemos mezclar variables de tipo ```int``` y ```float``` al trabajar. Si es así, el resultado siempre será de tipo ```float```.

In [None]:
x = 4
y = 5.0
print("x tiene valor", x, "y es de tipo", type(x)) # La función type nos entrega el tipo de dato de una variable
print("y tiene valor", x, "y es de tipo", type(y))
print("Suma:", x+y)
print("Resta:", x-y)
print("Multiplicación:", x*y)
print("División:", x/y)
print("Potenciación:", x**y)
print("Cociente:", x//y)
print("Resto:", y%x)

##### Booleanos

Python también nos permite tener datos de tipo Booleano y usar los operadores lógicos clásicos:
- ```and```: Y
- ```or```: O
- ```not```: Negación

Ademas, para comparar dos variables y obtener un resultado booleano tenemos los operadores:
- ```==```: Igual
- ```!=```: Distinto

In [None]:
t, f = True, False
print(type(t))

In [None]:
print(t == f)  # Igual;
print(t != f)  # Distinto;

print(t and f) # Y = AND; &
print(t or f)  # O = OR; |
print(not t)   # NO = NOT;
print(not (t or f)) # Negación de una proposición más compleja

##### Strings (Cadenas de texto)

El tipo de dato String en Python nos permite almacenar texto. \
Para crear un String debemos escribir entre comillas ```"..."``` el texto que queremos asignarle. También podemos usar comillas simple ```'...'```, lo importante es que sean las mismas al iniciar y terminar el texto.

In [None]:
hola = "Hola"
mundo = 'Mundo!'
print(hola)
print(mundo)

Python nos permite concatenar (unir) dos Strings de forma fácil. \

In [None]:
hola_mundo = hola + " " + mundo
print(hola_mundo)

Pero cuidado con querer concatenar un String con otro tipo de dato!

In [None]:
x = 5
valor = "X tiene un valor de "
print(valor + x)

Si queremos usar el valor de una variable de tipo distinto a String dentro un String podemos usar un ```f-string```:\
Debemos anteponer una ```f``` a las comillas e insertar la variable dentro del texto entre llaves ```{...}```

In [None]:
valor = f"X tiene un valor de {x}"
print(valor)

Los Strings tienen muchos métodos útiles como:
- capitalize(): Convierte la primera letra en mayúscula
- upper(): Convierte todas las letras en mayúscula
- lower(): Convierte todas las letras en minúscula
- strip(x): Elimina el caracter que le entreguemos como argumento ```x``` del inicio y final del String (Si no le entregamos un argumento elimina los espacios en blanco)\
Para más métodos pueden visitar: https://www.w3schools.com/python/python_strings_methods.asp

In [None]:
s = "hOlA mUnDo"
print(s.capitalize())  # Convierte la primera letra en mayúscula
print(s.upper())       # Convierte toda la cadena a mayúsculas
print(s.lower())       # Convierte toda la cadena a minúsculas
print('___world__'.strip('_'))  # Elimina los espacios en blanco iniciales y finales

#### 1.3 Colecciones (Collections)
Las Colecciones en Python nos permiten guardar múltiples valores en una sola variables.\
Hay 4 tipos de Colecciones que vienen por defecto con Python: 
- Listas (List)
- Diccionarios (Dictionary)
- Tuplas (Tuple)
- Conjuntos (Set)\

Pero por ahora solo veremos los primeros dos.

##### Listas (List)

Las Listas nos permiten guardar múltiples datos de distintos tipos en una sola variable.

Para crear una lista debemos declararla usando corchetes ```[]```. Si queremos agregar elementos al momento de crearla, debemos separarlos usando ```,```.

Las Listas son conjuntos ordenados (mantienen el orden con el que vamos agregando elementos), mutables (podemos agregar, eliminar o cambiar los valores de elementos ya agregados) y nos permiten tener elementos duplicados.

Además, las Listas son indexadas, por lo que podemos acceder a elementos específicos a través de su índice (los índices parten desde 0!)

In [None]:
my_list = [] # Crea una lista vacía
print(my_list)

In [None]:
my_list = [1,2,3,4,5] # Crea una lista poblada
print(my_list)

In [None]:
my_list.append('hola') # Agregar un elemento al final de la lista
print(my_list)

In [None]:
my_list.remove(3) # Borra la primera ocurrencia de un valor dentro de la lista
print(my_list)

In [None]:
print(my_list[2]) # Acceder al 3er elemento de la lista

In [None]:
print(my_list[-1]) # Acceder al último elemento de la lista

Además de acceder a los elementos de la lista de uno en uno, Python proporciona una sintaxis concisa para acceder a sublistas; esto se conoce como ```slicing```:

In [None]:
print(my_list[1:3]) # Acceder al 2do y 3er elemento de la lista (Python excluye el último índice que le damos en el rango)

In [None]:
print(my_list[1:-1])

##### Diccionarios (Dictionary)

Los diccionarios nos permiten guardar distintos pares de llave-valor en una sola variable.

Para crear un diccionario debemos declararlo usando llaves ```{}```. Si queremos agregar elementos al momento de crearlo, debemos declararlos como ```llave: valor``` y separarlos usando ```,```.

Los Diccionarios son conjuntos ordenados (desde Python 3.7 en adelante), mutables (podemos agregar, eliminar o cambiar los valores de pares ya agregados) y NO nos permiten tener llaves duplicadas.

In [None]:
my_dict = {} # Crea un diccionario vacío
print(my_dict)

In [None]:
my_dict = {'llave_1': 'valor_1', 'llave_2': 'valor_2'} # Crea un diccionario vacío
print(my_dict)

In [None]:
my_dict['llave_3'] = 'valor_3' # Agregar un par llave-valor al final del diccionario
print(my_dict)

In [None]:
my_dict['llave_2'] = 'valor_2.1' # Si la llave ya existe, se modifica el valor
print(my_dict)

In [None]:
print(my_dict['llave_2']) # Acceder a un valor del diccionario

#### 1.4 Control de Flujo y Bucles (Loops)

##### Control de Flujo

Para controlar el flujo de nuestro código dependiendo de condiciones que queramos definir podemos utilizar un bloque if-else
```
    if condition_1:
        result_1
    elif condition_2:
        result_2
    else:
        default_result
```

Este bloque nos entregará ```result_1``` si la ```condtion_1``` se cumple, ```result_2``` si la ```condtion_2``` Y la ```condition_1``` no se cumple o ```default_result``` si ni ```condtion_1``` ni ```condtion_2``` se cumplen.

In [None]:
x = 5
if x > 10:
    print("x es mayor que 10")
elif x > 3:
    print("x es mayor que 3")
else:
    print("x es menor o igual a 3")

In [None]:
x = 1
if x > 10:
    print("x es mayor que 10")
elif x > 3:
    print("x es mayor que 3")
else:
    print("x es menor o igual a 3")

##### Bucles (Loops)

Para poder realizar tareas repetitivas para un rango de datos podemos ocupar las palabres clave ```for``` o ```while```:
- ```for```: Nos permite ejecutar un bloque de código para todos los valores de un rango o colección.
- ```while```: Nos permite ejecutar un bloque de código mientras se cumpla una condición (Cuidado con las condiciones siempre verdaderas!)

In [None]:
# Uso de for
for i in range(0,5):
    print(i)

In [None]:
# Podemos iterar sobre los elementos de una lista:
for elemento in my_list:
    print(elemento)

In [None]:
# También podemos iterar sobre los pares llave-valor de un diccionario:
for llave, valor in my_dict.items():
    print(f"Llave: {llave} - Valor: {valor}")

In [None]:
# Uso de while:
i = 0
while i < 5:
    print(i)
    i = i+1

##### Comprensión de Listas (List Comprehension)
La iteración y el control de flujo nos habilita esta herramienta muy útil. Con ella podemos crear listas basadas en otras colecciones:


In [None]:
# Podemos crear una lista que tenga todos los valores de nuestro diccionario con una sola línea
dict_values = [value for key, value in my_dict.items()]
print(my_dict)
print(dict_values)

In [None]:
# Podemos crear una lista que solo tenga los elementos de tipo entero de nuestra lista original
int_list = [element for element in my_list if type(element) == int]
print(my_list)
print(int_list)

In [None]:
# También podemos crear diccionarios! En este caso es un diccionario que tiene como llaves los valores de nuestra lista de enteros
# y como valores sus cuadrados
square_dict = {el: el**2 for el in int_list}
print(square_dict)

#### 1.5 Funciones

Las funciones nos permiten guardar una serie de instrucciones que queramos usar repetidamente en una sola línea de código.

En Python se declaran usando la palabra clave ```def```:
```
def my_function(x):
    ...
    return value
```

Las funciones pueden recibir argumentos, que son valores que se usan dentro de su lógica.

In [None]:
# Esta función va a retornar el cuadrado del argumento que le entreguemos, más 1
def get_square_plus_one(x):
    return x**2 + 1

In [None]:
for i in range(0,5):
    print(f"Input: {i}, Output: {get_square_plus_one(i)}")

In [None]:
# Se pueden definir valores por defecto para los argumentos
# Esta función va a retornar el cuadrado del primer argumento, más el valor del segundo argumento
# Si no le entregamos un segundo argumento, va a usar por defecto el valor 1.
def get_square_plus_y(x, y = 1):
    return x**2 + y

In [None]:
for i in range(0,5):
    print(f"Input: {i}, Output: {get_square_plus_y(i, 4)}")

In [None]:
for i in range(0,5):
    print(f"Input: {i}, Output: {get_square_plus_y(i)}")

### 2. SQL

Structured Query Language (SQL) es el lenguaje dominante para operaciones de almacenamiento, manipulación y consulta de bases de datos relacionales. \

No está dentro de los objetivos del curso enseñarles a usar SQL pero es una herramienta fundamental para el trabajo con datos en la vida real. \
Por eso vamos a ejecutar algunas consultas de ejemplo usando el sitio: https://www.sql-practice.com/ \
Si no conocen SQL aún, un buen recurso para empezar a aprender es: https://www.w3schools.com/sql/default.asp 

Ejemplos:

1. Q: Show first name, last name, and gender of patients whose gender is 'M' \
A: ```SELECT first_name, last_name, gender FROM patients WHERE gender = "M";```

2. Q: Show first name of patients that start with the letter 'C' \
A: ```SELECT first_name FROM patients WHERE SUBSTRING(first_name,1,1) = "C"```

3. Q: Show first name, last name, and the full province name of each patient. Example: 'Ontario' instead of 'ON' \
A: ```SELECT p.first_name, p.last_name, prov.province_name
FROM patients p
LEFT JOIN
province_names prov
USING(province_id)```

### 3. Git

Git es un sistema de control de versiones distribuido utilizado para rastrear cambios en el código fuente durante el desarrollo de software. Permite a múltiples desarrolladores colaborar en proyectos, llevar un registro de sus cambios y gestionar el historial del proyecto. \

Conceptos clave:
- Repositorio (Repo): Git almacena toda la información sobre un proyecto en una estructura de datos llamada repositorio. Incluye los archivos del proyecto y un registro de todos los cambios realizados en esos archivos.

- Repositorio local: Cada desarrollador que trabaja en un proyecto tiene su propio repositorio local, que es una copia del repositorio del proyecto almacenado en su computadora.

- Repositorio remoto: Un repositorio remoto es una copia del repositorio del proyecto que se almacena en un servidor, generalmente utilizado para la colaboración entre desarrolladores. Un ejemplo de plataforma que les permite tener un repositorio remoto es GitHub.

- Commit: Un commit es una foto del proyecto en un punto específico en el tiempo. Cada vez que quieran que sus cambios queden guardados en la historia del proyecto deben hace un commit.

- Rama (Branch): Una rama es una línea de desarrollo separada (piensen en un universo paralelo). Los desarrolladores pueden crear ramas para trabajar en nuevas funciones o correcciones de errores sin afectar el código base principal. Las ramas pueden fusionarse de nuevo en el código principal cuando los cambios estén listos.

- Merge: Fusionar es el proceso de combinar los cambios de una rama en otra. Esto se hace típicamente para incorporar los cambios de una rama de características en el código base principal.

- Pull: Pull es el proceso de obtener cambios de un repositorio remoto y fusionarlos en tu repositorio local. Es una combinación de las operaciones de fetch y merge. MUY IMPORTANTE hacer un pull antes de crear una rama nueva, así nos aseguramos de tener la versión más actual del código y no tener que estar peleando después para resolver conflictos entre sus cambios y los que hizo alguien más.

- Push: Push es el proceso de subir tus cambios locales a un repositorio remoto. Esto hace que tus cambios estén disponibles para otros desarrolladores que trabajan en el proyecto.

Ejemplo (de juguete) de uso de Git:
```bash
$ cd # Cambiamos de directorio a nuestra carpeta base
$ mkdir example-repo # Creamos una nueva carpeta llamada example-repo para guardar nuestros archivos
$ cd example-repo # Cambiamos de directorio a nuestra nueva carpeta
$ git init # Inicializamos un repositorio de Git
$ git status # Consultamos el estado actual de nuestra rama de trabajo
$ echo Hola Mundo! >> hola.txt # Creamos un archivo de texto llamado hola.txt que dice "Hola Mundo!"
$ cat hola.txt # Leemos lo que está en nuestro archivo hola.txt
$ git status # Consultamos el estado actual de la rama. Nos indica que hay cambios no commiteados
$ git add hola.txt # Agregamos nuestro archivo a los cambios a commitear
$ git commit -m "Added hola text file" # Commiteamos nuestros cambios con un mensaje descriptivo
$ git status # Consultamos el estado actual de nuestra rama. No hay cambios por commitear
$ git checkout -b new_branch # Creamos una rama nueva a partir del estado actual del proyecto
$ echo Adios Mundo! >> hola.txt # Agregamos una nueva linea al archivo hola.txt
$ cat hola.txt # Leemos la nueva version del archivo hola.txt
$ git status # Tenemos cambios por commitear
$ git add hola.txt # Preparamos nuestros cambios para ser commiteados
$ git commit -m "Added new text to file" # Commiteamos con un mensaje descriptivo
$ git checkout master # Volvemos a nuestra rama original previa a modificar el archivo de texto
$ cat hola.txt # Al leer el archivo, vemos la version original!
$ git merge new_branch # Como estamos seguros de que el texto que agregamos esta bien, mergeamos las ramas
$ cat hola.txt
```

##### Cómo se usa esto en la práctica?
Aquí pueden leer más sobre un paradigma de Git Flow, si es que quieren aprender más: https://www.bitbull.it/en/blog/how-git-flow-works/