#  Clase 3: Programaci√≥n Funcional

**MDS7202: Laboratorio de Programaci√≥n Cient√≠fica para Ciencia de Datos**

*Profesor: Mauricio Araneda Hernandez*

## Objetivos de la Clase:

- Funciones y su sintaxis en Python
- Scopes
- Programaci√≥n funcional: `lambdas`, `map`, `filter` y `reduce`
- Referencias y Mutabilidad
- Git


---

## Parte 1: Funciones


Una funci√≥n es un segmento de c√≥digo separado del c√≥digo principal, la cual puede ser ejecutada (de aqu√≠ en adelante, *invocada*) desde cualquier otro punto del programa (incluyendo de si misma).

Las funciones por lo general toman par√°metros, que en t√©rminos pr√°cticos, son los datos sobre los cuales operar√°n.

### Sintaxis B√°sica

En Python, una funci√≥n se define por medio de la keyword `def` seguido por el nombre y los par√°metros que recibir√° de entrada la funci√≥n. 


```python
def funci√≥n_1(par√°metro_1, par√°metro_2): 
    acci√≥n
    ...

```


#### Return

La keyword ```return``` permite que valores definidos dentro de la funci√≥n puedan ser retornadas hacia el exterior.  Una funci√≥n definida sin ```return``` entrega como resultado el tipo de datos ```None```.

```python
def funci√≥n_2(par√°metro_1, par√°metro_2): 
    acci√≥n
    nuevo_valor = ...
    ...
    
    return nuevo_valor

```

> **Nota üìù**: Parametro es el nombre de la variable dentro de la funci√≥n. Argumento es el valor que le pasamos a el par√°metro al momento de invocar la funci√≥n. Se pueden usar indistintivamente.



#### Invocaci√≥n 

Para invocar una funci√≥n (*ejecutarla*), se utiliza el nombre de la funci√≥n junto a dos par√©ntesis que encierran los argumentos.

```python
def funci√≥n_2(par√°metro_1, par√°metro_2): 
    acci√≥n
    nuevo_valor = ...
    ...
    
    return nuevo_valor


variable_1 = 1
variable_2 = 2

funci√≥n_2(variable_1, variable_2)
```


Ya hemos estudiado funciones b√°sicas de Python, como lo son `print()`, `type()` o `isinstance()`.


> **Ejemplo üìñ**

La funci√≥n ```sumar(a, b)``` que suma dos n√∫mero esta definida por:

In [1]:
def sumar(a, b):
    c = a + b
    return c

In [2]:
sumar(10, 200)

210

> **Pregunta ‚ùì:** ¬øQu√© sucede con la variable `c` definida dentro de la funci√≥n?

In [3]:
c

NameError: name 'c' is not defined

### Elementos extra de la sint√°xis de funciones

#### Par√°metros nombrados

Las funciones de python tamb√≠en aceptan par√°metros nombrados. Es decir, al invocar la funci√≥n indicarle especificamente el valor de cada par√°metro por su nombre.

In [4]:
def sumar(a, b):
    c = a + b
    return c

In [6]:
sumar(a=10, b=20)

30

In [8]:
sumar(b=40, a=20)

TypeError: sumar() missing 1 required positional argument: 'a'

#### Cero par√°metros

Una funci√≥n puede ser ejecutada sin necesidad de tener par√°metros.
En este caso (idealmente) la funci√≥n siempre deber√≠a hacer la misma acci√≥n.

In [9]:
def hola_mundo():
    print('Hola!üòä')

hola_mundo()

Hola!üòä


#### Valores por defecto

Los par√°metros tambi√©n pueden tener valores por defecto:


> **Nota üìù:** Los par√°metros con valores por defecto deben ser declarados a la derecha de todos aquellos par√°metros sin valores predefinidos.


In [10]:
def sumar_2(a, b):
    c = a + b
    return c

In [11]:
sumar_2(10, 15, 23, 14)

12

In [13]:
sumar_2(10, 2000)

2010

> **Pregunta ‚ùì**: ¬øPuede una funcion tener un numero de par√°metros variable?

#### N par√°metros

Una funci√≥n puede tomar n par√°metros sin que esten previamente definidos. 
Esto se logra a trav√©s del par√°metro `*args`, el cu√°l actua como una tupla:

In [15]:
def funcion_n_parametros(*args):
    # args= par√°metros sin nombre
    print('Los par√°metros entregados son:', args)

funcion_n_parametros(1, 8, 17, 23, 26)

Los par√°metros entregados son: (1, 8, 17, 23, 26)


¬øCu√°l es la utilidad de esto?

In [16]:
def sumador(x, y, z):
    return x + y + z

In [17]:
sumador(1, 8, 17)

26

In [18]:
sumador(1, 8, 17, 23)

TypeError: sumador() takes 3 positional arguments but 4 were given

In [20]:
def sumador(*args): 
    acum = 0
    for i in args:
        acum += i
    return acum

sumador(1, 8, 17, 23)

49

In [22]:
def sumador(lista_de_numeros):
    acum = 0
    for i in lista_de_numeros:
        acum += i
    return acum
sumador([1, 8, 17, 23])

49

#### N Par√°metros nombrados

Las funciones tambi√©n pueden tomar n par√°metros nombrados a trav√©s de `**kwargs`, el c√∫al se comporta como un diccionario.

In [23]:
def generar_samples(n_samples, mu, sigma):
    print(f"N samples: {n_samples}")
    print(f"Media: {mu}")
    print(f"Desviacion Estandar: {sigma}")

In [24]:
d = {
    'n_samples': 100,
    'mu': 5,
    'sigma': 0.3
}
generar_samples(**d)

N samples: 100
Media: 5
Desviacion Estandar: 0.3


Este ultimo caso puede ser util para cuando se tienen funciones con muchos parametros y es mas facil declarar un diccionario con sus argumentos.

In [25]:
def funcion_kwargs(*args, **kwargs): 
    print(f"Args: {args}")
    print(f"Kwargs: {kwargs}")

In [26]:
dic = {
    'freeze_params': True, 
    'n_samples': 8, 
    'deterministic': True
}

funcion_kwargs(**dic)

Args: ()
Kwargs: {'freeze_params': True, 'n_samples': 8, 'deterministic': True}


In [27]:
dic = {
    'freeze_params': True, 
    'n_samples': 8, 
    'deterministic': True
}

funcion_kwargs(10, 25, True, **dic)

Args: (10, 25, True)
Kwargs: {'freeze_params': True, 'n_samples': 8, 'deterministic': True}


#### Retornar m√∫ltiples valores

Tambi√©n se pueden retornar m√∫ltiples valores

In [28]:
def operaciones(a, b):
    suma = a+b
    resta = a-b
    mult = a*b
    div = a/b
    
    return suma, resta, mult, div

> **Pregunta ‚ùì**: ¬øQu√© retorno cuando hay varias variables en el return?

In [29]:
operaciones(5,2)

(7, 3, 10, 2.5)

In [30]:
suma, resta, mult, div = operaciones(5,2)

suma

7

In [31]:
resta

3

In [32]:
mult

10

In [33]:
div

2.5

In [34]:
type(operaciones(5,2))

tuple

----

## Parte 2: Scopes 

En cada funci√≥n se define un entorno de variables o *namespace*. Esto quiere decir, que para cada funci√≥n existe un conjunto de variables (o nombres) los cuales solo funcionan dentro de la funcion. 

Esto permite definir el concepto de **scope**. El scope se define como un lugar delimitado en donde se define y son visibles un cierto conjunto de variables. 

Una de las implicancias de esta delimitaci√≥n es que aquellas variables definidas dentro de un scope en particular no pueden interactuar con las de afuera de dicha √°rea. 



En `Python` se pueden diferenciar 3 tipos de scopes:

1. **Global**: variables (u objetos si se desea) definidas en el cuerpo del c√≥digo.
2. **Local**: variables definidas dentro de una funci√≥n.
3. **Built-in**: variables predefinidas por el modulo built-in's (como ```print()``` por ejemplo.)


In [37]:
def suma(a, b):
    c = a + b
    return c


suma(10, 15)

25

Notemos que si intentamos inspeccionar `c`, el int√©rprete nos va a indicar que no est√° definida: 

In [38]:
c

NameError: name 'c' is not defined

Esto es porque `c` se defini√≥ dentro del scope de la funci√≥n `suma` y no sobre el scope global.

> **Pregunta ‚ùì**: ¬øQu√© suceder√° en la siguiente celda?

In [39]:
n = 5

def suma_n(a):
    n = 10
    c = a + n
    return c

suma_n(10)

20

In [40]:
n

5

En este caso, la instrucci√≥n `n = 10` hace que `n` se modifique en el scope local de la funci√≥n `suma_n`, pero esto no modifica el valor de `n` en el scope global (el de afuera).


#### Locals

Pueden ver que variables hay en el scope local usando la funci√≥n `locals()`

In [41]:
n = 5

def suma_n(a):
    n = 10
    c = a + n
    print(f'Las variables locales de la funci√≥n son {locals()}')
    return c


In [42]:
suma_n(10)

Las variables locales de la funci√≥n son {'a': 10, 'n': 10, 'c': 20}


20

> **Ejercicio üíª**

Dentro de una funci√≥n tambien se puede modificar el valor de una variable en el scope global. Consulte la keyword `global` y utilicela para programar esta funcionalidad. 

---

## Parte 3: Programaci√≥n Funcional con Lambda: Map, Filter y Reduce

<br>
<br>

<div align='center'>
<img alt="Map, filter y reduce" src="./resources/map_filter_reduce.jpeg" width=600/>
</div>
<br>

<div align='center'>Fuente: <a href='https://towardsdatascience.com/accelerate-your-python-list-handling-with-map-filter-and-reduce-d70941b19e52'>Map, Filter And Reduce In Pure Python</a><div/>


En ciencia de datos, la utilidad de las funciones ```lambda``` generalmente se asocia a las operaciones ```map()```, ```filter()``` y ```reduce()``` usando el modulo functools). Est√°s operaciones se denotan como **funciones de orden superior** pues reciben otra funci√≥n como argumento. 

### Map

```map()``` permite aplicar la funci√≥n objetivo sobre una coleccion (como una lista) elemento por elemento, el resultado es un objeto tipo ```map``` que entre sus caracter√≠sticas es un iterable.


In [43]:
# Ejemplo iterativo usando for

def al_cuadrado(x):
    return x**2

lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = []

for i in lista:
    c = al_cuadrado(i)
    lista_al_cuadrado.append(c)

lista_al_cuadrado

[1, 4, 9, 16, 25, 36]

Podemos reescribir esta funci√≥n usando `map` como:

In [44]:
def al_cuadrado(x):
    return x**2

lista = [1, 2, 3, 4, 5, 6]
map(al_cuadrado, lista)

<map at 0x1d65c6b6100>

Notemos que `map` retorna un iterable (un objeto que puede ser iterado, pero que a√∫n no ha sido generado). Para evaluarlo, podemos utilizar la funci√≥n `list`:

In [45]:
 # Retorna un iterable. Para evaluarlo, usar list(map)
    
def al_cuadrado(x):
    return x**2

lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = list(map(al_cuadrado, lista))
lista_al_cuadrado

[1, 4, 9, 16, 25, 36]

### Funciones lambda

Cuando se trabaja con funciones simples, la notaci√≥n ```def``` puede ser 
lenta e innecesaria. En este contexto, Python posee las funciones **lambda**. Estas se pueden considerar como un an√°logo de las funciones. 

> **Ejemplo üìñ**

La sintaxis es bastante sencilla. Por ejemplo, la funci√≥n `al_cuadrado`

In [None]:
def al_cuadrado(x):
    
    return x**2

al_cuadrado(10)

Esta se puede reemplazar por


In [46]:
al_cuadrado = lambda x: x ** 2

al_cuadrado(10)

100

In [47]:
suma = lambda x,y : x+y
suma(4, 15)

19

Es decir, se sigue la sintaxis:

```python
lambda param_1, param_2, ..., param_n : accion
```


#### Map y funciones lambdas

Podemos definir `al_cuadrado` en una sola linea usando una funci√≥n lambda. Esto hace el c√≥digo a√∫n m√°s compacto y funcional (y de paso, *anonimiza* la funci√≥n):

In [49]:
lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = list(map(lambda x: x**2, lista))
lista_al_cuadrado

[1, 4, 9, 16, 25, 36]

> **Pregunta ‚ùì**: ¬øCual es la diferencia entre Map y List Comprehension? ¬øSe pueden obtener los mismos resultados con ambos acercamientos?

In [48]:
lista = [1, 2, 3, 4, 5, 6]
lista_al_cuadrado = [x**2 for x in lista]
lista_al_cuadrado

[1, 4, 9, 16, 25, 36]

### Filter

La funci√≥n ```filter()``` permite mantener elementos de un arreglo seg√∫n el valor de verdad asociado a cada uno por la funci√≥n objetivo.


In [50]:
lista = [1, 2, 3, 4, 5, 6]

# Mantener solo numeros pares
list(filter(lambda x: x % 2 == 0, lista))

[2, 4, 6]

In [51]:
# combinando ambas operaciones:
list(filter(lambda x: x % 2 == 0, map(lambda x: x**2, lista)))

[4, 16, 36]

En List Comprehension:

In [53]:
lista = [1, 2, 3, 4, 5, 6]
[x**2 for x in lista if x**2 % 2 == 0]

[4, 16, 36]

### Reduce

`reduce()` permite acumular valores de izquierda a derecha seg√∫n una funci√≥n sobre alg√∫n iterable. La idea es reducir la lista a un solo valor seg√∫n la funci√≥n estipulada.
El primer argumento de los 2 de la funci√≥n a pasar es el valor acumulado y el segundo es el valor siguiente de la secuencia.

> **Nota üìñ**: Esta funci√≥n debe ser *importada* desde el m√≥dulo `functools`.

Por ejemplo:

```python
fun = lambda x, y: x + y
functools.reduce(fun, [1, 2, ,3, 4, 5])
```

Al ejecutar esta l√≠nea, por cada iteraci√≥n se calcula:

0. `fun(0, 1)`
1. `fun(1, 2)`
2. `fun(fun(1, 2), 3)` 
3. `fun(fun(fun(1, 2), 3), 4)`
4. `fun(fun(fun(fun(1, 2), 3), 4), 5)`

Lo que en resumidas cuentas calcula:
```python
0 + ((((1+2)+3)+4)+5) = 15
```
`reduce` tambi√©n tiene un tercer (opcional) argumento, `initializer`, si este es entregado se utiliza como primer elemento en el calculo acumulativo, por lo que si en el caso anterior se tuviera

```python
functools.reduce(fun, [1, 2, ,3, 4, 5], 8)
```

el resultado ser√≠a,

```python
8 + ((((1+2)+3)+4)+5) = 23
```


In [54]:
# importamos la funci√≥n usando la siguiente instrucci√≥n:
from functools import reduce

lista = [1, 2, 3, 4, 5]

# Sumar todos los elementos
reduce(lambda a, b: a + b, lista)

15

In [55]:
reduce(lambda a, b: a + b, lista, 8)

23

In [56]:
lista = [1, 2, 3, 4, 5]

reduce(lambda a, b: a * b, lista)

120

Otro ejemplo, combinando if else m√°s reduce, podemos encontrar el m√°ximo de una lista:m

In [57]:
# Encontrar el m√°ximo
lista = [1, 2, 30, 4, 5]

reduce(lambda a, b: a if a > b else b, lista, 0)

30

---
> **Ejercicios para practicar programaci√≥n funcional üíª**

1. En strings el m√©todo ```.upper()``` permite transformar el contenido en may√∫sculas. Cree la funci√≥n ```to_upper(texto)``` que toma un caracter (un string de largo 1) y retorna una versi√≥n en may√∫sculas. Luego, utilice la funci√≥n `map()` sobre cada caracter del string.


2. El m√©todo ```.split()``` permite obtener todas las palabras de un string. Por otra parte, la funci√≥n ```len()``` permite obtener el largo de un arreglo o cantidad de letras en una palabra. Cree la funci√≥n `separador()` que separe un texto por espacios (`' '`) y quite todas aquellas palabras de tama√±o 3 o menos usando `filter()`. 

3. Cree la funci√≥n `mayus_r()` la cual transforme a may√∫sculas todas las palabras que terminen en 'r'. Considere  adem√°s cada palabra como una lista y acceda la √∫ltima letra con el slice correspondiente. Utilice ```map()``` m√°s las herramientas que crea necesarias para resolver este problema.

4. Cree la funci√≥n `promedio(lista)` la cual calcule el promedio usando solo las funciones `reduce()` y `len()`

4. Cree test unitarios independientes que prueben estas funciones.

---

In [None]:
# Pueden usar este texto de ejemplo para hacer los ejercicios

texto_ejemplo = """
Bud√≠n de zapallos italianos

Una tradicional receta chilena, que siempre me ha gustado mucho.
Ac√° estamos en plena temporada de zapallos italianos y aunque a√∫n no he cosechado ninguno en casa, 
si lo he estado haciendo en una de las huertas donde trabajo de voluntaria. 
Esta receta ya estaba en el blog, pero la estoy re-publicando con fotos nuevas y mas lindas. 
¬øCu√°l es tu manera favorita de preparar los zapallos italianos?
Recuerden siempre probar los zapallos crudos y descartarlos si est√°n amargos, 
no hay nada peor que cocinarlos y descubrir al momento de servir que hab√≠a uno malo.
Fuente: https://www.enmicocinahoy.cl/pastel-zapallos-italianos/"""

In [None]:
# solo nombres de las funciones, falta agregar sus par√°metros.

def to_upper():
    pass

def separador():
    pass

def mayus_r():
    pass

def promedio():
    pass

---

---

## Parte 4: Referencias

<br>

Consideremos el siguiente ejemplo:

In [58]:
lista_1 = [1, 2, 3, 4, 5]
lista_2 = lista_1

In [59]:
lista_1.append(10)
lista_1

[1, 2, 3, 4, 5, 10]

In [60]:
lista_2

[1, 2, 3, 4, 5, 10]

In [61]:
lista_2.append(100)

In [62]:
lista_1

[1, 2, 3, 4, 5, 10, 100]

> **Pregunta ‚ùì:** ¬øPor qu√© al modificar `lista_1`, los cambios tambi√©n se ven reflejados en `lista_2`?

Cuando asignamos una lista a una variable, lo que guardamos en la misma es en realidad una referencia a la lista y no la lista en s√≠. 

> Referencia seg√∫n la *RAE* : 9. f. Ling. Relaci√≥n que se establece entre una expresi√≥n ling√º√≠stica y aquello a lo que alude.

Por lo tanto, al copiar la variable a otra lo que hicimos fue copiar la referencia y no sus valores. Podemos analizar las referencias de cada variable (lugar en la direcci√≥n de memoria donde se encuentran los datos) a trav√©s de la funci√≥n `id`:

In [None]:
print(f'Identificador lista_1: {id(lista_1)}\nIdentificador lista_2: {id(lista_2)}')

> **Nota**: Si realmente queremos copiar un arreglo (y cu√°lquier colecci√≥n y estructura compleja en general) debemos utilizar la funci√≥n `deepcopy()`

In [63]:
from copy import deepcopy

lista_1 = [1, 2, 3, 4, 5]

lista_3 = deepcopy(lista_1)

lista_1.append(10)

lista_1

[1, 2, 3, 4, 5, 10]

In [64]:
lista_3

[1, 2, 3, 4, 5]

In [None]:
print(f'Identificador lista_1: {id(lista_1)}\nIdentificador lista_3: {id(lista_3)}')

En general, Python asignar√° identificadores distintos cuando creemos listas y diccionarios:

In [65]:
d_1 = {'key_1': 'Hola'}
d_2 = {'key_1': 'Hola'}

print(f'Identificador dict_1: {id(d_1)}\nIdentificador dict_2: {id(d_2)}')

Identificador dict_1: 2020214211136
Identificador dict_2: 2020214230080


¬øQu√© pasa ahora con los elementos inmutables como los strings?

In [66]:
s1 = 'Hola'
id(s1)

2020214228656

In [67]:
s2 = 'Hola'
id(s2)

2020214228656

In [68]:
id(d_1['key_1'])

2020214228656

¬øY si le concatenamos otro string (similar al `append` del inicio)?

In [69]:
s3 = s1 + ', qu√© tal?'
id(s3)

2020185546064

> **Pregunta ‚ùì**: ¬øPor qu√© no se conserva el id?

## Parte 5: Control de Versiones con Git üîÉ

Un **sistema de control de versiones (VCS)** es una herramienta que permite registrar cambios realizados en carpetas y archivos de un proyecto. Con tal registro es posible:

- Regresar a un estado anterior para deshacer errores.
- Colaborar de manera sincronizada a trav√©s de la nube.

Al trabajar en equipo, un sistema de control de versiones ayuda a identificar:

- Qu√© cambios fueron hechos.
- Qui√©n/nes hicieron los cambios.
- Cu√°ndo fueron hechos.

**`Git`** es una herramienta de este tipo y es la que usaremos en el curso. Es software libre y lo pueden encontrar en https://git-scm.com/. 

<div align="center">
    <br>
<img src="./resources/git_logo.png" alt="Git" width=200/>
    <br>
</div>

> **Pregunta ‚ùì**: ¬øEs el control de versiones y git solo para equipos?


### Formas de usar `git`

Hay dos formas de utilizar git: 

1. Desde la consola de comandos.
2. Desde alguna aplicaci√≥n con interfaz visual (como [Github desktop](https://desktop.github.com/), [Gitkraken](https://www.gitkraken.com/) o incluso a trav√©s de plugins de su editor de c√≥digo favorito).



---

### Instalaci√≥n e Inicializaci√≥n

La instalaci√≥n de `git` la pueden hacer a trav√©s de:

- Windows: Instalador que encuentran en la [p√°gina oficial](https://git-scm.com/downloads).
- MacOS: 

```bash
brew install git
```

- Linux (ubuntu): 

```bash
sudo apt-get update
sudo apt-get install git
```


Una vez realizada, es necesario configurar la identidad de quien lo va a utilizar.
Esto se hace por medio de:
    
```https://git-scm.com/
$ git config --global user.name "Nombre-Usuario"
$ git config --global user.email mail@ejemplo.xyz
```


## Repositorio

Un repositorio es un conjunto de carpetas y archivos en el que se almacena el c√≥digo de un proyecto m√°s el historial de cambios de cada archivo. Git administra los registros a trav√©s de archivos en una carpeta oculta llamada `.git`.

<img src="./resources/ejemplo_proyecto.jpg" alt="Ejemplo de repositorio" style="width: 600px;"/>

<center>Un ejemplo de un repositorio t√≠pico de un proyecto basado en python (Fuente: https://github.com/fabiommendes/python-boilerplate)</center>




> **Pregunta ‚ùì**: ¬øCu√°l es la funcionalidad de Github, Bitbucket, Gitlab, etc...?

## Git es Distribuido

<div align="center">
<img src="./resources/git_distributed.png" alt="Git es distribuido" style="width: 600px;"/>
<center>Fuente: https://www.edureka.co/blog/what-is-git/</center>
</div>

El repositorio central se encuentra en alg√∫n servidor (ejemplo: Github, Bitbucket,etc...)

Cada programador mantiene una copia del repositorio en su computador local. Veremos las consecuencias de esto m√°s adelante.
    



## Primeros Pasos (`git init` y `git clone`)
 
    
- Para inicializar un repositorio desde cero, usamos:

```bash
git init nombre-del-repo
```

- Para clonar un repositorio (es decir, copiar un repositorio a tu almacenamiento local desde alg√∫n servidor github, gitlab, bitbucket u otro servidor de git):

```bash
git clone /ruta/al/repo.git
```


- Para inicializar un repositorio en alg√∫n servicio de repositorios remotos, como github.

> Visitar la p√°gina del servicio.

### Estado del proyecto

> **Nota üìì**: Desde aqu√≠ en adelante hablaremos solo de nuestro repositorio local (ejemplo_mds7202) a menos que se indique lo contrario.


La idea general de git es ir guardando *snapshots/capturas* (**commits**) en el historial que registran y consolidan los cambios. Esto puede ser visto como un grafo en donde cada nodo es un **commit** o una captura de como se ve√≠a el repositorio en ese entonces:

<img src="./resources/git_basico.png" alt="Git b√°sico" width=600/>

### `git status`


Una operaci√≥n simple de entender es el comando ```status```. Este permite tener una idea del estado actual del repositorio. Este se ejecuta por medio del comando :

```bash
git status
```


Al clonar el repositorio, por defecto veremos el √∫ltimo commit. Por ejemplo, para el proyecto [ejemplo_MDS7202](https://github.com/pbadillatorrealba/ejemplo_MDS7202.git) que tiene ya varios archivos:

<img src="./resources/ejemplo_repo_0.jpg" alt="Ejemplo de un proyecto 2" width=400/>


Al ejecutar `git status`, la consola imprimir√°: 


<img src="./resources/git_status_0.jpg" alt="Git status" width=700/>




#### Cambios

Supongamos que ahora agregamos los archivos `new_class.py` y `test_new_class.py` (recalcados en verde):


<img src="./resources/ejemplo_repo_2.jpg" alt="Ejemplo de un proyecto 2" width=400/>


Al ejecutar `git status` nos muestra:


<img src="./resources/git_status_1.jpg" alt="Git status" width=600/>


Como podr√°s haber visto, `git status` detect√≥ cambios y los indic√≥ en color rojo.


## Ciclo de Vida de los Archivos üóÑÔ∏è

`Git` permite llevar un registro de los cambios del proyecto por medio de la asignaci√≥n de ciclos de vida a los archivos.

Visto de manera sencilla, se puede decir que en `git` existen 4 tipos de archivos:

- no rastreados o `untracked`.
- no modificados o `unmodified`.
- modificados o `modified`.
- listos para ser consilidados o `staged`.

Las interacciones son las siguientes:

<img src='./resources/lifecycle.png' width=600/>




### Staging Area

La staging area consiste en el conjunto de archivos modificados que a√∫n no han sido aprobados para formar parte del repositorio ni de su registro de cambios, pero que est√°n a un paso de serlos.


Para que un archivo que ha sido modificado (`modified`) pase a ser parte de la staging area, debe estar *marcado* como `staged`. Esto puede ser realizado a trav√©s de `git add`:

```bash 
# Caso de un archivo:
git add path/to/file.py

# Caso de una carpeta:
git add path/*

# Caso de todos los cambios:
git add --all
```

Si agregamos `src/new_class.py` ahora ejecutamos `git status`, veremos algo como esto:

<img src="./resources/git_status_2.jpg" alt="Git status" width=700/>


> **Pregunta ‚ùì**: ¬øQu√© pasa si agrego un archivo al staging area y despu√©s lo modifico?

- Finalmente un archivo del repositorio puede no ser marcado como tracked, por lo que al modificarse, no pasa a ser parte del √°rea de montaje. Este tipo de archivos de denota como **untracked**. 

### Commit o C√≥mo Consolidar Archivos

Realizar un commit permite es capturar una instantanea de los archivos `staged` del repositorio y agregarlos a su historial de cambios.

Para ello utilizo:

```bash
git commit
```

Esto abrira un archivo en su editor de texto prederminado donde deber√°n dejar un mensaje de que cambios hicimos y porque. 

Si desean dejar una descripci√≥n peque√±a de los cambios, simplemente podemos agregar el par√°metro `-m`

```bash
git commit -m "Mi mensaje aqu√≠"
```

Hacer un commit har√° que los archivos `staged` pasen a ser `unmodified`.


> **Pregunta ‚ùì**: ¬øQu√© pasa con los archivos `untracked` hago un `commit`?

## Comandos √∫tiles


#### `git log`

Para observar el rgistro de cambios se utiliza ```git log```, al ejecutar este comando se aprecia la estructura de un commit: este consta de un autor, momento de realizaci√≥n de la modificaci√≥n y un **hash** identificador del cambio. 

<img src="./resources/git_log.jpg" alt="Git log" width=600/>

Observa que cada commit tiene su propio identificador **hash** (n√∫meros y letas despu√©s de la palabra commit).

## Git Ignore

En algunos proyectos, como producci√≥n de archivos en LaTex, se generan archivos colaterales como logs y pdfs. Es posible ignorar este tipo de archivos en el repositorio. Para ello se genera un archivo ```.gitignore``` en la carpeta raiz listando archivos y carpetas no deseados en cada linea.

<img src="./resources/ejemplo_gitignore.jpg" alt="Git log" width=500/>



## Deshacer Cambios ‚¨ÖÔ∏è

#### Eliminar del area de montaje

¬øQu√© ocurre si se agrega accidentalmente un archivo al √°rea de montaje? 

```bash
git reset HEAD
```

Nota: esto eliminar√° todos los archivos con cambios que hayan sido agregados al area de montaje.

#### Deshacer cambios de un archivo:


Si por otra parte, un archivo ```folder/file``` ya fue consolidado y se desean revertir los cambios al commit anterior, es posible usar el comando 

```bash
git checkout -- folder/file
```


Al igual que ```diff```, el comando ```checkout``` puede realizar m√∫ltiples funciones. Es posible volver a una versi√≥n (commit) anterior de cierto archivo utilizando la sintaxis:

```bash
git checkout commit-hash folder/file
```

Y si quieres retornar todos los archivos a un commit anterior, puedes usar:
    
```bash
git checkout commit-hash
```

## Branches y Colaboraci√≥n

### Branches

Una rama o **branch** es un mecanismo que nos permite trabajar en un ambiente independiente del c√≥digo principal.


<img src="./resources/branch.png" alt="Branch" width=500/>

<center>Fuente: https://www.atlassian.com/es/git/tutorials/using-branches</center>

Al crear una branch, se "replican" los elementos de la rama desde donde se origin√≥. Todos los commits que hagamos se har√°n en la branch que creamos. Luego, podemos juntar los cambios a trav√©s de un `merge`.


> **Pregunta ‚ùì**: Imag√≠nense que estamos construyendo una app para gestionar pedidos de comida. ¬øQu√© beneficios nos entrega trabajar con ramas?

#### Comandos

**Ver las ramas disponibles**


```bash
git branch
```

Permite ver las ramas disponibles en el repositorio.

**Crear ramas**

```bash
git branch new-branch
``` 

permite crear una rama con nombre *new-branch*. 

**Cambiar de ramas**

Para cambiar a la nueva rama, hacemos uso de 

```bash
git checkout new-branch
```

Para cambiar en general a cualquier rama:

```bash
git checkout <nombre-rama>
```

Un atajo para crear una nueva rama y acceder inmediatamente es el comando: 

```bash 
git checkout -b new-branch
```

### Merge

La gran ventaja de trabajar con ramas viene de unir posteriormente los resultados y registros, esto se denomina **merging**. Para unir dos ramas se utiliza el comando:

```bash
git merge source_branch destination_branch
```

<img src="./resources/merge.png" alt="Gitflow" width=600/>

<center>Fuente: https://www.atlassian.com/es/git/tutorials/using-branches/git-merge<center/>
   
    
<br>
    
Usando esta opci√≥n, git intentar√° unir el trabajo de ambas branch de forma autom√°tica.    
    
> **Pregunta ‚ùì**: ¬øQu√© pasa cuando dos personas trabajan en las mismas lineas de c√≥digo?

### Conflictos üò•

Finalmente, es posible que existan colisiones en el trabajo realizado dentro de distintas ramas.
Estas ocurren cuando 2 personas trabajan en las mismas lineas de c√≥digo y luego intentan unir sus cambios. Estas colisiones se denominan **conflictos** .

Comunmente uno deber√° resolver estos conflictos a mano y luego subir los cambios.

En el siguiente ejemplo se muestra que es lo que ocurre cuando git detecta conflicto que no pudo resolver por cuenta propia:

<img src="./resources/git_conflicto.jpg" alt="Gitflow" width=750/>


Al usar un IDE (Entorno de desarrollo integrado) como `vscode`, tenemos cuatro opciones disponibles:
    
- Conservar los cambios actuales (los que est√°n en la rama que hizo el merge)
- Conservar los cambios entrantes (los que vienen en la rama entrante)
- Aceptar ambos cambios
- Resolver manualmente que conservar y que descartar.

---

## Repositorios Remotos üì°

Ya sabemos iniciar repositorios y clonarlos. 
En el segundo caso, `git` registra el repositorio original del cual se obtuvo un clon, tal repositorio original se denota como **remoto**. Tal informaci√≥n se almacena con un nombre y una direcci√≥n (local o url). 

El comando ```git clone ruta``` permite nombrar el repositorio clonado por medio de ```git clone ruta nombre_clon```. 


La ventaja de este sistema de almacenamiento de rutas remotas, es que permite sincronizar el trabajo tanto en una m√°quina local, como en colaboraciones por medio de internet. 

#### Pull

La comunicaci√≥n entre repositorios se hace por medio de intrucciones especiales, una de ellas es ```pull```. 

```git pull``` permite obtener el registro de cambios de un repositorio remoto, e incluso, una rama de tal repositorio. La sintaxis es:

```bash
git pull repo_remoto rama
```

Con este comando, se toma toda la informaci√≥n del repositorio ```repo_remoto``` y se une directamente con el repositorio actual (*merging*).

#### Push

Por otra parte, es posible enviar cambios a un repositorio remoto, esto se hace por medio de ```git push```. La sintaxis es an√°loga: 

```bash
git push repo_remoto rama
```

## Flujo de trabajo de Gitflow ü§ù
 
 

Existen varios tipos de flujos de trabajo usando branch. Uno de ellos es Gitflow.
<div align="center">
    <img src="./resources/gitflow.png" alt="Gitflow" width=600/>
    <div>
    Fuente: <a href="https://www.atlassian.com/es/git/tutorials/comparing-workflows/gitflow-workflow">
Gitflow Workflow
</a>
    </div>
</div>


Si tienen dudas o quieren profundizar a√∫n mas en git, pueden visitar:
    
[https://www.atlassian.com/es/git/tutorials](https://www.atlassian.com/es/git/tutorials)

Tiene exelentes tutoriales en espa√±ol.

## Trunk Based ü§ù

<div align="center">
<img src="./resources/trunk_based.png">

<div>
Fuente: <a href='https://dev.to/marianocodes/por-que-trunk-based-development-i5n'> ¬øPor qu√© Trunk-Based Development? </a>
</div>
</div>

### Torpedo Git (por Atlassian)


https://wac-cdn.atlassian.com/es/dam/jcr:e7e22f25-bba2-4ef1-a197-53f46b6df4a5/SWTM-2088_Atlassian-Git-Cheatsheet.pdf?cdnVersion=264

### Ejercicio 


> Ejercicio üìñ: Clonar el repositorio del curso desde el repositorio remoto github: https://github.com/pbadillatorrealba/MDS7202

El elemento cambi√≥ porque le pasamos una referencia de la lista a la funci√≥n. NO una copia de esta.