# Git y Github

Los objetivos de aprendizaje son:

1. ¿Qué es Git?
    - Control de versiones
    - Control de versiones distribuido
2. Uso básico
    - Crear un nuevo repo
    - Añadir Archivos
    - Commit
3. Staging
4. .gitignore
5. ¿Qué no añadir a un repo?
6. SHA
7. Git Log
8. Regresar en el tiempo
9. Branchs
    - Merging
    - Rebase
    - Cherry-Picking
10. Repositorios Remotos
    - Clone
    - Fetch
    - Pull
    - Push 
    - PRs
    
## ¿Qué es Git?

¿Alguna vez has trabajado en un proyecto que dejó de funcionar después de realizar un cambio? y ¿después de hacer el cambio no estabas muy segur@ de cómo recuperarlo? **Git puede ser la solución**


Git es un sistema de control de versiones distribuido (DVCS), es decir:


- **Sistema de control de versiones**: Es un conjunto de herramientas que rastrean el historial de cambios de un conjunto de archivos, a.k.a. Repositorio. Git también permite comparar archivos entre diferentes versiones (commits), así como recuperar un archivo (o todos los archivos) de cualquier versión dentro del historial del repositorio.


- **Distribuido**: Git no tiene un servidor central con la versión definitiva del repositorio. Todos los usuarios tienen una copia completa del repositorio.

## Uso básico

Comenzaremos trabajando con Git en local. Una vez que lo dominemos, agregaremos GitHub.


### Crear un nuevo Repo

Primero configuraremos nuestro nombre de usuario, recomiendo usar el mismo nombre de usuario que en GitHub.

``` shell
!git config --global user.name "nombre de usuario"
```


In [None]:
!git config --global user.name 

Primero necesitaremos un repositorio para trabajar. Para ello crearemos un nuevo proyecto con poetry

In [None]:
!poetry new git-test

Ahora cambiaremos al directorio del repositorio dentro del kernel para poder ejecutar los comandos desde acá.

In [None]:
import os 
os.chdir("./git-test")

Verificamos:

In [None]:
!ls

Para inicializar git ejecutaremos el siguiente comando:

In [None]:
!git init

Con el repositorio inicializado podemos usar el comando `git status` para ver el estatus de nuestro repo.

In [None]:
!git status

Esto muestra:

- **On branch master**: En qué rama estamos `master` (hablaremos de las ramas más adelante)
<br>

- **No commits yet**: Significa que todavía no hay cambios versus la última versión registrada del repo.
<br>

- **Untracked files**: Una lista de los archivos que no son parte del repositorio y que no están bajo control de versión.
<br>

- **nothing added to commit but untracked files present (use "git add" to track)**: Sin diferencias con la última versión registrada, pero sí identifica archivos que no están siendo rastreados por el control de versiones.

### Añadir Archivos

Podemos añadir los archivos no rastreados al sistema de control de versiones usando el siguiente comando:

In [None]:
!git add README.rst

Veamos el estatus

In [None]:
!git status

**Changes to be committed**: Indica que el estado actual de la rama `master` tiene una diferencia vs la última versión registrada.

Podemos añadir el resto de archivos usando el siguiente comando:

In [None]:
!git add .

In [None]:
!git status

### Commit

Cuando hacemos *commit* de los cambios le estamos diciendo a Git que haga una "fotografía" del estado actual del repo y que confirme todos los cambios propuestos como válidos para esta siguiente versión.

Para hacer *commit* debemos ejecutar el siguiente comando:

In [None]:
!git commit -m "Inicializando proyecto."

El comando *commit* regresa info de lo que acabamos de hacer, la mayoría no es tan útil. Lo más relevante es el SHA de la confirmación `(root-commit) <SHA>`, hablaremos de esto más adelante.


Veamos el estatus:

In [None]:
!git status

## Staging


El área de `Staging` es en dónde Git realiza un seguimiento de los cambios que queremos que estén en el próxima *commit*.

Cuando ejecutamos `git add README.rst` le dijimos a Git que queríamos mover el nuevo archivo `README.rst` al área de `staging`. El archivo pasó de la sección sin seguimiento a la sección *to-be-commited*.


>**Nota**: En `Staging` se refleja el contenido exacto del archivo cuando ejecutamos `git add`, Si modificamos el archivo aquí, el archivo aparecerá tanto en `Staging` como en `unstaged`.

Veamos qué significa esto, primero abriré el archivo `README.rst` y añadiré "Hola":

In [None]:
!git status

Git ha detectado cambios no registrados por el sistema de control de versiones (SCV) en el archivo.

In [None]:
!git add README.rst

In [None]:
!git status

Hemos añadido los cambios, y de esta manera están listos para formar parte de la siguiente versión.

Ahora modificaré el archivo `README.rst` añadiendo "Hola Mundo.":

In [None]:
!git status

Con Git, en un punto dado (sin contar con todo el historial de versiones) pueden existir tres versiones de un mismo archivo: 

- **Changes not staged for commit**: La versión que estamos editando en nuestro disco duro.
<br>

- **Changes to be committed**: La versión que Git almacena en `Staging`, i.e. últimos cambios añadidos.
<br>

- **La última versión registada en el repo**: La versión generada después de usar `git commit`. 

Ahora añadiremos los últimos cambios y haremos commit.

In [None]:
!git add .

In [None]:
!git commit -m "feat: update README file."

Veremos que se ha generado un nuevo SHA, `master <nuevo SHA>`.

## .gitignore

A veces querremos que git no vea algunos archivos, e.g. un archivo con credenciales. Ahí es donde entra el archivo .gitignore.

Crearemos un archivo `credenciales.py` en la práctica esto se hace mediante el uso de variables de entorno, y en desarrollo local suelen guardarse en un archivo llamado [`.env`](https://www.python-engineer.com/posts/dotenv-python/)

In [None]:
!echo "#credenciales" > ./credenciales.py

In [None]:
!git status

Para que se ignorar el archivo `credenciales.py` (y su contenido), agregaremos un archivo .gitignore a nuestro repositorio.

In [None]:
!echo "credenciales.py" > .gitignore

In [None]:
!git status

Ahora ya no aparece el archivo `credenciales.py`, no obstante sí vemos el nuevo archivo `.gitignore`, que es un archivo que debemos añadir al SCV.

In [None]:
!git add .gitignore && git commit -m "feat: add gitignore file."

In [None]:
!git status

## ¿Qué no añadir a un repo?

No debemos poner todos los archivos dentro del SCV, existen limitaciones, así como problemas de seguridad que debemos tener en consideración, una regla sencilla es:

> Solo añadir source files, nunca los archivos generados.

En este contexto, un source files es cualquier archivo que hagamos nosotros, generalmente escribiendo en un editor. Un archivo generado es algo que crea la computadora, generalmente al procesar un source files.

al usar Git, y especialmente cuando trabajemos con GitHub, nunca debemos colocar información confidencial en un repositorio.

## SHA

Cuando Git almacena cosas (archivos, directorios, confirmaciones, etc.) en su repositorio, las almacena mediante el uso de una función hash. 

una función hash toma una cosa y produce un identificador único para esa cosa que es mucho más compacta (20 bytes, en nuestro caso). Este ID se llama "SHA" en Git.

Git usa los SHAs para indexar todo en su repositorio. Cada archivo tiene un SHA que refleja el contenido de ese archivo. Cada directorio, a su vez, tiene SHA. Si un archivo en ese directorio cambia, el SHA del directorio también cambia.

Cada *commit* contiene el SHA del directorio padre dentro de nuestro repo, junto con otra info, así es como un número de 20 bytes describe el etado completo de nuestro Repo.


```` shell
commit e12848ab4c8af3a310af30953dace79833f477eb 
````

## Git Log

Muestra el historial de *commits* realizados hasta este momento:

In [None]:
!git log

## Regresar en el tiempo

Debido a que Git recuerda cada *commit* realizado y su SHA, puedemos decirle a Git que vaya a cualquiera de esos *commits* para ver el repositorio tal como era en ese momento.

Contenido actual del archivo README.rst:
``` rst
Hola Mundo.

```


Para regresar el estado original usaremos el commando:

In [None]:
!git checkout a36c792b088bd9365c8ed14ae23427167b53ad76

In [None]:
!git log

Vamos a procesar la nueva terminología:

- **HEAD**: Es el nombre de Git para cualquier SHA que estemos viendo al momento. **NO** significa lo que está en el sistema de archivos o lo que está en `Staging`. Entonces, si editamos un archivo, la versión en el sistema de archivos es diferente a la versión en HEAD.


- **branch**: Es una "etiqueta" que le damos a un SHA. Tiene algunas otras propiedades que son útiles, pero por ahora, pensemos en una rama como una etiqueta de un SHA.


Por tanto:

- **detached HEAD**: Significa que nuestro HEAD apunta a un SHA que no tiene una rama ( etiqueta) asociada.


Si miramos el directorio del repo veremos que el archivo .gitignore no está y que el archivo README.rst está vacío, justo el estado del primer *commit*.

Bien. Ahora, ¿cómo volvemos a donde estábamos? Hay dos formas, una de las cuales es igual que hicmos antes para volver al primer *commit*.

La otra es mediante un *checkout* a la rama (branch) master.

In [None]:
! git checkout master

Esto nos devolverá al último *commit* SHA de la rama master, que en nuestro caso tiene el mensaje "feat: add gitignore file."

## Branchs

Las ramas (*branchs*) brindan una manera de mantener separados los flujos de desarrollo. Si bien esto puede ser útil cuando trabajamos solo, es esencial cuando trabaja en equipo.

Imaginemos que estamos trabajando en un equipo, y que estamos desarrollando una funcionalidad para agregar al proyecto. Mientras trabajamos en ello, no quierremos agregar los cambios a la rama principal `master`, ya que todavía no funcionan correctamente y podría estropear el código.


Podríamos esperar para hacer *commit* de los cambios hasta terminar por completo, pero eso no es muy seguro y no siempre es práctico. Entonces, en lugar de trabajar sobre la rama `master`, crearemos una nueva rama:


In [None]:
!git checkout -b feat/add_func

In [None]:
!git status

Usamos la opción `-b` del comando `checkout` para creara una nueva rama.

Al ejecutar `git status` git muestra que el nombre de la rama ha cambiado. Veamos el log:

In [None]:
!git log

Cuando creamos una nueva rama, ésta comenzará desde la ubicación en la que estábamos. En este caso, estábamos en la parte superior de `master`.

Ahora, crearemos una nueva feature:

In [None]:
!echo "'Neva feature python'" > ./git_test/feature.py

In [None]:
!git status

In [None]:
!git add git_test/feature.py

In [None]:
!git commit -m "feat: new feature in python."

Si revisamos el log, veremos un nuevo commit:

In [None]:
!git log

Regresemos a `master` y miremos los logs:

In [None]:
!git checkout master && git log

El nuevo commit no está acá.

Git tiene una forma integrada de comparar el estado de dos ramas:

In [None]:
!git show-branch feat/add_func master

La info que se muestra es un poco confusa al principio. 

- **Dos primeras lineas**: El primer carácter que no es un espacio en cada línea es `*` o `!` seguido del nombre de la rama y luego el *commit message* más reciente de cada rama.
    - `*` se usa para indicar en qué rama estamos actualmente
    - `!` se utiliza para todas las demás ramas. `!` está en la columna que coincide con los *commits* en la tabla inferior.

La tercera línea es un separador.

- **Desde la cuarta línea hasta la penúltima**: se listarán los *commits* si aparecen con el símbolo `+` significará que están en la rama actual, si aparecen con el símbolo `*` significará que no están en la rama actual pero sí en la que estamos comparando.


- **Última línea**: Muestra el primer *commit* que comparten las dos ramas.

Ahora que tenemos una rama la funcionalidad desarolladoa. ¿Cómo la compartimos con el resto del equipo?

Hay tres formas principales de obtener de llevar los commits de una rama a otra:

- merging
- rebasing
- cherry-picking


### Merging

Es la forma más simple. Cuando macemos `merge` de `feat/add_func` a `master`, Git creará una nuevo *commit* que cominará los SHA más nuevos de las dos ramas. Si todas los *commits* en la rama `feat/add_func` están por delante del *commit* más nuevo de la rama `master`, simplemente se hará un `fast-foward merge`, i.e. se colocarán los nuevos *commits* `feat/add_func` por delante de los *commits* de `master`.



In [None]:
!git checkout master

In [None]:
!git merge feat/add_func

Si hubiéramos hecho cambios en `master` antes del `merge`, Git habría creado un nuevo *commit* que sería la combinación de los cambios de las dos ramas.

Una de las cosas en las que Git es bastante bueno es en comprender los ancestros comunes de diferentes ramas y fusionar automáticamente los cambios.

> **Nota**: Si la misma sección de código se ha modificado en ambas ramas, Git no puede averiguar qué hacer. Cuando esto sucede, detiene el `merge`. Esto se denomina `merge conflict`.


### Rebasing

Es similar al `merge`. En un `merge`, si ambas ramas tienen cambios, se crea un nuevo *commit* de `merge`. Al hacer `rebasing`, Git tomará los *commits* de la rama que integraremos y los reproducirá, uno a la vez, en la parte superior de la otra rama.


### Cherry-Picking

Es otro método para mover *commits* de una rama a otra. A diferencia del `merge` y `rebase`, con `cherry-picking` especificamos exactamente a qué *commits* queremos. La forma más fácil de hacer esto es simplemente especificando un solo SHA:

```shell
git cherry-pick c8290f21fc4bae610cc37734d48906828ffabac8
```

Esto le dice a Git que tome los cambios que se hicieron en c8290f21 y los aplique a la rama actual.

Esta característica puede ser muy útil cuando queremos un cambio específico pero no toda la rama en la que se realizó el cambio.

## Repositorios Remotos

Todos los comandos que hemos discutido hasta este punto funcionan solo con su repositorio local. No se comunican con un servidor o a través de la red.

Hay cuatro comandos principales de Git que pueden comunicarnos con repositorios remotos:

- clone
- fetch
- pull
- push


### Clone 

Primero crearemos un repositorio en [GitHub](https://github.com/), después usaremos su URL para clonarlo en local.

In [1]:
import os
os.chdir("..")
os.chdir("..")

In [None]:
!git clone <url>

In [None]:
!cd <repo-name> && ls

In [4]:
os.chdir("./test-curso-cac/")

Ahora tenemos el repositorioc en local. Esto incluye todos los commits y todas las `branches`.

### Push

Envía la información sobre la rama que estamos trabajando y le pregunta al `remote` si le gustaría actualizar su versión de esa rama para que coincida con la nuestra.

Antes de usar el comando `push`, actualziaremos el repo:

In [5]:
!git checkout -b feat/new-feat

Switched to a new branch 'feat/new-feat'


In [None]:
!echo "'Hola'" > ./hola.py

In [None]:
!git add hola.py

In [None]:
!git commit -m "feat: add hola"

In [None]:
!git push --set-upstream origin feat/new-feat

### Pull Request

Se trata de una manera más estructurada de integrar cambios a un repositorio remoto, de esta manera podemos incorporar:

- Revisiones: Podemos pedir a colegas que revisen nuestras cambios y añadan sugerencias.

- Workflows: Podemos añadir rutinas que verifique que los cambios propuestos cumplan con requisitos de formato o que pasen un set de pruebas, e.g. `pytest`.

Ahora iremos al repo y haremos una solicitud para integrar nuestros cambios...


¿Cómo incorporamos los cambios más nuevos a nuestro repositorio local?

### Fetch

Cuando clonamos un nuevo repositorio, Git no solo copia una sola versión de los archivos en ese proyecto. Copia todo el repositorio y lo usa para crear un nuevo repositorio en local.

Git no crea `branches` locales, excepto para `master` o `main`. Sin embargo, realiza un seguimiento de las `branches` que estaban en el servidor. Para hacerlo, Git crea un conjunto de `branches` que comienzan con `remotes/origin/<branch_name>`.

`git fetch` actualiza todas las `branches` dentro de `remotes/origin`. Solo modificará las `branches` almacenadas en `remotes/origin` y ninguna de las `branches` locales.


### Pull

Git pull es simplemente la combinación de dos comandos:

- Hace un git fetch para actualizar las `branches` dentro de `remotes/origin`.

- Si la `branch` en la que estamos está vinculada a una `branch` remota, entonces se hará un `merge` de la `branch` `remotes/origin` a nuestra `branch` local.

In [None]:
!git branch

In [None]:
!git checkout master

In [None]:
!git pull