
# Version Control (Git)


En los últimos años de mi pregrado de Ingeniería en Sistemas utilicé git para los proyectos individuales y grupales. Desafortunadamente, el uso de esta herramienta se limitó a add, commit y push.  

Después de tomar la lección Version Control (Git) del MIT, descubrí nuevas formas de utilizar y pensar con git. Así que en este ensaño pretendo resumir dicha lección con las partes que considero útiles desde mi punto de vista actual, como estudiante de Data Science.

### ¿Qué podemos hacer con git?
git es el sistema de control de versiones más utilizado en estos tiempos y resulta curioso como muchas personas como yo, lo utilizan únicamente para subir sus repositorios a github. Si algo sale mal, eliminamos el repositorio local e iniciamos una nueva copia con lo subido a github.

Pero, git es mucho más que eso.  Es una gran herramienta para el trabajo individual y grupal, nos permite saber quién escribió cada cosa en nuestro proyecto, cuando y exactamente qué.  Además, nos permite por medio de snapshots, tener un historial de estados o versiones de nuestros cambios por cada commit, y tener acceso a dichos estados, crear diferentes lineas de versiones para trabajar el mismo proyecto en versiones paralelas.  Esto resulta sumamente útil cuando se están haciendo pruebas, las cuales no son necesarias en el resultado final.

La lección menciona que el uso de git por CLI no es amigable, pero pienso lo contrario.  Es cuestión de dedicar tiempo para entender el funcionamiento principal y las opciones que ofrece para encontrarlo hermoso.

### Terminología
En git se le llama "blob" a los archivos, un directorio es llamado "tree" y por supuesto estos trees pueden contener blobs y más trees.  Un snapshot es el top-level tree, de esta forma contiene punteros a todos los blobs y trees presentes en el commit.  Un objeto es blob, un tree o un commit, y está direccionado por medio de un hash SHA-1.

### Ejemplo
Para el ejemplo se utilizará un repositorio local llamado "demo".

In [32]:
!mkdir demo


In [33]:
!cd demo && git init

Initialized empty Git repository in /home/jarminet/Desktop/Maestria/Python/demo/.git/


Al inicializar el repositorio se crea una carpeta oculta llamada .git.  Esta carpeta contiene toda la información necesaria para el proyecto, branches, commits, dirección de repositorio remoto, etc. También contiene un registro que almacena el historial de commits que permite volver al historial.

In [36]:
!cd demo/.git && ls

branches  config  description  HEAD  hooks  info  objects  refs


Dentro de la carpeta demo crearemos un archivo de prueba llamado "text.txt" con algún texto random.  Luego de esto, lo agregaremos al staging area (git add) y finalmente haremos nuestro primer commit.

In [38]:
!cd demo && echo "texto de prueba" >> text.txt

In [40]:
!cd demo/ && cat text.txt

texto de prueba


In [41]:
!cd demo && git add text.txt

In [42]:
!cd demo && git commit -m "primer commit"

[master (root-commit) 6a01ff9] primer commit
 1 file changed, 1 insertion(+)
 create mode 100644 text.txt


Ok, ya tenemos un commit.  El cual podemos ver con "git log", agregaré algunos parametros para visualizar mejor el resultado, el cual muestra el commit realizado, la fecha, y el autor.  AWESOME!

In [47]:
!cd demo && git log --all --graph --decorate

* [33mcommit 6a01ff96c4f8d763c01408b76e9dad41da75fbed[m[33m ([m[1;36mHEAD -> [m[1;32mmaster[m[33m)[m
  Author: jarminett <luissflorian@gmail.com>
  Date:   Wed Feb 10 12:12:31 2021 -0600
  
      primer commit


Crearemos otra version archivo agregando una linea de texto, luego hacemos commit para tener las dos versiones y las visualizamos nuevamente con de git log.

In [48]:
!cd demo && echo "Otra linea" >> text.txt && cat text.txt

texto de prueba
Otra linea


In [53]:
!cd demo/ && git add text.txt

In [54]:
!cd demo/ && git commit -m "segundo commit" && git log --all --graph --decorate

[master 3a2bed8] segundo commit
 1 file changed, 1 insertion(+)
* [33mcommit 3a2bed8ec3dbd5152eecc55965b88d15ca4f2834[m[33m ([m[1;36mHEAD -> [m[1;32mmaster[m[33m)[m
[31m|[m Author: jarminett <luissflorian@gmail.com>
[31m|[m Date:   Wed Feb 10 12:27:27 2021 -0600
[31m|[m 
[31m|[m     segundo commit
[31m|[m 
* [33mcommit 6a01ff96c4f8d763c01408b76e9dad41da75fbed[m
  Author: jarminett <luissflorian@gmail.com>
  Date:   Wed Feb 10 12:12:31 2021 -0600
  
      primer commit


El log muestra dos commits esta vez, se muestran la palabras HEAD y master.  Master es el default branch y HEAD indica la versión en la que nos encontramos actualmente o la última.  ¿Cómo visualizamos los cambios realizados desde el último commit?  Esto lo podemos visualizar con git diff como se muestra a continuación.

In [57]:
!cd demo/ && git diff 6a01ff9

[1mdiff --git a/text.txt b/text.txt[m
[1mindex 68dc9e6..c404a9f 100644[m
[1m--- a/text.txt[m
[1m+++ b/text.txt[m
[36m@@ -1 +1,2 @@[m
 texto de prueba[m
[32m+[m[32mOtra linea[m


El output anterior muestra en verde la linea que se agregó desde el último commit.

Ya sabemos como visualizar y hacer diferentes commits.  Es tiempo de experimentar la manera de moverse entre diferentes versiones.  Esto lo hacemos con "git checkout".

In [58]:
!cd demo/ && cat text.txt

texto de prueba
Otra linea


In [65]:
!cd demo/ && git log --all --graph --decorate --oneline

* [33m3a2bed8[m[33m ([m[1;36mHEAD[m[33m, [m[1;32mmaster[m[33m)[m segundo commit
* [33m6a01ff9[m primer commit


Se observa que nos encontramos en el segundo commit, el cual tiene como hash "6a01ff9".  La idea es cambiarnos a la version anterior del documento, el cual tenía una sola línea de texto (texto de prueba).

In [68]:
!cd demo/ && git checkout 6a01ff9 && git log --all --graph --decorate --oneline 

Previous HEAD position was 3a2bed8 segundo commit
HEAD is now at 6a01ff9 primer commit
* [33m3a2bed8[m[33m ([m[1;32mmaster[m[33m)[m segundo commit
* [33m6a01ff9[m[33m ([m[1;36mHEAD[m[33m)[m primer commit


In [69]:
!cd demo/ && cat text.txt

texto de prueba


Se observa que ahora HEAD está en el primer commit y que el archivo está en su versión incial.

 ¿Qué pasa con el working tree si agregamos otra modificación?

In [71]:
!cd demo/ && echo "tercera linea" >> text.txt && cat text.txt

texto de prueba
tercera linea


In [72]:
!cd demo/ && git status

[31mHEAD detached at [m6a01ff9
Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)

	[31mmodified:   text.txt[m

no changes added to commit (use "git add" and/or "git commit -a")


Se reporta una modificación en el archivo pero se indica que no se ha agregado al staging area y que no hay commits. ¿Qué pasa si hacemos commit?

In [73]:
!cd demo/ && git add text.txt && git commit -m "Tercer commit" && git log --all --graph --decorate

[detached HEAD f9d7934] Tercer commit
 1 file changed, 1 insertion(+)
* [33mcommit f9d7934d8463f2a19cc5c92248bdb41faf30fcc3[m[33m ([m[1;36mHEAD[m[33m)[m
[31m|[m Author: jarminett <luissflorian@gmail.com>
[31m|[m Date:   Wed Feb 10 13:01:12 2021 -0600
[31m|[m 
[31m|[m     Tercer commit
[31m|[m   
[31m|[m * [33mcommit 3a2bed8ec3dbd5152eecc55965b88d15ca4f2834[m[33m ([m[1;32mmaster[m[33m)[m
[31m|[m[31m/[m  Author: jarminett <luissflorian@gmail.com>
[31m|[m   Date:   Wed Feb 10 12:27:27 2021 -0600
[31m|[m   
[31m|[m       segundo commit
[31m|[m 
* [33mcommit 6a01ff96c4f8d763c01408b76e9dad41da75fbed[m
  Author: jarminett <luissflorian@gmail.com>
  Date:   Wed Feb 10 12:12:31 2021 -0600
  
      primer commit


Justo lo que esperabamos, se agrega un nuevo commit a nuestro working tree, y por ser el último se muestra en HEAD.

Al inicio mencioné la opción que nos brinda git para crear lineas paralelas de desarrollo, mencionando el ejemplo de realización de pruebas o fix bugs.  La forma de realizar esto es por medio de branches, nuestro brach de default es llamado master, pero podemos agregar más según nuestra conveniencia.  

Para entender el funcionamiento de los branches, debemos recordar que git no almacena copias de las diferentes versiones de los archvios, en lugar de esto almacena series de snapshots.  Cuando hacemos commit, git almacena un objeto commit que contiene un puntero al snapshot del contenido que cambiamos.  Este objeto también contiene el nombre del autor, email, date, etc.  Entonces, un branch no es más que un puntero movible a los diferentes commits, que nos permite crear líneas paralelas de desarrollo de nuestro proyecto.  Cuando entendí esto, me recordó a Steins;Gate y Back to the future, con la diferencia que con git si podemos hacer un merge entre las líneas de desarrollo.

In [74]:
!cd demo/ && git branch

* [32m(HEAD detached from 6a01ff9)[m
  master[m


git branch me muestra el listado de branches actuales.  En nuestro caso únicamente tenemos el default.  Para agregar un nuevo branch basta con escribir el nombre deseado.

In [75]:
!cd demo/ && git branch galileo && git branch

* [32m(HEAD detached from 6a01ff9)[m
  galileo[m
  master[m


In [76]:
!cd demo/ && git log --all --graph --decorate

* [33mcommit f9d7934d8463f2a19cc5c92248bdb41faf30fcc3[m[33m ([m[1;36mHEAD[m[33m, [m[1;32mgalileo[m[33m)[m
[31m|[m Author: jarminett <luissflorian@gmail.com>
[31m|[m Date:   Wed Feb 10 13:01:12 2021 -0600
[31m|[m 
[31m|[m     Tercer commit
[31m|[m   
[31m|[m * [33mcommit 3a2bed8ec3dbd5152eecc55965b88d15ca4f2834[m[33m ([m[1;32mmaster[m[33m)[m
[31m|[m[31m/[m  Author: jarminett <luissflorian@gmail.com>
[31m|[m   Date:   Wed Feb 10 12:27:27 2021 -0600
[31m|[m   
[31m|[m       segundo commit
[31m|[m 
* [33mcommit 6a01ff96c4f8d763c01408b76e9dad41da75fbed[m
  Author: jarminett <luissflorian@gmail.com>
  Date:   Wed Feb 10 12:12:31 2021 -0600
  
      primer commit


Como anteriormente ya nos habíamos movido a otro commit con git checkout, el branch master quedó en una versión atrás.  Entonces, la idea es tener varias lineas paralelas de desarrollo al mismo tiempo.  Puedo agregar más branches si necesito.

## Conclusiones
git es sin duda una herramienta del día a día para un desarrollador.  Nos permite perfectamente trabajar en colaboración o individualmente al brindarnos la posibilidad de tener varias líneas paralelas de desarrollo, regresar a escenarios o versiones anteriores de nuestro código, ver quién modificó cada cosa y en qué momento.  Todo esto, sin guardar copias entereas de cada versión, únicamente por medio de snapshots guardando punteros del de diferentes estados y cambios realizados.

## <div align="right">Luis Florian</div><div align="right">UNIVERSIDAD GALILEO</div><div align="right">Maestría en Ciencia de Datos</div>
