# Control de Versiones con Git

### Objetivo
Presentar un resumen de lo aprendido en el video [Lecture 6 - Version control (git)](https://missing.csail.mit.edu/2020/version-control/)

## Control de versiones

Permite hacer un seguimiento histórico (tracking) de los cambios que se realizan a un archivo, éste puede ser código fuente de un programa (software) o cualquier otro tipo de archivo.

También permite el trabajo colaborativo, esto es, que dos o más personas trabajen sobre el archivo fuente u original para luego hacer un "merge" de ambos sin perder los cambios que cada persona realizó.

Dentro de éste control de versiones es importante lo que conoce como "snapshot", que podría decirse, es una imagen en una fecha y hora dada de todo lo que decidimos llevar control de versiones.

Por último, un control de versiones debe ofrecer metadata, que es información de los archivos sobre los que se esta llevando el control de versiones, por ejemplo, la fecha y hora de creación, autor, entre otros datos.

## Importancia del control de versiones

Dar seguimiento a los cambios a lo largo del tiempo, asegurando que no se pierda ninguno de los cambios realizados, además de un buen control para asegurar que, cuando se trabaja en paralelo un archivo, todos los cambios realizados sean contenidos en la nueva versión del mismo, cuando así se decida.

Sin importar el tamaño del proyecto, debe implementarse el control de versiones ya que ofrece la ventaja de trabajo en equipo con otras personas sobre el mismo archivo o grupo de archivos, además permite llevar un mejor control de calidad del desarrollo de los diferentes archivos, especialmente is es código fuente de una aplicación o software.

Realizar pruebas en un paralelo sin afectar la versión implementada del software.

# GIT

La [página oficial de GIT](https://git-scm.com/) dice que  Git es un sistema de control de versiones de código abierto y uso libre diseñado para utilizarse con pequeños y grandes proyectos con eficiencia, fácil de aprender, entre otras características.

Actualmente Git es un estándar mundial en lo que control de versiones se refiere.

## Estructura de Git

La unidad principal de almacenamiento en Git es el "objeto" que se identifica con el "Secure Hash Algorithm 1" (SHA-1, por sus siglas en ingles).

Tree es el equivalente a un arbol de archivos, donde cada folder es un "Tree" que puede contener a su vez otros folders o archivos dependientes los que se llaman blob's.

Blob es un objeto sin tipo y se pueden entender como los archivos contenidos dentro de un Tree, o más bien el contenido de un archivo dentro de un Tree.

Snapshot es una fotografía en un momento dado del código o archivos de lo que se lleva control de versiones con Git, una vez se realiza un commit.

Commit es la acción de guardar un snapshot del proyecto en la historía de Git. La historia en Git se representa como una serie de commits interrelacionados, cada snapshot referenciado a su antecesor a lo largo de la historia.

Se tienen al menos tres áreas donde los archivos pueden estar, primero el repositorio local, es decir, en el equipo del usuario. Luego el repositorio de Git, donde se lleva el control de versiones. Hay un área intermedia, que ocurre conceptualmente, se le llama stage area, estos son aquellos archivos que tienen control de versiones, por lo tanto Git los identifica como archivos modificados, pero estos cambios no han sido respaldados en el repositorio Git, esto ocurre cuando se realiza un commit y se especifican los archivos a respaldar en Git, una vez los cambios realizados se respaldan por medio del commit, dejan de estar en el Stage area para trasladarse al repositorio Git.

## Comandos de Git

A continuación los comandos y ejemplos realizados.

### Git init

Inicializar Git, es decir, crea un directorio .git en el directorio actual de trabajo, donde se guardaran los subdirectorios y archivos. Si el directorio ya existe lo reinicializa.

Primero veamos el directorio actual de trabajo, con el comando pwd, o seleccionamos el directorio de trabajo con cd /path/

In [11]:
pwd

'/home/jilmer/CienciaDatosGalileo/TrimestreI-2020/CienciaDatosPython'

In [12]:
git init

SyntaxError: invalid syntax (<ipython-input-12-f188d5ac1197>, line 1)

Podemos ver le contenido del archivo, como lo crea como .git, es un archivo oculto, por lo que usamos el comando ls -a para que muestre los archivos ocultos

In [13]:
ls -a

[0m[01;34m.[0m/   Clase1.pptx       Clase_3.ipynb  [01;34m.ipynb_checkpoints[0m/
[01;34m..[0m/  Clase2_Tools.pdf  [01;34mgit[0m/           VersionControl.ipynb


In [14]:
cd git

/home/jilmer/CienciaDatosGalileo/TrimestreI-2020/CienciaDatosPython/git


In [15]:
ls -a

[0m[01;34m.[0m/  [01;34m..[0m/  [01;34mds_py_galileo_2020[0m/


In [2]:
!git init

Initialized empty Git repository in /home/jilmer/CienciaDatosGalileo/TrimestreI-2020/CienciaDatosPython/.git/


Los comandos de git me generan un error al ejecutarlos desde acá, así que corri el comando desde la terminal sin problema. Utilizando una instancia de la terminal desde acá (jupyter lab) no tengo problema. 

File "<ipython-input-17-f188d5ac1197>", line 1
    git init    
        ^    
SyntaxError: invalid syntax

Para evitar el problema descrito anteriormente, hay que anteponer el signo de admiración, por ser un comando de shell y no de python. Referencia en [ésta página](https://github.com/jupyter/notebook/issues/3395).

In [1]:
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   miprimerarchivogit.txt[m

Untracked files:
  (use "git add <file>..." to include in what will be committed)

	[31m.ipynb_checkpoints/[m
	[31mClase1.pptx[m
	[31mClase2_Tools.pdf[m
	[31mClase_3.ipynb[m
	[31mVersionControl.ipynb[m
	[31mgit/[m



Funciona!

Veamos los archivos creados por el comando git init

In [5]:
ls .git

[0m[01;34mbranches[0m/  config  description  HEAD  [01;34mhooks[0m/  [01;34minfo[0m/  [01;34mobjects[0m/  [01;34mrefs[0m/


Creando primer archivo dentro del directorio local de git, utilizando python

In [10]:
f = open('miprimerarchivogit.txt','w')
f.write ('Mi primer archivo git desde python!')
f.close()

In [11]:
ls

Clase1.pptx       Clase_3.ipynb  miprimerarchivogit.txt
Clase2_Tools.pdf  [0m[01;34mgit[0m/           VersionControl.ipynb


Agregando archivo al índice o stage para el próximo commit

In [2]:
!git status
!git add miprimerarchivogit.txt
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   miprimerarchivogit.txt[m

Untracked files:
  (use "git add <file>..." to include in what will be committed)

	[31m.ipynb_checkpoints/[m
	[31mClase1.pptx[m
	[31mClase2_Tools.pdf[m
	[31mClase_3.ipynb[m
	[31mVersionControl.ipynb[m
	[31mgit/[m

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   miprimerarchivogit.txt[m

Untracked files:
  (use "git add <file>..." to include in what will be committed)

	[31m.ipynb_checkpoints/[m
	[31mClase1.pptx[m
	[31mClase2_Tools.pdf[m
	[31mClase_3.ipynb[m
	[31mVersionControl.ipynb[m
	[31mgit/[m



Realizamos el primer snapshot con el primer commit, esto realizará una copia al repositorio de Git y a partir de este punto se lleva el control de versiones para este archivo, siempre y cuando los cambios sean compleados con su respectivo commit.

Se agrega el parametro "m" para agregar el comentario respectivo al commit.

In [3]:
!git commit -m "Commit inicial, se agrega el archivo miprimerarchivogit.txt"

[master (root-commit) c16a41d] Commit inicial, se agrega el archivo miprimerarchivogit.txt
 1 file changed, 1 insertion(+)
 create mode 100644 miprimerarchivogit.txt


In [None]:
El log luego del commit

In [4]:
!git log

[33mcommit c16a41daed64e28952add247ed0ea9799e8051a7[m[33m ([m[1;36mHEAD -> [m[1;32mmaster[m[33m)[m
Author: Jilmer Peren <gperen@gmail.com>
Date:   Fri Feb 21 20:23:31 2020 -0600

    Commit inicial, se agrega el archivo miprimerarchivogit.txt


## Conclusiones

Luego de lo que aquí se presenta, la lectura continúa con otros comandos, como checkout, diff. Estos comandos no se han incluído en este ensayo todavía, hay que ahondar en ellos para una mejor comprensión.

Esta lectura tiene el gran aporte de explicar primero la estructura de git, me identifico totalmente con la pregunta que hace el presentador al principio, sobre el uso de los comandos de manera repetitiva o replicativa sin entender realmente su fundamento y uso, ese ha sido el aprendizaje.