# Control de versiones:
## Git: La herramienta que no sabias que necesitabas

#### Fuentes utilizadas para este tutorial: 
- ["Version Control for Fun and Profit"](https://nbviewer.jupyter.org/github/fperez/reprosw/raw/master/Version%20Control.ipynb)
- [LSST DSFP Session 1: Hands-on introduction to git](https://github.com/jakevdp/git-intro/blob/master/git-intro.ipynb)
- [ProGit - Scott Chacon and Ben Straub](https://git-scm.com/book/en/v2)

## Que es el Control de Versiones?

El control de versiones es un sistema que registra cambios a un archivo o conjunto de archivos a traves del tiempo con la particularidad que **se puede volver facilmente a una version anterior**

#### Reproducibilidad?
- Seguimiento y recreacion de cada paso de tu trabajo
- En el mundo de software esto se llama *Control de Versiones*!

#### Que te brinda un (buen) control de versiones?
- Paz mental (respaldos)
- Libertad (ramas exploratorias)
- Colaboracion (sincronizacion)

## Git es tecnologia habilitadora: Usalo para todo!
- Escritura de tesis/papers/tareas (nunca mas guardas archivos como tesis_v5_jose_vines_final_final_ago11_finalisimo.tex)
- Tareas
- Investigacion
- Proyectos personales

## Temario?

## Como instalar git?

### Linux:
- Distribucion basada en Debian (e.g. Ubuntu): ```sudo apt-get install git-all```
- Distribucion RPM (e.g. Fedora): ```sudo dnf install git-all```

### OS X
En OS X 10.9 o mas reciente se puede instalar a traves de Xcode Command Line Tools, para esto uno puede simplemente correr ```$ git --version``` desde la terminal y si no esta instalado, te pedira instalarlo.
Otra opcion es a traves de [homebrew](https://brew.sh/) con ```$ brew install git``` desde la terminal una vez homebrew este instalado. Finalmente se puede instalar a traves de la [aplicacion de escritorio de GitHub](https://desktop.github.com/)

### Windows
Se puede descargar un [instalador](https://git-scm.com/download/win) del proyecto [Git for Windows](https://gitforwindows.org), o bien se puede instalar a traves de la [aplicacion de escritorio de GitHub](https://desktop.github.com/)

Es posible tambien compilar git localmente, pero no ahondaremos en eso para esta ocasion.

### Primer setup

Ahora que hemos instalado Git, antes de empezar a respaldar nuestros proyectos debemos llevar a cabo ciertas configuraciones de nuestro entorno de Git, por suerte estas configuraciones se deben hacer solo unas vez en un computador y se quedaran entre actualizaciones.

Git viene con una instruccion llamada `git config` que te permite obtener y determinar variables de ajuste que controlan todo aspecto de como funciona Git. Puedes ver tus configuraciones con `$git config --list --show-origin`

Partamos por uno de los aspectos mas importantes: Tu.
Tenemos que darle nuestra identidad a git, ya que utilizara esta informacion cada vez que respaldemos algo (a estos respaldos les llamaremos «commit» de aqui en adelante). Cada commit guarda la informacion del usuario de manera tajante, es decir, una vez hecho un commit, no podremos editar la informacion del usuario que lo creo.

Configurar nuestra identidad es sencillo y se hace con los siguientes comandos en la consola:

```
$ git config --global user.name "Nombre Apellido"
$ git config --global user.email tuemail@ejemplo.com
```

Al usar el flag `--global` nos aseguramos que solo hay que configurar estos parametros una sola vez en el computador!

Otra configuracion quizas menos importante pero muy util es el editor de texto que usaremos cuando Git necesite que ingresemos informacion extra a algun commit. Si no configuramos esto, Git usara el editor por defecto en el sistema.

Si, por ejemplo, quisieramos usar Emacs como editor, esto lo configuramos con la instruccion: `$ git config --global core.editor emacs`

**En windows si quisieramos usar otro editor, debemos darle el path entero a su archivo ejecutable**

Un ejemplo con Notepad++: `$ git config --global core.editor "'C:/Program Files/Notepad++/notepad++.exe' -multiInst -notabbar -nosession -noPlugin"`

Otra configuracion util es el uso de colores: `$ git config --global color.ui "auto"`
Podemos revisar como quedaron nuestras configuraciones con el archivo `.gitconfig`

In [1]:
!cat ~/.gitconfig

# This is Git's per-user configuration file.
[user]
# Please adapt and uncomment the following lines:
	name = José Vines
	email = jose.vines@ug.uchile.cl
[alias]
	slog = log --oneline --topo-order --graph
[color]
	ui = auto


## Conceptos clave

Antes de comenzar con nuestro primer repositorio, haremos una pasada por los conceptos claves de git

El **commit**: Un registro de trabajo instantaneo en el tiempo.

![Anatomia de un commit](img/commit_anatomy.png "Anatomia de un commit")

Credito: libro ProGit de Scott Chacon, licencia CC.

Un **repositorio**: Un grupo de commits *enlazados*

![Un repositorio](img/threecommits.png "Un repositorio")

Nota: Un repositorio es un grafo dirigido aciclico cuyos nodos estan identificados por su *hash*

Hablando de **hash**, este es lo mas parecido a una huella digital de un commit

Un corto ejemplo en Python

In [2]:
import hashlib as sha

# Vamos a simular un commit!!
datos = b'Con esto comenzare mi tarea!'
metadatos = b'Nombre: Paulina Caceres'
hash1 = sha.sha1(datos + metadatos).hexdigest()
print(f'Hash: {hash1}')

Hash: eadf93cde4cfd0c23b66647642386912e507bd05


In [3]:
# Ahora simularemos un segundo commit, relacionado al primero!
mas_datos = b'Este es el primer parrafo de mi tarea.'
mas_metadatos = b'fecha: 11/11/2020'
hash2 = sha.sha1(mas_datos + mas_metadatos + bytes(hash1, 'utf-8')).hexdigest()
print(f'Hash: {hash2}')

Hash: fa6e22dff266f4f82c8a9f746fd9a26adf6fba4b


Esto es el corazon de Git!

Comencemos con lo mas basico: 

## Un workflow local con un solo usuario

Podemos ver una lista de los comandos «esenciales» de git escribiendo `git` en la terminal. Revisaremos varios de estos a traves de pequenos ejemplos

In [4]:
!git

usage: git [--version] [--help] [-C <path>] [-c <name>=<value>]
           [--exec-path[=<path>]] [--html-path] [--man-path] [--info-path]
           [-p | --paginate | -P | --no-pager] [--no-replace-objects] [--bare]
           [--git-dir=<path>] [--work-tree=<path>] [--namespace=<name>]
           <command> [<args>]

These are common Git commands used in various situations:

start a working area (see also: git help tutorial)
   clone      Clone a repository into a new directory
   init       Create an empty Git repository or reinitialize an existing one

work on the current change (see also: git help everyday)
   add        Add file contents to the index
   mv         Move or rename a file, a directory, or a symlink
   reset      Reset current HEAD to the specified state
   rm         Remove files from the working tree and from the index

examine the history and state (see also: git help revisions)
   bisect     Use binary search to find the commit that introduced 

### `git init`: crear un repositorio vacio

Intenta ejecutar las celdas a continuacion, o bien, copiar las instrucciones en una terminal para que vayas viendo como trabaja Git. Si usas una terminal, puedes ignorar las instrucciones `%%bash` y `cd test` en cada celda

In [5]:
%%bash
rm -rf test
git init test

Initialized empty Git repository in /Users/jvines/github/git-and-github/test/.git/


Veamos que ha hecho Git

In [6]:
%%bash
cd test

ls -la

total 0
drwxr-xr-x  3 jvines  staff   96 Sep 27 22:34 .
drwxr-xr-x  8 jvines  staff  256 Sep 27 22:34 ..
drwxr-xr-x  9 jvines  staff  288 Sep 27 22:34 .git


In [7]:
%%bash
cd test

ls -l .git

total 24
-rw-r--r--   1 jvines  staff   23 Sep 27 22:34 HEAD
-rw-r--r--   1 jvines  staff  137 Sep 27 22:34 config
-rw-r--r--   1 jvines  staff   73 Sep 27 22:34 description
drwxr-xr-x  13 jvines  staff  416 Sep 27 22:34 hooks
drwxr-xr-x   3 jvines  staff   96 Sep 27 22:34 info
drwxr-xr-x   4 jvines  staff  128 Sep 27 22:34 objects
drwxr-xr-x   4 jvines  staff  128 Sep 27 22:34 refs


Ahora vamos a modificar nuestro primer archivo en el directorio test. En esta ocasion lo hare a traves de la linea de comando, pero usualmente uno utilizaria un editor de texto para hacer este tipo de cosas

In [8]:
%%bash
cd test

echo "Hola, Mundo!" > archivo1.txt

In [9]:
%%bash
cd test

ls -al

total 8
drwxr-xr-x  4 jvines  staff  128 Sep 27 22:34 .
drwxr-xr-x  8 jvines  staff  256 Sep 27 22:34 ..
drwxr-xr-x  9 jvines  staff  288 Sep 27 22:34 .git
-rw-r--r--  1 jvines  staff   13 Sep 27 22:34 archivo1.txt


### `git add`: Le informa a git sobre nuevos archivos o cambios

In [10]:
%%bash
cd test

git add archivo1.txt

### `git status`: Nos dice el estado actual del repositorio

In [11]:
%%bash
cd test

git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	new file:   archivo1.txt



### `git commit`: Agrega permanentemente nuestros cambios al repositorio

Por ahora utilizaremos la instruccion `git commit` con el flag `-a` o con nombres de archivos (`git commit archivo1 archivo2 ...`)

Discutiremos mas adelante un aspecto de git que no es realmente necesario en el trabajo cientifico del dia a dia, pero podemos adquirir un control aun mayor de que y como Git guarda nuestras acciones

In [12]:
%%bash
cd test

git commit -a -m "Nuestro primer commit"

[master (root-commit) 242be32] Nuestro primer commit
 1 file changed, 1 insertion(+)
 create mode 100644 archivo1.txt


En la celda anterior usamos un flag extra, `-m`, acompanado de texto. Este flag le indica a git que el texto a continuacion es el mensaje asociado al commit.

Si no utilizamos este flag, git abre automaticamente el editor que especificamos para ingresar un mensaje. Por defecto git se rehusa a registrar cambios sin un mensaje, y es sumamente importante que estos resuman de manera efectiva el cambio.

Los mensajes facilitan la comprension y el seguimiento de los cambios de un proyecto a lo largo del tiempo!

### `git log`: Los commit hasta ahora

In [13]:
%%bash
cd test

git log

commit 242be32dbc0f920dd606ad08e9428b8f46b48a17
Author: José Vines <jose.vines@ug.uchile.cl>
Date:   Sun Sep 27 22:34:51 2020 -0300

    Nuestro primer commit


### `git diff`: Que hemos cambiado?

Nuevamente, recuerda que en la practica estaras modificando los archivos a mano. Aqui lo hacemos con comandos en la terminal para hacer que este tutorial sea reproducible en el futuro :)

In [14]:
%%bash
cd test

echo "Adios, Mundo!" >> archivo1.txt

Ahora le podemos preguntar a git que ha cambiado

In [15]:
%%bash
cd test

git diff

diff --git a/archivo1.txt b/archivo1.txt
index 37a9b58..e4f4c41 100644
--- a/archivo1.txt
+++ b/archivo1.txt
@@ -1 +1,2 @@
 Hola, Mundo!
+Adios, Mundo!


### El ciclo de git.... trabajo, commit, trabajo, commit, ...

In [16]:
%%bash
cd test

git commit -a -m "He avanzado mucho con mi tarea."

[master 0a35c94] He avanzado mucho con mi tarea.
 1 file changed, 1 insertion(+)


### `git log`: El reencuentro

Veamos que nos muestra el log ahora!

In [17]:
%%bash
cd test

git log

commit 0a35c947aaea3f30dba728ad172ee43c86e31c07
Author: José Vines <jose.vines@ug.uchile.cl>
Date:   Sun Sep 27 22:34:51 2020 -0300

    He avanzado mucho con mi tarea.

commit 242be32dbc0f920dd606ad08e9428b8f46b48a17
Author: José Vines <jose.vines@ug.uchile.cl>
Date:   Sun Sep 27 22:34:51 2020 -0300

    Nuestro primer commit


Tambien podemos ver una version resumida del log

In [18]:
%%bash
cd test

git log --oneline

0a35c94 He avanzado mucho con mi tarea.
242be32 Nuestro primer commit


Dijimos previamente que un repositorio es un grafo dirigido, y podemos pedirle a git que nos muestre nuestro repositorio como si fuera uno!

In [19]:
%%bash
cd test

git log --oneline --topo-order --graph

* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


Pero escribir esa linea cada vez que queramos revisar el log es tedioso y tan largo que quizas lo olvidemos de inmediato.... Como podremos corregir esto??

Introduciremos los **alias**!

Git soporta *aliases*, nombres cortos para combinaciones de instrucciones. Convirtamos la instruccion anterior en un alias llamado `slog`, asi, solo tendremos que escribir `git slog` y tendremos un log compacto visualizado como grafo!

Al crear un alias, git guarda esta informacion en el archivo de configuracion, `.gitconfig`

In [20]:
%%bash
cd test

git config --global alias.slog "log --oneline --topo-order --graph"

# Probemos nuestro alias
git slog

* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


### Mover y eliminar archivos con `git mv` y `git rm`

Vimos que con `git add` podemos decirle a git que observe nuevos archivos, pero tambien le podemos decir si queremos cambiarle el nombre y si queremos quitarlo

In [21]:
%%bash
cd test

git mv archivo1.txt nuevo-archivo.txt
git status

On branch master
Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)

	renamed:    archivo1.txt -> nuevo-archivo.txt



No olvidemos hacer commit!

In [22]:
%%bash
cd test

git commit -a -m "Este nombre es mas apropiado"

[master 0759aeb] Este nombre es mas apropiado
 1 file changed, 0 insertions(+), 0 deletions(-)
 rename archivo1.txt => nuevo-archivo.txt (100%)


Revisemos el log ahora!

In [23]:
%%bash
cd test

git slog

* 0759aeb Este nombre es mas apropiado
* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


`git rm` funciona de manera similar

### Pongamos a prueba lo aprendido: agreguen un nuevo archivo llamado archivo2.txt, haganle commit, luego cambios y otro commit. Finalmente borrenlo (no olviden el commit!)

Introduciremos un concepto importante llamado rama, o branch en ingles.

Una rama es simplemente el nombre para una secuencia de commits

![master branch](img/masterbranch.png)

Podemos tener multiples ramas en nuestro repositorio y la rama de trabajo actual se representa por un puntero especial llamado HEAD. En este ejemplo hay dos ramas, *master* y *testing*, pero *testing* es la rama activa ya que a el le apunta HEAD

![head test](img/HEAD_testing.png)

Una vez se hagan nuevos commits en una rama, HEAD y el nombre de la rama se mueven con los nuevos commits

![branch commit](img/branchcommit.png)

Esto permite que los branches diverjan eventualmente

![merge](img/mergescenario.png)

Y gracias a la estructura de grafo, git puede calcular la informacion necesaria para unir las ramas divergentes para formar una linea continua de desarrollo.

![mergeafter](img/mergeaftermath.png)

## Usuario local con ramas

Ilustraremos esto con un ejemplo concreto. Comencemos por reconocer nuestro estado actual

In [24]:
%%bash
cd test

git status
ls

On branch master
nothing to commit, working tree clean
nuevo-archivo.txt


Ahora vamos a intentar dos rutas de desarrollo diferentes: en la rama `master` agregaremos un archivo y en la rama `experimental`, la cual crearemos ahora, agregaremes un archivo diferente. Posteriormente uniremos la rama experimental a la rama `master`

In [25]:
%%bash
cd test

git branch experimental
git checkout experimental

Switched to branch 'experimental'


In [26]:
%%bash
cd test

echo "Alguna idea novedosa" > experimento.txt
git add experimento.txt
git commit -a -m "Intentando algo nuevo"
git slog

[experimental 864b2dd] Intentando algo nuevo
 1 file changed, 1 insertion(+)
 create mode 100644 experimento.txt
* 864b2dd Intentando algo nuevo
* 0759aeb Este nombre es mas apropiado
* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


In [27]:
%%bash
cd test

git checkout master
git slog

* 0759aeb Este nombre es mas apropiado
* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


Switched to branch 'master'


In [28]:
%%bash
cd test

echo "Mientras avanzo con experimental, le sigo haciendo cambios a master." >> nuevo-archivo.txt
git commit -a -m "El trabajo principal avanza"
git slog

[master 230607b] El trabajo principal avanza
 1 file changed, 1 insertion(+)
* 230607b El trabajo principal avanza
* 0759aeb Este nombre es mas apropiado
* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


In [29]:
%%bash
cd test

ls

nuevo-archivo.txt


In [30]:
%%bash
cd test

git merge experimental
git slog

Merge made by the 'recursive' strategy.
 experimento.txt | 1 +
 1 file changed, 1 insertion(+)
 create mode 100644 experimento.txt
*   2b0d5d4 Merge branch 'experimental'
|\  
| * 864b2dd Intentando algo nuevo
* | 230607b El trabajo principal avanza
|/  
* 0759aeb Este nombre es mas apropiado
* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit


## Utilizar repositorios remotos como usuario unico

Introduciremos el concepto de *repositorio remoto*: Un repositorio que se encuentra en un lugar distinto al lugar de trabajo, esto puede ser en otro directorio o bien algun servidor en internet.

Para esta parte ocuparemos repositorios hospedados en [GitHub.com](github.com), pero hay otros como [BitBucket](bitbucket.org) o [GitLab](gitlab.com) donde pueden hospedar sus propios repositorios.

Si no tienen una cuenta de GitHub, pueden crear una [aqui](https://github.com/)

### `git remote`: ver/modificar repositorios remotos

In [31]:
%%bash
cd test

ls
echo "Veamos si hay algun repositorio remoto aca:"
git remote -v

experimento.txt
nuevo-archivo.txt
Veamos si hay algun repositorio remoto aca:


Podemos ver que no hay ningun repositorio remoto configurado...

### Creando un repositorio remoto

Inicien sesion en GitHub, vayan a la seccion de [nuevo repositorio](https://github.com/new) y creen un repositorio llamado `test`

**No** deben apretar el boton que dice ``Add a README file`` ya que tenemos un repositorio existente local. Esa opcion es util cuando primero creas un repositorio desde GitHub sin tener uno local!

Ahora seguimos las instrucciones de la pagina siguiente:

In [32]:
%%bash
cd test

git remote add origin https://github.com/jvines/test.git

Revisemos nuevamente nuestros repositorios remotos:

In [33]:
%%bash
cd test

git remote -v

origin	https://github.com/jvines/test.git (fetch)
origin	https://github.com/jvines/test.git (push)


Ahora podemos sincronizar nuestro repositorio remoto con la instruccion `push`

In [34]:
%%bash
cd test

git push origin master

To https://github.com/jvines/test.git
 * [new branch]      master -> master


Y finalmente [podemos ver nuestro repositorio publico en GitHub](https://github.com/jvines/test.git)

Con Git y GitHub podemos facilmente **sincronizar** y **respaldar** nuestro trabajo, asi no se volveran a perder trabajos, manuscritos, codigos, etc, con la falla de un computador; se puede trabajar cooperativamente en equipos sin mayores conflictos; se puede tener documentacion de facil acceso para los usuarios de un proyecto; etc.

Ilustraremos la utilidad para respaldar y sincronizar nuestro trabajo entre dos computadores distintos. Vamos a simular el segundo computador con un directorio diferente.

In [35]:
%%bash

# Ahora clonaremos el repositorio 'test' pero con un nombre diferente, 'test2', para simular un segundo computador
git clone https://github.com/jvines/test.git test2
cd test2
pwd
git remote -v

/Users/jvines/github/git-and-github/test2
origin	https://github.com/jvines/test.git (fetch)
origin	https://github.com/jvines/test.git (push)


Cloning into 'test2'...


Ahora haremos cambios en un «computador» y lo sincronizaremos con el segundo

In [36]:
%%bash
cd test2  # Trabajaremos en el computador numero 2

echo "Mas contenido experimental" >> experimento.txt
git commit -a -m "Mas trabajo, desde el segundo computador."

[master 6b79d01] Mas trabajo, desde el segundo computador.
 1 file changed, 1 insertion(+)


Ahora pondremos este nuevo avance en el servidor de GitHub para que este disponible en internet

In [37]:
%%bash
cd test2

git push origin master

To https://github.com/jvines/test.git
   2b0d5d4..6b79d01  master -> master


Ahora recuperaremos ese trabajo desde la primera «maquina»

In [38]:
%%bash
cd test

git pull origin master

Updating 2b0d5d4..6b79d01
Fast-forward
 experimento.txt | 1 +
 1 file changed, 1 insertion(+)


From https://github.com/jvines/test
 * branch            master     -> FETCH_HEAD
   2b0d5d4..6b79d01  master     -> origin/master


## Manejo de conflictos

Git es muy bueno para unir ramas, pero si dos ramas diferentes modifican el mismo archivo en el mismo lugar, entonces no es capaz de decidir cual de los cambios debe permanecer. Es entonces que la intervencion humana es encesaria para tomar una decision. Git te ayuda marcando los lugares en el archivo donde hay un problema, pero depende de uno resolver ese conflicto. Veamos como funciona esto provocando un conflicto a proposito

Comenzaremos creando uan rama y haciendo un cambio a nuestro archivo experimental:

In [39]:
%%bash
cd test

git branch problema
git checkout problema
echo "Esto sera un problema..." >> experimento.txt
git commit -a -m "Cambios en la rama problema."

[problema e9485be] Cambios en la rama problema.
 1 file changed, 1 insertion(+)


Switched to branch 'problema'


In [40]:
%%bash
cd test

git checkout master
echo "Mas trabajo en la rama master..." >> experimento.txt
git commit -a -m "Trabajo principal"

[master 17274d9] Trabajo principal
 1 file changed, 1 insertion(+)


Switched to branch 'master'


## El conflicto!

Ahora veamos que ocurre si intentamos unir la rama `problema` con master

In [41]:
%%bash
cd test

git merge problema

Auto-merging experimento.txt
CONFLICT (content): Merge conflict in experimento.txt
Automatic merge failed; fix conflicts and then commit the result.


CalledProcessError: Command 'b'cd test\n\ngit merge problema\n'' returned non-zero exit status 1.

Ignoremos el error de Python llamado CalledProcessError que viene de git por no poder unir las ramas y concentremosnos en git.

Comencemos por revisar nuestro archivo

In [42]:
%%bash
cd test

cat experimento.txt

Alguna idea novedosa
Mas contenido experimental
<<<<<<< HEAD
Mas trabajo en la rama master...
Esto sera un problema...
>>>>>>> problema


Ahora es cuando entramos al archivo con un editor de texto, decidimos que cambios conservar, y hacemos un nuevo commit con nuestra decision. En este caso decidi que ambas adiciones son utiles, pero los integre con algun cambio

In [43]:
%%bash
cd test

cat experimento.txt

Alguna idea novedosa
Mas contenido experimental
Mas trabajo en la rama master...
Esto sera un problema...


Ahora hacemos nuestro nuevo commit

In [44]:
%%bash
cd test

git commit -a -m "Terminado el merge de problema, arregle los conflictos."
git slog

[master d8afb13] Terminado el merge de problema, arregle los conflictos.
*   d8afb13 Terminado el merge de problema, arregle los conflictos.
|\  
| * e9485be Cambios en la rama problema.
* | 17274d9 Trabajo principal
|/  
* 6b79d01 Mas trabajo, desde el segundo computador.
*   2b0d5d4 Merge branch 'experimental'
|\  
| * 864b2dd Intentando algo nuevo
* | 230607b El trabajo principal avanza
|/  
* 0759aeb Este nombre es mas apropiado
* 0a35c94 He avanzado mucho con mi tarea.
* 242be32 Nuestro primer commit
