# Sistema de Control de Versiones

# *Git*  y *GitHub*

<table><td><img src="pics/Git-logo.png" style="height:200px;"/></td><td> </td><td><img src="pics/GitHub-logo.png" style="height:400px;"/></td></table>

Un *sistema de control de versiones* es un sistema de software que permite mantener la historia de desarrollo de un proyecto (de lo que sea).

Es decir, se conservan todas las versiones de todos los archivos de computadora relevantes para el proyecto.

Además, estos sistemas permiten y ayudan en el desarrollo colaborativo del proyecto.

#### ¿Para qué?
Es esencial en cualquier proyecto controlar las versiones por las siguientes razones:
- Respaldo de los archivos del proyecto.
- Posibilidad de restablecer versiones anteriores después de cambios catastróficos.
- La revisión y control de cambios permite un mejor trabajo colaborativo: no repetir trabajo y evitar trabajo innecesario, uniformizar el manejo de archivos y vista del proyecto. 
- Los coordinadores de proyecto pueden dar mejor seguimiento al trabajo realizado por los colaboradores.

El sistema de control de versiones ***git*** es multiplataforma, gratis, de código abierto, fácil de aprender (según ellos), veloz y eficiente.

Pero su característica más importante es ser *distribuido*, es decir, los colaboradores tienen copias completas del proyecto y no requieren una conexión constante a internet. (A diferencia de los sistemas *centralizados*, donde sólo existe un único proyecto completo en un servidor y los colaboradores tienen que acceder a él vía internet o alguna red local.)

***git*** fué desarrollado por Linus Torvalds (creador de ***Linux***) y nombrado (por el mismo y de manera egocéntrica como todos sus proyectos, según él) por su personalidad (*git* en jerga de inglés británico significa persona desagradable).

In [None]:
%%html
<embed src="https://git-scm.com" width=1500 height=800>

In [None]:
%%html
<embed src="https://git-scm.com/downloads" width=1500 height=800>

***GitHub*** es una plataforma web para alojamiento de proyectos (principalmente de software), que además de integrar sistemas de control de versiones (***git*** y otros) tiene las siguientes características:
- Visualización de archivos formateados y con sintaxis resaltada.
- Visualización general del proyecto y sus versiones.
- Herramienta de gestión de proyectos (interna). También se puede vincular con externas como ***Trello***, ***Monday***, ***Asana***, etc.
- Uso prácticamente ilimitado y sin costo para proyectos públicos de código abierto (*open source*).

In [None]:
%%html
<embed src="https://github.com" width=1500 height=800>

In [None]:
%%html
<embed src="https://github.com/pricing" width=1500 height=800>

Una vez instalado ***git***, existe una aplicación `git` en el sistema que se ejecuta en terminal y recibe distintos comandos:
```bash
    > git <command>
```

Existen interfaces gráficas (para todos los SOs) para "facilitar" el uso de ***git***, pero en este mini-curso sólo veremos los comandos en terminal y la interacción con ***GitHub***.

De hecho el editor ***Atom*** ya tiene integrados *plugins* de ***git*** y ***GitHub***, por lo que es muy recomendable usarlo (además se le puede instalar un *plugin* de ***Julia*** que se llama ***Juno***).

## ¡Ayuda!
Para conocer todos los comados de ***git*** y su uso general:
```bash
    > git help
```
Para conocer el detalle de uso de cada comado:
```bash
    > git help <command>
```

In [None]:
git help help

Por cierto, este es un cuaderno con *kernel* ***Calysto Bash***, por lo que se pueden ejecutar instrucciones de terminal ***bash***.

In [None]:
%%html
<embed src="https://nbviewer.jupyter.org/github/Calysto/calysto_bash/blob/master/calysto_bash.ipynb" width=1500 height=800>

In [None]:
pwd

In [None]:
ls

## Creación de un *Proyecto* ***git***

Un *Proyecto* ***git*** o *depósito* (*repository*) es una carpeta con archivos y carpetas que será marcada para supervisión por ***git*** y contendrá todas las versiones del proyecto (comprimidas y optimizadas).

Para hacer esto hay que (crear e) ingresar a la carpeta del proyecto, por ejemplo
```bash
    > cd Software/Dev/ProjectGitExercise
```

y luego se utiliza el comando de "inicialización" de ***git***
```bash
    > git init
```
(Esto se hace una sóla vez en la vida del proyecto.)

In [None]:
ls -a

In [None]:
ls .git

#### Importante
Nunca modificar la los contenidos de la carpeta `.git`, que ahí está toda la hitoria (local) y configuración de supervisión del proyecto. 

El archivo `.gitignore` es un archivo de texto que enlista los archivos y carpetas que ***git*** ignorará en la carpeta del proyecto. Es útil para que nunca se agreguen a la historia del proyecto archivos temporales, intermedios, de notas personales, etc.

In [None]:
gedit .gitignore &

In [None]:
gedit PersonalNotes.txt &

También se puede crear un depósito directamente en ***GitHub***.

[https://github.com/new](https://github.com/new)

In [None]:
%%html
<embed src="https://github.com/new" width=1500 height=800>

In [None]:
%%html
<embed src="https://github.com/rlerichev/ProjectGitExercise" width=1500 height=800>

## Clones para los colaboradores

Para que los colaboradores puedan trabajar en el proyecto necesitan una copia, tienen que "clonarlo":
```bash
    > git clone <url>|<dir> [<dirname>]
```
`<url>` es una dirección remota, `<dir>` es una carpeta local y `<dirname>` es el nombre (opcional) que del depósito.

In [None]:
cd ..

In [None]:
git clone ProjectGitExercise ProjectGitExerciseCopy

In [None]:
ls -a ProjectGitExerciseCopy

In [None]:
git clone https://github.com/rlerichev/ProjectGitExercise.git ProjectGitExercise2

In [None]:
ls ProjectGitExercise2

En ocasiones es recomendable hacer "clones desnudos", que conservan una versión comprimida del depósito. Por ejemplo, para un depósito portátil en una memoria USB...
```bash
    > git clone --bare <url>|<dir> [<dirname>]
```

In [None]:
git clone --bare ProjectGitExercise ProjectGitExerciseBare

In [None]:
ls ProjectGitExerciseBare

In [None]:
cd ProjectGitExercise

## Creación y edición de archivos

Ahora ya se puede trabajar en el proyecto, o sea, crear y editar archivos del proyecto.

In [None]:
gedit README.md &

In [None]:
gedit NEWS.md &

In [None]:
ls

El comando de "estado" de ***git*** es muy útil para saber que archivos se han modificado y cuales no están rastreados
```bash
    > git status [-s]
```
Con la opción `-s` se muestra una versión condensada (*small*) del estado.

In [None]:
git status

In [None]:
git status -s

`M` es "modificado", `??` es "no rastreado".

Para deshacer todos los cambios de realizados en un archivo `<file>` se puede usar el comando "restaurar":
```bash
    > git restore <file>
```

In [None]:
git restore README.md

In [None]:
git status -s

Otro comando útil al desarrollar es la búsqueda de fragmentos de código en los archivos del proyecto. Para esto existe el comando de "búsqueda global de patrones con expresiones regulares" ("**G**lobal search / **R**egular **E**xpression / **P**attern"):
```bash
    > git grep "<regexp>"
```

Buscando todas la líneas de texto que inicien con la palabra "Play" o "play"...

In [None]:
git grep "[Pp]lay*"

## Añadir archivos y confirmar versiones

Una vez creados archivos se pueden "añadir" al depósito y una vez satisfechos con la edición en una sesión de trabajo se pueden "confirmar" las versiones en el depósito...

Pero antes hay que saber que un depósito de ***git*** funciona en varias capas:
- La *carpeta de trabajo* (*working directory*), que es la del sistema operativo que contiene el proyecto.
- El *índice* (*INDEX*) que es una *zona de armado* (*staging area*) donde se van agregando archivos para ser supervisados por ***git***.
- El *depósito local* es donde está localmente toda la historia y tiene la última la versión (identificada por *HEAD*).
- El *depósito remoto* (o tal vez sólo *externo*) es el depósito original de donde se clonó el depósito local.

Para añadir nuevos archivos (o todos los archivos en cierta carpeta) al índice para ser rastreados, usar el comando "añadir":
```bash
    > git add <file>|<dir> [<file1> ... <fileN> <dir1> ... <dirM>]
```
Nota: No se añaden carpetas vacías.

In [None]:
mkdir test

In [None]:
git add NEWS.md test

In [None]:
git status

In [None]:
gedit test/test.jl &

In [None]:
git add test

In [None]:
git status

Una vez satisfechos con la edición, se tienen que añadir los archivos modificados con `add` y con el comando "confirmar" se establece la versión:
```bash
    > git commit -m "Message"
```
La opción `m` indica que se aplicará el `"Message"`, que es un breve texto explicativo de los cambios realizados (en inglés).

Si se quieren añadir todos los archivos modificados, se puede usar la opción `a` al "confirmar":
```bash
    > git commit -am "Message"
```

In [None]:
git commit -am "Created files NEWS.md and test/test.jl. PersonalNotes.txt added to .gitignore."

In [None]:
ls -a

In [None]:
git status

Existe la posibilidad de que se nos haya olvidado agregar algo antes de confirmar la versión, pero en ese caso lo podemos solucionar con agregar lo necesario y luego usar la opción "enmendar" al confirmar:
```bash
    > git add <forgotten_files>
    > git commit --amend -m "Message"
```

In [None]:
gedit README.md &

In [None]:
git add README.md

In [None]:
git commit --amend -m "Created files NEWS.md and test/test.jl. PersonalNotes.txt Added to .gitignore. Typo corrected in README.md"

<table><td><img src="pics/git_trees.png" style="height:400px;"/></td></table>

<table><td><img src="pics/git_status.png" style="height:400px;"/></td></table>

## Renombrar, mover,  borrar
Claro, como parte de la edición se pueden renombrar o mover archivos o carpetas o borrarlos si es necesario, pero si esos archivos están en el *INDEX* hay que avisarle a ***git***. Para mover o renombrar hay que usar el comando "mover":
```bash
    > git mv ( <name> <newname> )|( <name1> ... <nameN> <dir> )
```

In [None]:
git mv test/test.jl test/test01.jl

In [None]:
git status

Para borrar archivos hay que usar el comando "remover":
```bash
    > git rm <file> [<file1> ... <fileN>]
```

In [None]:
git rm NEWS.md

In [None]:
git status

In [None]:
git commit -am "Moving test/test.jl to test/test01.jl and erasing file NEWS.md."

In [None]:
git status

In [None]:
ls

## Compartir nuestro trabajo con todo mundo
Ahora que ya tenemos nuestra versión local, la podemos compartir con los demás colaboradores enviándola al depósito original del que se clonó o algún otro depósito. Para esto se usa el comando "empujar":
```bash
    > git push [<repository>]
```
donde `<repository>` es la dirección web de un depósito remoto o la ruta de un depósito externo y desnudo en la misma computadora. Si este parámetro se omite entonces se usará el depósito origen.

In [None]:
git push

In [None]:
%%html
<embed src="https://github.com/rlerichev/ProjectGitExercise" width=1500 height=800>

Para conocer los depósitos remotos asociados al depósito local, se puede usar el comando "remoto":
```bash
    > git remote -v
```
El depósito original del que se clonó este depósito local tiene el nombre `origin` ("origen").

In [None]:
git remote -v

Ese mismo momando "remoto" sirve para agregar otros depósitos remotos (para poder usarlos con el comando "empujar"):
```bash
    > git remote add <name> <url>|<dir>
```
donde `<name>` es el nombre para el depósito remoto en `<url>` o `<dir>` (que no sea `origin`) que tiene que ser desnudo.

In [None]:
git remote add loc_extern ../ProjectGitExerciseBare

In [None]:
git remote -v

## Actualizar versiones compartidas por otros
Todos los colaboradores mandan sus versiones al depósito origen, así que para seguir trabajar de manera colaborativa hay que conseguir esas nuevas versiones. Para esto se usa el comando "traer":
```bash
    > git fetch [<repository>]
```

In [None]:
cd ../ProjectGitExercise2

In [None]:
ls

In [None]:
git fetch

In [None]:
ls

Una vez conseguidas las versiones, estas se tienen que combinar con nuestro trabajo local de la versión local *HEAD*. Para hacer esto se usa el comando "fusionar":
```bash
    > git merge <commitid>
```
donde `<commitid>` es el identificador de una versión.

Para fusionar con la versión traída más nueva se debe usar el identificador *FETCH_HEAD*.

In [None]:
git merge FETCH_HEAD

In [None]:
ls -a

Para simplificar el uso de "traer" y "fusionar" con la versión nueva que se trajo, existe el comando "jalar" que hace las dos cosas:
```bash
    > git pull [<repository>]
```

In [None]:
git pull

<table><td><img src="pics/git_stages.png" style="height:600px;"/></td></table>

## Historia, diferencias y culpas
Para conocer la historia del proyecto a *grosso modo*, es decir, quién hizo qué en cuál versión y cuándo, existe el comando "registro":
```bash
    > git log
```

In [None]:
cd ../ProjectGitExercise

In [None]:
git log

In [None]:
%%html
<embed src="https://github.com/rlerichev/ProjectGitExercise/commits/master" width=1500 height=800>

Se pueden conocer los cambios realizados a archivos entre la carpeta de trabajo, el *INDEX* y las distintas versiones en el depósito. Para esto existe el comando "diferenciar":
```bash
    > git diff [<commitid>] <file>
```
donde `<commitid>` es un identificador de  versión, como *HEAD*, *HEAD~3* (tres versiones antes de *HEAD*) o esos números asociados a las versiones  que aparecen cuando se ve la historia (`git log`).

In [None]:
git diff HEAD~2 README.md

También se puede conocer toda la historia de edición de un archivo. Para esto se usa el comando "culpar":
```bash
    > git blame <file>
```
Al desarrollar proyectos software es normal cometer errores (se crean *bugs*) y es útil ver que cambios se realizaron desde la última versión funcional, para encontrar el código "culpable" (y hasta el colaborador "culpable").

In [None]:
git blame README.md

In [None]:
%%html
<embed src="https://github.com/rlerichev/ProjectGitExercise/blame/master/README.md" width=1500 height=800>

En ocasiones es útil regresar archivos a alguna versión pasada, para esto se usa el commando "revisar afuera"
```bash
    > git checkout [<commitid>] -- <file> [<file1> ... <fileN>]
```

In [None]:
git checkout HEAD~2 -- README.md

In [None]:
gedit README.md &

In [None]:
git status

In [None]:
git checkout HEAD -- README.md

In [None]:
git status

En casos extremos, también puede regresarse todo en la carpeta de trabajo a versiones anteriores:
```bash
    > git checkout [<commitid>]
```

In [None]:
git checkout HEAD~2

In [None]:
ls

Pero podemos regresar fácilmente a la última versión con
```bash
    > git checkout master
```

In [None]:
git checkout master

In [None]:
git status

In [None]:
ls

## Ramas
Una funcionalidad muy interesante de ***git*** son las *ramas*. Una rama es un desarrollo paralelo del proyecto creado a partir de algún punto en la historia. Estas ramas también se pueden fusionar con otras en puntos de la historia.

Esto es útil para crear desarrollos de códigos de prueba o experimentales, de trabajo paralelo de colaboradores, etc.

Por defecto cada depósito se crea inicialmente con la rama principal *master*.

<table><td><img src="pics/git_branches.png" style="height:600px;"/></td></table>

Para mostrar las ramas se utiliza el comando "rama"
```bash
    > git branch
```
La rama actual se marca con `*`.

In [None]:
git branch

Para crear y entrar a una rama a partir de la rama actual utiliza el comando "ramificar"
```bash
    > git branch <name>
```
donde `<name>` es el nombre de la nueva rama (que no sea *master*).

In [None]:
git branch rlv

In [None]:
git branch

Se puede cambiar el directorio de trabajo a las distintas ramas con el comando "revisar afuera":
```bash
    > git checkout <branch>
```
donde `<branch>` es el nombre de una rama.

In [None]:
git checkout rlv

In [None]:
echo "f(x::Number)=x^2" > src/fun.jl

In [None]:
ls src

In [None]:
git status -s

In [None]:
git add src

In [None]:
git status -s

In [None]:
git commit -m "Branch 'rlv' initial work."

In [None]:
git checkout master

In [None]:
ls

<table><td><img src="pics/git_branchmerge.png" style="height:200px;"/></td></table>

Para fusionar la rama actual con otras ramas se usa el comando "fusionar":
```bash
    > git merge <branch> [<branch1> ... <branchN>]
```

In [None]:
git branch

In [None]:
git merge rlv

In [None]:
ls src

Se pueden borrar ramas:
```bash
    > git branch -d <name>
```

Si no hay versiones en la rama `<name>`, se borra la rama sin más.

Si hay versiones en la rama `<name>`, se hace una fusión con la rama padre y luego se borra.

In [None]:
git push

In [None]:
%%html
<embed src="https://github.com/rlerichev/ProjectGitExercise" width=1500 height=800>

## El problema de la edición colaborativa
<table><td><img src="pics/git_colaborative.png" style="height:600px;"/></td></table>

<table><td><img src="pics/git_conflict.png" style="height:600px;"/></td></table>

<table><td><img src="pics/git_merge.png" style="height:600px;"/></td></table>

## Resolviendo conflictos
Afortunadamente ***git*** fusiona los archivos de distintas versiones de manera "inteligente" y automática en la mayoría de los casos.

Pero en algunos casos ***git*** no puede fusionar por si solo y entonces se dice que hay un *conflicto* de versiones (que requiere intervención humana para resolverse).

***git*** notifica los conflictos al intentar una fusión (al usar los comandos `merge` o `pull`).

In [None]:
gedit src/fun.jl &

In [None]:
git commit -am "f with z in fun.jl."

In [None]:
git checkout rlv

In [None]:
gedit src/fun.jl &

In [None]:
git commit -am "f with y in fun.jl."

In [None]:
ls

In [None]:
git branch

In [None]:
git status

In [None]:
git merge master

Para revisar los detalles de los conflictos es muy útil el comando "diferenciar":
- Para ver todas las diferencias con conflictos en la carpeta de trabajo:
```bash
    > git diff
```
- Para ver todas las diferencias con conflictos de un archivo, con la versión antes del intento de fusión:
```bash
    > git diff --base <file>
```
- Para ver todas las diferencias con conflictos de un archivo, con la versión remota:
```bash
    > git diff --theirs <file>
```
- Para ver todas las diferencias con conflictos de un archivo, con la versión local:
```bash
    > git diff --ours <file>
```

In [None]:
git diff

In [None]:
git diff --base src/fun.jl

In [None]:
git diff --theirs src/fun.jl

In [None]:
git diff --ours src/fun.jl

En para resolver conflictos, se debe hacer lo siguiente:
- Para arreglar los archivos hay 3 opciones disjuntas:
    - Hacer una edición cuidadosa de los archivos conflictuados para arreglarlos.
    - Aceptar los cambios remotos como correctos sobreecribiendo lo local con 
    ```bash
        > git checkout --theirs <file> [<file1> ... <fileN>]
    ```
    - Indicar que los cambios locales son los correctos con
    ```bash
        > git checkout --ours <file> [<file1> ... <fileN>]
    ```
- Añadir con `add` otra vez archivos involucrados en conflictos.
- Hacer nueva versión con `commit` indicando que se resolvieron los conflictos.

In [None]:
git checkout --theirs src/fun.jl

In [None]:
git status

In [None]:
git add src/fun.jl

In [None]:
git status

In [None]:
git commit -m "Conflict resolved in fun.jl"

In [None]:
git status

In [None]:
git checkout master

## Etiquetar versiones especiales
En algún momento de la historia del proyecto, se llegará a una versión con todas las características prometidas y deseadas que debe tener un nombre especial. Para esto se utiliza el comando "etiquetar":
```bash
    > git tag [-m "<message>"] <tagname>
```
donde `<tagname>` es el nombre de la versión especial y `"<message>"` la descripción de la versión.

También se pueden listar las versiones etiquetadas con
```bash
    > git tag
```

In [None]:
git tag -m "Finally our first functional version 0.1" v0.1

In [None]:
git tag -l

In [None]:
git push

In [None]:
%%html
<embed src="https://github.com/rlerichev/ProjectGitExercise" width=1500 height=800>

## El ciclo(s) de desarrollo
Primero algunas convenciones:
- Nuestro proyecto estará formado varios proyectos-depósitos: `___Core.jl`, `___.jl`, `___IFS.jl`, `___Graphics.jl`, etc.
- La rama *master* es la rama que siempre tendrá la versión funcional de cada proyecto-depósito y se etiquetaran las versiones especiales a partir de ella.
- Cada desarrollador de nuestro proyecto tendrá su propia rama en cada proyecto-depósito para realizar sus desarrollos (potencialmente experimentales). Después podrán fusionar su rama con la *master*, cuando se tenga un desarrollo estable.

Antes de que los desarrolladores comiencen a trabajar, lo siguiente deberá estar realizado (por el desarrollador en jefe o el administrador del proyecto, una sóla vez en la vida del proyecto):
1. Crear la organización ***___*** en ***GitHub***, a la que pertenecerán los desarrolladores y se asociarán los proyectos-depósito.
2. Crear un proyecto-depósito en ***GitHub*** de cada biblioteca de ***___*** (que equivale a `git init`). Deberán contener los archivos y carpetas base y convencionales.

Cada desarrollador deberá:
1. Abrir una cuenta en ***GitHub***.
2. Clonar los proyectos-depósito en los que colabora localmente en su computadora. (También habrá clones de los proyectos-depósito en las computadoras del proyecto que se comprarán e inicialmente estarán en el cubículo del Dr. King).
3. Crear una rama personal de desarrollo, por ejemplo
```bash
    > git branch <name>
```

Recomiendo seguir los siguientes procesos para las sesiones de desarrollo:
1. Entrar en su rama de desarrollo:
```bash
    > git checkout rlv
```
2. Fusionar la última versión de la rama *master* con la rama de desarrollo, para actualizar archivos:
```bash
    > git pull origin master
```
3. Si hay conflictos, resolverlos adecuadamente.
4. Crear, editar, mover o renombrar (`git mv`), borrar (`git rm`) archivos y/o carpetas. Aquí se realiza el grueso del trabajo de desarrollo: escribir código, hacer pruebas, corregir...
5. Añadir los archivos creados que sean pertientes:
```bash
    > git add <file1> ... <fileN>
```
6. Crear una nueva versión local, con su respectivo comentario descriptivo:
```bash
    > git commit -am "Bug X repaired. New feature Y developed. Thing Z improved..."
```
7. Al final de la sesión de trabajo, enviar la versión al depósito en ***GitHub*** (para tener respaldo del trabajo realizado):
```bash
    > git push origin rlv
```

Finalmente, en alguna fase del desarrollo de software se tienen que incorporar los desarrollos particulares de cada colaborador con el principal. Para esto recomiendo:
1. Entrar en la rama *master*:
```bash
    > git checkout master
```
2. Obtener la última versión principal:
```bash
    > git pull
```
3. Fusionar la rama local de desarrollo con la rama *master*:
```bash
    > git merge rlv
```
4. Si hay conflictos, resolverlos adecuadamente.
5. Verificar que el software funcione haciendo las pruebas pertientes. Si hay problemas o *bugs*, corregirlos.
6. Crear una nueva versión local *master*, con su respectivo comentario descriptivo:
```bash
    > git commit -am "New features X,Y,Z. Things A,B,C repaired..."
```
7. Enviar la versión nueva al depósito en ***GitHub*** (para compartir con el mundo el trabajo realizado):
```bash
    > git push
```

## Para saber más...

In [None]:
%%html
<embed src="https://git-scm.com/book/es/v2" width=1500 height=800>

In [None]:
%%html
<embed src="./docs/pdf/BenLynn-GitMagic(ESP).pdf" width=1500 height=800>

In [None]:
%%html
<embed src="./docs/pdf/git-cheat-sheet.pdf" width=1500 height=800>