### Diego Fernando Valle Morales ###
### Carné: 20003022 ###


## TAREA 1 ##

# VERSION CONTROL CON GIT #

Las herramientas de control de versiones sirven para dar seguimiento a código fuente que esté en carpetas, asi como llevar el histórico de versiones, además de facilitar el trabajo colaborativo para edición de código fuente en un proyecto de software.
Estas herramientas capturan el código fuente en una serie de instantáneas del software, capturando un folder y el contenido de este; cada instantánea captura todo el estado en ese momento en el tiempo; además de este contenido captura metadata relacionado con la instantánea: el instante en el tiempo, el autor, así como un comentario de la instantánea.

Existen varias herramientas de versionamiento funcionando, pero Git es la herramienta a mencionar en este documento.

``` test ```

Git es una herramienta que no debe ser aprendida, sino comprendida, ya que fue hecha de de ideas increíbles.


## Modelo de Datos ##

Git ahorra muchos procesos, ya que si se desea trabajar con varias personas, en vez de mandar un archivo comprimido con toda la información por correo electrónico, recibir información, integrarla y volver a enviarla integrado.

El modelo de historial de datos que maneja git, nos permite manejar varias cosas que se presentan a lo largo de la historia de un proyecto de software, como ramas, colaboración, integrando cambios con otras personas.

Todo empieza con directorios raíz que pueden tener varios folders con archivos que contienen información. los cuales son llamados "trees" (arboles) y los los archivos son conocidos como "blobs" (gotas), siendo una jerarquía en la cual un árbol puede contener archivos o un árbol puede contener otros árboles y archivos; pero un archivo no puede contener un árbol.

```
<raíz> (tree)
|
+- directorio (tree)
|  |
|  + archivo.txt (blob, contiene = "hola phyton en la maestría")
|
+- archivoMaestro.txt (blob, contiene = "git sirve un montón")

```

Git usa para manejar el histórico un grafo dirigido acíclico.En el cual se cada nuevo _snapshot_ tiene como padre a la fotografía que lo genera, y cuando se generan ramas, tienen como padre al mismo snapshot donde se une, en el caso que se vuelven a integrar las ramas, tendrá dos padres, de los cuales se integra el codigo, usando terminología del tema se hace un _merge_ que es la integración de dos diferentes ramas.

```

o <-- o <-- o <-- o <---- o
            ^            /
             \          v
              --- o <-- o
              
o --> representa a una instantánea diferente del proyecto.
```


### Estructura de Datos de Git en pseudocódigo ###

Este es el modelo de datos de la estructura de Git.

```
type blob = array<byte>

type tree = map<string, tree|blob>

type commit = struct{
    padres:  array<commit>
    autor:   string
    mensaje: string
    instantanea: tree
}

```

Ahora para su funcionamiento se tiene lo siguiente:

```
type object = blob | tree | commit
objects =map<string, object>

```

Basicamente lo que realiza Git es utilizar claves _hash_ para definir a los diferente objectos, las cuales están definidas por un código hexadecimal conocido como *SHA-1* de 40 caracteres de longitud.

```
def guardar(o)
    id=sha1(o)
    objects[id]=o
    
def cargar(id)
    return objects[id]
```

Las referencias que se usan son legibles para humanos, ya que en vez de usar estas llaves largas hexadecimales, se pueden usar los textos de tal forma que:

```
referencia=map<string,string>

```

Por la forma en que ha sido diseñada la estructura de datos de Git, este es un grafo inmutable donde podemos añadir nuevas cosas, pero no puede ser manipulado nada que se encuentre dentro de este árbol. Por lo tanto se puede decir que es inmutable.

## Usando comandos con git ##

Para poder utilizar git se usa la línea de comandos, después de tener instalada la herramienta de Git, en caso de usar Windows, a continuación se colocarán una serie de comandos correspondientes a la usabilidad de Git:

Primero procederemos a crear un directorio dentro de la computadora:
```
mkdir demo_DiegoValle
```
Ingresamos al directorio
```
cd demo_DiegoValle
```

Debemos iniciar la herramienta de Git dentro del directorio, lo cual preparará la estructura para usar con Git
```
git init
```
Esto genera un folder oculto llamado _.git_ el cual contiene un montón de cosas relacionadas a la configuración de Git como los objetos (identificado por la carpeta **objects**) y sus referencias (identificado por el folder **refs**). 

Existen algunos comandos que pueden ayudar a saber el estado del repositorio Git donde estamos trabajando, básicamente nos da una vista rápida de lo que está sucediendo de forma entendible.
```
git status
```
En caso que indique _no commits yet_ es debido a que no se ha hecho ningún cambio.

Para agregar datos, se debe tener algún archivo, en este caso generaremos un archivo txt y le colocaremos información usando el siguiente comando:

```
echo "Hola Ciencia de datos en Phyton" > hola.txt
```
Para poder guardar información Git maneja un concepto llamado _staging area_ o área de ensayo, que es donde se indica a Git, que cambios se desean registrar. Si se ejecuta el comando **git status** indicará que nada ha sido agregado, pero que hay un archivo (en este caso hola.txt) que no está bajo seguimiento. Para corregir esto se debe usar el comando:

```
git add hola.txt
```
El cual devolverá que hay un nuevo archivo: hola.txt

Si se ejecuta en este momento el comando 

```
git commit
```
Inmediatamente abrirá un editor de texto en consola donde indica que hay que proporcionar el mensaje que identificará a este _commit_ y es muy importante escribir comentarios de alta calidad que permitan identificar lo que se ha realizado.

Esto nos devolverá un mensaje donde indica una parte del código Hash y el mensaje que hemos indicado en consola.

Por otra parte si deseamos realizar un rastreo de lo que se ha realizado, visualizar una bitácora, existe un comando llamado

```
git log
```

El cual permitirá ver la información relacionada con los commits realizados, lo cual está identificado por el código hash, el autor, la fecha, así como el comentario.

Por ejemplo, si al momento de hacer _commit_ se recibe un código hash y se aplica el comando 

```git cat-file -p CODIGO_HASH```

y se coloca el código hash recibido, se recibirá la meta información del commit además del hash correspondiente al árbol. 
Si se vuelve a colocar sobre el código hash el mismo comando se recibirá un nuevo código hash correspondiente al contenido de archivos sincronizados y si se vuelve a colocar el mismo comando se obtendrá el contenido del archivo.

Así también si no se recomienda incluir el contenido completo de la carpeta sino que se recomienda ir incluyendo archivo por archivo de acuerdo a lo que uno desee.

Otra opción para mostrar el histórico en formato de grafo, para lo cual debemos agregar una nueva línea en nuestro archivo y hacer nuevamente un nuevo commit, para lo cual usamos la siguiente serie de comandos:

```
    echo "otra linea puesta por Diego Valle" > hola.txt
    git add hola.txt
    git commit -m "se añadio nueva linea"
    git log --all --graph --decorate
    
```

Con esto se mostrará en una forma un poco más amigable la información de los commits, mostrando de lo más reciente a lo más antiguo.

Exisnten ciertas referencias que devuelve Git tales como el texto **HEAD** es una referencia especial para demostrar hacia donde se está viendo actualmente y **master** es una referencia creada por defecto y se refiere a la rama maestra del código.

Así también se indicó que Github es un repositorio web especialmente adaptado para Git, existen otros repositorios como Bitbucket.

Existe un comando que permite visualizar información que se tiene en alguna versión anterior del proyecto, se realiza con el siguiente código:

```
git checkout CODIGO_HASH
```
Este comando moverá el **HEAD** es decir lo que estoy visualizando de código. ESte comando es útil cuando se desea ver una versión anterior del código que se está utilizando.

Si se desea regresar a la versión de la rama actualizada, la rama maestra (master branch) se debe colocar el siguiente comando:
```
git checkout master
```

También existe un comando que permite mostrar los cambios que han habido desde la instantánea que está identificada con **HEAD** en Git, para lo cual se usa el comando:
```
git diff hola.txt
```
Mostrará de una manera amigable usando un signo + si se agregó una línea de código o un - si se quitó una línea de código.

Si se desea comparar con una versión diferente de la instantánea actual, se puede utilizar los primeros 8 caracteres del codigo hash de una versión diferente y colocarlas como argumento para comparar respecto a esa versión, es decir:
```
git diff HASH_VERSION hola.txt
```
Ahora bien, si se desea comparar entre dos versiones para saber lo que sucedió con el archivo se debe agregar un parámetro al comando anterior quedando del siguiente modo:

```
git diff HASH_VERSION1 HASH_VERSION2 hola.txt
```
Esto comparará lo que sucedió entre la versión 1 y la versión 2 del hash.

Si se desea usar una rama para mejorar el control del versionamiento o manejar dos caminos de desarrollo paralelos, se debe seguir los siguientes comandos:
```
git branch
```
Este comando nos muestra las ramas que están creadas en el proyecto que se está usando.

También existe un comando para saber el comentario y el inicio del código hash que identifica a la rama, el cual únicamente se agrega el parámetro -vv
```
git branch -vv
```
Si se desea crear una nueva rama se hace colocando el nombre de la rama al siguiente comando:
```
git branch NUEVA_RAMA
```
En este momento asigna la rama a la última rama creada, a la que tiene el parámetro master. Si se desea trasladar a la nueva rama se debe usar el comando _checkout_
```
git checkout NUEVA_RAMA
```
En este momento al momento de ejecutar el comando log de git, se verá que ahora **HEAD** apunta a la NUEVA_RAMA y ya no apunta a la rama maestra.
Por lo tanto si se realizan modificaciones en el archivo y se ejecuta
```
git status
```
Git nos indicará que el archivo tiene modificaciones y si se ejecutan los comando 
```
git add NUEVO_ARCHIVO
```
Y luego se ejecuta
```
git commit
```

Indicando el texto que define al commit, y se vuelve a ejecutar el log se verán ciertas diferencias, siendo la más importante que la rama "master" ahora apunta a otro commit, mientas que la rama **HEAD** apunta a la NUEVA_RAMA.

Mientras se agreguen más commits es necesario adaptar la vista de lo que se está desarrollando para lo cual se agrega un nuevo parámetro al log quedando de la siguiente manera:
```
git log --all --graph --decorate --online
```
Esto nos mostrará la secuencia de commits con un pequeño extracto del hash, las ramas que están activas y el comentario que representa a cada instantánea.

Existe también un comando que nos permite crear y seleccionar una nueva rama el cual es:
```
git checkout -b NUEVA_RAMA2
```

Después de que se trabajan ambas ramas, se debe seleccionar la rama maestra o la rama con la que se desee unir la otra rama, y se puede usar el comando
```
git merge NUEVA_RAMA
```
En caso de que la NUEVA_RAMA si la rama seleccionada es padre de la instantánea contenida en la rama que se desea unificar, nos indicará el texto _Fast-forward_ la cual mezclará las dos versiones.

Pero en caso de que se desee unificar otra rama que no tiene como padre la versión en la que se encuentra el checkout, que podría presentarse en caso de desarrollos en paralelo, al momento de ejecutar el comando 
```
git merge NUEVA_RAMA2
```
Git indicará que hay confictos, pero unificará ambas versiones del archivo, para que se resuelvan los conflictos editando manualmente el archivo. 
Al abrir el archivo aparecerá un texto que permite identificar los archivo siendo estos:
```
<<<<<<<<< HEAD
    //SEGMENTO DE CODIGO ORIGINAL
=========
    //NUEVO SEGMENTO DE CODIGO
>>>>>>>>> NUEVA_RAMA2

```
Simplemente se resuelve borrando los marcadores de conflicto y modificando el segmento de código para que quede de forma adecuada, se guarda el archivo y posterior a estos se usa el comando. 

```
git add ARCHIVO.PY
```
Con esto se prepara el archivo e inmediatamente después se usa el comando
```
git merge --continue
```
Se coloca el texto que define a este commit.

## Colaborando con otros usuarios ##
Para poder colaborar con otros usuarios se usan remotos, en este caso se utilizan en caso de que uno desee usar githut. Para saber si existen remotos se usa el comando:
```
git remote
```
Si se desea agregar una presencia remota se usa el comando
```
git remote add NOMBRE_REMOTO URLorigen
```

Si se desea enviar los cambios que uno esté realizando al remoto, se usa el siguiente comando:

```
git push <REMOTO> <RAMA_LOCAL>:<RAMA_REMOTA>
```
Al momento de realizar el push aparecerá un nuevo color dentro del log que indica el nombre del remoto y la nueva rama.

Existe un comando que permite realizar una copia de un código que esté en un repositorio en la nube y se desee usar de forma local, este es el comando clone, el cual sigue la siguiente sintaxis:

```
git clone <URL> <folder_local>
```

En caso de que se desee clonar sin el histórico se puede usar el comando:
```
git clone <URL> <folder_local> --shallow
```
Si se desea actualizar los datos que están en el servidor se puede usar:
```
git fetch;
```
Y para actualizar la rama para que vea igual que el servidor se puede usar el comando:
```
git merge;
```

Pero la forma más fácil de hacerlo, que integra los últimos dos comandos mencionados es:
```
git pull;
```


En caso se desee integrar los cambios de forma interactiva se puede usar el comando:
```
git add -p ARCHIVO
```

Si se desea saber el histórico relacionado con las líneas de código se puede usar el siguiente comando:
```
git blame ARCHIVO
```
Si se desean quitar los cambio hasta la última instantánea se debe usar el comando 
```
git stash
```
Pero los cambios quedan "guardados" en memoria, para lo que se usa el comando:
```
git stash pop
```
Lo cual devuelve la información a los archivos que se están usando.

Si se desea omitir un archivo que esté agregado en una carpeta se debe incluir en el archivo .gitignore.

#### Bibliografía: #### 
Este resumen está basado en la lección publicada en el siguiente link: https://missing.csail.mit.edu/2020/version-control/
