# Tarea 2
### Por Marco Zuñiga

## Fundametos de GIT

    
### Que es un VCS?
Los sistemas de control de versiones (VCSs) nos ayudan habilitando el seguimiento del historial de cambios sobre una colección de archivos y directorios. Es una herramienta poderosa ya que no se limita a archivos de un tipo específico, por lo que permite introducir un control de versiones a cualquier proyecto. El control de cambios se lleva a cabo almacenando instantáneas ordenadas e incrementales junto con información importante como la persona que tomo cada instantánea y un mensaje. 

Estas herramientas habilitas a los equipos a colaborar y coordinar esfuerzos de una forma sencilla. Permitiendo a diferentes personas trabajar en diferentes archivos o incluso el mismo archivo en diferentes ramas. Es una gran ventaja poder ver instantáneas anteriores de los cambios y ver como se ha modificado el proyecto o la diferencia entre instantáneas.

### GIT
Fue creado por Linus Torvalds, en su búsqueda por un sistema de control de versiones que fuera eficiente, confiable, enfatizando que fuera distribuido y open source para el proyecto de Linux Kernel. Por estas razones y ante la falta de opciones, Linus Torvalds decidió implementar GIT para satisfacer las necesidades para el proyecto. Ya que en ese momento utilizaban BitKeeper, otra herramienta para el control de código fuente que tenía algunas deficiencias (renombrado), además de no ser código libre. \[[1]\]

Desde entonces GIT ha ganado popularidad siendo hoy en día prácticamente el standard para VCSs de la industria. El éxito en la gran adopción de GIT es la facilidad y confiabilidad para trabajar copias locales que permiten a un equipo trabajar colaborativamente en sus propios repositorios, sin preocupaciones por permisos de escritura en el repositorio. 

Lo que diferencia a GIT de otros manejadores de versiones, como CVS o SVN , es que cada desarrollador puede tener su copia de trabajo del código en local, permitiendo también tener un historial completo de los cambios. 


[1]:https://www.linuxfoundation.org/blog/10-years-of-git-an-interview-with-git-creator-linus-torvalds/

#### Como funciona GIT?
GIT soporta varias funciones que permiten a los equipos trabajar en un mismo proyecto habilitando la colaboración, no solamente guarda el historial de cambios sino también soporta el manejo de branches.

GIT tiene un modelo sencillo que se basa en archivos, directorios, snapshots, referencias y metadatos. En GIT un archivo se le nombra "blob" representando un arreglo de bytes, un directorio es un "árbol" que puede contener archivos u otros arboles (directorios). GIT lleva un mapeo de nombres hacia blobs o árboles. Un snapshot es la raíz del árbol que a la que se le está siguiendo la pista. Los snapshots se enlazan para llevar el historial de cambios. GIT utiliza un grafo acíclico dirigido (DAG) de snapshots para llevar ese control. Lo que significa es que un snapshot puede tener varios snapshots padres o predecesores. Esto permite que dos contribuyentes del proyecto puedan trabajar en dos branch distintas. Partan de un snapshot base, y al momento de querer juntar sus esfuerzos se haga un snapshot que refleje esa unión de los cambios de ambas branches. Los snapshots en GIT o commits son inmutables. Eso quiere decir que una vez hecho el commit (y por tanto identificado por un SHA) este no puede modificarse. Si es necesario corregir algo, requerirá que nosotros hagamos un nuevo commit o al momento de "editar" el commit (ammend) se genere una nueva referencia (SHA) que identifique al nuevo commit y remplazando a la anterior referencia. 

Entonces resumiendo la parte central de GIT es la forma es su modelo, un commit va a estar conformado por:
- Listado de padres
- Autor del commit, 
- Mensaje
- Snapshot (la raíz del árbol). 

Y con esta estructura de datos se modelará el grafo que representará el historial de un repositorio. ¿Ahora cómo es que GIT relaciona los contenidos de cada uno de los commits o arboles? GIT se basa en hashes SHA para identificar objetos. GIT almacena todo como un objeto, un blob, directorio o commit. Y estos se pueden acceder a través de su hash. En GIT cuando un objeto hace referencia a otro objeto, realmente lo que tiene es una referencia por su hash; no una copia del objeto u otra representación. Pero un hash tiene 40 caracteres hexadecimales, no es una forma fácil de usar o navegar por el historial para un ser humano. Pero GIT también provee una forma simple para referirse a un punto especifico en el historial de snapshots. El más conocido es la referencia *master*, y normalmente en un proyecto *master* apunta al commit más actualizado y estable del repositorio. Otra referencia muy importante es *HEAD*, esta responde a la pregunta donde estamos actualmente en la historia del repositorio. Repositorio es la terminología utilizada para hacer referencia al directorio y este se compone por los objetos y referencias. Esto es lo que se almacena en disco y sobre lo que se basa GIT para habilitar las funcionalidades de colaboración e historia de cambios. Por lo que cuando estamos ejecutando comandos de GIT sobre un repositorio, lo que realmente estamos aplicando son cambios y manipulando el grafo de commits al agregar objetos y modificar referencias.

GIT nos permite utilizar nuestra copia local como un sandbox. Ahí podemos hacer los cambios que queramos y no necesitamos pedir permisos de escritura como en otras herramientas. Pero además GIT agrega otro concepto más para permitir al usuario elegir qué cambios desea agregar a la estructura de commits. A esta área se le nombre de *Staging*. Aquí la persona que realizo los cambios sobre distintos archivos puede elegir agregarlos al área de *Staging* donde se alistaran y agregara un comentario describiendo los cambios. De esta forma GIT permite acomodar los cambios con una gran flexibilidad. 

Algunos comandos que nos permiten manipular o nos dan información acerca de nuestro repositorio:

In [1]:
""" git status nos permite ver el estado actual de nuestro repositorio """
%sx git status


['On branch main',
 "Your branch is up to date with 'origin/main'.",
 '',
 'Changes not staged for commit:',
 '  (use "git add <file>..." to update what will be committed)',
 '  (use "git restore <file>..." to discard changes in working directory)',
 '\tmodified:   GIT.ipynb',
 '',
 'no changes added to commit (use "git add" and/or "git commit -a")']

In [2]:
""" git --help  nos muestra ayuda para  """
!!git --help

['usage: git [--version] [--help] [-C <path>] [-c <name>=<value>]',
 '           [--exec-path[=<path>]] [--html-path] [--man-path] [--info-path]',
 '           [-p | --paginate | -P | --no-pager] [--no-replace-objects] [--bare]',
 '           [--git-dir=<path>] [--work-tree=<path>] [--namespace=<name>]',
 '           <command> [<args>]',
 '',
 'These are common Git commands used in various situations:',
 '',
 'start a working area (see also: git help tutorial)',
 '   clone             Clone a repository into a new directory',
 '   init              Create an empty Git repository or reinitialize an existing one',
 '',
 'work on the current change (see also: git help everyday)',
 '   add               Add file contents to the index',
 '   mv                Move or rename a file, a directory, or a symlink',
 '   restore           Restore working tree files',
 '   rm                Remove files from the working tree and from the index',
 '   sparse-checkout   Initialize and modify the spar

In [3]:
""" git add nos permite agregar objetos con cambios al area de Staging """
!!git add .


 'The file will have its original line endings in your working directory']

In [5]:
""" git commit nos permite crear generar el snapshot con los elementos que se encuentren en el area de Staging y crear el commit en nuestro repositorio local """
!!git commit -m "Tarea 2: Git Fundamentals"

['[main eaff20d] Tarea 2: Git Fundamentals',
 ' 1 file changed, 51 insertions(+), 29 deletions(-)']

In [6]:
""" git push nos permite enviar nuestros commits locales para sincronizar los cambios con el repositorio en Github 
    o cualquier otro servicio de alojamiento de repositorios en la nube """
!!git push

['To github.com:mazg-95/data-science-2021.git',
 '   d472507..eaff20d  main -> main']

In [None]:
""" Si deseamos crear una copia local de un repositorio alojado en un servicio de alojamiento de repositorios podemos usar el comando"""
!!git clone <url-repo>

In [None]:
""" Si queremos crear un repositorio local nuevo,  lo podemos hacer utilizando el comando"""
!!git init

In [7]:
""" Para sincronizar nuestra copia del repositorio (objetos y referencias) del origen podes usar:"""
!!git fetch

[]

In [8]:
""" Para integrar los objetos y referencias que han sido agregados a nuestra copia local se utiliza:"""
!!git pull

['error: cannot pull with rebase: You have unstaged changes.',
 'error: please commit or stash them.']

In [9]:
""" Si queremos crear una nueva branch para continuar trabjando nuestros cambios sin afectar master """
!!git branch tarea2-git-fundamentals

[]

In [10]:
""" Para cambiarse de branch (cambiar la referencia en la que nos encontramos) podemos usar: """
!!git checkout  tarea2-git-fundamentals

['M\tTarea2/GIT.ipynb', "Switched to branch 'tarea2-git-fundamentals'"]

In [11]:
!!git checkout  main

['M\tTarea2/GIT.ipynb',
 "Your branch is up to date with 'origin/main'.",
 "Switched to branch 'main'"]