# Guia Git(Hub)

El propósito de esta guía es introducirlos al mundo de los sistemas de control de versión, y en específico, al uso de Git y GitHub.

**Antes de comenzar**: *es importante que sepan que existen interfaces graficas que permiten el uso de Git de una forma mas facil e intuitiva, pero por razones pedagogicas, no las usaremos en este curso.*

### 0. Uso de Anaconda Prompt (o Terminal)

Aquí les dejo algunos comandos útiles para "navegar" en el Terminal:

    cd [nombre carpeta] : permite "entrar" o moverse a la carpeta [nombre carpeta]
    cd .. : permite retroceder 1 directorio hacia atrás
    dir : presenta todas las carpetas y archivos del directorio actual (EN SISTEMAS UNIX, SE PUEDE USAR "ls")
    echo %CD% : permite conocer el directorio de trabajo actual (EN SISTEMAS UNIX, SE PUEDE USAR "pwd")
    mkdir [nombre] : permite crear una carpeta con nombre [nombre]
    
Con las flechas "arriba" y "abajo" del teclado pueden navegar a través de la historia de comandos ejecutados anteriormente.

La tecla "tab" sirve para auto-completar el nombre de algún directorio o archivo.
    

### 1. Instalación

Para instalar la aplicación "git" con Anaconda, abrir Anaconda Prompt y correr el siguiente comando:

```
conda install -c anaconda git 
```

Para instalar "git" en sistemas Unix, se puede usar el administrador de paquetes del sistema. Favor referirse a estas instrucciones: https://git-scm.com/book/en/v2/Getting-Started-Installing-Git

### 2. Primer uso de Git: clonar repositorio externo

Lo primero que haremos con Git será "conectar" nuestro computador con el repositorio privado creado en GitHub. Para ello, abrir Anaconda Prompt (Terminal), y navegar hacia la carpeta donde queremos guardar la carpeta del repositorio (para moverse entre carpetas, se usa el comando "`cd`").

En mi caso, cuando abro el Terminal se ve así:
    
    (base) C:\Users\calvarad>
    
Para moverme a la carpeta del curso, escribo `cd GIT_EAE253B` después del símbolo ">", vale decir:

    (base) C:\Users\calvarad>cd GIT_EAE253B

El comando anterior me mueve el directorio de trabajo hacia la carpeta "GIT_EAE253B". Ahora, veo lo siguiente:

    (base) C:\Users\calvarad\GIT_EAE253B>

En dicho directorio, puedo comenzar a "clonar" repositorios de GitHub, con el siguiente comando:

```
git clone [url] 
```

donde "url" es la URL del sitio web del repositorio que quieran clonar (en el caso de su repositorio privado, debería ser algo asi: https://github.com/calvarad/e253b-XXXX.git)


### 3. Publicación de nuestro primer "código"

Ahora, crearemos un archivo de texto y lo subiremos a GitHub. Seguir las siguientes instrucciones:

1. En nuestro computador, ir a la carpeta del repositorio ya clonado y crear un nuevo archivo de texto (puede ser con extensión 
*.txt*; más adelante la cambiaremos)
1. Abrir archivo de texto y escribir "# Este es mi repositorio privado"
1. Guardar el archivo con nombre README.txt y cerrar

Ahora, en el Terminal, seguir las siguientes instrucciones:
1. Primero, asegurarse que estamos en la carpeta del repositorio clonado.
1. Luego, escribir los siguientes comandos, intercalando el comando  `git status`  entre cada uno

```
git add README.txt
git commit -m "agregue mi primer archivo"
git push
```

##### git status
Nos entrega un resume de los archivos que Git está siguiendo y los que no está siguiendo.

##### git add
Con el comando `git add` le estamos diciendo a Git (en nuestro computador) que queremos comenzar a "seguir" los cambios del archivo "README.txt".

##### git commit
Con el comando `git commit` le decimos a Git que queremos "comprometernos" con los cambios realizados hasta este minuto. La lógica de que estos dos comandos estén separados es que, por un lado, podemos querer "seguir" un archivo, pero no siempre vamos a estar seguros de querer "comprometernos" con los cambios realizados. Sólo nos "comprometeremos" cuando estemos conformes con el código que hemos escrito.

El comando `git commit` **SIEMPRE** debe ir acompañado del parámetro "-m", y luego de un mensaje entre comillas.

##### git push
Con el comando `git push` le estamos diciendo a Git que queremos "empujar" nuestro código a alguna otra fuente; en este caso, dado que en un comienzo nosotros "clonamos" otro repositorio Git, el repositorio por defecto con el cual nos sincronizaremos será aquél ubicado en los servidores de GitHub.

### 4. Edición de nuestro primer código
Ahora que hemos subido nuestro código a la web, el flujo de trabajo normal sería seguir modificando nuestro código para perfeccionarlo o agregarle más funcionalidad. Ahora agregaremos un poco más de información al archivo:

1. Abrir archivo README.txt y agregar información sobre ustedes (Nombre, nacionalidad, etc).
1. Guardar y cerrar el archivo

Cuando estemos listos, podemos volver a decirle a Git los 3 comandos del punto 3, vale decir, `git add .. `, `git commit ..` y `git push`. Sin embargo, en este punto podemos juntar los primero dos comandos en una versión abreviada de los dos:

```
git commit -a -m "actualice mi primer archivo"
```

La opción "-a" le dice a Git que queremos "agregar" todos los archivos que hayamos agregado alguna vez en el pasado, y que hayan sido modificados desde el último commit.

Luego de realizar el "commit", pueden "empujar" los cambios a GitHub: `git push`

### 5. Para que nos deje de pedir la contraseña:

-- Guardar contraseña en Windows

```
git config --local credential.helper wincred
```

Referencia: https://stackoverflow.com/questions/11693074/git-credential-cache-is-not-a-git-command

-- Guardar contraseña (otros sistemas)

Ref: https://git-scm.com/docs/git-credential-cache


### 6. Cambio de nombres o eliminación de archivos

Git, al ser un sistema que busca sincronizar archivos en distintos computadores, es un poco rígido en cuanto al tratamiento de nombres y ubicaciones de los archivos.

Por lo mismo, cuando agreguemos un archivo a Git, ya no es recomendable manipular el archivo directamente desde nuestro computador (cambiar de nombre, cambiar de carpeta o eliminar). En vez de eso, lo recomendable es manipular el archivo a través de Git, para que los cambios se vean reflejados en todos los computadores donde tengamos nuestro repositorio sincronizado.

###### Cambio de nombre o mover de carpeta

Para cambiar de nombre o mover de carpeta, se usa el comando `git mv` (mv, de "move"). Practicaremos cambiando el tipo de archivo, desde README.txt a README.md:

```
git mv README.txt README.md
```

Se puede pensar que el comando "git mv" está al mismo nivel que el comando "git add", en el sentido que luego de decirle a Git que queremos mover el archivo, debemos decirle que sí estamos comprometidos con ese cambio (`git commit`) y que sí queremos subir el archivo a GitHub (`git push`).

###### Eliminación
Para eliminar un archivo, se usa el comando `git rm` (rm, de "remove")

### 7. Algunos conceptos de Git(Hub)

##### Branches (ramas)
Cada proyecto/repositorio puede tener 1 o muchas "ramas" (branches). La idea de ramas se incorporó a Git para poder trabajar simultáneamente en distintas versiones o funcionalidades del proyecto, sin afectar el código base.

En este curso no trabajaremos con distintas "ramas".

##### Fork
Un "fork" o bifurcación es un concepto propio de GitHub. La idea de un "fork" es que permite a un usuario "copiar" el código de otro usuario, y comenzar un desarrollo independiente de ese código. Al hacer un "fork" se pierde la conexión entre los proyectos, por lo que "git push" no modificará el proyecto original, y "git pull" no traerá cambios que se hubiesen hecho al proyecto original.

La forma de "empujar" cambios desde un "fork" al proyecto original se llama "pull request", donde el dueño del proyecto original tiene la opción de aceptar o rechazar dicha solicitud.

### 8. Trabajo colaborativo

Una de las grandes ventajas de Git es que nos permite trabajar colaborativamente con otras personas (o con nosotros mismos, en distintos computadores). Para "tirar" cambios que otras personas (computadores) hayan realizado sobre nuestro código, correr el siguiente comando:

```
git pull
```

### OPCIONAL: Lineas versus bytes en Git

En este ejercicio opcional trataremos de entender la diferencia de trabajar con "lineas" versus trabajar con "bytes" en Git.

¿a qué me refiero con esto? 

La forma en que Git hace seguimiento de los archivos es mediante "deltas" de texto. ¿Qué significa esto? Cada vez que subimos o actualizamos un archivo, Git trata de determinar qué líneas de código se han modificado, y sólo actualiza esas líneas de código. Vale decir, Git no guarda distintas versiones de nuestros archivos, sino que guarda el historial de modificaciones.

Sin embargo, Git no puede hacer este seguimiento de "líneas" en el caso de archivos con extensión "especial" (por ejemplo, PDF, xlsx, docx, dta), ya que se requiere software especializado para leer dichos archivos (¿han tratado de abrir un archivo .docx con el editor de texto?).

En el caso de archivos con extensión "especial", dado que Git no puede leer lineas, procede a actualizar el archivo completo cada vez que lo modificamos. Al hacer esto, Git trabaja con "bytes" y no con líneas de texto. Este proceso es un proceso muy ineficiente en cuanto al uso de disco, porque no permite aprovechar el uso de "deltas" de Git. 

Por ello, no se recomienda "seguir" archivos con estas extensiones especiales en Git, sobretodo si estos archivos van a ser modificados frecuentemente. 

*(p.d. esta también es la razón de por qué los programadores/data scientists prefieren trabajar con lenguajes "abiertos" donde se puede leer código sin algún interpretador especial. Ello también explica, en parte, el uso de extensiones CSV o TXT para datos.)*


#### Ejercicio 1:

1. Copiar algún archivo .docx al repositorio git. Correr "add", "commit" y "push" para este archivo.
1. Poner atención al output del comando "push". Señala que subió X número de "bytes"
1. Modificar archivo con Word, guardar, y volver a subir a Git.
1. Poner atención al output del comando "push".

Como podrán ver, el archivo es subido por completo cada vez que se modifica, aunque sea una modificación pequeña. 

Esto explica también la aparición de lenguajes de preparación de documentos (LaTex, Markdown, etc) de código abierto.

#### Ejercicio 2:

Borre el archivo Word con el comando `git rm`