<img src="https://raw.githubusercontent.com/andre-marcos-perez/ebac-course-utils/main/media/logo/newebac_logo_black_half.png" alt="ebac-logo">

---

# **Módulo** | Análise de Dados: Controle de Versão I
Caderno de **Aula**<br> 
Professor [André Perez](https://www.linkedin.com/in/andremarcosperez/)

---

# **Tópicos**

<ol type="1">
  <li>Introdução ao Git;</li>
  <li>Introdução ao GitHub;</li>
  <li>Criando um repositório no GitHub.</li>
</ol>

---

# **Aulas**

## 1\. Introdução ao Git

No mercado é muito comum trabalhar em equipes (mistas ou não) de analistas de dados, cientistas de dados, engenheiros de dados, especialistas de negócio, etc. Neste contexto, ao se utilizar programação como ferramenta de trabalho, é preciso garantir que: 

 - os **códigos** estejam disponíveis em algum **repositório** externo;
 - que haja um **histórico de alterações** dos **códigos**;
 - etc.

O [git](https://git-scm.com/) é um software de controle de versão distribuído de **arquivos**. Ele vem pré instalado em muitos sistemas operacionais mas você pode encontrar instruções de instalação para Linux/MacOS/Windows neste [link](https://www.atlassian.com/br/git/tutorials/install-git). Nas máquinas virtuais do Google Colab o `git` já vem instalado.

In [1]:
!git --version

git version 2.17.1


O `git` utiliza o conceito de repositório (diretório **local** com uma pasta `.git`) para organizar projetos. Dentro do repositório, modificações em arquivos podem ser:

 - visualizadas (`git status`);
 - adicionadas (`git add`);
 - salvas (`git commit`);
 - etc.

Exemplo:

In [2]:
!mkdir ./projeto                  # cria uma pasta
!touch ./projeto/hello.py    # cria um script Python

In [3]:
%cd /content/projeto/        # entra na pasta

/content/projeto


In [4]:
!pwd  # confirma que estamos dentro de um diretório (print working directory)

/content/projeto


In [5]:
!python3 hello.py             # executa o script

In [6]:
# criar um repositório
!git init

Initialized empty Git repository in /content/projeto/.git/


In [7]:
# visualizar o estado do repositório
!git status

On branch master

No commits yet

Untracked files:
  (use "git add <file>..." to include in what will be committed)

	[31mhello.py[m

nothing added to commit but untracked files present (use "git add" to track)


In [8]:
# adicionar modificações
!git add hello.py
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   hello.py[m



In [10]:
# visualizar o estado do repositório
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   hello.py[m

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)

	[31mmodified:   hello.py[m



In [11]:
# adicionar modificações
!git add hello.py
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   hello.py[m



In [12]:
# salvar as alterações
!git commit -m "arquivo hello.py criado"
!git status


*** Please tell me who you are.

Run

  git config --global user.email "you@example.com"
  git config --global user.name "Your Name"

to set your account's default identity.
Omit --global to set the identity only in this repository.

fatal: unable to auto-detect email address (got 'root@61014cde8c51.(none)')
On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)

	[32mnew file:   hello.py[m



In [None]:
%cd /content/

/content


O `git` possui seu próprio jargão e seu uso é feito através da linha de comando (`bash` no Linux/MacOS e `cmd` no Windows) e por isso ele é conhecido por ser difícil de se aprender.

In [None]:
!git --help

usage: git [--version] [--help] [-C <path>] [-c <name>=<value>]
           [--exec-path[=<path>]] [--html-path] [--man-path] [--info-path]
           [-p | --paginate | --no-pager] [--no-replace-objects] [--bare]
           [--git-dir=<path>] [--work-tree=<path>] [--namespace=<name>]
           <command> [<args>]

These are common Git commands used in various situations:

start a working area (see also: git help tutorial)
   clone      Clone a repository into a new directory
   init       Create an empty Git repository or reinitialize an existing one

work on the current change (see also: git help everyday)
   add        Add file contents to the index
   mv         Move or rename a file, a directory, or a symlink
   reset      Reset current HEAD to the specified state
   rm         Remove files from the working tree and from the index

examine the history and state (see also: git help revisions)
   bisect     Use binary search to find the commit that introduced a bug
   grep       Prin

## 2\. Introdução ao GitHub

O `git` utiliza o conceito de repositório (diretório **local** com uma pasta `.git`) para organizar projetos. Existem diversas empresas e organizações que oferecem versões **remotas** (online) de repositórios:

 - [GitHub](https://github.com/);
 - [GitLab](https://about.gitlab.com/);
 - [Bitbucket](https://bitbucket.org/).

Para fazer o download de um projeto, basta utilizar o comando `git clone`. Como examplo, vamos fazer o download do projeto *Awesome Public Datasets* ([link](https://github.com/awesomedata/awesome-public-datasets)):

In [None]:
!git clone https://github.com/awesomedata/awesome-public-datasets

Cloning into 'awesome-public-datasets'...
remote: Enumerating objects: 2020, done.[K
remote: Counting objects: 100% (22/22), done.[K
remote: Compressing objects: 100% (12/12), done.[K
remote: Total 2020 (delta 12), reused 12 (delta 10), pack-reused 1998[K
Receiving objects: 100% (2020/2020), 860.93 KiB | 3.40 MiB/s, done.
Resolving deltas: 100% (1221/1221), done.


In [None]:
!git clone https://github.com/OviedoVR/DRX-Python-GoogleColab.git

Cloning into 'DRX-Python-GoogleColab'...
remote: Enumerating objects: 12, done.[K
remote: Counting objects: 100% (12/12), done.[K
remote: Compressing objects: 100% (10/10), done.[K
remote: Total 12 (delta 1), reused 0 (delta 0), pack-reused 0[K
Unpacking objects: 100% (12/12), done.


## 3\. Criando um repositório no GitHub

 > Conta

 - Criar uma conta no GitHub.

 - Criar um *personal access token*.

 - Configurar a conexão entre o `git` local com o `git` remoto (GitHub):

In [None]:
import os

username = "OviedoVR"
os.environ["GITHUB_USER"] = username

!git config --global user.name "${GITHUB_USER}"

In [None]:
import os
from getpass import getpass

usermail = getpass()
os.environ["GITHUB_MAIL"] = usermail

!git config --global user.email "${GITHUB_MAIL}"

··········


In [None]:
import os
from getpass import getpass

usertoken = getpass()
os.environ["GITHUB_TOKEN"] = usertoken

··········


 > Projeto

 - Criar o projeto **remoto**.

 - Fazer o download do projeto **remoto** na máquina **local**.

In [None]:
#!git clone https://${GITHUB_USER}:${GITHUB_TOKEN}@github.com/andre-marcos-perez/da-ebac.git

In [None]:
!git clone https://${GITHUB_USER}:${GITHUB_TOKEN}@github.com/OviedoVR/ebac-learning.git

Cloning into 'ebac-learning'...
remote: Enumerating objects: 5, done.[K
remote: Counting objects: 100% (5/5), done.[K
remote: Compressing objects: 100% (4/4), done.[K
remote: Total 5 (delta 0), reused 0 (delta 0), pack-reused 0[K
Unpacking objects: 100% (5/5), done.


In [None]:
%cd /content/ebac-learning/

/content/ebac-learning


 - Criar um arquivo e salvar as aterações no repositório **local**.

In [None]:
!touch hello.py
!git status

On branch main
Your branch is up to date with 'origin/main'.

Untracked files:
  (use "git add <file>..." to include in what will be committed)

	[31mhello.py[m

nothing added to commit but untracked files present (use "git add" to track)


In [None]:
!git add hello.py
!git status

On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git reset HEAD <file>..." to unstage)

	[32mmodified:   hello.py[m



In [None]:
!git commit -m "arquivo hello.py criado"
!git status

[main a0a6461] arquivo hello.py criado
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 hello.py
On branch main
Your branch is ahead of 'origin/main' by 1 commit.
  (use "git push" to publish your local commits)

Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)

	[31mmodified:   hello.py[m

no changes added to commit (use "git add" and/or "git commit -a")


In [None]:
!git commit -m "Arquivo alterado"

[main 0ff8dbc] Arquivo alterado
 1 file changed, 1 insertion(+)


 - Enviar as alterações para o repositório **remoto**.

In [None]:
!git push origin main
!git status

Counting objects: 3, done.
Delta compression using up to 2 threads.
Compressing objects:  50% (1/2)   Compressing objects: 100% (2/2)   Compressing objects: 100% (2/2), done.
Writing objects:  33% (1/3)   Writing objects:  66% (2/3)   Writing objects: 100% (3/3)   Writing objects: 100% (3/3), 284 bytes | 284.00 KiB/s, done.
Total 3 (delta 1), reused 0 (delta 0)
remote: Resolving deltas:   0% (0/1)[Kremote: Resolving deltas: 100% (1/1)[Kremote: Resolving deltas: 100% (1/1), completed with 1 local object.[K
To https://github.com/OviedoVR/ebac-learning.git
   a0a6461..0ff8dbc  main -> main
On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean
