<img src="https://raw.githubusercontent.com/andre-marcos-perez/ebac-course-utils/main/media/logo/newebac_logo_black_half.png" alt="ebac-logo">

---

# **Módulo** | Análise de Dados: Controle de Versão I
Caderno de **Aula**<br>
Professor [André Perez](https://www.linkedin.com/in/andremarcosperez/)

---

# **Tópicos**

<ol type="1">
  <li>Introdução ao Git;</li>
  <li>Introdução ao GitHub;</li>
  <li>Criando um repositório no GitHub.</li>
</ol>

---

# **Aulas**

## 1\. Introdução ao Git

No mercado é muito comum trabalhar em equipes (mistas ou não) de analistas de dados, cientistas de dados, engenheiros de dados, especialistas de negócio, etc. Neste contexto, ao se utilizar programação como ferramenta de trabalho, é preciso garantir que:

 - os **códigos** estejam disponíveis em algum **repositório** externo;
 - que haja um **histórico de alterações** dos **códigos**;
 - etc.

O [git](https://git-scm.com/) é um software de controle de versão distribuído de **arquivos**. Ele vem pré instalado em muitos sistemas operacionais mas você pode encontrar instruções de instalação para Linux/MacOS/Windows neste [link](https://www.atlassian.com/br/git/tutorials/install-git). Nas máquinas virtuais do Google Colab o `git` já vem instalado.

In [None]:
!git --version

git version 2.34.1


O `git` utiliza o conceito de repositório (diretório **local** com uma pasta `.git`) para organizar projetos. Dentro do repositório, modificações em arquivos podem ser:

 - visualizadas (`git status`);
 - adicionadas (`git add`);
 - salvas (`git commit`);
 - etc.

Exemplo:

In [None]:
!mkdir ./projeto
!touch ./projeto/hello.py

In [None]:
%cd /content/projeto/

/content/projeto


In [None]:
# Cria a pasta 'projeto' se ela não existir
#import os

#os.makedirs('/projeto', exist_ok=True)

# Cria e escreve no arquivo hello.py dentro da pasta 'projeto'
with open('/content/projeto/hello.py', 'w') as f:
    f.write("print('hello world')")  # Escreve "hello world" no arquivo

# Verifica se o arquivo foi criado
!ls hello.py

ls: cannot access 'projeto': No such file or directory


In [None]:
!pwd

/content/projeto


In [None]:
!python3 hello.py

hello world


In [None]:
# criar um repositório
!git init

Reinitialized existing Git repository in /content/projeto/.git/


In [None]:
# visualizar o estado do repositório
!git status

On branch master

No commits yet

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	[31mhello.py[m

nothing added to commit but untracked files present (use "git add" to track)


In [None]:
# adicionar modificações
!git add hello.py
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [None]:
# visualizar o estado do repositório
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [None]:
# adicionar modificações
!git add hello.py
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [None]:
# salvar as alterações
!git commit -m "arquivo hello.py criado"
!git status

Author identity unknown

*** Please tell me who you are.

Run

  git config --global user.email "you@example.com"
  git config --global user.name "Your Name"

to set your account's default identity.
Omit --global to set the identity only in this repository.

fatal: unable to auto-detect email address (got 'root@e3c6c52a74df.(none)')
On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [None]:
%cd /content/

/content


O `git` possui seu próprio jargão e seu uso é feito através da linha de comando (`bash` no Linux/MacOS e `cmd` no Windows) e por isso ele é conhecido por ser difícil de se aprender.

In [None]:
!git --help

## 2\. Introdução ao GitHub

O `git` utiliza o conceito de repositório (diretório **local** com uma pasta `.git`) para organizar projetos. Existem diversas empresas e organizações que oferecem versões **remotas** (online) de repositórios:

 - [GitHub](https://github.com/);
 - [GitLab](https://about.gitlab.com/);
 - [Bitbucket](https://bitbucket.org/).

Para fazer o download de um projeto, basta utilizar o comando `git clone`. Como examplo, vamos fazer o download do projeto *Awesome Public Datasets* ([link](https://github.com/awesomedata/awesome-public-datasets)):

In [None]:
!git clone https://github.com/awesomedata/awesome-public-datasets

Cloning into 'awesome-public-datasets'...
remote: Enumerating objects: 2119, done.[K
remote: Counting objects: 100% (425/425), done.[K
remote: Compressing objects: 100% (20/20), done.[K
remote: Total 2119 (delta 410), reused 406 (delta 405), pack-reused 1694 (from 1)[K
Receiving objects: 100% (2119/2119), 940.21 KiB | 12.05 MiB/s, done.
Resolving deltas: 100% (1296/1296), done.


## 3\. Criando um repositório no GitHub

 > Conta

 - Criar uma conta no GitHub.

 - Criar um *personal access token*.

 - Configurar a conexão entre o `git` local com o `git` remoto (GitHub):

In [None]:
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

In [None]:
import os

username = "mateus4411"
os.environ["GITHUB_USER"] = username

!git config --global user.name "${GITHUB_USER}"

In [None]:
import os
from getpass import getpass

usermail = getpass()
os.environ["GITHUB_MAIL"] = usermail

!git config --global user.email "${GITHUB_MAIL}"

··········


In [None]:
import os
from getpass import getpass

usertoken = getpass()
os.environ["GITHUB_TOKEN"] = usertoken

··········


 > Projeto

 - Criar o projeto **remoto**.

 - Fazer o download do projeto **remoto** na máquina **local**.

In [None]:
!git clone https://${GITHUB_USER}:${GITHUB_TOKEN}@github.com/mateus4411/da-ebac.git

Cloning into 'da-ebac'...
remote: Enumerating objects: 5, done.[K
remote: Counting objects: 100% (5/5), done.[K
remote: Compressing objects: 100% (4/4), done.[K
remote: Total 5 (delta 0), reused 0 (delta 0), pack-reused 0 (from 0)[K
Receiving objects: 100% (5/5), done.


In [None]:
%cd /content/da-ebac/

/content/da-ebac


 - Criar um arquivo e salvar as aterações no repositório **local**.

In [None]:
!touch hello.py
!git status

On branch main
Your branch is up to date with 'origin/main'.

Untracked files:
  (use "git add <file>..." to include in what will be committed)
	[31mhello.py[m

nothing added to commit but untracked files present (use "git add" to track)


In [None]:
!git add hello.py
!git status

On branch main
Your branch is up to date with 'origin/main'.

Changes to be committed:
  (use "git restore --staged <file>..." to unstage)
	[32mnew file:   hello.py[m



In [None]:
!git commit -m "arquivo hello.py criado"
!git status

[main 7c69d2e] arquivo hello.py criado
 1 file changed, 1 insertion(+)
 create mode 100644 hello.py
On branch main
Your branch is ahead of 'origin/main' by 1 commit.
  (use "git push" to publish your local commits)

nothing to commit, working tree clean


 - Enviar as alterações para o repositório **remoto**.

In [None]:
!git push origin main
!git status

Enumerating objects: 4, done.
Counting objects:  25% (1/4)Counting objects:  50% (2/4)Counting objects:  75% (3/4)Counting objects: 100% (4/4)Counting objects: 100% (4/4), done.
Delta compression using up to 2 threads
Compressing objects:  50% (1/2)Compressing objects: 100% (2/2)Compressing objects: 100% (2/2), done.
Writing objects:  33% (1/3)Writing objects:  66% (2/3)Writing objects: 100% (3/3)Writing objects: 100% (3/3), 300 bytes | 300.00 KiB/s, done.
Total 3 (delta 1), reused 0 (delta 0), pack-reused 0
remote: Resolving deltas:   0% (0/1)[Kremote: Resolving deltas: 100% (1/1)[Kremote: Resolving deltas: 100% (1/1), completed with 1 local object.[K
To https://github.com/mateus4411/da-ebac.git
   057343c..7c69d2e  main -> main
On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean
