<a href="https://colab.research.google.com/github/GabrielBeninga/Ebac-Profissao-Analista-de-Dados/blob/main/Profissao_Analista_de_dados_M17_Material_de_apoio.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://raw.githubusercontent.com/andre-marcos-perez/ebac-course-utils/main/media/logo/newebac_logo_black_half.png" alt="ebac-logo">

---

# **Módulo** | Análise de Dados: Controle de Versão I
Caderno de **Aula**<br>
Professor [André Perez](https://www.linkedin.com/in/andremarcosperez/)

---

# **Tópicos**

<ol type="1">
  <li>Introdução ao Git;</li>
  <li>Introdução ao GitHub;</li>
  <li>Criando um repositório no GitHub.</li>
</ol>

---

# **Aulas**

## 1\. Introdução ao Git

No mercado é muito comum trabalhar em equipes (mistas ou não) de analistas de dados, cientistas de dados, engenheiros de dados, especialistas de negócio, etc. Neste contexto, ao se utilizar programação como ferramenta de trabalho, é preciso garantir que:

 - os **códigos** estejam disponíveis em algum **repositório** externo;
 - que haja um **histórico de alterações** dos **códigos**;
 - etc.

O [git](https://git-scm.com/) é um software de controle de versão distribuído de **arquivos**. Ele vem pré instalado em muitos sistemas operacionais mas você pode encontrar instruções de instalação para Linux/MacOS/Windows neste [link](https://www.atlassian.com/br/git/tutorials/install-git). Nas máquinas virtuais do Google Colab o `git` já vem instalado.

In [30]:
!git --version

git version 2.34.1


O `git` utiliza o conceito de repositório (diretório **local** com uma pasta `.git`) para organizar projetos. Dentro do repositório, modificações em arquivos podem ser:

 - visualizadas (`git status`);
 - adicionadas (`git add`);
 - salvas (`git commit`);
 - etc.

Exemplo:

In [15]:
!mkdir ./projeto
!touch ./projeto/hello.py

mkdir: cannot create directory ‘./projeto’: File exists


In [16]:
%cd /content/projeto/

/content/projeto


In [17]:
!pwd

/content/projeto


In [18]:
!python3 hello.py

In [19]:
# criar um repositório
!git init

Reinitialized existing Git repository in /content/projeto/.git/


In [20]:
# visualizar o estado do repositório
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [21]:
# adicionar modificações
!git add hello.py
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [22]:
# visualizar o estado do repositório
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [23]:
# adicionar modificações
!git add hello.py
!git status

On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [24]:
# salvar as alterações
!git commit -m "arquivo hello.py criado"
!git status

Author identity unknown

*** Please tell me who you are.

Run

  git config --global user.email "you@example.com"
  git config --global user.name "Your Name"

to set your account's default identity.
Omit --global to set the identity only in this repository.

fatal: unable to auto-detect email address (got 'root@11aa18f580e2.(none)')
On branch master

No commits yet

Changes to be committed:
  (use "git rm --cached <file>..." to unstage)
	[32mnew file:   hello.py[m



In [25]:
%cd /content/

/content


O `git` possui seu próprio jargão e seu uso é feito através da linha de comando (`bash` no Linux/MacOS e `cmd` no Windows) e por isso ele é conhecido por ser difícil de se aprender.

In [26]:
!git --help

usage: git [--version] [--help] [-C <path>] [-c <name>=<value>]
           [--exec-path[=<path>]] [--html-path] [--man-path] [--info-path]
           [-p | --paginate | -P | --no-pager] [--no-replace-objects] [--bare]
           [--git-dir=<path>] [--work-tree=<path>] [--namespace=<name>]
           [--super-prefix=<path>] [--config-env=<name>=<envvar>]
           <command> [<args>]

These are common Git commands used in various situations:

start a working area (see also: git help tutorial)
   clone     Clone a repository into a new directory
   init      Create an empty Git repository or reinitialize an existing one

work on the current change (see also: git help everyday)
   add       Add file contents to the index
   mv        Move or rename a file, a directory, or a symlink
   restore   Restore working tree files
   rm        Remove files from the working tree and from the index

examine the history and state (see also: git help revisions)
   bisect    Use binary search to find th

## 2\. Introdução ao GitHub

O `git` utiliza o conceito de repositório (diretório **local** com uma pasta `.git`) para organizar projetos. Existem diversas empresas e organizações que oferecem versões **remotas** (online) de repositórios:

 - [GitHub](https://github.com/);
 - [GitLab](https://about.gitlab.com/);
 - [Bitbucket](https://bitbucket.org/).

Para fazer o download de um projeto, basta utilizar o comando `git clone`. Como examplo, vamos fazer o download do projeto *Awesome Public Datasets* ([link](https://github.com/awesomedata/awesome-public-datasets)):

In [27]:
!git clone https://github.com/awesomedata/awesome-public-datasets

Cloning into 'awesome-public-datasets'...
remote: Enumerating objects: 2104, done.[K
remote: Counting objects: 100% (2104/2104), done.[K
remote: Compressing objects: 100% (818/818), done.[K
remote: Total 2104 (delta 1288), reused 2093 (delta 1285), pack-reused 0[K
Receiving objects: 100% (2104/2104), 892.58 KiB | 3.34 MiB/s, done.
Resolving deltas: 100% (1288/1288), done.


## 3\. Criando um repositório no GitHub

 > Conta

 - Criar uma conta no GitHub.

 - Criar um *personal access token*.

 - Configurar a conexão entre o `git` local com o `git` remoto (GitHub):

In [2]:
import os

username = "GabrielBeninga"
os.environ["GITHUB_USER"] = username

!git config --global user.name "${GITHUB_USER}"

In [3]:
import os
from getpass import getpass

usermail = getpass()
os.environ["GITHUB_MAIL"] = usermail

!git config --global user.email "${GITHUB_MAIL}"

··········


In [4]:
import os
from getpass import getpass

usertoken = getpass()
os.environ["GITHUB_TOKEN"] = usertoken

··········


 > Projeto

 - Criar o projeto **remoto**.

 - Fazer o download do projeto **remoto** na máquina **local**.

In [5]:
!git clone https://${GITHUB_USER}:${GITHUB_TOKEN}@github.com/andre-marcos-perez/da-ebac.git

Cloning into 'da-ebac'...
remote: Enumerating objects: 15, done.[K
remote: Counting objects: 100% (15/15), done.[K
remote: Compressing objects: 100% (10/10), done.[K
remote: Total 15 (delta 4), reused 7 (delta 1), pack-reused 0[K
Receiving objects: 100% (15/15), done.
Resolving deltas: 100% (4/4), done.


In [6]:
%cd /content/da-ebac/

/content/da-ebac


 - Criar um arquivo e salvar as aterações no repositório **local**.

In [7]:
!touch hello.py
!git status

On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean


In [8]:
!git add hello.py
!git status

On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean


In [9]:
!git commit -m "arquivo hello.py criado"
!git status

On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean
On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean


 - Enviar as alterações para o repositório **remoto**.

In [10]:
!git push origin main
!git status

remote: Support for password authentication was removed on August 13, 2021.
remote: Please see https://docs.github.com/get-started/getting-started-with-git/about-remote-repositories#cloning-with-https-urls for information on currently recommended modes of authentication.
fatal: Authentication failed for 'https://github.com/andre-marcos-perez/da-ebac.git/'
On branch main
Your branch is up to date with 'origin/main'.

nothing to commit, working tree clean
