# GIT versjonskontrollsystem

![vc-xkcd](figures/vc-xkcd.jpg)
Bildet er hentet fra http://smutch.github.io/VersionControlTutorial/.

## Målet med et versjonskontrollsystem

- Vi ønsker at flere personer skal kunne jobbe med de samme filene samtidig
  - Branching
- Når vi arbeider samtidig ønsker vi ikke at endringer ødelegger for andre, men vi ønsker å få oppdateringer fra andre
  - Merging
  - Pull requests
- Vi ønsker å kunne gå tilbake i historien til en hvilken som helst tidligere versjon
- Vi ønsker å se hvorfor endinger ble gjort, når og av hvem de ble gjort

### Versjonskontrollsystem er essensielt når man arbeider med andre, men er også veldig nyttig når man arbeider alene

Anta at du jobber med et prosjekt og du har klart å løse oppgaven. Du ønsker nå å eksperimentere med andre løsningsmetoder, men ender opp med å ødelegge koden. Bruker du et versjonskontrollsystem er det mulig å angre, og gå tilbake til en tidligere versjon som fungerer.

**Hva slags type versjonskontrollsystemer har vi?**

I dag er `git` desidert det mest brukte versjonskontrollsystemet.
I en [undersøkelse på stackoverflow](https://insights.stackoverflow.com/survey/2021#section-most-popular-technologies-other-tools) sier over 93% av alle spurte at `git` er en del av arbeidsflyten deres og at det kommer til å fortsette å være det neste år.

Men det finnes også andre VC-systemer: `Bazaar`, `Mercurial`, `Subversion`

## Hva er git?

- `git` er en type versjonskontrollsystem (version control system / VC system)
- `git` putter filene dine inn i noe som kalles et *repository* (repo)
- Et repo er en slags samling av filene dine og hvordan de utvikler seg over tid
    ```
    repository = filesystem * time
    ```
- Dette gjør at vi kan både se på en enkelt fil og hvordan denne endrer seg over tid
- Eller vi kan ta alle filene tilbake til et gitt tidspunkt


### Hvordan får jeg tak i git?

Last ned fra: https://git-scm.com/downloads

Test om `git` er installert ved å kjøre commandoen `git` i terminalen.

## GitHub

* For å forsikre seg om at data ikke går tapt er det alltid lurt å sette opp et git repo på en server
* Gjennom en server har samarbeidspartnere også tilgang til alle oppdateringer
* Eksempler på servere er GitHub, Bitbucket, Gitlab
* Gjennom UiO så har alle en egen bruker på GitHub (https://github.uio.no)

Tips: For å slippe å skrive passordet hver gang kan du sette opp en SSH nøkkel (prøv å google "github ssh key tutorial" eller noe sånt).

## La oss prøve `git` i praksis!

### `git clone <adress>` - klone repository fra GitHub

Adressen til repo'et finner du på UiO sin [GitHub](https://github.uio.no).

**Prøv selv:**

Lag et nytt (tomt) repo på https://github.uio.no . Det kan f.eks hete `MyProject`.


Gå til en mappe i terminalen hvor du kan ha repoet. Vi kan da klone:
```
git clone https://github.uio.no/eirillsh/MyProject.git
```
Adressen til ditt repo finner du på GitHub. 

I mappen med repoet vil det ligge en mappe som heter `.git`:
```
cd MyProject
ls -a
```
Denne inneholder all informasjonen som `git` trenger.

### `git status` - se tilstanden til git

Sjekk status hyppig! Den gir også en del hint. 

### Tilstander i git 

Nå er repoet tomt. Når man legger til filer kan disse ha forskjellige tilstander.

- **Working directory**: mappen slik den ser ut på maskinen din nå 
- **Staging area**: filer klargjort for lagring i git
- **Repository**: lagret i git-historikk! 

![](figures/areas.png)

### `git add <file>` - flytt filendringer fra "working directory" til "staging area"

![](figures/add.png)

**Prøv selv:**

Lag en ny fil med litt kode:
```
# Legg til noe kode i en ny fil `first.py`
```
Når vi bruker kommandoen `git add` på en fil flyttes filen over til "staging area". 
 ```
git add first.py
git status
```
Filen `first.py` er nå klar til å flyttes til repo. 


### `git commit -m "message"` - flytter alt i "staging area" til repoet

![](figures/commit.png)

**Prøv selv:**

Hvis du ikke har brukt git før kan det være greit å sette navn og email i git. Kommandoer for dette er:
```
git config --global user.name "<Navn Navnsesen>"
git config --global user.email <mailadresse>
```

Nå skal vi legge til en melding som beskriver hva vi har gjort:
```
git commit -m "La til first.py"
git status
```
Her går det også an å kun skrive `git commit`. Dette vil åpne en editor (default er mest sannsynlig vim eller nano). Dette kan du endre til for eksempel Visual studio code ved å skrive:
```
git config --global core.editor "code --wait"
```
Det kan være lurt å google hvordan du setter opp din editor som default i git.

Alt som var av filer i "staging area" blir nå fjernet derfra igjen (vi hadde bare `first.py` der) og lagt til i historikken til git-repoet ditt. 

### Filendringer skjer i "working directory"

![](figures/changes.png)


**Prøv selv:**

Gjør endringer i `first.py` og legg det til i "staging area":
```
# gjør en endring i first.py
git add first.py
git status 
``` 
Denne endringen ligger nå i "staging area", som vises under "Changes to be committed" når du ber om git status.

Gjør så nok en endring, men la den ligge i "working directory":
```
# gjør ny endring i first.py
git status 
``` 
Endringen du nå gjorde ligger i "working directory", som vises under "Changes not staged for commit" når du ber om git status. 

Filen `first.py` har tre forskjellige versjoner:
* Den versjonen vi sist committet (repository) 
* Den versjonen vi "added"/"staged" (staged)
* Den versjonen vi akkurat endret (working directory)

### `git diff` - se endringer

* `git diff`: Endringer mellom "working directory" og "staging area"
* `git diff --cached`: Endringer mellom repoet og "staging area"

![](figures/diff.png)

**Prøv selv:**

Filen `first.py` skal nå ha tre forskjellige versjoner. 

De første endringene (som ligger i "staging area") vises ved kommando:
```
git diff --cached
```

De siste endringene (som ligger i working directory) vises ved kommando:
```
git diff
```

### `git restore <file>` - forkaster endringene i "working directory"

![](figures/restore.png)

**Prøv selv:**

Forkast filendringen i "working directory" ved å skrive
```
git restore first.py
```
Du kan nå se at den siste (unstaged) endringen du gjorde i `first.py` er borte! Alt i både "staging area" og "repository" vil forbli uendret. 

### `git restore --staged <file>` - flytt filendringer fra "staging area" tilbake til "working directory"

![](figures/restore-staged.png)

**Prøv selv:**

Flytt endringene  i `first.py` som ikke er i repoet fra "staging area" tilbake til "working directory":
```
git restore --staged first.py
git status
```
Endringene er ikke borte, men ligger kun i "working directory". "Repository" er uendret. 

### "Untracked" - en fjerde tilstand

![](figures/untracked.png)

**Prøv selv:**

Lag en ny fil `second.py`. Ikke legg den til i "staging area". Sjekk status.  
```
touch second.py
git status
```
Filen ligger i "working directory", men du finner den i git-status under "Untracked files".

Filen flyttes direkte til "staging area" ved å bruke: 
```
git add second.py
```
og videre til repoet
```
git commit -m "La til second.py"
```

###  `git rm <file>` - slette filer fra git

For å slette en fil fra git må vi bruke `git rm`: 
```
git rm <file>
```
Dette vil også slette filen fra maskinen din.
    
Dersom du kun ønsker å slette filen fra git, men vil beholde filen på maskinen kan du skrive
```
git rm --cached <file> 
```

**Prøv selv:**

Lag en ny fil `third.py` og legg den i repoet.
```
touch third.py
git add third.py
git commit -m "La til third.py"
```

Vi kan nå slette filen:
```
git rm third.py
git commit -m "Slettet third.py"
```
Slettingen av filen går rett til "staging area" og er derfor klar for commit! Filen er nå borte fra maskinen og repoet.

## Historikk i git 

### `git log` - se på tidligere commits

* *hash*: unik kode for å identifisere committen
* `main`: navn på *branch* (mer om dette senere)
    * Peker nyeste commit
* `HEAD`: viser hvor du er lokalt 

![](figures/log.png)

**Prøv selv:**
Eksempel på output fra `git log`:
```
$ git log
commit 111d831c70ade9a47fd45087035ce9f15982ebf1 (HEAD -> main)
Author: Eirill Hauge <eirill@simula.no>
Date:   Mon Aug 8 14:45:30 2022 +0200

    Slettet third.py

commit 16b80d761fb15c8254ec73f032778432c84e8590
Author: Eirill Hauge <eirill@simula.no>
Date:   Mon Aug 8 14:42:08 2022 +0200

    La til third.py

.
.
.
```
Hver commit er listet med en hash (den lange greien etter commit), en forfatter, dato og beskjed.


### `git checkout <hash>` - se på tidligere commit  

Bruk `checkout` for å få et *snapshot* av repoet ved commit #3:

* Senere commits er da borte fra mappen din slik du ser den
* git-historikken er uendret, så du kan gå tilbake til seneste commit

![](figures/checkout.png)

### `git reset <hash>`  - gå tilbake til tidligere commit 

Bruk `reset` for å gå tilbake til repoet ved commit #3:
 
* Alle endringer fra senere commits legges i "staging area"
* OBS: dette **sletter** alle commits og git-historikk etter `<hash>`

![](figures/reset.png)

### Bytt versjon av enkeltfil 

Både `checkout` og `reset` kan brukes til å gå tilbake til en tidligere versjon av en *enkeltfil*:
* `git checkout <hash> <file>`
* `git reset <hash> <file>` 

Dette kan også brukes for å gjenopprette slettede filer.

**Prøv selv:**

Begynn med å flytte endringene fra `first.py` (og eventuelt andre filer) fra "working directory" til repo. Dette kan gjøres med én linje ved å bruke `-am` som argument til commit:
```
git commit -am "Lagt til mer kode i first.py"
```

Bruk `git log` for å finne hash'en til commit'en hvor `first.py` ble lagt til. Gå tilbake til den gamle versjonen:
```
git checkout <hash> first.py 
```
Du kan nå åpne filene og se at du har en gammel versjon av `first.py`, mens alle andre filer er i sin nyeste versjon.

For å gå tilbake til siste versjon:
```
git checkout HEAD first.py 
```

## GitHub

### Synkronisering av lokalt `git` repo med GitHub

For å synkronisere GitHub med dine lokale commits bruker du
```
git push <remote> <branch>
```
hvor `branch` typisk heter `main` eller `master` før.
  
Sjekk remote med:
```
git remote -v
```
hvor `-v` er kort for `--verbose`. Av konvensjon heter remote `origin`.


#### Set remote 
Legg til "Upstream" med å legge til `-u` (kort for `--set-upstream`):
```
git push -u <remote> <branch>
```
Da kan du senere bruke den enklere versjonen:
```
git push
```

**Prøv selv:**

Push så hele repoet til GitHub:
```
git push origin main
```
Obs: Det er mulig at din `<branch>` heter `master`, ikke `main`.

Sjekk på [GitHub](https://github.uio.no) at filene ligger der nå.

### `.gitignore` -  Ignorere filer

Noen ganger har vi filer i mappen som vi ikke ønsker å inkludere. Eksempler kan være
* Private notater
* `__pycache__`
* `.ipynb_checkpoints`
* `.DS_Store` (mac)

Disse kan vi be git om å ignorere ved å legge til en fil som heter `.gitignore`

For mer info: https://www.gitignore.io

**Prøv selv:**

Et eksempler på filer som er unødvendig å ha med  er `__pycache__`.

Generer `__pycache__` ved å først importere `first` i `second.py`.
```
# legg til "import first" i second.py
python second.py
git status
```
Den nye mappen `__pycache__` er unødvendig å ha med i repoet, og ligger nå under "Untracked files".

For å ignorere denne lager vi en ignorefil. Lag en ny fil som heter `.gitignore` og skriv `__pycache__` i den. På kort:
```
echo "__pycache__" >> .gitignore
git status
```
Legg merke til at "Untracked files" nå inkluderer `.gitignore`, men ikke `__pycache__`!


Legg til alle endringene til repo og synkroniser med remote:
```
git add .
git commit -m "La til ignorefil"
git push
```
Sjekk repoet på GitHub, `__pycache__` skal ikke være der. 

### `git pull` - hent endringer fra GitHub til lokalt repo

For å synkronisere din lokale mappe med GitHub bruker du
```
git pull <remote> <branch>
```
Eventuelt bare
```
git pull
```

### merge-konflikt

Anta nå at to personer jobber i samme repo samtidig. Du har gjort noen endringer, og vil pushe disse opp til GitHub.

* Du kan ikke pushe hvis du ligger bak i commits
   - pull først, så push 
   
* Hvis dine endringer er i forskjellige filer enn endringene på remote:
    - pull, rett frem merge, så push

* Hvis det ikke er trivielt å merge:
    - pull gir merge-konflikt! Løs konflikten, commit, så push

Pull alltid fra remote før du begynner å jobbe!

**Prøv selv:**

Gi en medstudent tilgang til ditt repo.

Medstudent:
```
git clone <adresse>
# Legg til en linje på slutten av second.py 
git commit -am "La til noe second.py"
git push 
```
Dette vil gå helt fint! 

Da er det din tur:
```
# Legg til noe annet på slutten av second.py  
git commit -m "La også til noe i second.py"
git push 
```
Her får du en stor feilmelding, fordi du ikke har fått siste commit fra medstudenten din. 

Du må derfor bruke pull først. Endringene er i samme fil, og det vil oppstå en merge-konflikt. Denne løses ved å åpne `first.py` og manuelt fikse filen. 
```
git pull 
# løs konflikt i second.py
git add second.py
git commit -m "konflikt løst"
git push 
```


## git branching (forgreninger)

Forgreninger bruker vi når vi ønsker å utvikle noe nytt eller fikse en feil uten å ødelegge noe for andre.

* **Hovedgrenen** kalles `main` 
    * Det het `master` før, ble nylig byttet ut med `main`
* ` git branch`: List alle lokale forgreninger
* ` git branch -a`: List alle forgreninger du har både lokalt og remote

### `git branch <branch>` - lag ny branch


**Prøv selv:**

Lag en ny branch som heter `testing`:
```
git branch testing
```
Sjekk at den nye branch'en er der ved å liste branches:
```
git branch
```
Nå skal du ha to braches, `main` og `testing`. Du er nå på `main`, så den vil være markert. 

![](figures/new_branch.png)

### `git switch <branch>` - bytte branch

Dette kan gjøres på to måter: 
* `git switch <branch>`
* `git checkout <branch>`

Nye kommandoer ble lagt til for noen år siden for å erstatte noen av funksjonene til `checkout`.

**Prøv selv:**

For å begynne å jobbe på den nye branch'en må vi først flytte `HEAD` til `testing`.
```
git switch testing
```
Sjekk at du er på riktig branch:
```
git branch
```
Nå skal `testing` være markert. 


![](figures/switch.png)

### Gjør begge stegene samtidig

I stedet for å først lage en ny branch og deretter bytte til den, kan vi gjøre alt i én kommando. Da kan du bruke en av disse:

* `git switch -c <branch>`
* `git checkout -b <branch>`

### Legge til commits i branch

Nye commits legges kun i branchen du jobber i. 


**Prøv selv:**

Lag en ny fil og legg til i repo i branchen `testing`:
```
touch test.py
# eventuelt legg til noe kode i test.py
git add test.py 
git commit -m "La til testfil"
```

![](figures/advance.png)

###  Brancher på GitHub 

Alle branchene kan pushes til remote på [GitHub](https://github.uio.no). 

Husk at *upstream* ikke er satt for ny branch.

**Prøv selv:**

Prøv å pushe med:
```
git push
```
Her blir det feilmelding! Denne vil ikke fungere fordi GitHub ikke finner en branch `testing`. 

Når du pusher en ny branch må du presisere `remote` og `branch`: 
```
git push -u origin testing
```
set upstream med `-u`, så kan du bruke kortversjonen `git push` neste gang.

Finn ditt repo på [GitHub](https://github.uio.no) og se at det nå er flere brancher der.

#### Hva skjer om vi skriver `git switch main`?

![](figures/advance.png)

####  `git switch main`:

![](figures/advance-switch.png)

**Prøv selv:**

Bytt branch til `main` og sjekk git-loggen:
```
git switch main
git log
```
Siste commit (som ble lagt til i `testing`) er ikke i loggen til `main`.

### Divergerende brancher 

Jobbes det i flere brancher samtidig, så vil de divergere.

**Prøv selv:**


Gjør først noen endringer i `main` og push til GitHub:
```
# legg til noe kode i second.py 
git commit -am "Mer kode i second.py"
git push
```

Bytt så til `testing` og gjør en ny endring der:
```
# legg til noe kode i first.py 
git commit -am "Ny kode til first.py"
git push
```

Nå divergerer `testing` og `main`.

![](figures/diverge_testing.png)

## Branch merging

* Fletter inn divergerende commits fra en annen branch

### Pull Request (PR)

- Be om å merge *din branch* inn i en annen branch (ofte til `main`) på GitHub
- PR er et verktøy som kan brukes til å fortelle andre hva du har endret og hvorfor
- I en PR kan man se over koden og komme med kommentarer og ha en diskusjon rundt endringene som er gjort
- Når noen ser over koden i en pull request kalles det for **code review**

**Prøv selv:**

Gå inn på repoet ditt på [GitHub](https://github.uio.no). `main` og `testing` divergerer nå, så det skal stå en knapp over filoversikten med **Compare and pull**. Hvis den ikke er der, så finner du den ved å gå til *branches*. 

Trykk på **New pull request**. 

Nå kan du skrive kommentarer om hva du har gjort og hvorfor du vil merge. Trykk så på **Create pull request**. 

Det skal ikke være noen konflikter, så merge skal være rett frem. Det bør stå noe som "*This branch has no conflicts with the base branch*". Egentlig er det noen andre som burde gjøre code review, men du kan merge (denne gangen).

Trykk på **Merge pull request** og videre på **Confirm merge**. 

Du får nå valg om å slette `testing` fra GitHub. Gjør dette ved å trykke på **Delete branch**.

Alle endringene du la til i `testing` skal nå også ligge i `main` på GitHub. 

Til slutt, oppdater ditt lokale repo:
```
git switch main
git pull
```

###  `git merge <barnch>`:  flett inn `<branch>` i branchen du er i 

Alternativ til pull request som kan gjøres lokalt, uten code review. 

### `git branch -d <branch>` - slett branch

Flagget `-d` er kort for `--delete`.

Fullversjonen er
```
git branch --delete <branch>
```

**Prøv selv:**

`testing` er nå slettet fra GitHub, men ikke fra ditt lokale repo. Slett den og sjekk etterpå at den faktisk er borte:
```
git branch -d testing
git branch
```

## Ressurser

- https://github.uio.no/IN1910/IN1910_H22
- https://git-scm.com
    - Git Pro book (https://git-scm.com/book/en/v2)
- https://ericsink.com/vcbe/
- git-it (https://github.com/jlord/git-it-electron)
- https://guides.github.com/introduction/git-handbook/
- https://ohshitgit.com
- http://ndpsoftware.com/git-cheatsheet.html
- http://justinhileman.info/article/git-pretty/git-pretty.png
- Google
- Youtube
- `man git`
- `git --help`
- `git <command> --help` (for eksempel `git status --help`

## Oppsummering 

Henger dere med? :)

### Hva heter de fire tilstandene en fil kan være i?

![](figures/empty.png)

### Hva heter de fire tilstandene en fil kan være i?

![](figures/stages.png)

### Lokale kommandoer i git 

* **`git add <file>`**
* **`git commit -m "<message>"`**
* `git restore <file>` 
* `git restore --staged <file>`
* `git diff`
* `git diff --cached`
* `git rm <file>`
* `git status`

![](figures/areas.png)

### Kommandoer for historikk i git 

* `git reset <hash>`
* `git reset <hash> <file>`
* `git checkout <hash>`
* `git checkout <hash> <file>`
* `git log`

### Kommandoer for synkronisering med GitHub

* **`git clone <adress>`**
* **`git push <remote> <branch>`**
* **`git pull <remote> <branch>`**
* `git remote -v`

### Kommandoer for branching

* `git branch` 
* **`git branch <branch>`**
* `git branch -d <branch>`
* **`git switch <branch>`**
* `git switch -c <branch>`
* `git merge <branch>`