# Einführung in Git und GitHub

Mit zunehmender Programmiererfahrung und komplexeren Problemstellungen nimmt auch der zeitliche Aufwand zu, der in das Erstellen eines Programms fließt. Zugleich ist denkbar, dass mehrere Personen an demselben Projekt beteiligt sind. Um bei der Vielzahl an Datenbeständen und Skripten nicht den Überblick zu verlieren, lohnt sich der Einsatz einer Versionsverwaltung. Vielleicht kennst Du eine solche schon von Cloudsystemen: Beispielsweise Nextcloud hat oftmals eine Versionsverwaltung integriert, mit welcher die Bearbeitung der Dokumente nachvollzogen werden kann und bei Bedarf auch eine Zurückstufung auf einen früheren Arbeitsstand möglich ist. In der Welt des Programmierens wird zur Versionsverwaltung dahingegen **Git** genutzt.

## Was ist Git?
Git ist ein frei verfügbares (Open Source) Versionskontrollsystem, das Deine Arbeitsschritte dokumentieren kann. Am besten stellst Du Dir Git wie ein Logbuch vor: Durch das Abspeichern der Zeit, der vorgenommenen Änderungen und Deiner Kommentare zu diesen sind Entwicklungsschritte im Nachhinein viel leichter nachvollziehbar. Darüber hinaus kannst Du unkompliziert und automatisiert Deine Arbeitsstände miteinander vergleichen lassen und sogar einen früheren Arbeitsstand wiederherstellen. Dies sind Anwendungsfälle, die Dir das Arbeiten an Deinen Skripten sehr erleichtern und absichern können. Und wenn Du mal mit anderen Personen gemeinsam auf mehreren Computern an einem Projekt arbeitest, übernimmt Git das Abgleichen und Zusammenführen der unterschiedlichen Versionen für euch. 

## Nutzung von Git über die Command Line
Als erstes musst Du Git auf Deinem Rechner installieren. Dazu wählst Du auf der [Download-Seite von Git](https://git-scm.com/book/de/v2/Erste-Schritte-Git-installieren) die für Dein Betriebssystem passende Version aus. Wenn Git auf Deinem Rechner installiert ist, kannst Du fortan die Versionsverwaltung vollständig über die Command Line (Terminal bei macOS/Linux bzw. Eingabeaufforderung bei Windows) bedienen. Dazu brauchst Du nicht einmal zwingend Erfahrungen in der Bedienung der Command Line, Du musst lediglich die passenden Gitbefehle eingeben, welche Du hier im Notebook findest.

#### **Erste Schritte zum Start in Git** 
Hier findest Du die wichtigsten Schritte, um Git auf Deinem Rechner zu nutzen. Im Anschluss daran findest Du außerdem ein Anwendungsbeispiel zum Mitmachen, um die hier vorgestellten Schritte selbst ausprobieren zu können.

1. Zunächst musst Du ein lokales Repositorium (kurz: *Repo*) erstellen. Dies ist ein Verzeichnis, welches auf Deinem Gerät unter die Versionsverwaltung gestellt wird, also von ihr überwacht wird. In der Logbuch-Metapher entspricht das Initialisieren in Git dem Moment, in dem Du ein neues, leeres Logbuch für ein bestimmtes Projekt erstellst. Es ist der erste Schritt, um Änderungen aufzuzeichnen und die Geschichte Deines Projekts zu dokumentieren. Damit  legst Du also den Grundstein für die Versionskontrolle. <br><br> Navigier dazu mit der Command Line zu dem Verzeichnis (```cd path```) oder öffne das Terminal im Zielverzeichnis, wo das Repositorium erstellt werden soll und gib den Befehl ```git init``` ein. Es wird ein verstecktes Vereichnis angelegt mit dem Namen ".git". Diesen Git-Ordner solltest Du **nie verändern**, außer wenn Du ihn löschen willst. Du kannst ihn Dir anzeigen lassen, indem Du in Deinem Dateimanager das Anzeigen versteckter Dateien aktivierst: <br><br>
![](../3_Dateien/Git/Screenshot_versteckter_Gitordner.png)

2. Wenn Du nun Dateien auf Deinem Rechner erstellst und bearbeitest, musst Du Git anschließend sagen, dass es diese Dateien in die Versionsverwaltung aufnehmen soll. Dazu navigierst Du wieder in das Verzeichnis, in dem das Repositorium sowie die Dateien liegen und führst den Befehl ```git add <dateiname.dateiendung>``` aus. Es können natürlich auch mehrere Dateien hinzugefügt werden. Wenn Du alle geänderten Dateien aufnehmen willst, kannst Du ```git add .``` ausführen. 

3. Anschließend führst Du mit ```git commit -m <"message">``` einen *Commit* durch. Dieser speichert den Zwischenstand (genauer gesagt werden nur die geänderten Zeilen gespeichert) automatisch unter einer eindeutigen Nummer ab, um später darauf zurückgreifen zu können. Als Message solltest Du treffend beschreiben, welche Änderungen Du vorgenommen hast. Das Committing in Git ähnelt metaphorisch gesprochen dem Schreiben des Eintrags in Dein Logbuch: Wenn Du Änderungen an dem Projekt vornimmst und sie in die Versionsgeschichte aufnehmen möchtest, fügst Du sie dem Logbuch hinzu. Ein Commit speichert also einen Snapshot der aktuellen Änderungen, der dann in die Geschichte des Projekts aufgenommen wird.

#### **🔧 Anwendungsbeispiel zum Mitmachen**
Vollziehen wir die einzelnen Schritte an einem konkreten Beispiel nach. 
- Als erstes legen wir einen Testordner an, z. B. mit dem Namen "Testordner_Git".
- Nun öffnen wir die Command Line und navigieren zum neuen Ordner (```cd path```).
- Als nächstes initiieren wir ein leeres, lokales Repositorium für die Versionsverwaltung mit ```git init```.
- Nun musst Du einige Dateien im Testordner anlegen, die versionsverwaltet werden sollen. Zum Testen kannst Du z.&nbsp;B. zwei Textdateien anlegen.  
- Anschließend sagen wir Git, dass es die beiden Dateien aufnehmen soll. Dazu gibst Du ```git add .``` in die Command Line ein. Wenn Du nur eine Datei davon nachverfolgen willst, kannst Du stattdessen den Namen der Datei ohne Anführungszeichen eingeben.
- Anschließend fehlt noch der Commit. Diesen erstellen wir, indem wir ```git commit -m "Erster Arbeitsstand: XYZ"``` eingeben.
- Damit haben wir die Dateien unserem "Logbuch" hinzugefügt. Nehmen wir an, wir arbeiten nun an den beiden Dateien und wollen einen weiteren Zwischenstand abspeichern. Dann fügen wir sie zunächst wieder mit ```git add .``` hinzu (das nennt sich übrigens *stagen*, die Datei wird dann für den nächsten Commit vorgemerkt). Wenn wir zufrieden mit unserem Arbeitsstand sind, können wir die vorgemerkten Datei anschließend committen.

Eine Übersicht über wichtige Befehle zum Einstieg findest Du hier zusammengestellt:
| Kommando | Bedeutung/Funktion | Hinweise |
| ---- | ---- | ---- |
| ```git init```| Initialisieren eines neuen Repositoriums für die Versionskontrolle | Dabei wird eine versteckte Datei angelegt | 
| ```git add <dateiname.dateiendung>``` bzw. ```git add .``` | Hinzufügen von Dateien zur Versionsverwaltung | Keine Anführungszeichen um Dateinamen | 
| ```git commit -m <"message">``` | Beschreiben der vorgenommenen Änderungen als kurzen Kommentar | Message muss in Anführungszeichen geschrieben werden|


Weitere nützliche Befehle sind:
| Kommando | Bedeutung/Funktion | Hinweise |
| ---- | ---- | ---- |
| ```git status```| Erhalten eines Überblicks über den Zustand des Repositoriums | Liefert Informationen über Branch (s.&nbsp;u.), ob Dateien noch nicht mit ```git add``` hinzugefügt wurden bzw. ob es Dateien zu committen gibt | 
| ```git diff``` | Anzeigen von Änderungen zwischen einer noch nicht hinzugefügten Datei und der bereits gespeicherten Version | Funktioniert nur, wenn die zu vergleichende Datei **noch nicht** mit ```git add``` hinzugefügt wurde!  | 
| ```git log``` | Anzeigen der Versionsgeschichte, also aller Commits | Die Command Line gibt die Änderungen so aus, dass der jüngste Commit immer als oberster steht |


Das sind die wichtigsten Befehle, um schnell in Git einzusteigen. Doch die Versionsverwaltung ist weitaus mächtiger. So ist es möglich, auf verschiedenen Zweigen - sog. *Branches* - zu arbeiten. Dabei handelt es sich um fortgeschritteneres Wissen zu Git. Wenn Du Dich zunächst einmal langsam herantasten und nur mit den grundlegenden Funktionen der Versionsverwaltung vertraut machen willst, kannst Du diesen Teil überspringen und später darauf zurückkommen. 

#### **Fortgeschritten: Branches**
Jeder Zweig repräsentiert eine eigenständige Linie der Arbeit und ermöglicht es, an verschiedenen Funktionen oder Ideen unabhängig voneinander zu arbeiten, ohne die Hauptgeschichte zu beeinflussen. Zu Beginn steht lediglich ein main-Branch zur Verfügung. Auf diesem werden standardmäßig alle Änderungen vorgenommen. Wenn man nur an kleineren Änderungen und Weiterentwicklungen arbeitet, reicht dieser Branch meist aus. Sobald es aber an das Vornehmen umfangreicher Änderungen geht, sollte zunächst ein neuer Branch erzeugt und auf diesem gearbeitet werden. Der Vorteil ist recht offensichtlich: Alle Änderungen, die auf dem neuen Branch vorgenommen werden, sind unabhängig von der Version auf dem main-Branch. Dadurch wird der alte Arbeitsfortschritt nicht überschrieben und im Fall, dass die Version auf dem neuen Branch nicht funktioniert, kann diese einfach verworfen werden. Zur Arbeit mit verschiedenen Branches gibt es eine Reihe von Befehlen, die Du jederzeit hier nachschlagen kannst:
| Kommando | Bedeutung/Funktion | Hinweise |
| ---- | ---- | ---- |
| ```git branch <name>```| Anlegen eines neuen Branch als Kopie von main | Angabe des Namens immer ohne Anführungszeichen | 
| ```git checkout <name> ``` | Auschecken aus dem aktuellen Branch und wechseln in einen anderen Branch, der unter ```<name>``` angegeben wird | Unbedingt Änderungen an den Dateien vorher committen | 
| ```git merge <name>``` | Übertragen der Änderungen von dem mit ```<name>``` angegebenen Branch in den Hauptbranch (i.&nbsp;d.&nbsp;R. main) | Die Übertragung erfolgt zeilenweise, es werden also immer veränderte Zeilen gelöscht und neu eingefügt. Es kommt so zu keinen Konflikten, selbst wenn zwischenzeitlich auch am main-Branch gearbeitet wurde. Konflikte treten nur dann auf, wenn die gleichen Zeilen geändert wurden. Dann stoppt das Mergen und es ist manuelle Nacharbeit notwendig (s.&nbsp;u.).| 

**Lösen von Konflikten:** Wenn dieselben Zeilen auf beiden Branches geändert wurden, wirst Du über einen Konflikt informiert. Dann werden beim Mergen zunächst beide Versionen untereinander in die betroffene Datei eingetragen. Das Lösen des Konfliktes kann mit einem Texteditor vorgenommen werden. Mit diesem öffnest Du die Datei und löschst den Teil manuell, welcher nicht benötigt wird. Such dazu nach den Markierungen *HEAD* und *MAIN*. Erstere steht für die Version aus dem abgezweigten Branch, letztere für jene aus main. Die nicht benötigten Zeilen kannst Du samt der beiden Markierungen löschen. Anschließend muss die Datei committed werden, um den Merge erfolgreich zu beenden. 

## Git in einer Entwicklungsumgebung nutzen
Git kann nicht nur über die Command Line bedient, sondern auch als Erweiterung in Deine Entwicklungsumgebungen eingebunden werden. Aber auch für diesen Weg musst Du Git zunächst auf Deinem Rechner installieren – die Anleitung findest Du oben. Eine Anleitung zur anschließenden Installation für JupyterLab findest Du [hier](https://humtechlab.gitbook.io/redcar/1-reproducible/1.3-git-extension-jupyterlab). Wenn Du Visual Studio Code nutzt, musst Du nichts installieren, die Git-Unterstützung ist bereits standardmäßig integriert.

Git bei JupyterLab sieht beispielsweise so aus: <br><br>
![](../3_Dateien/Git/Screenshot_Git_in_JupyterLab.png)

Die Bedienung von Git variiert leicht je nach installierter Erweiterung bzw. Entwicklungsumgebung. Anleitungen und Dokumentationen findest Du im Internet. Die Nutzung von Git in der Entwicklungsumgebung ist oft etwas einfacher als über die Command Line, bietet aber meist nicht alle Funktionen, die über die Command Line möglich sind. Deshalb solltest Du die Möglichkeiten der Command Line stets im Hinterkopf behalten. <br>

## GitHub

Git kennst Du nun – eine lokal auf Deinem Rechner nutzbare Versionsverwaltung. Doch wie eingangs beschrieben ist es bei einigen Projekten nötig, mit mehreren Personen gemeinsam an Skripten zu arbeiten. Auch dabei kommt Git wieder ins Spiel. Die Zwischenstände werden dazu auf einer gemeinsamen Plattform hochgeladen, auf die berechtigte Personen Zugriff haben. Auch die Möglichkeit des Teilens und gemeinsamen Bearbeitens von Dateien kennst Du vielleicht bereits von Cloudsystemen wie Nextcloud. Solche Plattformen in der Programmier-Community sind bspw. GitLab oder GitHub, letzteres schauen wir uns nun genauer an.

Öffne [GitHub](https://github.com/) und such in der Suchleiste rechts oben nach dem Repositorium "exdimed-student". Wenn Du darauf klickst, gelangst Du zu folgendem öffentlichen Repositorium:

![](../3_Dateien/Git/Screenshot_GitHub.png)

Hier befinden sich alle Notebooks zum Programmierenlernen, so auch dieses. Das Repositorium ist öffentlich, d.&nbsp;h. Du kannst es lokal auf Deinem Rechner speichern. Dazu gibt es drei Wege, die im Folgenden kurz vorgestellt werden. Probier sie alle aus und entscheid dann, welcher Dir am besten gefällt.

#### Nutzung der Command Line
Ein Repositorium kann mit dem Befehl ```git clone <URL>``` von GitHub in ein lokales Arbeitsverzeichnis auf Deinem Rechner kopiert werden. Dazu benötigst Du nicht einmal ein Profil auf GitHub. Navigier dazu einfach in der Command Line zum gewünschten lokalen Speicherort des Repositoriums, gib den obigen Befehl ein und ersetz \<URL> durch die URL des Repositorium von GitHub. Das war's auch schon, Du hast nun sämtliche Dateien auf Deinem Rechner und kannst mit ihnen lokal arbeiten. Probier es doch gleich einmal aus. <br><br>
Wenn Änderungen an dem Repositorium auf GitHub vorgenommen werden, werden diese nicht automatisch mit den Dateien in Deinem Arbeitsverzeichnis synchronisiert. Stattdessen musst Du sie vom Server herunterladen. Dies funktioniert allgemein über den Befehl ```git pull <URL> <branch>```. In unserem Beispiel gibt es nur den main-Branch, daher musst Du den Befehl wie folgt eingeben: ```git pull https://github.com/yannickfrommherz/exdimed-student main```. 

Wenn Du gemeinsam mit anderen Entwickler:innen an Programmen arbeitest, musst Du früher oder später Deine Änderungen auch wieder auf GitHub hochladen. Dazu musst Du Dir zunächst ein kostenloses Profil auf GitHub anlegen. Das Hochladen (sog. *pushen*) funktioniert mit dem Befehl ```git push```. Die Änderungen werden dann in die Quelle, von der sie stammen, hochgeladen. Voraussetzung hierfür ist, dass Du die entsprechenden Schreibrechte seitens der/des Besitzer:in des Repositoriums erhalten hast.

#### Nutzung von GitHub Desktop
GitHub Desktop ist eine Anwendung, die von GitHub entwickelt wurde, um Entwickler:innen das Arbeiten mit Git-Repositories auf eine benutzerfreundliche Art und Weise zu ermöglichen. Insbesondere für diejenigen, die nicht so vertraut mit der Command Line sind, kann GitHub Desktop eine gute Alternative zum Einstieg darstellen. GitHub Desktop ist eine grafische Benutzeroberfläche (eine sog. *GUI*), die es für die Betriebssysteme [Windows, Mac](https://desktop.github.com/) und [Linux](https://www.githubdesktop.com/github-desktop-linux-install/) herunterzuladen gibt. 

Die Benutzeroberfläche sieht wie folgt aus: <br>
<img src="../3_Dateien/Git/Übersicht_Funktionen_GitHub_Desktop.jpg" alt="drawing" width="500"/>


*Bildquelle: Jünger/Gärtner 2023, S. 213*

Kurz zur Bedienung von GitHub Desktop:<br>
* Über das File-Menü oben links kannst Du ein neues Repositorium anlegen oder ein bestehendes auswählen und verwalten.
* Das Herunterladen eines Repositoriums z.&nbsp;B. von GitHub funktioniert ebenfalls über das File-Menü, wähl dazu "Clone Repository" aus und gib als Adresse die URL ein sowie den Ort auf Deinem Rechner, wo es gespeichert werden soll. 
* Über die Schaltfläche "Fetch" wird Dein lokales mit dem Online-Repositorium abgeglichen. Diese Schaltfläche ändert sich je nachdem, ob Du einen Pull oder Push durchführen musst. 
* Nachdem Du Ordner oder Dateien bearbeitet hast, kannst Du die Änderungen ins Feld "Summary" (unten links) eintragen und committen. 
* Wenn Du nach dem Committen auf die Schaltfläche "Fetch" schaust, steht dort "Push origin". Damit kannst Du Deine Änderungen ins Online-Repositorium übertragen (wiederum vorausgesetzt Du verfügst über die entsprechenden Rechte).

#### Nutzung von GitHub über den Browser
Zuletzt kurz zur Nutzung von GitHub über den Browser. Du hast Dich vielleicht bereits gefragt, warum dieser offensichtlich erscheinende Weg nicht als erster hier vorgestellt wurde. Das liegt am minimierten Funktionsumfang und der Unkonventionalität dieses Vorgehens. Grundlegende Aktionen kannst Du dennoch über den Browser ausführen, wie etwa das Herunterladen der Dateien. Diese kannst Du alternativ zum Clonen über die Command Line auch als ZIP-Archiv downloaden. Klick dazu auf den grünen Button "Code" und wähl "Download ZIP":

![](../3_Dateien/Git/Screenshot_Github_2.png)

Du hast im Browser auch die Möglichkeit, Dateien hochzuladen, zu committen und zusammenzuführen, allerdings kannst Du nicht Deinen lokalen Arbeitsstand mit dem auf GitHub abgleichen oder Dir die neu hinzugekommene Änderungen herunterladen (vgl. ```pull```-Befehl), stattdessen kannst Du nur alle Dateien auf einmal downloaden.  

## Motivation
Du hast verschiedene Wege gesehen, wie Du die Versionsverwaltung Git bzw. die Plattform GitHub nutzen kannst und einen Überblick über wichtige Befehle bekommen. Die Vielzahl an Möglichkeiten und Funktionen ist im ersten Moment vermutlich erschlagend. Taste Dich langsam heran. Du kannst mit den hier dargestellten Befehlen nichts falsch machen oder gar einen Schaden anrichten. Besonders die Arbeit mit der Konsole kann am Anfang ungewohnt sein, Du wirst aber schnell ein Gefühl dafür bekommen. 
<br><br>
Versuch für den Einstieg doch einfach, die Versionsverwaltung schrittweise in Deinen (Arbeits)-Alltag einzubauen. So kannst Du z.&nbsp:B. einfach Textdokumente mit Git verwalten. Schrittweise wirst Du so mehr Sicherheit gewinnen und Git/GitHub bald schon routiniert nutzen. Bei Fragen und Problemen lohnt es sich, im Internet nachzuschauen. Git und GitHub sind in der Programmier-Community sehr weit verbreitet, weshalb Du dazu viel finden wirst.

**Viel Spaß und Erfolg beim Einstieg in Git und GitHub!**

-----
#### Referenz und Empfehlung zur Vertiefung:
Jünger, Jakob / Gärtner, Chantal (2023): Computational Methods für die Sozial- und Geisteswissenschaften. Wiesbaden: Springer VS. DOI: https://doi.org/10.1007/978-3-658-37747-2.
<br><br><br>


<table>
      <tr>
        <td>
            <img src="../3_Dateien/Lizenz/CC-BY-SA.png" width="400">
        </td> 
        <td>
            <p>Dieses Notebook sowie sämtliche weiteren <a href="https://github.com/yannickfrommherz/exdimed-student/tree/main">Materialien zum Programmierenlernen für Geistes- und Sozialwissenschaftler:innen</a> sind im Rahmen des Projekts <i>Experimentierraum Digitale Medienkompetenz</i> als Teil von <a href="https://tu-dresden.de/gsw/virtuos/">virTUos</a> entstanden. Erstellt wurden sie von Anne Josephine Matz und Yannick Frommherz. Sie stehen als Open Educational Resource nach <a href="https://creativecommons.org/licenses/by-sa/4.0/">CC BY SA</a> zur freien Verfügung.
        </td>
      </tr>
</table>