# Das Dateisystem

## Lernziele

* Die Begriffe »Datei« und »Dateisystem« verstehen
* Die verschiedenen Dateitypen kennen
* Sich im Verzeichnisbaum eines Linux-Systems zurechtfinden
* Wissen, wie externe Dateisysteme in den Verzeichnisbaum eingebunden werden

## Vorkenntnisse

* Linux-Grundkenntnisse (etwa aus den vorherigen Kapiteln)
* Umgang mit Dateien und Verzeichnissen (Kapitel 6)

## Begriffe

### Datei

Der Begriff Datei steht ganz allgemein für eine abgeschlossene Ansammlung von Daten. Für die Art der enthaltenen Daten gibt es keine Einschränkungen; eine Datei kann ein Text sein, der nur wenige Buchstaben lang ist, aber auch ein viele Megabyte großes Archiv, das das gesamte Lebenswerk eines Anwenders umfaßt. Dateien müssen natürlich nicht unbedingt gewöhnlichen Text enthalten. Bilder, Klänge, ausführbare Programme und vieles andere mehr werden ebenfalls in Form von Dateien auf dem Datenträger abgelegt. Um herauszufinden, welche Art von Inhalt eine Datei hat, können Sie den Befehl `file` verwenden:

In [5]:
file /bin/ls /usr/sbin/adduser /etc/passwd

/bin/ls:           ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, for GNU/Linux 2.6.32, BuildID[sha1]=eca98eeadafddff44caf37ae3d4b227132861218, stripped
/usr/sbin/adduser: a /usr/bin/perl script, ASCII text executable
/etc/passwd:       ASCII text


file errät den Typ einer Datei auf der Basis von Regeln, die im Verzeichnis /usr/share/file stehen. /usr/share/file/magic enthält die Regeln im Klartext. Sie können eigene Regeln definieren, wenn Sie sie in /etc/magic ablegen. Näheres verrät magic (5).

### Dateisystem

Der Begriff »Dateisystem« wird in der Linux-Szene in mehreren Bedeutungen verwendet. »Dateisystem« ist außer der in diesem Abschnitt eingeführten Bedeutung »Methode, Bytes auf einem Medium zu arrangieren« für manche Leute auch das, was wir als »Verzeichnisbaum« bezeichnen, außerdem nennt man ein konkretes Medium (Festplatte, USB-Stick, ...) mitsamt den darauf befindlichen Daten »Dateisystem« – etwa in dem Sinn, dass man sagt, dass harte Links (Abschnitt 6.4.2) nicht »über Dateisystemgrenzen hinweg«, also nicht zwischen zwei verschiedenen Partitionen auf der Festplatte oder zwischen der Platte und einem USB-Stick, funktionieren.

## Dateitypen

* Normale Datei (-) name
* Verzeichnis (d) name/
* Symbolisches Link (l) name@ mkdir ln -s 
* Gerätedatei (b oder c) name mknod 
* FIFO (named pipe) (p) name| mkfifo 
* Unix-Domain-Socket (s) name= kein Kommando 


__Übung__

 9.1 Suchen Sie in Ihrem System nach Beispielen für die verschiedenen Dateitypen.
 (Tabelle 9.1 zeigt Ihnen, woran Sie die betreffenden Dateien erkennen können.)


In [6]:
cd /
ls -l

total 96
drwxr-xr-x   2 root    root     4096 Nov  2 11:18 [0m[01;34mbin[0m
drwxr-xr-x   3 root    root     4096 Nov  2 11:26 [01;34mboot[0m
drwxr-xr-x   3 mongodb mongodb  4096 Nov  3 10:02 [01;34mdata[0m
drwxr-xr-x  19 root    root     4180 Nov  3 19:56 [01;34mdev[0m
drwxr-xr-x 116 root    root     4096 Nov  3 19:57 [01;34metc[0m
drwxr-xr-x   4 root    root     4096 Nov  3 10:02 [01;34mhome[0m
lrwxrwxrwx   1 root    root       32 Nov  2 11:20 [01;36minitrd.img[0m -> boot/initrd.img-4.4.0-45-generic
lrwxrwxrwx   1 root    root       32 Sep 21 17:12 [01;36minitrd.img.old[0m -> boot/initrd.img-4.4.0-38-generic
drwxr-xr-x  22 root    root     4096 Nov  2 11:18 [01;34mlib[0m
drwxr-xr-x   2 root    root     4096 Nov  2 11:17 [01;34mlib64[0m
drwx------   2 root    root    16384 Sep 12 16:01 [01;34mlost+found[0m
drwxr-xr-x   3 root    root     4096 Sep 12 16:01 [01;34mmedia[0m
drwxr-xr-x   2 root    root     4096 Jul 19 22:43 [01;34mmnt[0m
drwxr-xr-x 

In [7]:
ls -F

[0m[01;34mbin[0m/   [01;34metc[0m/             [01;34mlib[0m/         [01;34mmnt[0m/   [01;34mrun[0m/   [01;34msys[0m/      [01;34mvar[0m/
[01;34mboot[0m/  [01;34mhome[0m/            [01;34mlib64[0m/       [01;34mopt[0m/   [01;34msbin[0m/  [30;42mtmp[0m/      [01;36mvmlinuz[0m@
[01;34mdata[0m/  [01;36minitrd.img[0m@      [01;34mlost+found[0m/  [01;34mproc[0m/  [01;34msnap[0m/  [01;34musr[0m/      [01;36mvmlinuz.old[0m@
[01;34mdev[0m/   [01;36minitrd.img.old[0m@  [01;34mmedia[0m/       [01;34mroot[0m/  [01;34msrv[0m/   [01;34mvagrant[0m/


## Der Linux-Verzeichnisbaum

### FHS

Um einen Überblick zu behalten, gibt es gewisse Konventionen für die Verzeichnisstruktur und die Dateien, die ein Linux-System ausmachen, den Filesystem Hierarchy Standard, kurz »FHS«.

https://de.wikipedia.org/wiki/Filesystem_Hierarchy_Standard

* Wurzelverzichnis: /
* Heimatverzeichnis von root: /root
* Betriebssystemkern /boot
* Allgemeine Systemprogramme: /bin
* Spezielle Systemprogramme: /sbin
* Systembibliotheken: /lib 
* Gerätedateien: /dev
* Konfigurationsdateien: /etc
* Zubehör: /opt
* Unveränderliche Dateien: /usr
* Das Fenster zum Kernel: /proc
* Hardwaresteuerung: /sys
* Veränderliche Dateien: /var
* Vergängliche Daten: /tmp
* Serverdateien: /srv
* Zugriff auf CD-ROMs und Disketten: /media
* Zugriff auf andere Datenträger: /mnt
* Heimatverzeichnisse für Benutzer: /home

Eine andere Motivation für die Verzeichnisanordnung ist wie folgt: Der FHS unterteilt Dateien und Verzeichnisse grob nach zwei Kriterien – Müssen sie lokal verfügbar sein oder können sie auch über das Netz von einem anderen Rechner bezogen werden, und sind ihre Inhalte statisch (Veränderung nur durch Intervention des Administrators) oder ändern sie sich im laufenden Betrieb?

Die Idee hinter dieser Einteilung ist es, die Pflege des Systems zu vereinfachen: Verzeichnisse können leicht auf Datei-Server ausgelagert und damit zentral administriert werden. Verzeichnisse, die keine dynamischen Daten enthalten, können nur zum Lesen eingebunden werden und sind damit absturzresistenter.

* statisch
    * lokal: /etc, /bin, /sbin, /lib
    * entfernt: /usr, /opt
* dynamisch
    * lokal: /dev, /var/log
    * entfernt: /home, /var/mail

__Übungen__

9.2 Wie viele Programme enthält Ihr System an den »gängigen« Plätzen?

9.3 Wird grep mit mehr als einem Dateinamen als Parameter aufgerufen, gibt es vor jeder passenden Zeile den Namen der betreffenden Datei aus. Dies ist möglicherweise ein Problem, wenn man grep mit einem Shell-Dateisuchmuster (etwa »*.txt «) aufruft, da das genaue Format der grep -Ausgabe so nicht vorhersehbar ist und Programme weiter hinten in einer Pipeline deswegen durcheinander kommen können. Wie können Sie die Ausgabe des Dateinamens erzwingen, selbst wenn das Suchmuster nur zu einem einzigen Dateinamen expandiert? (Tipp: Eine dafür nützliche »Datei« steht im
Verzeichnis /dev.)

9.4 Das Kommando »cp bla.txt /dev/null « tut im Wesentlichen nichts, aber das Kommando »mv bla.txt /dev/null« – entsprechende Zugriffsrechte vorausgesetzt – ersetzt /dev/null durch bla.txt. Warum?

9.5 Welche Softwarepakete stehen auf Ihrem System unter /opt? Welche davon stammen aus der Distribution und welche von Drittanbietern? Sollte eine Distribution eine »Schnupperversion« eines Drittanbieter-Programms unter /opt installieren oder anderswo? Was halten Sie davon?

9.6 Warum ist es unklug, Sicherheitskopien des Verzeichnisses /proc anzulegen?


## Verzeichnisbaum und Dateisysteme


In [8]:
cat /etc/fstab

# /etc/fstab: static file system information.
#
# Use 'blkid' to print the universally unique identifier for a
# device; this may be used with UUID= as a more robust way to name devices
# that works even if disks are added and removed. See fstab(5).
#
# <file system> <mount point>   <type>  <options>       <dump>  <pass>
# / was on /dev/sda1 during installation
UUID=0f601548-d7b4-4eea-836c-aa960f35c330 /               ext4    errors=remount-ro 0       1
# swap was on /dev/sda5 during installation
UUID=b4665c18-3579-490a-9d90-5b0b0ef69a24 none            swap    sw              0       0


Zu UUID https://wiki.ubuntuusers.de/UUID/

In [9]:
sudo blkid

/dev/sr0: UUID="2016-10-18-14-59-47-00" LABEL="VBOXADDITIONS_5.1.8_111374" TYPE="iso9660"
/dev/sda1: UUID="0f601548-d7b4-4eea-836c-aa960f35c330" TYPE="ext4" PARTUUID="5c3f723b-01"
/dev/sda5: UUID="b4665c18-3579-490a-9d90-5b0b0ef69a24" TYPE="swap" PARTUUID="5c3f723b-05"


In [10]:
ls -Al /dev/disk/by-uuid

total 0
lrwxrwxrwx 1 root root 10 Nov  3 19:55 [0m[01;36m0f601548-d7b4-4eea-836c-aa960f35c330[0m -> [40;33;01m../../sda1[0m
lrwxrwxrwx 1 root root  9 Nov  3 19:57 [01;36m2016-10-18-14-59-47-00[0m -> [40;33;01m../../sr0[0m
lrwxrwxrwx 1 root root 10 Nov  3 19:55 [01;36mb4665c18-3579-490a-9d90-5b0b0ef69a24[0m -> [40;33;01m../../sda5[0m
