-
Notifications
You must be signed in to change notification settings - Fork 0
1.4 Linux auf Ihrem Computer
Der erste Punkt, der einigen Teilnehmer:innen dieses Kurses möglicherweise Schwierigkeiten bereiten wird, ist die Notwendigkeit, viele (aber nicht alle) Aktionen in einem Unix-Kommandozeilenterminal (d.h. einem Linux- oder Mac-Terminal) durchzuführen. Hier einige der Hauptgründe dafür:
- Das Unix-Betriebssystem kann sehr effizient mit grossen - Dateien umgehen und das Betriebssystem selbst verfügt über Befehle für die grundlegende Verarbeitung von Textdateien. Da die parallelen Korpora, mit denen wir arbeiten werden, im Textformat vorliegen werden, wird diese Fähigkeit, grossen Dateien zu verarbeiten, von grosser Hilfe sein.
- Die meisten der Tools, die wir verwenden werden, wurden in Linux-Umgebungen entwickelt und funktionieren gut unter diesem Betriebssystem. Viele der Tools (wenn auch nicht alle) funktionieren auch unter Windows oder Mac.
- Die meisten der Tools, die wir verwenden werden, haben keine grafische Benutzeroberfläche und funktionieren nur im Terminal. Dafür gibt es zwei Hauptgründe:
- Die Entwicklung von grafischen Benutzeroberflächen ist sehr zeitaufwändig;
- Terminalprogramme können leicht von anderen Skripten aus gestartet werden, was die Automatisierung von Aufgaben wesentlich erleichtert.
- In realen Umgebungen arbeiten wir mit leistungsstarken Servern, mit denen wir uns von einem Terminal aus verbinden, so dass unser Terminal zum eigenen Terminal des Servers wird.
Aber keine Sorge, der Umgang mit dem Terminal und den grundlegenden Unix-Anweisungen ist leicht zu erlernen und damit werden wir in diesem Kurs beginnen. Am Ende des Seminars werden Sie ein Experte im Umgang mit einem Unix-Terminal sein.
Es gibt mehrere Möglichkeiten, wie Sie ein Unix-Terminal verfügbar machen können:
- Sie haben einen Computer mit installiertem Linux (s Abschnitt 4.2.a)
- Sie haben einen Mac-Computer (s. Abschnitt 4.2.b)
- Unter Windows (10 oder höher) installieren Sie WSL - Windows Subsystem für Linux (s. Abschnitt 4.2.c).
- Virtuelle Maschinen verwenden (s. Abschnitt 4.2.d)
- Verbinden Sie sich mit einem entfernten Linux-Server
Wir werden im Folgenden kurz auf jede dieser Optionen eingehen.
Die beste Möglichkeit, ein Linux-Terminal zu verwenden, ist natürlich ein Computer mit installiertem Linux. Es ist möglich, Computer zu kaufen, auf denen Linux installiert ist (so sparen Sie etwas Geld für den Kauf des proprietären Betriebssystems). Es ist aber auch möglich, dass Sie Zugang zu einem veralteten Computer haben, den Sie nicht mehr benutzen und der einfach nur irgendwo in einer staubigen Ecke steht. In diesem Fall ist es an der Zeit, diesem Computer ein neues Leben zu geben und eine Linux-Distribution zu installieren. Je nachdem, ob der Computer schon sehr alt ist oder nicht, bieten sich die beiden folgenden Optionen an. Aber jede Distribution ist ohne Probleme geeignet:
- Wenn der Computer nicht zu alt ist und mindestens 4 GB Ram hat: Ubuntu 22.04. Installationsanleitung.
- Wenn der Computer schon etwas älter ist, können Sie eine leichtere Distribution wie Xubuntu installieren. Anleitung zur Installation
Wenn Sie mit einem Mac-Computer arbeiten, können Sie das Terminal direkt verwenden, da es ein Unix-Terminal ist. Einige der Programme oder Bibliotheken sind möglicherweise nicht kompatibel oder werden anders installiert als in einer Linux-Umgebung. Eine gute Möglichkeit, Software auf dem Mac zu installieren, ist die Verwendung von Homebrew: https://brew.sh/es/. Dieser Link erklärt, wie man brew installiert und wie man Software mit brew installiert.
Ab Windows Version 10 ist es möglich, ein Linux-Subsystem nativ zu installieren, als wäre es eine Anwendung aus dem Microsoft Store. Die Installation ist sehr einfach, aber auf manchen Computern können Konfigurationsprobleme auftreten. Alle diese Probleme sind gut dokumentiert und eine Suche im Internet nach dem angezeigten Fehlercode reicht in der Regel aus, um alle Probleme zu lösen.
Es gibt zwei Möglichkeiten für die Installation:
- Suchen Sie im Microsoft Store nach einer Linux-Distribution, zum Beispiel Ubuntu 22.04. Wenn Sie den Microsoft Store zur Verfügung haben, nutzen Sie diese Option und installieren Sie es direkt von dort.
- Wenn Sie den Microsoft Store nicht zur Verfügung haben, können Sie sich für eine manuelle Installation entscheiden. Folgen Sie den Anweisungen zur Installation von Linux unter Windows mit WSL.
Nach der Installation starten Sie WSL. Wenn alles funktioniert, werden Sie nach einem Administrator-Benutzernamen und einem Passwort gefragt. Merken Sie sich diese Angaben, da Sie sie brauchen werden. Wenn Sie das Kennwort eingeben, erscheint nichts auf dem Bildschirm, wenn Sie tippen. Dann werden Sie aufgefordert, das Kennwort zu wiederholen.
Sobald das System installiert ist, verfügen Sie über ein Linux-System mit einem Linux-Verzeichnissystem. Es ist jedoch auch möglich, auf die Windows-Systemlaufwerke zuzugreifen, da diese bei jedem Start des Linux-Subsystems automatisch eingebunden werden. Wenn wir auf das Windows-Laufwerk C zugreifen möchten, können wir Folgendes tun:
cd /mnt/c
Wenn wir ein Windows-Laufwerk verwenden, während wir mit dem Linux-Subsystem arbeiten, können wir die üblichen Dateioperationen sowohl von Linux als auch von Windows aus durchführen. Wenn wir beispielsweise ein Verzeichnis erstellen möchten und uns nicht mehr an den Linux-Befehl erinnern, können wir den Windows File Explorer öffnen und das Unterverzeichnis mit dieser Anwendung erstellen. Wir können die Dateien auch mit unserem bevorzugten Windows-Editor bearbeiten.
Um virtuelle Maschinen nutzen zu können, müssen Sie ein spezielles Programm installieren. Es gibt mehrere Möglichkeiten und für diesen Kurs schlagen wir die Verwendung von VirtualBox vor (das für Windows, Linux und Mac verfügbar ist). Der Prozess des Erwerbs und der Installation wird unter folgendem Link ausführlich erklärt: https://www.virtualbox.org/wiki/Downloads
Ein sehr wichtiger Aspekt, den Sie berücksichtigen müssen, ist, ob Ihr Computer 32-Bit oder 64-Bit ist und ob das Betriebssyste, (unabhängig davon, ob es sich um Windows, Linux oder Mac handelt) 32-Bit oder 64-Bit ist. Wenn es sich um ein 32-Bit-Betriebssystem handelt, können Sie nur virtuelle 32-Bit-Maschinen verwenden. Wenn es sich um ein 64-Bit-Betriebssystem handelt, können Sie sowohl virtuelle 32-Bit- als auch 64-Bit-Maschinen verwenden. Prüfen Sie, ob auf Ihrem Computer ein 32-Bit- oder ein 64-Bit-Betriebssystem läuft. Die meisten aktuellen Systeme sind 64-Bit-Systeme.
Wenn VirtualBox bei Ihnen nicht funktioniert, ist es möglich, dass die Möglichkeit zur Virtualisierung im Bios deaktiviert ist. Um dieses Problem zu lösen, müssen Sie die folgenden Schritte ausführen:
-
Rufen Sie das Bios des Systems auf. Dazu muss der Computer neu gebootet werden und während des Neustarts müssen Sie eine bestimmte Taste drücken. Diese Taste kann je nach Computerhersteller variieren. Normalerweise sind es die folgenden (Liste von https://www.tomshardware.com/reviews/bios-keys-to-access-your-firmware,5732.html)))
- ASRock: F2 oder DEL
- ASUS: F2 für alle PCs, F2 oder DEL für Motherboards
- Acer: F2 oder DEL
- Dell: F2 oder F12
- ECS: DEL
- Gigabyte / Aorus: F2 oder DEL
- HP: F10
- Lenovo (Laptops für Endverbraucher): F2 oder Fn + F2
- Lenovo (Desktops): F1
- Lenovo (ThinkPads): Enter und dann F1.
- MSI: DEL für Motherboards und PCs
- Microsoft Surface Tablets: Drücken und halten Sie die Lautstärketaste nach oben.
- Origin PC: F2
- Samsung: F2
- Toshiba: F2
- Zotac: DEL
- Zotac: DEL
-
Sobald Sie im Bios sind, müssen Sie die Virtualisierung aktivieren. Gehen Sie dazu in das entsprechende Menü und aktivieren Sie die entsprechende Option. Sie finden diese Optionen, indem Sie eine Google-Suche durchführen, die "activate virtualization bios" und die Marke und das Modell Ihres Computers enthält. Wenn Sie z.B. nach "enable virtualization hp pavilion" suchen, finden Sie die Seite [https://support.hp.com/us-en/document/c04760917], auf der Sie alle Details finden.
Wenn Sie mit diesen Schritten Ihre Virtualisierungsprobleme immer noch nicht lösen konnten, können Sie den folgenden Forumsbeitrag lesen oder Ihren Lehrer fragen.
Importieren einer virtuellen Maschine
Sie können die folgende virtuelle Maschine herunterladen und installieren:
* [http://lpg.uoc.edu/MT-course/UbuntuServer-20.04.ova](http://lpg.uoc.edu/MT-course/UbuntuServer-20.04.ova)
die im .ova-Format vorliegt.
Um eine virtuelle Maschine zu importieren, gehen Sie wie folgt vor:
- Laden Sie die virtuelle Maschine herunter
- Öffnen Sie Virtual Box und gehen Sie zu Datei > Appliance importieren
- In wenigen Minuten wird die virtuelle Maschine verfügbar sein
Zugriff der virtuellen Maschine auf das Netzwerk
Es ist wichtig, dass unser Netzwerk der Maschine eine gültige IP-Adresse zuweist, die es uns ermöglicht, Dateien von der virtuellen Maschine zu senden und abzurufen und der Maschine bei Bedarf einen Internetzugang zu gewähren.
Um dies zu erreichen, müssen wir vor dem Start der virtuellen Maschine die Maschine auswählen und unter Einstellungen > Netzwerk die Option Angeschlossen an - Bridged Adapter wählen. Wählen Sie unter Name entweder ethX oder wlanX, je nachdem, ob Sie über Kabel oder WLAN mit dem Netzwerk verbunden sind. Der Konfigurationsbildschirm sollte in etwa so aussehen wie in der folgenden Abbildung gezeigt:
Entweder von einem Linux- oder Mac-Terminal oder von der Windows-Eingabeaufforderung (cmd) aus ist es möglich, sich über das ssh-Protokoll mit einem Terminal auf einem Server zu verbinden. Dazu benötigen Sie einen Benutzernamen und ein Passwort auf dem Server, die IP-Adresse und den Port, den der Server für das ssh-Protokoll verwendet (Standard ist 22).
Wenn wir zum Beispiel ssh-Zugang zu einem Server mit der IP 123.45.67.89 haben, der den Standardport verwendet und der Benutzer aoliverg ist, können wir im Terminal oder in der Eingabeaufforderung Folgendes eingeben
ssh -l aoliverg 123.45.67.89
Daraufhin wird ein Terminalbildschirm angezeigt, in dem Sie nach dem Passwort gefragt werden. Sobald Sie es eingegeben haben, erscheint das eigene Terminal des Servers und Sie können normal arbeiten.
Wenn der Server für das ssh-Protokoll einen anderen Port als den Standardport (22) verwendet, müssen Sie den Port angeben. Wenn er zum Beispiel 55000 verwendet, geben Sie Folgendes ein
ssh -p 55000 -l aoliverg 123.45.67.89
4.2.e Hochladen und Herunterladen von Dateien auf die virtuelle Maschine (oder einen beliebigen Server)
Wenn wir mit einer virtuellen Maschine oder einem externen Server arbeiten, müssen wir Dateien übertragen, sowohl von unserem Computer zur virtuellen Maschine oder zum Server als auch von der virtuellen Maschine oder dem Server zu unserem Computer. Dies kann auf zwei Arten geschehen:
Vom Terminal aus mit scp
Über das Linux- oder Mac-Terminal selbst und über die Windows-Eingabeaufforderung (in einigen Windows 10-Updates) mit dem Befehl scp. Um die Datei text.txt von unserem Computer (wenn sie sich im Arbeitsverzeichnis des Terminals befindet, wenn nicht, müssen wir den vollständigen Pfad angeben) auf den Server (mit der IP 123.456.789 und mit dem Benutzer "user") in das Verzeichnis /home/user/arrivaldirectory
zu übertragen, können wir schreiben:
scp text.txt usuario@123.456.789:/home/usuario/directoriodellegada
Wenn wir vom Server auf den Computer übertragen wollen, können wir Folgendes tun:
scp usuario@123.456.789:/home/usuario/directoriodellegada/texto.tx
t .
Denken Sie daran, dass der Benutzer mtuoc und das Passwort mtuoc lautet, wenn Sie mit den virtuellen Maschinen arbeiten, die wir anbieten.
Um die der virtuellen Maschine zugewiesene IP zu erfahren, müssen Sie Folgendes eingeben:
ifconfig
Und die IP ist die Nummer neben inet (213.73.33.35) im folgenden Beispiel:
Wenn der Server einen anderen Port als den Standardport (22) für ssh verwendet, müssen wir -P und den Port (in diesem Beispiel 5555) hinzufügen:
scp -P 5555 text.txt :/home/user/directoryofarrivale
scp -P 5555 :/home/benutzer/ankunftsverzeichnis/text.txt
.
Beachten Sie, dass das P gross geschrieben wird, anders als bei der Angabe des Ports mit ssh, wo es klein geschrieben wird.
Filezilla verwenden
Unter Linux, Windows und Mac können wir die Anwendung Filezilla verwenden.
Nach Eingabe der Zugangsdaten werden zwei Dateilisten angezeigt, die linke für den lokalen Computer und die rechte für den Server. Die Benutzung ist sehr intuitiv und alle Informationen finden Sie in der Dokumentation des Programms. Denken Sie daran, dass Änderungen, die außerhalb von Filezilla vorgenommen werden, nicht automatisch auf dem Programmbildschirm aktualisiert werden und dass Sie auf die Schaltfläche Aktualisieren der Datei- und Ordnerliste klicken müssen.
Wenn Sie mit dem Server arbeiten, müssen Sie Dateien übertragen, sowohl von Ihrem Computer zum Server als auch vom Server zu Ihrem Computer. Dies kann auf zwei Arten geschehen:
Über das Linux- oder Mac-Terminal selbst und über die Windows-Eingabeaufforderung (in einigen Windows 10 Updates) mit dem Befehl scp. Um die Datei text.txt von unserem Computer (wenn sie sich im Arbeitsverzeichnis des Terminals befindet, wenn nicht, müssen wir den vollständigen Pfad angeben) auf den Server (mit der IP 123.456.789 und mit dem Benutzer "user") in das Verzeichnis /home/user/arrivaldirectory zu übertragen, können wir schreiben:
scp text.txt usuario@123.456.789:/home/usuario/directoriodellegada
Wenn wir vom Server auf den Computer übertragen wollen, können wir Folgendes tun:
scp usuario@123.456.789:/home/usuario/directoriodellegada/texto.txt
.
Denken Sie daran, dass der Benutzer mtuoc und das Passwort mtuoc lautet, wenn Sie mit den virtuellen Maschinen arbeiten, die wir anbieten.
Um die der virtuellen Maschine zugewiesene IP zu erfahren, müssen Sie Folgendes eingeben:
ifconfig
Und die IP ist die Nummer neben inet (213.73.33.35) im folgenden Beispiel:
Wenn der Server für ssh einen anderen Port als den Standardport (den 22) verwendet, müssen wir -P und den Port (in diesem Beispiel 5555) hinzufügen:
scp -P 5555 text.txt :/home/user/arrivaldirectory
scp -P 5555 :/home/benutzername/ankunftsverzeichnis/text.txt
.
Sobald wir die Zugangsdaten eingegeben haben, sehen wir zwei Dateilisten, wobei die linke dem lokalen Computer und die rechte dem Server entspricht. Die Benutzung ist sehr intuitiv und alle Informationen finden Sie in der Dokumentation des Programms. Denken Sie daran, dass Änderungen, die außerhalb von Filezilla vorgenommen werden, nicht automatisch auf dem Bildschirm des Programms aktualisiert werden und dass Sie auf die Schaltfläche Aktualisieren der Datei- und Ordnerliste klicken müssen.
- Woche 1: 1. Übersicht
- Woche 1: 2. Empfohlene Lektüre
- Woche 1: 3. Parallele Korpora
- Woche 1: 4. Linux auf Ihrem Computer
- Woche 1: 5. Grundlegende UNIX Befehle
- Woche 1: 6. Grundlegende Korpusvorbereitung mit UNIX-Befehlen
Dateien unter: https://github.com/mkappus1/DatenmanagementMTHS24/blob/main/Woche1/Aufgaben/Wortliste-de.txt und https://github.com/mkappus1/DatenmanagementMTHS24/blob/main/Woche1/Aufgaben/Wortliste.en.txt
- Woche 2. 1. Übersicht
- Woche 2: 2. Vorarbeiten
- Woche 2: 3. Konvertieren von TMX-Dateien in ein Tabellenformat
- Woche 2: 4. Alignment mit LF Aligner
- Woche 2: 5. Automatisches Alignment mit hunalign
- Woche 3: 1. Übersicht
- Woche 3: 2. Lektüre:
- Woche 3: 3. Herunterladen von Websites mit generischen Algorithmen
- Woche 3: 3.1 Einleitung
- Woche 3: 3.2 Sitemap erstellen
- Woche 3: 3.3 Herunterladen der Inhalte der Website (I)
- Woche 3: 3.4 Herunterladen der Inhalte der Website (II) - Trafilatura
- Woche 3: 3.5 Konvertierung in Text - NOCH NICHT BEARBEITEN