Dieses Repository enthält eine Python-Einführung für die Vorlesung Computerlinguistische Techniken (Sommersemester 2014, Universität Potsdam). Eine noch grundlegendere Einführung gibt es z.B. in Dirk Hovys Python for Linguists.
Die Einführung kann man am einfachsten hier mit dem IPython Notebook Viewer betrachten. Bearbeiten und verändern lässt sie sich wie folgt:
git clone https://github.com/arne-cl/python-einfuehrung.git
cd python-einfuehrung
ipython notebook
Wer noch mehr computerlinguistische Themen mit Python und NLTK ausprobieren möchte, dem sei die Webseite Natural Language Processing and Applications der Uni Kaiserslautern ans Herz gelegt. Dort gibt es diverse IPython-Notebooks zu NLTK, regulären Ausdrücken, Hidden Markov Models, Unicode, POS-Tagging, Transduktoren und einigen Klassifikatoren.
Mein Beispiel zur Visualisierung des CKY-Erkenners (Code: A. Koller/ T. Hanneforth) könnt ihr euch zwar online ansehen, sie funktioniert allerdings nur richtig, wenn ihr sie lokal auf eurem Rechner installiert (s.o.). Hierfür muss zudem noch ipythonblocks installiert werden.
Wie man Python-Pakete mit pip installiert, habe ich hier zusammengefasst.
Zum Debuggen habe ich pudb vorgestellt.
Das Paket lässt sich auch mit pip
installieren, funktioniert aber
anscheinend nur unter Linux/Mac OS. Alternativ könnt ihr es mit
winpdb probieren (Windows/Linux/Mac OS).
Es gibt einen kostenlosen Online-Kurs zum Thema Debugging (in Python) bei Udacity von Andreas Zeller (die Videos sind thematisch gegliedert, man kann sie sich auch einzeln ansehen). Von ihm stammt auch das schöne Buch Why Programs Fail.
Zum Bearbeiten des Notebooks benötigt man git sowie IPython.
Dieses Geschwurbel ist lizensiert unter der Creative Commons Attribution-ShareAlike 4.0 International License.
Arne Neumann