# Elementary Lexical Analysis with the CLTK

In this tutorial, we will use the Classical Language Toolkit to analyze word choice in Sophocles' *Antigone*. Specifically, we will isolate words that occur both in Ode to Man and somewhere in the rest of the play.

## General Design

We will follow these steps to complete our task:

1) Lemmetize the texts and extract the necessary lemmata.
2) Isolate only the lemmata that occur in both the Ode and somewhere else in the text.
3) Print the isolated lemmata.
4) Create a concordance for key words.

## Lemmatizing Texts

Lemmatization is the process of simplifying inflected words to their basic form. For example, the lemma of γραψάμενος is γράφω. We begin by first loading the text we wish to lemmatize, the ```antigone.txt``` file in this case, and saving it as a string for later use. Note that we do not have to close the file with ```file.close()``` since this is executed automatically at the end of the ```with``` statement.

In [6]:
with open("antigone.txt") as file:
    antigone_text = file.read()
print(antigone_text[:1084]) # The [:1084] limits the print statement to print only the first 1,084 
                            # characters of the text, which are the first 30 lines.

ὦ κοινὸν αὐτάδελφον Ἰσμήνης κάρα
ἆρ᾽ οἶσθ᾽ ὅ τι Ζεὺς τῶν ἀπ᾽ Οἰδίπου κακῶν
ὁποῖον οὐχὶ νῷν ἔτι ζώσαιν τελεῖ
οὐδὲν γὰρ οὔτ᾽ ἀλγεινὸν οὔτ᾽ ἄτης ἄτερ
οὔτ᾽ αἰσχρὸν οὔτ᾽ ἄτιμόν ἐσθ᾽ ὁποῖον οὐ
τῶν σῶν τε κἀμῶν οὐκ ὄπωπ᾽ ἐγὼ κακῶν
καὶ νῦν τί τοῦτ᾽ αὖ φασι πανδήμῳ πόλει
κήρυγμα θεῖναι τὸν στρατηγὸν ἀρτίως
ἔχεις τι κεἰσήκουσας ἤ σε λανθάνει
πρὸς τοὺς φίλους στείχοντα τῶν ἐχθρῶν κακά
ἐμοὶ μὲν οὐδεὶς μῦθος  φίλων
οὔθ᾽ ἡδὺς οὔτ᾽ ἀλγεινὸς ἵκετ᾽ ἐξ ὅτου
δυοῖν ἀδελφοῖν ἐστερήθημεν δύο
μιᾷ θανόντοιν ἡμέρᾳ διπλῇ χερί
ἐπεὶ δὲ φροῦδός ἐστιν Ἀργείων στρατὸς
ἐν νυκτὶ τῇ νῦν οὐδὲν οἶδ᾽ ὑπέρτερον
οὔτ᾽ εὐτυχοῦσα μᾶλλον οὔτ᾽ ἀτωμένη
ᾔδη καλῶς καί σ᾽ ἐκτὸς αὐλείων πυλῶν
τοῦδ᾽ οὕνεκ᾽ ἐξέπεμπον ὡς μόνη κλύοις
τί δ᾽ ἔστι δηλοῖς γάρ τι καλχαίνουσ᾽ ἔπος
οὐ γὰρ τάφου νῷν τὼ κασιγνήτω 
τὸν μὲν προτίσας τὸν δ᾽ ἀτιμάσας ἔχει
Ἐτεοκλέα μέν ὡς λέγουσι σὺν δίκης
χρήσει δικαίᾳ καὶ νόμου κατὰ χθονὸς
ἔκρυψε τοῖς ἔνερθεν ἔντιμον νεκροῖς
τὸν δ᾽ ἀθλίως θανόντα Πολυνείκους νέκυν
ἀστοῖσί φασιν ἐκκεκηρῦχθαι τὸ μὴ
τάφῳ καλύψαι μηδὲ κ

Now let us load the Ode text the same way.

In [3]:
with open("odeToMan.txt") as file:
    ode_text = file.read()
print(ode_text)

πολλὰ τὰ δεινὰ κοὐδὲν ἀνθρώπου δεινότερον πέλει
τοῦτο καὶ πολιοῦ πέραν πόντου χειμερίῳ νότῳ	
χωρεῖ περιβρυχίοισιν
περῶν ὑπ᾽ οἴδμασιν
θεῶν τε τὰν ὑπερτάταν Γᾶν
ἄφθιτον ἀκαμάταν ἀποτρύεται
ἰλλομένων ἀρότρων ἔτος εἰς ἔτος
ἱππείῳ γένει πολεύων	
κουφονόων τε φῦλον ὀρνίθων ἀμφιβαλὼν ἄγει
καὶ θηρῶν ἀγρίων ἔθνη πόντου τ᾽ εἰναλίαν φύσιν	
σπείραισι δικτυοκλώστοις
περιφραδὴς ἀνήρ
κρατεῖ δὲ μηχαναῖς ἀγραύλου
θηρὸς ὀρεσσιβάτα λασιαύχενά θ᾽	
ἵππον ὀχμάζεται ἀμφὶ λόφον ζυγῶν
οὔρειόν τ᾽ ἀκμῆτα ταῦρον
καὶ φθέγμα καὶ ἀνεμόεν φρόνημα καὶ ἀστυνόμους	
ὀργὰς ἐδιδάξατο καὶ δυσαύλων
πάγων ὑπαίθρεια καὶ δύσομβρα φεύγειν βέλη
παντοπόρος ἄπορος ἐπ᾽ οὐδὲν ἔρχεται
τὸ μέλλον Ἅιδα μόνον φεῦξιν οὐκ ἐπάξεται	
νόσων δ᾽ ἀμηχάνων φυγὰς ξυμπέφρασται
σοφόν τι τὸ μηχανόεν τέχνας ὑπὲρ ἐλπίδ᾽ ἔχων	
τοτὲ μὲν κακόν ἄλλοτ᾽ ἐπ᾽ ἐσθλὸν ἕρπει
νόμους γεραίρων χθονὸς θεῶν τ᾽ ἔνορκον δίκαν
ὑψίπολις ἄπολις ὅτῳ τὸ μὴ καλὸν	
ξύνεστι τόλμας χάριν μήτ᾽ ἐμοὶ παρέστιος
γένοιτο μήτ᾽ ἴσον φρονῶν ὃς τάδ᾽ ἔρδει	
ἐς δαιμόνιον τέρας ἀμφινοῶ
τόδε π