<h1><center>NLP für Arabisch mit CAMeL Tools</center></h1>

<img src="assets/banner.png" /><br>
<br>Herzlich willkommen zu dieser kleinen Einführung zum Thema NLP für Arabisch mit CAMeL Tools! In den folgenden Aufgaben werden wir uns mit dem sechsten Vers (Aya) der ersten Sure des Korans beschäftigen. Genauer gesagt werden wir uns Korankommentare unterschiedlicher Autoren ansehen, die sich mit diesem Vers beschäftigt haben.<br>
Wie wir bereits in der Präsentation von Prof. Büssow erfahren haben, scheint für die Textgattung der Korankommentare eine Unterteilung in drei Ansätze möglich: Tradition / Moral, Philologie / Wissenserwerb, Mystik / Erkenntnis.
Der Frage, ob sich im Sprachgebrauch von Korankommentatoren, ihrem Wortschatz und den von ihnen verwendeten Metaphern Hinweise finden lassen, welche diese These stützen, möchten wir heute zuarbeiten. Dabei lernen wir
- das uns zur Verfügung stehende Korpus (https://www.altafsir.com/Tafasir.asp) kennen,
- extrahieren aus dem Korpus ein Sample (`tafsir_extractor`),
- bereiten dieses Sample auf, analysieren es (`CAMeL Tools`),
- und stellen den Kernwortschatz graphisch in einer Wortwolke dar (`Wordcloud`).

Hierbei werden wir bekannte Konzepte, Funktionen und Module, wiederholen und neue Module und ein neues Konzept (das der `Klasse`), kennenlernen.
<center>Viel Spaß (und Erfolg)!</center>

____

## 1. Überblick über den Datenbestand beschaffen

Wie wir gesehen haben finden sich auf <a href="https://www.altafsir.com">altafsir.com</a> zahlreiche Tafsire (Korankommentare), die sich an Hand eines Dropdown-Menüs durchstöbern und auswählen lassen. Oh Schreck, alles auf Arabisch! Das wir kein Arabisch können, ist an dieser Stelle aber gar nicht so schlimm! Wir können nämlich trotzdem alle Tafsire identifizieren, da im Ordner <code>./assets/</code> eine csv-Datei <code>tafasir.csv</code> hinterlegt ist, die eine Liste aller verfügbaren Tafsire enthält und von der Seite extrahiert (und etwas ergänzt) wurde. Darin finden wir für jeden Tafsir unterschiedliche Angaben, hierunter seine eindeutige ID, die wir bei der Extraktion des Textes benötigen.<br><br>
<b>Aufgabe 1:</b> Wir importieren das Modul pandas. Dann laden wir die Datei <code>./assets/tafasir.csv</code> in einen Dataframe (Trennzeichen beachten!) und machen die Spalte <code>Id</code> zum Index. Zum Schluss lassen wir uns den Dataframe anzeigen.

In [None]:
# Erstellen des Dataframes
import pandas as pd

tafasir = pd.read_csv("./assets/tafasir.csv", sep=";").set_index("Id")

In [None]:
# Ausgabe des Dataframes
tafasir[:7]

Als Ergebnis erhalten wir eine Tabelle, mit der wir leichter herausfinden können, welche Id ein bestimmter Tafsir hat. Da uns in unserer Forschungsfrage ein paar Tafsire ganz besonders interessieren, haben wir deren Namen in der Liste `random_tafsir` hinterlegt. Und damit wir nicht alle den selben Tafsir bearbeiten, führen wir den folgenen Code aus, um einen zufälligen Tafsir zugewiesen zu bekommen:

In [None]:
import random

random_tafsir = ["Muqātil b. Sulaymān", "Ibn ʿAǧība", "aš-Šaʿrawī", "az-Zamaḫšarī", "aṭ-Ṭabarī", "Abū as-Suʿūd", "ar-Rāzī"]
random.choice(random_tafsir)

<b>Aufgabe 2:</b> Wir suchen für unseren Tafsir die Id. Hierfür benutzen wir </b> <code>.loc[]</code> und suchen nach einer Übereinstimmung in der Spalte <code>AuthorName</code>.<br>
<i>Tipp:</i> Copy & paste für den Tafsirnamen nutzen!

In [None]:
tafasir.loc[tafasir["AuthorName"] == "al-Bayḍāwī"]

Nun da wir wissen, welche Id unser Tafsir hat und dass wir uns uns mit Sure 1, Aya 6 beschäftigen wollen, können wir zum nächsten Schritt übergehen und den entsprechenden Text von der Website extrahieren.

___________

# 2. Sample beschaffen
Im nächsten Schritt werden wir das Modul <b><code style="color:#9b0014">tafsir_extractor</code></b> importieren, mit dessen Hilfe wir uns den Text unseres Tafsirs erscrapen. Um das Modul kennenzulernen lohnt es sich, die eingebaute Hilfsfunktion <b><code style="color:#ce5d19">help()</code></b> auf das Modul anzuwenden.

In [None]:
import tafsir_extractor as te
help(te)

Aus dem Hilfe-Output können wir entnehmen, dass das Modul eine Objektklasse namens <code>tafsir_sample</code> enthält. Was aber ist eigentlich ein Objekt und was eine Klasse? Es lohnt sich ein kurzer Exkurs.<br><br>

<h2>2.1 Ein Sample von altafsir.com extrahieren</h2>
Zurück zu unserem Modul <b><code style="color:#9b0014">tafsir_extractor</code></b>: Wie oben gesehen, bringt das Modul die für Samples vorgesehene Objektklasse <code style="color:#9b0014">tafsir_sample</code> mit, die uns das Leben etwas leichter machen soll. Damit wir ein Objekt dieser Klasse initialisieren können, müssen wir bei der Initialisierung folgende Attribute übergeben:
<ul><li>TafsirId</li>
<li>Sura</li>
<li>Aya</li></ul>
Da wir bereits bei der Initialisierung alle notwendigen Informationen zum Extrahieren an unser neues Objekt <code>sample</code> übergeben, können wir mit der Methode <code>collect_data()</code> automatisch den Text für die gewünschte Stelle extrahieren. Dieser wird dann automatisch im Attribut <code>Text</code> unseres Sample-Objekts gespeichert

<b>Aufgabe 4:</b> Wir initialisieren unser Sample-Objekt. Bitte Attributnamen durch Werte ersetzen.

In [None]:
import tafsir_extractor as te
sample = te.tafsir_sample(TafsirId, Sura, Aya)
sample.collect_data()

## 2.2 Alternativ: aus Datei laden
Sollte es aus irgendwelchen Gründen mit der Extraktion nicht klappen, können wir auf die mitgelieferten Datensätze zurückgreifen.<br>

<b>Aufgabe 4 (Alternative):</b> Wir initialisieren unser Sample-Objekt. Bitte Attributnamen durch Werte ersetzen.

In [None]:
import tafsir_extractor as te
sample = te.tafsir_sample(TafsirId, Sura, Aya)
with open(f"./data/{sample.TafsirId}-{sample.Sura}_{sample.Aya}.txt", "r", encoding="utf-8") as f:
    sample.Text = f.read()

Den somit erhaltenen Text können wir uns ganz einfach anzeigen lassen:

In [90]:
sample.Text

'قال أبو جعفر: ومعنى قوله: { ٱهْدِنَا ٱلصِّرَاطَ ٱلْمُسْتَقِيمَ } فـي هذا الـموضع عندنا: وَفّقنا للثبـات علـيه، كما رُوي ذلك عن ابن عبـاس. حدثنا أبو كريب، قال: حدثنا عثمان بن سعيد، قال: حدثنا بشر بن عمارة، قال: حدثنا أبو روق، عن الضحاك، عن عبد الله بن عبـاس قال: قال جبريـل لـمـحمد: «قل يا مـحمد اهدنا الصراط الـمستقـيـم»، يقول: ألهمنا الطريق الهادي. وإلهامه إياه ذلك هو توفـيقه له كالذي قلنا فـي تأويـله. ومعناه نظير معنى قوله: { إيَّاكَ نَسْتَعِينُ } فـي أنه مسألة العبد ربه التوفـيق للثبـات علـى العمل بطاعته، وإصابة الـحقّ والصواب فـيـما أمره به، ونهاه عنه فـيـما يستقبل من عمره دون ما قد مضى من أعماله، وتقضى فـيـما سلف من عمره، كما فـي قوله: { إِيَّاكَ نَسْتَعِينُ } مسألة منه ربه الـمعونة علـى أداء ما قد كلفه من طاعته فـيـما بقـي من عمره. فكان معنى الكلام: اللهم إياك نعبد وحدك لا شريك لك، مخـلصين لك العبـادة دون ما سواك من الآلهة والأوثان، فأعنا علـى عبـادتك، ووفقنا لـما وفقت له من أنعمت علـيه من أنبـيائك وأهل طاعتك من السبـيـل والـمنهاج. فإن قال قائل: وأنّـي وجدت الهداية فـي كلام العرب 

____

# 3 Preprocessing
Bevor wir den Text analysieren können, müssen wir ihn zunächst vorverarbeiten, um ihn in eine für unser Toolkit "saubere" Form zu überführen.

## 3.1 Normalisierung der Daten
In einem ersten Schritt möchten wir den Text normalisieren, das heißt ihn von Ungleichmäßigkeiten im Zeichensatz und von Inhalten, die für unsere Fragestellung irrelevant sind, befreien. In diesem Fall möchten wir:
- alle Unicode-Zeichen normalisieren (z.B. `\xa0` zu Leerzeichen),
- alle Diakritischen Zeichen,
- Koranzitate, Querverweise auf andere Koranverse und Eulogien
- sowie alle Zeichen, die nicht zu den Konsonanten und Halbvokalen des Arabischen Kernalphabets gehören,

entfernen. Hierfür können wir einige Funktionen aus <a href="https://camel-tools.readthedocs.io/en/latest/">CAMeL Tools</a> importierten. Für das Entfernen von Koranzitaten etc. müssen wir aber auf eigene Funktionen zurückgreifen. So ist der Code allerdings noch lauffähig. Wir werfen einen Blick auf <b>Aufgaben 6</b> und <b>7</b> weiter unten um den Code zu vervollständigen.


In [93]:
from camel_tools.utils.normalize import normalize_unicode
from camel_tools.utils.dediac import dediac_ar
import re

def reduce_charset(text):
    """Entfernt alle Zeichen aus dem Text, die nicht zwischen
    'X' und 'Y' liegen"""

    chars_excluded = '[^\u0621-\u064A ]'
    text = re.sub(chars_excluded, ' ', text)
    
    return text

def remove_aya(text):
    """Entfernt alle aus dem Koran zitierten Textstellen"""
    
    aya = '\{(.*?)\}'####
    text = re.sub(aya, '', text)

    return text

def remove_ref(text):
    """Entfernt alle Verweise auf weitere Verse im Koran
    aus dem Text"""
    
    ref = '\[(.*?)\]'
    text = re.sub(ref, '', text)
    
    return text

def remove_eulogies(text):
    """Entfernt Eulogien (Segenssprüche) aus dem Text"""
    
    with open("./assets/eulogies.txt", encoding="utf-8") as f:
        eulogies = f.read().splitlines()
    
    for eulogy in eulogies:
        text = re.sub(eulogy, '', text)
    
    return text

def normalizer(string):
    """Wendet die Gewünschten Normalisierungsschritte an"""

    # Unicode-Zeichensatz normalisieren
    str_norm = normalize_unicode(string)
    
    # Diakritika aus dem Text entfernen
    str_norm = dediac_ar(str_norm)

    # Koranzitate, Verweise und Eulogien entfernen
    str_norm = remove_aya(str_norm)
    str_norm = remove_ref(str_norm)
    str_norm = remove_eulogies(str_norm)
    
    # Zeichensatz auf relevante Zeichen reduzieren
    str_norm = reduce_charset(str_norm)

    return str_norm

<b>Aufgabe 5:</b> In der Funktion <code style="color:#ce5d19">reduce_charset()</code> wird durch die Variable <code style="color:#4e89b4">chars_excluded</code> ein Zeichenbereich angegeben. Wie lauten die Arabischen Namen der beiden Buchstaben, die diesen Zeichenbereich begrenzen? Wir ersetzen im DocString <code>X</code> und <code>Y</code> durch die entsprechenden Namen. <li><i>Tipp:</i> <a href="https://unicode-table.com/de/">Unicode Zeichentabelle</a>

<b>Aufgabe 6:</b> Mit der Funktion <code style="color:#ce5d19">remove_aya()</code> sollen alle Koranzitate aus dem Text entfernt werden. Koranzitate sind sehr leicht identifizierbar, da sie von geschweiften Klammern (<code>{}</code>)umgeben werden. Wie lautet ein möglicher regulärer Ausdruck, den wir der Variable <code style="color:#4e89b4">aya</code> zuweisen müssen, um alle Koranzitate zu erfassen?
<li><i>Tipp:</i> Das Tool <a href="https://regex101.com/">regular expressions 101</a> ist sehr hilfreich, aber Vorsicht: Die Darstellung von Markierungen bei rechtsläufiger Schrift kann irritieren!<br>
<li><i>Hinweis:</i> Text zum Testen kann über <code style="color:#4e89b4">sample</code><code>.</code><code style="color:#9872a2">Text</code> abgerufen werden und von dann kopiert werden.

<b>Aufgabe 7:</b> Analog zu <b>6</b>, nur dass Querverweise von eckigen Klammern (<code>[]</code>) umgeben werden.

Jetzt wo der Code vollständig ist, können wir den <code style="color:#ce5d19">normalizer()</code> auf unseren Text anwenden. Hier wird nun ein Vorzug von Objekten sichtbar: wir können unserem Sample einfach ein neues Attribut zuweisen, das wir Normalized nennen und in dem wir den normalisierten Text speichern. So können wir den Originaltext für (un-)vorhergesehene Fälle aufbewahren, ohne ihn zu überschreiben.

In [94]:
sample.Normalized = normalizer(sample.Text)

## 3.2 Tokenisierung
Nun trennen wir mit Hilfe des in CAMeL-Tools enthaltenen Tokenizers unseren Text (im Augenblick ein langer String) in eine Liste aller Einzelwörter auf, die wir in unserem Sample in einem neuen Attribut namens Tokenized speichern.

In [106]:
from camel_tools.tokenizers.word import simple_word_tokenize

sample.Tokenized = simple_word_tokenize(sample.Normalized)

## 3.3 Disambiguierung
Ein besonders vielseitiges und starkes Tool, das für unsere weiteren Schritte von zentraler Bedeutung ist, ist der Maximum Likelihood Disambiguator (MLED). Dieses Tool greift auf mitgelieferte Datensätze zurück und berechnet damit für jeden Token, um was für ein Lemma, in welcher Form usw. es sich handelt. Eine hilfreiche Übersicht über die berechneten Parameter findet sich in der Dokumentation unter <a href="https://camel-tools.readthedocs.io/en/latest/reference/camel_morphology_features.html#camel-morphology-features">CAMeL Morphology Features</a>.

In [189]:
from camel_tools.disambig.mle import MLEDisambiguator

# Eine Instanz des Maximum Likelihood Disambiguator wird aufgerufen
mle = MLEDisambiguator.pretrained()

# Der Text wird in tokenisierter Form übergeben
sample.Disambiguated = mle.disambiguate(sample.Tokenized)

Wirft man einen ersten Blick auf den Output des MLED, so wirkt er zugegebenermaßen etwas verwirrend. Dem schafft die folgende Grafik abhilfe, die den Output etwas aufschlüsselt und zugänglicher macht.<br>
<center><img src="assets/MLED_output_tree.png" /><br></center>
<b>Bildbeschreibung:</b> der MLED übergibt uns eine Liste, in der sich für jeden Token ein Objekt der Klasse DisambiguatedWord befindet. DisambiguatedWord hat zwei Attribute: word (der Token selbst) sowie analyses (eine Liste). analyses beinhaltet ScoredAnalysis-Objekte. In unserem Fall ist es immer nur ein einziges ScoredAnalysis-objekt und der Index-Wert somit immer 0 (in anderen Fällen auch > 1 ScoredAnalysis-Objekt). Das ScoredAnalysis-Objekt hat zwei Attribute: score (ein Float-Wert) und analysis (ein Dictionary). In diesem Dictionary befinden sich die für uns relevanten Daten wie Lemma, Part-Of-Speech-Tag, Wortstamm etc.

<b>Aufgabe 8:</b> Wir lassen uns für einen beliebigen Token den Parameter "stemgloss" ausgeben, der uns die englische Bedeutung

In [200]:
sample.Disambiguated[2].analyses[0].analysis["stemgloss"]
# sample.Disambiguated[2]

'Jaafar'

Damit wir gleich den Text um seine Stopwörter reduzieren können, fügen wir dem Objekt `corpus["Disambig"]` ein Attribut hinzu, welches das Lemma in normalisierter Form enthält.

In [None]:
from camel_tools.utils.normalize import normalize_alef_ar
from camel_tools.utils.dediac import dediac_ar

for i, val in enumerate(sample.Disambiguated):
    normalized = normalize_alef_ar(dediac_ar(val.analyses[0].analysis["lex"]))
    sample.Disambiguated[i].normalized = normalized

## 3.4 Filtern unerwünschter Wörter
### 3.4.1 Durch Part-Of-Speech-Tags

In [None]:
sample.Filtered = sample.Disambiguated.copy()

In [None]:
sample.Filtered == sample.Disambiguated

In [None]:
for i in enumerate(sample.Filtered):
    if sample.Filtered[i[0]].analyses[0].analysis["pos"] in ("conj", "prep", "pron", "abbrev", "pron_dem", "conj_sub"):
        sample.Filtered.pop(i[0])

### 3.4.2 Mittels Stopwortliste

In [None]:
# Stopwortliste aus NLTK extrahiert
with open("./assets/stopwords_nltk.txt", "r", encoding="utf-8") as sf:
    stopwords_nltk = normalize_alef_ar(dediac_ar(sf.read()))

# Zusätzliche Stopwörter
with open("./assets/stopwords_extra.txt", "r", encoding="utf-8") as sf:
    stopwords_extra = normalize_alef_ar(dediac_ar(sf.read()))

stopwords = stopwords_nltk + " " + stopwords_extra
stopwords = stopwords.split()

In [None]:
def del_stopwords(token_list, stopwords_list):
    """Entfernt alle in der Stopwortliste vorhandenen Einträge
    aus dem Datensatz der disambiguierten Tokens."""

    for i, token in enumerate(token_list):
        if token.normalized in stopwords_list:
            token_list.pop(i)
        else:
            pass
    
    return len(token_list)

Da nicht bei jedem Durchgang auch wirklich alle Stopwörter erfasst werden, wird der Vorgang solange durchgeführt, bis sich die Länge des verbleibenden Tokensatzes nicht mehr verändert

In [None]:
while True:
    if len(sample.Filtered) == del_stopwords(sample.Filtered, stopwords):
        print(len(sample.Filtered))
        break
    else:
        del_stopwords(sample.Filtered, stopwords)

## 4. Visualisierung
### 4.1 Häufigkeiten von Lemmata

In [None]:
# für Häufigkeitsverteilungen
from collections import Counter

# Für Grafik
import matplotlib.pyplot as plt          
from wordcloud import WordCloud

# Für die korrekte Darstellung
# arabischer Schrift in Grafiken
from arabic_reshaper import reshape
from bidi.algorithm import get_display

In [None]:
# Auswahl des gewünschten Parameters
parameter = "lex"

# Korrektur der Darstellung arab. Buchstaben
rtl = lambda w: get_display(reshape(f'{w}'))

# Auswahl aller Werte durch 'parameter' bestimmte Werte mittles Listen-Abstraktion,
# Berechnung der Häufigkeiten, Umwandlung von Tuples in Dictionary
counter_input = [v.analyses[0].analysis[f"{parameter}"] for v in sample.Filtered]
counter_output = Counter(counter_input).most_common(40)
counts = {rtl(k):v for k, v in counter_output}
counts_ltr = {k:v for k, v in counter_output}


# Ausgabe der Häufigkeiten in Datei
with open(f"./output/{sample.TafsirId}-{sample.Sura}_{sample.Aya}_{parameter}_freqs.csv", 'w', encoding="utf-8") as f:
    for key in counts_ltr.keys():
        f.write("%s, %s\n" % (key, counts_ltr[key]))


# Angabe des Font-Files zur Darstellung arab. Buchstaben
# und Ausgabe der Wortwolke in Datei und Plot
font_file = './assets/fonts/NotoNaskhArabic-Regular.ttf'

wordcloud = WordCloud(font_path=font_file,
                      background_color="white",
                      width=400,
                      height=200).generate_from_frequencies(counts)
wordcloud.to_file(f"./output/{sample.TafsirId}-{sample.Sura}_{sample.Aya}_{parameter}_wc.png")

plt.figure(figsize=(10,10))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

### 4.2 Häufigkeiten von Stammbedeutungen

In [None]:
# Auswahl des gewünschten Parameters
parameter = "stemgloss"


# Auswahl aller Werte durch 'parameter' bestimmte Werte mittles Listen-Abstraktion,
# Berechnung der Häufigkeiten, Umwandlung von Tuples in Dictionary
counter_input = [v.analyses[0].analysis[f"{parameter}"] for v in sample.Filtered]
counter_output = Counter(counter_input).most_common(40)
counts = {k:v for k, v in counter_output}


# Ausgabe der Häufigkeiten in Datei
with open(f"./output/{sample.TafsirId}-{sample.Sura}_{sample.Aya}_{parameter}_freqs.csv", 'w', encoding="utf-8") as f:
    for key in counts.keys():
        f.write("%s, %s\n" % (key, counts[key]))


# Ausgabe der Wortwolke in Datei und Plot
wordcloud = WordCloud(background_color="white",
                      width=400,
                      height=200).generate_from_frequencies(counts)
wordcloud.to_file(f"./output/{sample.TafsirId}-{sample.Sura}_{sample.Aya}_{parameter}_wc.png")

plt.figure(figsize=(10,10))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

<center><h1>Exkurs: Klassen</h1></center>
Werfen wir einen kurzen Blick auf das Foto, so erkennen wir unschwer, dass es sich bei all den abgebildeten Vierbeinern, so sehr sie sich auch unterscheiden mögen, um Hunde handelt. Deshalb sagen wir, dass sie der Klasse <b><code style="color:#9b0014">Hunde</code></b> angehören. Deshalb ist jeder einzelne Vierbeiner eine Instanz des Objekttyps "Hund".
<center><img src="assets/Collage_of_Nine_Dogs.jpg" width=300 /></center><br>
Zudem haben Hunde bestimmte Eigenschaften wie <code style="color:#9872a2">Größe</code>, <code style="color:#9872a2">Fellfarbe</code> oder <code style="color:#9872a2">Schnauzentyp</code>. Diese Eigenschaften nennen wir <b><code style="color:#9872a2">Attribute</code></b>.<br>
Hunde haben aber auch bestimmte Fähigkeiten, für die sie von vielen Menschen geliebt werden: Sie können zum Beispiel mit ihrer Nase <code style="color:#ce5d19">spüren()</code>, können <code style="color:#ce5d19">bellen()</code> oder <code style="color:#ce5d19">sabbern()</code>. All diese Fähigkeiten sind im Prinzip Funktionen, da sie aber zur Klasse <b><code style="color:#9b0014">Hunde</code></b> gehören, nennen wir sie <b><code style="color:#ce5d19">Methoden</code></b>.<br>
Lasst uns nun diese Beispielklasse erstellen:

In [None]:
# Wir definieren eine neue Klasse Namens "Hunde"
class Hunde:
    # wird eine Instanz von Hunde, also ein Hund, initialisiert
    # müssen die Attribute Größe, Fellfarbe und Schnauzentyp angegeben werden
    def __init__(self, groesse, fellfarbe, schnauzentyp):
        self.groesse = groesse
        self.fellfarbe = fellfarbe
        self.schnauzentyp = schnauzentyp
        self.sabbern()
        self.bellen()

# ein Hund kann bellen, sabbern und sitz machen.
# Damit ihm aber klar wird, dass genau er gemeint ist
# müssen wir ihn bestärken, indem wir immer 
# "Du! Ja, Bello! Fein, Du Bello!" sagen.
# Und das machen wir jedes mal wieder durch self ...
    def bellen(self):
        print("...Wuff Wuff!")

    def sabbern(self):
        print("...sabbert...")

    def sitz(self):
        print("...macht Sitz...")

Wir haben nun die Klasse <b><code style="color:#9b0014">Hunde</code></b> erstellt und können unseren ersten Hund nach Hause holen/initialisieren. Diesen würden wir gerne <code>bello</code> nennen. Bello ist 40 cm groß, hat braunes Fell und eine Stupsnase.

In [None]:
Bello = Hunde(120, "braun", "gedrungen")

Bello ist zuhause angekommen und das erste was er macht ist natürlich: sabbern und bellen... Um zu sehen, ob Bello auch auf unser Kommando hört, sagen wir ihr ihm, er soll Sitz machen:

In [None]:
Bello.sitz()

Wenigstens das klappt. Bei genauerem hinsehen ist uns aufgefallen, dass Bello blaue Augen hat. Deshalb bekommt Bello ein weiteres Attribut:

In [None]:
Bello.augenfarbe = "blau"

Wir wissen nun also, dass Bello ein Objekt der Klasse <b><code style="color:#9b0014">Hunde</code></b> ist, das verschiedene <b><code style="color:#9872a2">Attribute</code></b> und <b><code style="color:#ce5d19">Methoden</code></b> hat. Da die einzelnen Attribute in Form eines Dictionaries gespeichert werden, lassen wir uns zum Abschluss noch einmal alle Attribute unseres lieben Bellos anzeigen:

In [None]:
Bello.__dict__