In [None]:
import string


def calculate_ttr(text: str) -> float:
    """
    Calculates the Type-Token Ratio (TTR) for a given text string.

    TTR is the ratio of unique words (types) to the total number of words (tokens).
    Punctuation is removed and text is lowercased before calculation
    to standardize word comparison.

    Args:
        text: The input string.

    Returns:
        The Type-Token Ratio as a percentage (float). Returns 0.0
        if the text contains no words after cleaning.
    """
    if not text or not text.strip():
        # Handle empty or whitespace-only string
        return 0.0

    # Convert to lowercase for case-insensitive comparison
    text = text.lower()

    # Remove punctuation and split into words
    # Using translate is an efficient way to remove all punctuation characters
    # defined in string.punctuation
    translator = str.maketrans("", "", string.punctuation)
    cleaned_text = text.translate(translator)

    # Split the cleaned text into tokens (words)
    words = cleaned_text.split()

    # Handle case where text was only punctuation or became empty after cleaning
    if not words:
        return 0.0

    total_tokens = len(words)
    unique_types = len(set(words))

    ttr = (unique_types / total_tokens) * 100

    return ttr

In [5]:
poems = {
    "ALLAM": """
شكراً لجامعة سعود درب المجد
طريق التقدم يا سعود لك استمد

من العلم قد أحييت أرضك بالندى
ومن العلم قد أحييت أرضك بالجدد""",
    "SILMA": """
جامعة سعود في نجد، فخرها يزداد
في الشرق والغرب، تظل رمز الجداد

ما من مكان في العالم إلا وهي حماة
كالنجم في السماء، يضيء بالنجاد

فصاحتها تعانق الأفق، في كل بلاد
ومدائحها تتردد، بكل لسان وفؤاد

منها العلم ينبع، ويمتد في كل مداد
في نجد، جامعة سعود، فخر الأمجاد""",
    "GPT": """
سَعَيتِ لِلعُلا والمَجدِ يا خيرَ مَقصِدِ

وسِرتِ بعِلمِ الناسِ تَزهينَ بالرُشدِ


رَفعتِ منارَ الحقِّ فوقَ ذُرا العُلى

وغَرسْتِ في الأرواحِ نورًا منَ السَّعدِ


إذا ذُكِرَ التعليمُ كنتِ أوَّلًا

وصوتُكِ بينَ الخَلقِ أَبهى منَ الغَدِ


لَكِ الحمدُ يا دارَ العُلومِ ومَهدَها

تَفيضينَ علمًا في السُّهولِ وفي النَّجدِ""",
    "CLAUDE": """
أَيا صَرْحَ عِلْمٍ قَدْ سَمَوْتَ بِفَضْلِكُمْ

وَأَشْرَقْتَ نُوراً في رُبوعِ البَوادي



تُنيرُ عُقولاً بِالمَعارِفِ والنُّهَى

 وَتَبْني رِجالاً للغَدِ المُتَجَدِّدِ


بِكَ العِلْمُ يَزْهو والثَّقافَةُ تَزْدَهي

وَتَسْمو بِكَ الآمالُ نَحْوَ السُّؤْدُدِ



فَكَمْ أَنْجَبَتْ أَجْيالَ عِلْمٍ مُضيئَةً

وَكَمْ أَطْلَقَتْ أَفْكارَ فَكْرٍ مُسَدَّدِ



سَتَبْقَى مَناراً شامِخاً في بِلادِنا

يُشِعُّ بِمَجْدٍ راسِخٍ مُتَجَدِّدِ



فَدُمْتَ لِأَوْطانِ العُروبَةِ مَفْخَراً 

وَدامَ عَطاؤُكَ الزَّاكي على مَرِّ الأَبَدِ""",
}

In [8]:
for k, v in poems.items():
    print(f"{k} poem TTR={calculate_ttr(v):.2f}")

ALLAM poem TTR=78.26
SILMA poem TTR=81.63
GPT poem TTR=93.48
CLAUDE poem TTR=94.83
