# Punjabi Text Normalization Test Cases

This notebook tests the Punjabi text normalization implementation.

## Test Categories:
1. Cardinal Numbers
2. Decimal Numbers
3. Fractions
4. Dates
5. Time
6. Money
7. Measurements
8. Ordinal Numbers
9. Telephone Numbers
10. Whitelist/Abbreviations
11. Mixed Content
12. Batch Testing


In [1]:
import sys
import os

# Add the NeMo-text-processing directory to the path
sys.path.insert(0, os.path.abspath('.'))

from nemo_text_processing.text_normalization.normalize import Normalizer

print("Imports successful!")


Imports successful!


In [2]:
# Initialize Punjabi normalizer
normalizer_pu = Normalizer(
    input_case='cased',
    lang='pu',
    cache_dir=None,  # Set to a directory path if you want to cache .far files
    overwrite_cache=False,
    post_process=True
)

print("Punjabi Text Normalizer initialized successfully!")
print(f"Language: {normalizer_pu.lang}")


Punjabi Text Normalizer initialized successfully!
Language: pu


## 1. Cardinal Numbers Test


In [3]:
cardinal_tests = [
    "155=100",
    "१२३४",
    "१२३४५",
    "१२३४५६",
    "१२३४५६७",
    "१२३४५६७८",
    "-१२३",
    "-120",
    "१०००",
    "१०००००",  # 1 lakh
    "१००००००००",
    "456",
    "9943206870",
    "1,234,566"
]

print("=" * 60)
print("CARDINAL NUMBERS TEST")
print("=" * 60)
for test in cardinal_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


CARDINAL NUMBERS TEST
Input:  155=100         -> Output: ਇੱਕ सौ ਪਚਵੰਜਾ ਬਰਾਬਰ ਇੱਕ सौ
Input:  १२३४            -> Output: ਇੱਕ हज़ार ਦੋ सौ ਚੌਂਤੀ
Input:  १२३४५           -> Output: ਬਾਰਾਂ हज़ार ਤਿੰਨ सौ ਪੈਂਤਾਲੀ
Input:  १२३४५६          -> Output: ਇੱਕ लाख ਤੇਈ हज़ार ਚਾਰ सौ ਛਪੰਜਾ
Input:  १२३४५६७         -> Output: ਬਾਰਾਂ लाख ਚੌਂਤੀ हज़ार ਪੰਜ सौ ਸਤੱਠ
Input:  १२३४५६७८        -> Output: ਇੱਕ करोड़ ਤੇਈ लाख ਪੈਂਤਾਲੀ हज़ार ਛੇ सौ ਅਠੱਤਰ
Input:  -१२३            -> Output:  ਮਾਈਨਸ ਇੱਕ सौ ਤੇਈ
Input:  -120            -> Output:  ਮਾਈਨਸ ਇੱਕ सौ ਵੀਹ
Input:  १०००            -> Output: ਇੱਕ हज़ार
Input:  १०००००          -> Output: ਇੱਕ लाख
Input:  १००००००००       -> Output: ਦਸ करोड़
Input:  456             -> Output: ਚਾਰ सौ ਛਪੰਜਾ
Input:  9943206870      -> Output: ਨੌਂ अरब ਚੁਰਾਨਵੇਂ करोड़ ਬੱਤੀ लाख ਛੇ हज़ार ਅੱਠ सौ ਸੱਤਰ
Input:  1,234,566       -> Output: ਇੱਕ ਕਾਮਾ ਦੋ सौ ਚੌਂਤੀ ਕਾਮਾ ਪੰਜ सौ ਛਿਆਠ


## 1.2. Time Test (English Digits)


In [4]:
# Test English digits for time - should work now!
time_tests_english = [
    "12:30",
    "1:40",
    "12:00",
    "12:14",
    "12:30:45",
    "9:15",
    "09:15",
    "23:59",
    "12:49",
]

print("=" * 60)
print("TIME TEST (ENGLISH DIGITS)")
print("=" * 60)
for test in time_tests_english:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


TIME TEST (ENGLISH DIGITS)
Input:  12:30           -> Output: ਬਾਰਾਂ बजकर ਤੀਹ मिनट
Input:  1:40            -> Output: ਇੱਕ बजकर ਚਾਲੀ मिनट
Input:  12:00           -> Output: ਬਾਰਾਂ बजे
Input:  12:14           -> Output: ਬਾਰਾਂ बजकर ਚੌਦਾਂ मिनट
Input:  12:30:45        -> Output: ਬਾਰਾਂ बजकर ਤੀਹ मिनट ਪੈਂਤਾਲੀ सेकंड
Input:  9:15            -> Output: ਨੌਂ बजकर ਪੰਦਰਾਂ मिनट
Input:  09:15           -> Output: ਨੌਂ बजकर ਪੰਦਰਾਂ मिनट
Input:  23:59           -> Output: ਤੇਈ बजकर ਉਨੱਠ मिनट
Input:  12:49           -> Output: ਬਾਰਾਂ बजकर ਉਨੰਜਾ मिनट


## 1.3. Money Test (English Digits)


In [5]:
# Test English digits for money - should work now!
money_tests_english = [
    "₹100",
    "₹1234",
    "₹50.50",
    "₹0.50",
    "₹1000000",
    "₹1050000",
    "₹500",
]

print("=" * 60)
print("MONEY TEST (ENGLISH DIGITS)")
print("=" * 60)
for test in money_tests_english:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")




MONEY TEST (ENGLISH DIGITS)
Input:  ₹100            -> Output: ਇੱਕ सौ ਰੁਪਏ
Input:  ₹1234           -> Output: ਇੱਕ हज़ार ਦੋ सौ ਚੌਂਤੀ ਰੁਪਏ
Input:  ₹50.50          -> Output: ₹50.50
Input:  ₹0.50           -> Output: ₹0.50
Input:  ₹1000000        -> Output: ਦਸ लाख ਰੁਪਏ
Input:  ₹1050000        -> Output: ਦਸ लाख ਪੰਜਾਹ हज़ार ਰੁਪਏ
Input:  ₹500            -> Output: ਪੰਜ सौ ਰੁਪਏ


## 2. Decimal Numbers Test


In [6]:
# Test both Devanagari and English digits for decimals
decimal_tests = [
    "१२.३४",      # Devanagari digits
    "१२३.४५६",    # Devanagari digits
    "०.५",         # Devanagari digits
    "-१२.३४",     # Devanagari digits
    "१२.३४५६",    # Devanagari digits
    "12.34",        # English digits
    "123.456",      # English digits
    "0.5",          # English digits
    "-12.34",       # English digits
    "96.3456",      # English digits
]

print("=" * 60)
print("DECIMAL NUMBERS TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in decimal_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


DECIMAL NUMBERS TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  १२.३४           -> Output: ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ
Input:  १२३.४५६         -> Output: ਇੱਕ सौ ਤੇਈ दशमलव ਚਾਰ ਪੰਜ ਛੇ
Input:  ०.५             -> Output: ਸਿਫ਼ਰ दशमलव ਪੰਜ
Input:  -१२.३४          -> Output:  ऋणात्मक ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ
Input:  १२.३४५६         -> Output: ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ ਪੰਜ ਛੇ
Input:  12.34           -> Output: ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ
Input:  123.456         -> Output: ਇੱਕ सौ ਤੇਈ दशमलव ਚਾਰ ਪੰਜ ਛੇ
Input:  0.5             -> Output: ਸਿਫ਼ਰ दशमलव ਪੰਜ
Input:  -12.34          -> Output:  ऋणात्मक ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ
Input:  96.3456         -> Output: ਛਿਆਨਵੇਂ दशमलव ਤਿੰਨ ਚਾਰ ਪੰਜ ਛੇ


## 3. Fractions Test


In [7]:
# Test both Devanagari and English digits for fractions
fraction_tests = [
    "३/४",         # Devanagari digits
    "१/२",         # Devanagari digits
    "१/४",         # Devanagari digits
    "१२३/४",      # Devanagari digits
    "-१/२",        # Devanagari digits
    "3/4",          # English digits
    "1/2",          # English digits
    "1/4",          # English digits
    "23/4",       # English digits
    "-1/2",         # English digits
]

print("=" * 60)
print("FRACTIONS TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in fraction_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


FRACTIONS TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  ३/४             -> Output: ਤਿੰਨ बटा ਚਾਰ
Input:  १/२             -> Output: ਇੱਕ बटा ਦੋ
Input:  १/४             -> Output: ਇੱਕ बटा ਚਾਰ
Input:  १२३/४           -> Output: ਇੱਕ सौ ਤੇਈ बटा ਚਾਰ
Input:  -१/२            -> Output:  ऋणात्मक ਇੱਕ बटा ਦੋ
Input:  3/4             -> Output: ਤਿੰਨ बटा ਚਾਰ
Input:  1/2             -> Output: ਇੱਕ बटा ਦੋ
Input:  1/4             -> Output: ਇੱਕ बटा ਚਾਰ
Input:  23/4            -> Output: ਤੇਈ बटा ਚਾਰ
Input:  -1/2            -> Output:  ऋणात्मक ਇੱਕ बटा ਦੋ


## 4. Dates Test


In [8]:
# Test both Devanagari and English digits for dates
date_tests = [
    "०१-०४-२०२४",      # Devanagari digits
    "१५-०६-२०२४",      # Devanagari digits
    "२०२४-०१-१५",      # Devanagari digits
    "१५/०६/२०२४",      # Devanagari digits
    "०४-०१-२०२४",      # MM-DD format, Devanagari digits
    "01-04-2024",        # English digits
    "15-06-2024",        # English digits
    "2024-01-15",        # English digits
    "15/06/2024",        # English digits
    "04-01-2024",        # MM-DD format, English digits
]

print("=" * 60)
print("DATES TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in date_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


DATES TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  ०१-०४-२०२४      -> Output: ਇੱਕ ਅਪ੍ਰੈਲ ਦੋ हज़ार ਚੌਬੀ
Input:  १५-०६-२०२४      -> Output: ਪੰਦਰਾਂ ਜੂਨ ਦੋ हज़ार ਚੌਬੀ
Input:  २०२४-०१-१५      -> Output: ਦੋ हज़ार ਚੌਬੀ ਮਾਈਨਸ ਸਿਫ਼ਰ ਇੱਕ ਮਾਈਨਸ ਪੰਦਰਾਂ
Input:  १५/०६/२०२४      -> Output: ਪੰਦਰਾਂ ਜੂਨ ਦੋ हज़ार ਚੌਬੀ
Input:  ०४-०१-२०२४      -> Output: ਚਾਰ ਜਨਵਰੀ ਦੋ हज़ार ਚੌਬੀ
Input:  01-04-2024      -> Output: ਇੱਕ ਅਪ੍ਰੈਲ ਦੋ हज़ार ਚੌਬੀ
Input:  15-06-2024      -> Output: ਪੰਦਰਾਂ ਜੂਨ ਦੋ हज़ार ਚੌਬੀ
Input:  2024-01-15      -> Output: ਦੋ हज़ार ਚੌਬੀ ਮਾਈਨਸ ਸਿਫ਼ਰ ਇੱਕ ਮਾਈਨਸ ਪੰਦਰਾਂ
Input:  15/06/2024      -> Output: ਪੰਦਰਾਂ ਜੂਨ ਦੋ हज़ार ਚੌਬੀ
Input:  04-01-2024      -> Output: ਚਾਰ ਜਨਵਰੀ ਦੋ हज़ार ਚੌਬੀ


## 5. Time Test


In [9]:
# Test both Devanagari and English digits for time
time_tests = [
    "१२:३०",         # Devanagari digits
    "१:४०",          # Devanagari digits
    "१२:००",         # Devanagari digits
    "१२:३०:४५",      # Devanagari digits
    "०९:१५",         # Devanagari digits
    "२३:५९",         # Devanagari digits
    "12:30",          # English digits
    "1:40",           # English digits
    "12:00",          # English digits
    "12:30:45",       # English digits
    "09:15",          # English digits
    "23:59",          # English digits
    "9:15",           # English digits (single digit hour)
]

print("=" * 60)
print("TIME TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in time_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


TIME TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  १२:३०           -> Output: साढ़े ਬਾਰਾਂ
Input:  १:४०            -> Output: ਇੱਕ बजकर ਚਾਲੀ मिनट
Input:  १२:००           -> Output: ਬਾਰਾਂ बजे
Input:  १२:३०:४५        -> Output: ਬਾਰਾਂ बजकर ਤੀਹ मिनट ਪੈਂਤਾਲੀ सेकंड
Input:  ०९:१५           -> Output: ਨੌਂ बजकर ਪੰਦਰਾਂ मिनट
Input:  २३:५९           -> Output: ਤੇਈ बजकर ਉਨੱਠ मिनट
Input:  12:30           -> Output: ਬਾਰਾਂ बजकर ਤੀਹ मिनट
Input:  1:40            -> Output: ਇੱਕ बजकर ਚਾਲੀ मिनट
Input:  12:00           -> Output: ਬਾਰਾਂ बजे
Input:  12:30:45        -> Output: ਬਾਰਾਂ बजकर ਤੀਹ मिनट ਪੈਂਤਾਲੀ सेकंड
Input:  09:15           -> Output: ਨੌਂ बजकर ਪੰਦਰਾਂ मिनट
Input:  23:59           -> Output: ਤੇਈ बजकर ਉਨੱਠ मिनट
Input:  9:15            -> Output: ਨੌਂ बजकर ਪੰਦਰਾਂ मिनट


## 6. Money Test


In [10]:
# Test both Devanagari and English digits for money
money_tests = [
    "₹१००",         # Devanagari digits
    "₹१२३४",        # Devanagari digits
    "₹५०.५०",       # Devanagari digits
    "₹०.५०",        # Devanagari digits
    "ਰੁ. १०००",      # Devanagari digits
    "₹100",          # English digits
    "₹1234",         # English digits
    "₹50.50",        # English digits
    "₹0.50",         # English digits
    "₹1000",         # English digits
    "₹500",          # English digits
]

print("=" * 60)
print("MONEY TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in money_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")




MONEY TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  ₹१००            -> Output: ਇੱਕ सौ ਰੁਪਏ
Input:  ₹१२३४           -> Output: ਇੱਕ हज़ार ਦੋ सौ ਚੌਂਤੀ ਰੁਪਏ
Input:  ₹५०.५०          -> Output: ₹५०.५०
Input:  ₹०.५०           -> Output: ₹०.५०
Input:  ਰੁ. १०००        -> Output: ਰੁ . ਇੱਕ हज़ार
Input:  ₹100            -> Output: ਇੱਕ सौ ਰੁਪਏ
Input:  ₹1234           -> Output: ਇੱਕ हज़ार ਦੋ सौ ਚੌਂਤੀ ਰੁਪਏ
Input:  ₹50.50          -> Output: ₹50.50
Input:  ₹0.50           -> Output: ₹0.50
Input:  ₹1000           -> Output: ਇੱਕ हज़ार ਰੁਪਏ
Input:  ₹500            -> Output: ਪੰਜ सौ ਰੁਪਏ


## 7. Measurements Test


In [11]:
# Test both Devanagari and English digits for measurements
measure_tests = [
    "१२ kg",         # Devanagari digits
    "१२५ kg",        # Devanagari digits
    "१०० m",         # Devanagari digits
    "५ km",          # Devanagari digits
    "१२.३४ cm",      # Devanagari digits
    "12 kg",          # English digits
    "125 kg",         # English digits
    "100 m",          # English digits
    "5 km",           # English digits
    "12.34 cm",       # English digits
]

print("=" * 60)
print("MEASUREMENTS TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in measure_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


MEASUREMENTS TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  १२ kg           -> Output: ਬਾਰਾਂ ਕਿਲੋਗ੍ਰਾਮ
Input:  १२५ kg          -> Output: ਇੱਕ सौ ਪੱਚੀ ਕਿਲੋਗ੍ਰਾਮ
Input:  १०० m           -> Output: ਇੱਕ सौ ਮੀਟਰ
Input:  ५ km            -> Output: ਪੰਜ ਕਿਲੋਮੀਟਰ
Input:  १२.३४ cm        -> Output: ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ ਸੈਂਟੀਮੀਟਰ
Input:  12 kg           -> Output: ਬਾਰਾਂ ਕਿਲੋਗ੍ਰਾਮ
Input:  125 kg          -> Output: ਇੱਕ सौ ਪੱਚੀ ਕਿਲੋਗ੍ਰਾਮ
Input:  100 m           -> Output: ਇੱਕ सौ ਮੀਟਰ
Input:  5 km            -> Output: ਪੰਜ ਕਿਲੋਮੀਟਰ
Input:  12.34 cm        -> Output: ਬਾਰਾਂ दशमलव ਤਿੰਨ ਚਾਰ ਸੈਂਟੀਮੀਟਰ


## 8. Ordinal Numbers Test


In [12]:
# Test both Devanagari and English digits for ordinals
ordinal_tests = [
    "१ਵਾਂ",           # Devanagari digits
    "२ਵਾਂ",           # Devanagari digits
    "१०ਵਾਂ",          # Devanagari digits
    "२१ਵਾਂ",          # Devanagari digits
    "१००ਵਾਂ",         # Devanagari digits
    "1ਵਾਂ",            # English digits with Gurmukhi suffix
    "2ਵਾਂ",            # English digits with Gurmukhi suffix
    "10ਵਾਂ",           # English digits with Gurmukhi suffix
    "21ਵਾਂ",           # English digits with Gurmukhi suffix
    "100ਵਾਂ",          # English digits with Gurmukhi suffix
]

print("=" * 60)
print("ORDINAL NUMBERS TEST (DEVANAGARI & ENGLISH DIGITS)")
print("=" * 60)
for test in ordinal_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


ORDINAL NUMBERS TEST (DEVANAGARI & ENGLISH DIGITS)
Input:  १ਵਾਂ            -> Output: ਪਹਿਲਾ
Input:  २ਵਾਂ            -> Output: ਦੂਜਾ
Input:  १०ਵਾਂ           -> Output: ਦਸਵਾਂ
Input:  २१ਵਾਂ           -> Output: ਇੱਕੀਵਾਂ
Input:  १००ਵਾਂ          -> Output: ਇੱਕ सौਵਾਂ
Input:  1ਵਾਂ            -> Output: ਪਹਿਲਾ
Input:  2ਵਾਂ            -> Output: ਦੂਜਾ
Input:  10ਵਾਂ           -> Output: ਦਸਵਾਂ
Input:  21ਵਾਂ           -> Output: ਇੱਕੀਵਾਂ
Input:  100ਵਾਂ          -> Output: ਇੱਕ सौਵਾਂ


## 9. Telephone Numbers Test


In [13]:
telephone_tests = [
    "ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ +९१५७११४००७",
    "+९१ ९२१०५१५६०६",
    "ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ १३७४३०९९८८",
    "9943206292",
    "9943206292",
    "1,234,567"
]

print("=" * 60)
print("TELEPHONE NUMBERS TEST")
print("=" * 60)
for test in telephone_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:20} -> Output: {result}")


TELEPHONE NUMBERS TEST
Input:  ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ +९१५७११४००७ -> Output: ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ ਪਲੱਸ ਨੌਂ अरब ਪੰਦਰਾਂ करोड़ ਇਕੱਤਰ लाख ਚੌਦਾਂ हज़ार ਸੱਤ
Input:  +९१ ९२१०५१५६०६       -> Output: प्लस ਨੌਂ ਇੱਕ ਨੌਂ ਦੋ ਇੱਕ ਸਿਫ਼ਰ ਪੰਜ ਇੱਕ ਪੰਜ ਛੇ ਸਿਫ਼ਰ ਛੇ
Input:  ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ १३७४३०९९८८ -> Output: ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ शून्य ਇੱਕ ਤਿੰਨ ਸੱਤ ਚਾਰ ਤਿੰਨ ਸਿਫ਼ਰ ਨੌਂ ਨੌਂ ਅੱਠ ਅੱਠ
Input:  9943206292           -> Output: ਨੌਂ अरब ਚੁਰਾਨਵੇਂ करोड़ ਬੱਤੀ लाख ਛੇ हज़ार ਦੋ सौ ਬਾਨਵੇਂ
Input:  9943206292           -> Output: ਨੌਂ अरब ਚੁਰਾਨਵੇਂ करोड़ ਬੱਤੀ लाख ਛੇ हज़ार ਦੋ सौ ਬਾਨਵੇਂ
Input:  1,234,567            -> Output: ਇੱਕ ਕਾਮਾ ਦੋ सौ ਚੌਂਤੀ ਕਾਮਾ ਪੰਜ सौ ਸਤੱਠ


## 10. Whitelist/Abbreviations Test


In [14]:
whitelist_tests = [
    "ਡਾ.",
    "ਪ੍ਰੋ.",
    "ਸ਼੍ਰੀ",
    "ਕਿ.ਮੀ.",
    "ਮੀ.",
]

print("=" * 60)
print("WHITELIST/ABBREVIATIONS TEST")
print("=" * 60)
for test in whitelist_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test:15} -> Output: {result}")


WHITELIST/ABBREVIATIONS TEST
Input:  ਡਾ.             -> Output: ਡਾਕਟਰ
Input:  ਪ੍ਰੋ.           -> Output: ਪ੍ਰੋਫੈਸਰ
Input:  ਸ਼੍ਰੀ           -> Output: ਸ਼੍ਰੀ
Input:  ਕਿ.ਮੀ.          -> Output: ਕਿਲੋਮੀਟਰ
Input:  ਮੀ.             -> Output: ਮੀਟਰ


## 11. Mixed Content Test


In [None]:
mixed_tests = [
    "ਅੱਜ १५-०६-२०२४ ਨੂੰ १२:३० ਵਜੇ ਮੀਟਿੰਗ ਹੈ.",
    "₹१००० ਅਤੇ ₹५०० ਜੋੜਨ ਨਾਲ ₹१५०० ਹੁੰਦਾ ਹੈ.",
    "१२३ ਕਿਲੋਗ੍ਰਾਮ ਭਾਰ ਅਤੇ ५० ਕਿਲੋਮੀਟਰ ਦੂਰੀ.",
    "ਪਹਿਲੀ ਜਗ੍ਹਾ ਅਤੇ ਦੂਜੀ ਜਗ੍ਹਾ.",
    "ਮੇਰਾ ਮੋਬਾਈਲ ਨੰਬਰ 9876543210 ਹੈ."
]

print("=" * 60)
print("MIXED CONTENT TEST")
print("=" * 60)
for test in mixed_tests:
    result = normalizer_pu.normalize(test)
    print(f"Input:  {test}")
    print(f"Output: {result}")
    print("-" * 60)


## 12. Batch Testing


In [None]:
# Test multiple inputs at once
batch_tests = [
    "123",
    "१२.३४",
    "१२:३०",
    "₹१००",
    "१५-०६-२०२४",
]

print("=" * 60)
print("BATCH TESTING")
print("=" * 60)
results = normalizer_pu.normalize_list(batch_tests)
for input_text, output_text in zip(batch_tests, results):
    print(f"Input:  {input_text:15} -> Output: {output_text}")


## Summary

All test cases have been executed. Check the outputs above to verify that Punjabi text normalization is working correctly for all categories.

### Usage Tips:
- Run each cell sequentially (Shift+Enter)
- Modify test cases in any cell to test your own inputs
- Use `verbose=True` in normalize() to see detailed processing information
- Set `cache_dir` to a directory path to speed up subsequent runs
