In [1]:
import sentencepiece as spm

sp = spm.SentencePieceProcessor(model_file='hy_bpe.model')

test_sentences = [
    "Հայաստանն ունի հարուստ պատմություն։",
    "Արհեստական բանականությունը արագ զարգանում է։",
    "Ծրագրավորումը կարևոր հմտություն է ապագայի համար։"
]

for s in test_sentences:
    pieces = sp.encode_as_pieces(s)
    ids = sp.encode_as_ids(s)
    decoded = sp.decode_ids(ids)
    match = decoded == s
    
    print(f"Original: {s}")
    print(f"Pieces:   {pieces}")
    print(f"IDs:      {ids}")
    print(f"Decoded:  {decoded}")
    print(f"Match:    {match}")
    print("-" * 30)

Original: Հայաստանն ունի հարուստ պատմություն։
Pieces:   ['▁Հայաստան', 'ն', '▁ունի', '▁հարուստ', '▁պ', 'ատ', 'մ', 'ություն', '։']
IDs:      [35, 236, 60, 221, 95, 26, 242, 16, 246]
Decoded:  Հայաստանն ունի հարուստ պատմություն։
Match:    True
------------------------------
Original: Արհեստական բանականությունը արագ զարգանում է։
Pieces:   ['▁Ար', 'հ', 'եստ', 'ական', '▁բ', 'ան', 'ականությունը', '▁արագ', '▁զարգ', 'անում', '▁է', '։']
IDs:      [149, 247, 98, 24, 56, 4, 229, 161, 132, 158, 13, 246]
Decoded:  Արհեստական բանականությունը արագ զարգանում է։
Match:    True
------------------------------
Original: Ծրագրավորումը կարևոր հմտություն է ապագայի համար։
Pieces:   ['▁Ծ', 'րագ', 'րա', 'վ', 'որ', 'ումը', '▁կարեւոր', '▁հ', 'մ', 'տ', 'ություն', '▁է', '▁ապագայի', '▁համար', '։']
IDs:      [188, 202, 73, 252, 22, 208, 40, 9, 242, 244, 16, 13, 220, 165, 246]
Decoded:  Ծրագրավորումը կարեւոր հմտություն է ապագայի համար։
Match:    False
------------------------------
