# CIS Demo

## Dependencies and Imports

In [None]:
#@title Install dependencies

!pip install -q silero 

import torch
from IPython.display import Audio, display

## Load model

Available models:
- v5_cis_base
- v5_cis_base_nostress
- v5_cis_ext

**Important notes:**
- `v5_cis_base` and `v5_cis_ext` models assume that proper stress should be added for each word for all languages, i.e. к+ошка;
- `v5_cis_base_nostress` models assume that proper stress should be added for each word ONLY for slavic languages (i.e. ru, bel, ukr);
- It is recommended to select a speaker that matches the target language. For example, to generate text in Kazakh, select `kaz_zhadyra`. To generate Russian text with the same voice, select `ru_zhadyra`.

In [None]:
from silero import silero_tts

model_id = 'v5_cis_base_nostress'

device = torch.device('cpu')

model, example_text = silero_tts(language='ru',
                                 speaker=model_id)
model.to(device)  # gpu or cpu

In [None]:
val_texts = {
    'aze': 'Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.',
    'bak': 'Күп балалыларға былайҙа сертификат бирелә бит.',
    'bel': 'В+ечарам +я любл+ю чыт+аць цік+авыя кн+ігі пры святл+е начнік+а.',
    'chv': 'Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.',
    'erz': 'Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.',
    'hye': 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:',
    'kat': 'მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.', 
    'kaz': 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.',
    'kbd': 'Сэ уиӀуанэ уашъхъэри унагъуэхэри сэбэп хъущтыр сыту щӀэлъэӀу.',
    'kir': 'Мен мектепте окуп жүргөндө эң жакшы досум менен тааныштым.',
    'kjh': 'Мин аал чоньчарға пастабахсынар хайдиғырам хынаңның хоный.',
    'mdf': 'Монь тяштеть эзда кизонь карьхть сельметь кштинь аф лац.',
    'sah': 'Мин бүгүн оройунан саһарҕа оонньуу сылдьан сымнаҕыстык утуйбутум.',
    'tat': 'Мин ерак түгел урман эчендә чиста һавада йөргәне яратам.',
    'tgk': 'Ман дар бораи хонаи нави худ дар канори дарё хондем.',
    'udm': 'Мон ашалэ тӥлед нуналлы огы быдэсэ кошко учке.',
    'ukr': '+Я з р+аннього дит+инства д+уже любл+ю сл+ухати цік+аві к+азки.',
    'uzb': "Men bolaligimda ko'pincha do'stlarim bilan hovlida futbol o'ynardim.",
    'xal': 'Би эцкд сарин җилин дуулҗана хойр седклтә күрәм.'
}

### List speakers

In [None]:
sorted(model.speakers)

## Example

### Slavic(ru/bel/ukr)

To automatically place stress marks, you can use the `silero-stress` library. An example is given below

In [None]:
# v5_cis_base_nostress
sample_rate = 48000
speaker = 'ukr_igor'

example_text = '+Я з р+аннього дит+инства д+уже любл+ю сл+ухати цік+аві к+азки.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

In [None]:
# v5_cis_base_nostress
sample_rate = 48000
speaker = 'ru_zhadyra'

example_text = 'брод+ить с дожд+ём п+од +окнами тво+ими.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

### Not slavic

In [None]:
# uzbek cyrillic
sample_rate = 48000
speaker = 'uzb_saida'

example_text = 'Бунинг устида ишлаш керак. бир йил эмас. кўп йил ишлаш керак.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

In [None]:
# v5_cis_base_nostress
sample_rate = 48000
speaker = 'kaz_zhadyra'

example_text = 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

In [None]:
sample_rate = 48000
speaker = 'hye_zara'

example_text = 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

## SSML example

- Supported SSML tags can be found here https://github.com/snakers4/silero-models/wiki/SSML
- Text should start and end with the root tag <speak></speak>;
- Use the `ssml_text` parameter

In [None]:
sample_rate = 48000
speaker = 'ru_zhadyra'

ssml_text = '<speak>брод+ить с дожд+ём <break time="2000ms"/> п+од +окнами тво+ими.</speak>'
audio = model.apply_tts(ssml_text=ssml_text,
                        speaker=speaker,
                        sample_rate=sample_rate)

print('Русский')
display(Audio(audio, rate=sample_rate))

# Accentor Demo

In case, you need word stress, but you don't want to manually annotate texts, we provide supplementary accentuation modules as a part of `silero-stress` project.

- We provide full-fledged accentor and `ё`-ficator trained on large vocab with homograph disambiguation for Russian language.

- We provide accentor trained on large vocab for Ukrainian language.

- And we provide manually annotated dictionaries with minimalistic wrapper for another languages.

In [None]:
!pip install -q silero-stress

### Russian / Ukrainian

In [7]:
from silero_stress import load_accentor

In [None]:
accentor = load_accentor(lang='ru')  # lang could be "ru" / "ukr"
sample_sent = "В недрах тундры выдры в гетрах тырят в ведра ядра кедров."
print(accentor(sample_sent))

### Other Languages

Basically, there is no "accentor" for other languages, but we released stress dictionaries with some minimalistic wrapper.

In [9]:
sample_texts = {
    # if you need "aze" language, you need to specify which layout do you use - latin or cyrillic
    'aze_lat': 'Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.',
    'aze_cyr': 'Мән һәр сәһәр еркән галхыб тәзә һава ылә мәшг едырәм.',
    'bak': 'Күп балалыларға былайҙа сертификат бирелә бит.',
    'bel': 'Вечарам я люблю чытаць цікавыя кнігі пры святле начніка.',
    'chv': 'Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.',
    'erz': 'Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.',
    'hye': 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:',
    'kat': 'მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.',
    'kaz': 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.',
    'kbd': 'Сэ уиӀуанэ уашъхъэри унагъуэхэри сэбэп хъущтыр сыту щӀэлъэӀу.',
    'kir': 'Мен мектепте окуп жүргөндө эң жакшы досум менен тааныштым.',
    'kjh': 'Мин аал чоньчарға пастабахсынар хайдиғырам хынаңның хоный.',
    'mdf': 'Монь тяштеть эзда кизонь карьхть сельметь кштинь аф лац.',
    'sah': 'Мин бүгүн оройунан саһарҕа оонньуу сылдьан сымнаҕыстык утуйбутум.',
    'tat': 'Мин ерак түгел урман эчендә чиста һавада йөргәне яратам.',
    'tgk': 'Ман дар бораи хонаи нави худ дар канори дарё хондем.',
    'udm': 'Мон ашалэ тӥлед нуналлы огы быдэсэ кошко учке.',
    # if you need "uzb" language, you need to specify which layout do you use - latin or cyrillic
    'uzb_lat': "Men bolaligimda ko'pincha do'stlarim bilan hovlida futbol o'ynardim.",
    'uzb_cyr': "Мен болалигимда кўпинча дўстларим билан ҳовлида футбол ўйнардим.",
    'xal': 'Би эцкд сарин җилин дуулҗана хойр седклтә күрәм.'
}

In [10]:
from silero_stress.simple_accentor import SimpleAccentor

In [None]:
for lang in sample_texts:
    accentor = SimpleAccentor(lang=lang)
    print(sample_texts[lang])
    print(accentor(sample_texts[lang]))
    print()