<a href="https://colab.research.google.com/github/nikas25/ANYCUBIC_Kossel_Source_Code/blob/master/examples_tts_cis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CIS Demo

## Dependencies and Imports

In [1]:
#@title Install dependencies

!pip install -q silero

import torch
from IPython.display import Audio, display

## Load model

Available models:
- v5_cis_base
- v5_cis_base_nostress
- v5_cis_ext

**Important notes:**
- `v5_cis_base` and `v5_cis_ext` models assume that proper stress should be added for each word for all languages, i.e. к+ошка;
- `v5_cis_base_nostress` models assume that proper stress should be added for each word ONLY for slavic languages (i.e. ru, bel, ukr);
- It is recommended to select a speaker that matches the target language. For example, to generate text in Kazakh, select `kaz_zhadyra`. To generate Russian text with the same voice, select `ru_zhadyra`.

In [2]:
from silero import silero_tts

model_id = 'v5_cis_base_nostress'

device = torch.device('cpu')

model, example_text = silero_tts(language='ru',
                                 speaker=model_id)
model.to(device)  # gpu or cpu

100%|██████████| 87.5M/87.5M [00:04<00:00, 19.7MB/s]
  text = re.sub(r'[^{}]'.format(self.symbols[3:] + '\^'), '', text)
  dtype = storage_type.dtype


In [3]:
val_texts = {
    'aze': 'Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.',
    'bak': 'Күп балалыларға былайҙа сертификат бирелә бит.',
    'bel': 'В+ечарам +я любл+ю чыт+аць цік+авыя кн+ігі пры святл+е начнік+а.',
    'chv': 'Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.',
    'erz': 'Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.',
    'hye': 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:',
    'kat': 'მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.',
    'kaz': 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.',
    'kbd': 'Сэ уиӀуанэ уашъхъэри унагъуэхэри сэбэп хъущтыр сыту щӀэлъэӀу.',
    'kir': 'Мен мектепте окуп жүргөндө эң жакшы досум менен тааныштым.',
    'kjh': 'Мин аал чоньчарға пастабахсынар хайдиғырам хынаңның хоный.',
    'mdf': 'Монь тяштеть эзда кизонь карьхть сельметь кштинь аф лац.',
    'sah': 'Мин бүгүн оройунан саһарҕа оонньуу сылдьан сымнаҕыстык утуйбутум.',
    'tat': 'Мин ерак түгел урман эчендә чиста һавада йөргәне яратам.',
    'tgk': 'Ман дар бораи хонаи нави худ дар канори дарё хондем.',
    'udm': 'Мон ашалэ тӥлед нуналлы огы быдэсэ кошко учке.',
    'ukr': '+Я з р+аннього дит+инства д+уже любл+ю сл+ухати цік+аві к+азки.',
    'uzb': "Men bolaligimda ko'pincha do'stlarim bilan hovlida futbol o'ynardim.",
    'xal': 'Би эцкд сарин җилин дуулҗана хойр седклтә күрәм.'
}

### List speakers

In [4]:
sorted(model.speakers)

['aze_gamat',
 'bak_aigul',
 'bak_alfia',
 'bak_alfia2',
 'bak_miyau',
 'bak_ramilia',
 'bel_anatoliy',
 'bel_dmitriy',
 'bel_larisa',
 'chv_ekaterina',
 'erz_alexandr',
 'hye_zara',
 'kat_vika',
 'kaz_zhadyra',
 'kaz_zhazira',
 'kbd_eduard',
 'kir_nurgul',
 'kjh_karina',
 'kjh_sibday',
 'mdf_oksana',
 'ru_aigul',
 'ru_albina',
 'ru_alexandr',
 'ru_alfia',
 'ru_alfia2',
 'ru_bogdan',
 'ru_dmitriy',
 'ru_eduard',
 'ru_ekaterina',
 'ru_gamat',
 'ru_igor',
 'ru_karina',
 'ru_kejilgan',
 'ru_kermen',
 'ru_marat',
 'ru_miyau',
 'ru_nurgul',
 'ru_oksana',
 'ru_onaoy',
 'ru_ramilia',
 'ru_roman',
 'ru_safarhuja',
 'ru_saida',
 'ru_sibday',
 'ru_vika',
 'ru_zara',
 'ru_zhadyra',
 'ru_zhazira',
 'ru_zinaida',
 'sah_zinaida',
 'tat_albina',
 'tat_marat',
 'tgk_onaoy',
 'tgk_safarhuja',
 'udm_bogdan',
 'ukr_igor',
 'ukr_roman',
 'uzb_saida',
 'xal_kejilgan',
 'xal_kermen']

## Example

### Slavic(ru/bel/ukr)

To automatically place stress marks, you can use the `silero-stress` library. An example is given below

In [5]:
# v5_cis_base_nostress
sample_rate = 48000
speaker = 'ukr_igor'

example_text = '+Я з р+аннього дит+инства д+уже любл+ю сл+ухати цік+аві к+азки.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

+Я з р+аннього дит+инства д+уже любл+ю сл+ухати цік+аві к+азки.


In [6]:
# v5_cis_base_nostress
sample_rate = 48000
speaker = 'ru_zhadyra'

example_text = 'брод+ить с дожд+ём п+од +окнами тво+ими.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

брод+ить с дожд+ём п+од +окнами тво+ими.


### Not slavic

In [7]:
# v5_cis_base_nostress
sample_rate = 48000
speaker = 'kaz_zhadyra'

example_text = 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.


In [8]:
sample_rate = 48000
speaker = 'hye_zara'

example_text = 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:'

audio = model.apply_tts(text=example_text,
                        speaker=speaker,
                        sample_rate=sample_rate)
print(example_text)
display(Audio(audio, rate=sample_rate))

Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:


# Accentor Demo

In case, you need word stress, but you don't want to manually annotate texts, we provide supplementary accentuation modules as a part of `silero-stress` project.

- We provide full-fledged accentor and `ё`-ficator trained on large vocab with homograph disambiguation for Russian language.

- We provide accentor trained on large vocab for Ukrainian language.

- And we provide manually annotated dictionaries with minimalistic wrapper for another languages.

In [9]:
!pip install -q silero-stress

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m36.1/36.1 MB[0m [31m52.0 MB/s[0m eta [36m0:00:00[0m
[?25h

### Russian / Ukrainian

In [10]:
from silero_stress import load_accentor

In [11]:
accentor = load_accentor(lang='ru')  # lang could be "ru" / "ukr"
sample_sent = "В недрах тундры выдры в гетрах тырят в ведра ядра кедров."
print(accentor(sample_sent))

В н+едрах т+ундры в+ыдры в г+етрах т+ырят в в+ёдра ядр+а к+едров.


### Other Languages

Basically, there is no "accentor" for other languages, but we released stress dictionaries with some minimalistic wrapper.

In [12]:
sample_texts = {
    # if you need "aze" language, you need to specify which layout do you use - latin or cyrillic
    'aze_lat': 'Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.',
    'aze_cyr': 'Мән һәр сәһәр еркән галхыб тәзә һава ылә мәшг едырәм.',
    'bak': 'Күп балалыларға былайҙа сертификат бирелә бит.',
    'bel': 'Вечарам я люблю чытаць цікавыя кнігі пры святле начніка.',
    'chv': 'Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.',
    'erz': 'Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.',
    'hye': 'Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:',
    'kat': 'მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.',
    'kaz': 'Мен балалық шақта жаңа досдармен танысуды әбден ұнататынмын.',
    'kbd': 'Сэ уиӀуанэ уашъхъэри унагъуэхэри сэбэп хъущтыр сыту щӀэлъэӀу.',
    'kir': 'Мен мектепте окуп жүргөндө эң жакшы досум менен тааныштым.',
    'kjh': 'Мин аал чоньчарға пастабахсынар хайдиғырам хынаңның хоный.',
    'mdf': 'Монь тяштеть эзда кизонь карьхть сельметь кштинь аф лац.',
    'sah': 'Мин бүгүн оройунан саһарҕа оонньуу сылдьан сымнаҕыстык утуйбутум.',
    'tat': 'Мин ерак түгел урман эчендә чиста һавада йөргәне яратам.',
    'tgk': 'Ман дар бораи хонаи нави худ дар канори дарё хондем.',
    'udm': 'Мон ашалэ тӥлед нуналлы огы быдэсэ кошко учке.',
    # if you need "uzb" language, you need to specify which layout do you use - latin or cyrillic
    'uzb_lat': "Men bolaligimda ko'pincha do'stlarim bilan hovlida futbol o'ynardim.",
    'uzb_cyr': "Мен болалигимда кўпинча дўстларим билан ҳовлида футбол ўйнардим.",
    'xal': 'Би эцкд сарин җилин дуулҗана хойр седклтә күрәм.'
}

In [13]:
from silero_stress.simple_accentor import SimpleAccentor

In [14]:
for lang in sample_texts:
    accentor = SimpleAccentor(lang=lang)
    print(sample_texts[lang])
    print(accentor(sample_texts[lang]))
    print()

Mən hər səhər erkən qalxıb təzə hava ilə məşq edirəm.
M+ən h+ər səh+ər erk+ən qalx+ıb təz+ə hav+a il+ə m+əşq ed+irəm.

Мән һәр сәһәр еркән галхыб тәзә һава ылә мәшг едырәм.
М+ән һ+әр сәһ+әр ерк+ән галх+ыб тәз+ә һав+а ыл+ә м+әшг едыр+әм.

Күп балалыларға былайҙа сертификат бирелә бит.
К+үп балалыларғ+а былайҙ+а сертифик+ат бирел+ә б+ит.

Вечарам я люблю чытаць цікавыя кнігі пры святле начніка.
Вечарам +я любл+ю чыт+аць цік+авыя кн+ігі пр+ы святле начніка.

Эпĕ ача чухнех пиччĕшсемпе юнашар кĕтӳльех вăйă вылянă.
+Эпĕ ач+а чухн+ех пиччĕшсемп+е юнаш+ар кĕтӳль+ех вăйă выл+янă.

Монь веленек шачемсёномань панжовксонть кис эрьва кизонь туема.
М+онь в+еленек ш+ачемсёномань п+анжовксонть к+ис +эрьва к+изонь т+уема.

Ես շաբաթ օրերին սիրում եմ երկար զբոսնել անտառով:
+Ես շաբ+աթ օրեր+ին սիրո+ւմ +եմ երկ+ար զբոսն+ել անտառ+ով:

მე ძალიან მიყვარს ჩემი ოჯახის წევრებთან ერთად დროის გატარება.
მ+ე ძ+ალიან მ+იყვარს ჩ+ემი +ოჯახის წ+ევრებთან +ერთად დრ+ოის გატარ+ება.

Мен балалық шақта жаңа досдармен танысуды 