In [1]:
# Imports
import torch
from TTS.api import TTS

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# Get Device
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Using device:", device)

Using device: cuda


In [3]:
# List of available models
print("Available models:")
for model in TTS().list_models():
    print(model)

Available models:
tts_models/multilingual/multi-dataset/xtts_v2
tts_models/multilingual/multi-dataset/xtts_v1.1
tts_models/multilingual/multi-dataset/your_tts
tts_models/multilingual/multi-dataset/bark
tts_models/bg/cv/vits
tts_models/cs/cv/vits
tts_models/da/cv/vits
tts_models/et/cv/vits
tts_models/ga/cv/vits
tts_models/en/ek1/tacotron2
tts_models/en/ljspeech/tacotron2-DDC
tts_models/en/ljspeech/tacotron2-DDC_ph
tts_models/en/ljspeech/glow-tts
tts_models/en/ljspeech/speedy-speech
tts_models/en/ljspeech/tacotron2-DCA
tts_models/en/ljspeech/vits
tts_models/en/ljspeech/vits--neon
tts_models/en/ljspeech/fast_pitch
tts_models/en/ljspeech/overflow
tts_models/en/ljspeech/neural_hmm
tts_models/en/vctk/vits
tts_models/en/vctk/fast_pitch
tts_models/en/sam/tacotron-DDC
tts_models/en/blizzard2013/capacitron-t2-c50
tts_models/en/blizzard2013/capacitron-t2-c150_v2
tts_models/en/multi-dataset/tortoise-v2
tts_models/en/jenny/jenny
tts_models/es/mai/tacotron2-DDC
tts_models/es/css10/vits
tts_models/fr

In [4]:
# Init TTS
tts = TTS("tts_models/multilingual/multi-dataset/xtts_v2").to(device)
# tts = TTS("tts_models/multilingual/multi-dataset/bark").to(device)

In [5]:
# List speakers
for speaker in tts.speakers:
    print(speaker)

Claribel Dervla
Daisy Studious
Gracie Wise
Tammie Ema
Alison Dietlinde
Ana Florence
Annmarie Nele
Asya Anara
Brenda Stern
Gitta Nikolina
Henriette Usha
Sofia Hellen
Tammy Grit
Tanja Adelina
Vjollca Johnnie
Andrew Chipper
Badr Odhiambo
Dionisio Schuyler
Royston Min
Viktor Eka
Abrahan Mack
Adde Michal
Baldur Sanjin
Craig Gutsy
Damien Black
Gilberto Mathias
Ilkin Urbano
Kazuhiko Atallah
Ludvig Milivoj
Suad Qasim
Torcull Diarmuid
Viktor Menelaos
Zacharie Aimilios
Nova Hogarth
Maja Ruoho
Uta Obando
Lidiya Szekeres
Chandra MacFarland
Szofi Granger
Camilla Holmström
Lilya Stainthorpe
Zofija Kendrick
Narelle Moon
Barbora MacLean
Alexandra Hisakawa
Alma María
Rosemary Okafor
Ige Behringer
Filip Traverse
Damjan Chapman
Wulf Carlevaro
Aaron Dreschner
Kumar Dahl
Eugenio Mataracı
Ferran Simen
Xavier Hayasaka
Luis Moray
Marcos Rudaski


In [None]:
# Run TTS
# ❗ XTTS supports both, but many models allow only one of the `speaker` and
# `speaker_wav` arguments

# TTS with list of amplitude values as output, clone the voice from `speaker_wav`
wav = tts.tts(
  text="Hello world!",
  speaker_wav="out/audio.wav",
  language="en"
)

In [27]:
# TTS to a file, use a preset speaker
text = """हर साल की तरह इस बार भी गाँव में holi ki kahani की तैयारियाँ जोरों पर थीं।"""

tts.tts_to_file(
  text=text,
  speaker="Kumar Dahl",
  language="hi",
  file_path="out/output.wav",
)

'out/output.wav'

In [35]:
para = """
हर साल की तरह इस बार भी गाँव में holi ki kahani की तैयारियाँ जोरों पर थीं। चारों तरफ रंग-बिरंगे गुलाल की थालियाँ सजी थीं, और ढोल-नगाड़ों की थाप गूँज रही थी। लेकिन इस बार की holi ki kahani कुछ अलग थी। गाँव के बीचों-बीच बनी पुरानी हवेली, जो सालों से खामोश पड़ी थी, इस बार चर्चा का केंद्र बन गई थी। लोग कहते थे कि हवेली में कोई रहस्य छिपा है, और होली के दिन वो रहस्य सामने आने वाला था।

कहानी की शुरुआत होती है नन्हीं राधिका से, जो अपने दादाजी की बताई holi ki kahani सुनकर बड़ी हुई थी। दादाजी हमेशा कहते, “होली सिर्फ रंगों का त्योहार नहीं, बल्कि मन के भावों को उजागर करने का मौका है।” राधिका को यह बातें बचपन से आकर्षित करती थीं। इस बार उसने ठान लिया था कि वो हवेली के रहस्य को सुलझाएगी।
"""
for line in para.split("।"):
    if line.strip() == "":
        continue
    tts.tts_to_file(
        text=line,
        speaker="Kumar Dahl",
        language="hi",
        file_path="out/output_" + str(para.index(line)) + ".wav",
    )

In [39]:
# Stitching audio files
import os
import soundfile as sf
import numpy as np

files = [f for f in os.listdir("out") if f.endswith(".wav")]
audio = []

files.sort(key=lambda x: int(x.split("_")[1].split(".")[0]))

for file in files:
    wav, sr = sf.read("out/" + file)
    audio.append(wav)
audio = np.concatenate(audio)
sf.write("out/output.wav", audio, sr)

In [41]:
# Convert to mp3
import pydub
from pydub import AudioSegment

audio = AudioSegment.from_wav("out/output.wav")
audio.export("out/output.mp3", format="mp3")

<_io.BufferedRandom name='out/output.mp3'>

In [47]:
test = """हर साल की तरह इस बार भी गाँव में               holi ki kahani की तैयारियाँ जोरों पर थीं।"""
tts.tts_to_file(
    text=test,
    speaker="Kumar Dahl",
    language="hi",
    file_path="out/test.wav",
)

'out/test.wav'

In [19]:
from kokoro import KPipeline
from IPython.display import display, Audio
import soundfile as sf
import torch
pipeline = KPipeline(lang_code='hi', device='cuda')
# text = '''
# [Kokoro](/kˈOkəɹO/) is an open-weight TTS model with 82 million parameters. Despite its lightweight architecture, it delivers comparable quality to larger models while being significantly faster and more cost-efficient. With Apache-licensed weights, [Kokoro](/kˈOkəɹO/) can be deployed anywhere from production environments to personal projects.
# '''
text = """
हर साल की तरह इस बार भी गाँव में holi ki kahani की तैयारियाँ जोरों पर थीं। चारों तरफ रंग-बिरंगे गुलाल की थालियाँ सजी थीं, और ढोल-नगाड़ों की थाप गूँज रही थी। लेकिन इस बार की holi ki kahani कुछ अलग थी। गाँव के बीचों-बीच बनी पुरानी हवेली, जो सालों से खामोश पड़ी थी, इस बार चर्चा का केंद्र बन गई थी। लोग कहते थे कि हवेली में कोई रहस्य छिपा है, और होली के दिन वो रहस्य सामने आने वाला था। कहानी की शुरुआत होती है नन्हीं राधिका से, जो अपने दादाजी की बताई holi ki kahani सुनकर बड़ी हुई थी। दादाजी हमेशा कहते, “होली सिर्फ रंगों का त्योहार नहीं, बल्कि मन के भावों को उजागर करने का मौका है।” राधिका को यह बातें बचपन से आकर्षित करती थीं। इस बार उसने ठान लिया था कि वो हवेली के रहस्य को सुलझाएगी।
"""
generator = pipeline(text, voice='hm_psi', speed=1, split_pattern='।')
for i, (gs, ps, audio) in enumerate(generator):
    print(i, gs, ps)
    display(Audio(data=audio, rate=24000, autoplay=i==0))
    sf.write(f'out/{i}.wav', audio, 24000)

0 हर साल की तरह इस बार भी गाँव में holi ki kahani की तैयारियाँ जोरों पर थीं hˈʌɾ sˈaːl ki tˈʌɾəh ˈɪs bˈaːɾ bʰˈi ɡˈãnʋ mẽː hˈQli kˈI kahˈɑːni ki tɛːjˈaːɾɪjˌã ɟˈoːɾõ pˈʌɾ tʰĩ


1 चारों तरफ रंग-बिरंगे गुलाल की थालियाँ सजी थीं, और ढोल-नगाड़ों की थाप गूँज रही थी cˈaːɾõ tˈʌɾəpʰ ɾˈʌŋɡəbɪɾˈʌŋɡeː ɡʊlˈaːl ki tʰˈaːlɪjˌã sˈʌɟi tʰĩ, ɔːɾ ɖʰˈoːlənɡˈaːr.õ ki tʰˈaːp ɡˈũnɟ ɾˌəhi tʰi


2 लेकिन इस बार की holi ki kahani कुछ अलग थी lˈeːkɪn ˈɪs bˈaːɾ ki hˈQli kˈI kahˈɑːni kˈʊcʰ ˈʌləɡ tʰi


3 गाँव के बीचों-बीच बनी पुरानी हवेली, जो सालों से खामोश पड़ी थी, इस बार चर्चा का केंद्र बन गई थी ɡˈãnʋ keː bˈiːcõbˈiːc bˈʌni pʊɾˈaːni həʋˈeːli, ɟˈoː sˈaːlõ seː kʰaːmˈoːʃ pˈʌr.i tʰi, ˈɪs bˈaːɾ cˈʌɾcaː kaː kˈẽːdɾə bˈʌn ɡˈʌi tʰi


4 लोग कहते थे कि हवेली में कोई रहस्य छिपा है, और होली के दिन वो रहस्य सामने आने वाला था lˈoːɡ kˈʌhətˌeː tʰeː kˈɪ həʋˈeːli mẽː kˈoːi ɾəhˈʌsjə cʰˈɪpaː hɛː, ɔːɾ hˈoːli keː dˈɪn ʋoː ɾəhˈʌsjə sˈaːmnˌeː ˈaːneː ʋˈaːlaː tʰaː


5 कहानी की शुरुआत होती है नन्हीं राधिका से, जो अपने दादाजी की बताई holi ki kahani सुनकर बड़ी हुई थी kəhˈaːni ki ʃˌʊɾʊˈaːt hˈoːti hɛː nˈʌnhĩ ɾˈaːdʰɪkˌaː seː, ɟˈoː ˈʌpnˌeː daːdˈaːɟi ki bətˈaːi hˈQli kˈI kahˈɑːni sˈʊnəkˌəɾ bˈʌr.i hˈʊi tʰi


6 दादाजी हमेशा कहते, “होली सिर्फ रंगों का त्योहार नहीं, बल्कि मन के भावों को उजागर करने का मौका है daːdˈaːɟi həmˈeːʃaː kˈʌhətˌeː, “hˈoːli sˈɪɾpʰ ɾˈʌŋɡõ kaː tːjoːhˈaːɾ nˈʌhĩ, bˈʌlkɪ mˈʌn keː bʰˈaːʋõ koː ʊɟˈaːɡəɾ kˈʌɾnˌeː kaː mˈɔːkaː hɛː


7 ” राधिका को यह बातें बचपन से आकर्षित करती थीं ” ɾˈaːdʰɪkˌaː koː jˌəh bˈaːtẽː bˈʌcəpˌən seː aːkˈʌrʂɪt kˈʌɾtˌi tʰĩ


8 इस बार उसने ठान लिया था कि वो हवेली के रहस्य को सुलझाएगी ˈɪs bˈaːɾ ˈʊsnˌeː ʈʰˈaːn lˈɪjaː tʰaː kˈɪ ʋoː həʋˈeːli keː ɾəhˈʌsjə koː sˌʊlɟʰaːˈeːɡi
