ใช้โมเดล VIZINTZOR/F5-TTS-THAI (version 1)

In [1]:
!pip install f5-tts-th



In [19]:
# ================================
# Thai Text-to-Speech (F5-TTS-THAI)
# ================================

from f5_tts_th.tts import TTS
import soundfile as sf
from IPython.display import Audio, display

# ----------------
# 1. โหลดโมเดล (ครั้งเดียว)
# ----------------
print("Loading TTS model (v1)...")
tts = TTS(model="v1")   # v1 = เสียงไทยเป็นธรรมชาติ
print("Model loaded successfully!")

# ----------------------------------------
# 2. ตั้งค่าเสียงอ้างอิง (Voice Clone)
# ----------------------------------------
REFERENCE_AUDIO = "/content/voice4.webm"
REFERENCE_TEXT = "เชื่อว่าหลายๆคนต้องเคยเจอ"

# ------------------------------------------------
# 3. ฟังก์ชันสร้างเสียง (ปรับจูนได้)
# ------------------------------------------------
def generate_thai_voice(
    text_to_speak,
    output_filename,
    sample_rate=24000,
    step=32,
    cfg=2.0,
    speed=1.0
):
    print(f"\n🎙️ กำลังสร้างเสียง:\n{text_to_speak}\n")

    try:
        wav = tts.infer(
            ref_audio=REFERENCE_AUDIO,
            ref_text=REFERENCE_TEXT,
            gen_text=text_to_speak,
            step=step,
            cfg=cfg,
            speed=speed
        )

        sf.write(output_filename, wav, sample_rate)
        print(f"✅ สร้างไฟล์เสียงสำเร็จ: {output_filename}")

        display(Audio(output_filename))
        return True

    except Exception as e:
        print(f"❌ เกิดข้อผิดพลาด: {e}")
        return False


Loading TTS model (v1)...
Load TTS model :  /root/.cache/huggingface/hub/models--VIZINTZOR--F5-TTS-THAI/snapshots/af023c707f4208e5fc1fce59c1fd1501cfc3fc22/model_1000000.pt 

Load Vocoder : charactr/vocos-mel-24khz
Model loaded successfully!


Example 1

In [20]:
text_1 = (
    "อากาศสดชื่น ธรรมชาติอุดมสมบูรณ์ "
    "รุ่งรวยวัฒนธรรม ท่ามกลางโลกสมัยใหม่ที่พัฒนาอย่างรวดเร็ว"
)

generate_thai_voice(
    text_to_speak=text_1,
    output_filename="thai_voice1_v1.wav",
    step=32,
    cfg=2.0,
    speed=1.0
)


🎙️ กำลังสร้างเสียง:
อากาศสดชื่น ธรรมชาติอุดมสมบูรณ์ รุ่งรวยวัฒนธรรม ท่ามกลางโลกสมัยใหม่ที่พัฒนาอย่างรวดเร็ว

Converting audio...
Using custom reference text...

ref_text   เชื่อว่าหลายๆคนต้องเคยเจอ. 
gen_text 0 อากาศสดชื่น ธรรมชาติอุดมสมบูรณ์ รุ่งรวยวัฒนธรรม ท่ามกลางโลกสมัยใหม่ที่พัฒนาอย่างรวดเร็ว


Generating audio in 1 batches...


100%|██████████| 1/1 [00:01<00:00,  1.95s/it]

✅ สร้างไฟล์เสียงสำเร็จ: thai_voice1_v1.wav





True

Example 2

In [21]:
text_2 = (
    "จากหญิงงามที่ถูกบังคับแต่งให้คนใกล้ตาย "
    "สู่คู่ครองที่ร่วมใจกันเขียนประวัติศาสตร์หน้าใหม่ "
    "เมื่อรูปโฉมงดงามของ ‘กู้เจี้ยนหลี’ กลับคืนมา "
    "แต่ภัยจากราชบัลลังก์ที่กำลังจะลุกเป็นไฟกลับคืบคลานเข้ามาใกล้ "
    "ยามที่ทุกฝ่ายต่างชิงไหวชิงพริบเพื่อครองอำนาจสูงสุด "
    "จีอู๋จิ้ง... ท่านอาผู้โหดเหี้ยมกลับมีแผนการลับ "
    "เขาจะใช้ฝีมือและเล่ห์กลทั้งหมดเพื่อให้ภรรยาที่รักได้สมหวัง "
    "สองสามีภรรยาผนึกกำลังเป็นหนึ่งเดียว "
    "ร่วมกันวางหมากให้จักรพรรดิองค์น้อยครองบัลลังก์ "
    "แลกกับชีวิตเรียบง่ายไร้พันธนาการที่รอคอยพวกเขาอยู่"
)

generate_thai_voice(
    text_to_speak=text_2,
    output_filename="thai_voice2_v1.wav",
    step=32,
    cfg=2.2,     # นิยายยาว เพิ่มความเสถียรนิดนึง
    speed=0.95   # ช้าลงเล็กน้อย ฟังนุ่ม
)


🎙️ กำลังสร้างเสียง:
จากหญิงงามที่ถูกบังคับแต่งให้คนใกล้ตาย สู่คู่ครองที่ร่วมใจกันเขียนประวัติศาสตร์หน้าใหม่ เมื่อรูปโฉมงดงามของ ‘กู้เจี้ยนหลี’ กลับคืนมา แต่ภัยจากราชบัลลังก์ที่กำลังจะลุกเป็นไฟกลับคืบคลานเข้ามาใกล้ ยามที่ทุกฝ่ายต่างชิงไหวชิงพริบเพื่อครองอำนาจสูงสุด จีอู๋จิ้ง... ท่านอาผู้โหดเหี้ยมกลับมีแผนการลับ เขาจะใช้ฝีมือและเล่ห์กลทั้งหมดเพื่อให้ภรรยาที่รักได้สมหวัง สองสามีภรรยาผนึกกำลังเป็นหนึ่งเดียว ร่วมกันวางหมากให้จักรพรรดิองค์น้อยครองบัลลังก์ แลกกับชีวิตเรียบง่ายไร้พันธนาการที่รอคอยพวกเขาอยู่

Converting audio...
Using custom reference text...

ref_text   เชื่อว่าหลายๆคนต้องเคยเจอ. 
gen_text 0 จากหญิงงามที่ถูกบังคับแต่งให้คนใกล้ตาย สู่คู่ครองที่ร่วมใจกันเขียนประวัติศาสตร์หน้าใหม่ เมื่อรูปโฉม
gen_text 1 งดงามของ ‘กู้เจี้ยนหลี’ กลับคืนมา แต่ภัยจากราชบัลลังก์ที่กำลังจะลุกเป็นไฟกลับคืบคลานเข้ามาใกล้ ยาม
gen_text 2 ที่ทุกฝ่ายต่างชิงไหวชิงพริบเพื่อครองอำนาจสูงสุด จีอู๋จิ้ง ท่านอาผู้โหดเหี้ยมกลับมีแผนการลับ เขาจะใช้
gen_text 3 ฝีมือและเล่ห์กลทั้งหมดเพื่อให้ภรรยาที่รักได้สมหวัง สองสามี

100%|██████████| 5/5 [00:10<00:00,  2.15s/it]

✅ สร้างไฟล์เสียงสำเร็จ: thai_voice2_v1.wav





True

ใช้โมเดล VIZINTZOR/F5-TTS-THAI (version 2)

In [16]:
# ================================
# Thai Text-to-Speech (F5-TTS-THAI) - v2
# ================================

from f5_tts_th.tts import TTS
import soundfile as sf
from IPython.display import Audio, display

# ----------------
# 1. โหลดโมเดล (ครั้งเดียว)
# ----------------
print("Loading TTS model (v2)...")
tts = TTS(model="v2")   # v2 = อ่านแม่น ลดคำเพี้ยน (IPA)
print("Model loaded successfully!")

# ----------------------------------------
# 2. ตั้งค่าเสียงอ้างอิง (Voice Clone)
# ----------------------------------------
REFERENCE_AUDIO = "/content/voice4.webm"
REFERENCE_TEXT = "เชื่อว่าหลายๆคนต้องเคยเจอ"

# ------------------------------------------------
# 3. ฟังก์ชันสร้างเสียง (จูนให้เหมาะกับ v2)
# ------------------------------------------------
def generate_thai_voice(
    text_to_speak,
    output_filename,
    sample_rate=24000,
    step=40,     # v2 ต้องการ step สูงขึ้นนิด
    cfg=2.4,     # คุมความแม่นของคำ
    speed=0.95   # ลดความแข็งของเสียง
):
    print(f"\n🎙️ กำลังสร้างเสียง (v2):\n{text_to_speak}\n")

    try:
        wav = tts.infer(
            ref_audio=REFERENCE_AUDIO,
            ref_text=REFERENCE_TEXT,
            gen_text=text_to_speak,
            step=step,
            cfg=cfg,
            speed=speed
        )

        sf.write(output_filename, wav, sample_rate)
        print(f"✅ สร้างไฟล์เสียงสำเร็จ: {output_filename}")

        display(Audio(output_filename))
        return True

    except Exception as e:
        print(f"❌ เกิดข้อผิดพลาด: {e}")
        return False

Loading TTS model (v2)...


model_350000.pt:   0%|          | 0.00/1.35G [00:00<?, ?B/s]

vocab.txt: 0.00B [00:00, ?B/s]

Load TTS model :  /root/.cache/huggingface/hub/models--VIZINTZOR--F5-TTS-TH-V2/snapshots/2da424e44f9f00ca05715974673435305ac09f45/model_350000.pt 

Load Vocoder : charactr/vocos-mel-24khz
Model loaded successfully!


Example 1

In [17]:
text_1 = (
    "อากาศสดชื่น ธรรมชาติอุดมสมบูรณ์ "
    "รุ่งรวยวัฒนธรรม ท่ามกลางโลกสมัยใหม่ที่พัฒนาอย่างรวดเร็ว"
)

generate_thai_voice(
    text_to_speak=text_1,
    output_filename="thai_voice1_v2.wav"
)


🎙️ กำลังสร้างเสียง (v2):
อากาศสดชื่น ธรรมชาติอุดมสมบูรณ์ รุ่งรวยวัฒนธรรม ท่ามกลางโลกสมัยใหม่ที่พัฒนาอย่างรวดเร็ว

Converting audio...
Using custom reference text...

ref_text   เชื่อว่าหลายๆคนต้องเคยเจอ. 
gen_text 0 อากาศสดชื่น ธรรมชาติอุดมสมบูรณ์ รุ่งรวยวัฒนธรรม ท่ามกลางโลกสมัยใหม่ที่พัฒนาอย่างรวดเร็ว


Generating audio in 1 batches...


100%|██████████| 1/1 [00:04<00:00,  4.81s/it]

✅ สร้างไฟล์เสียงสำเร็จ: thai_voice1_v2.wav





True

Example 2

In [18]:
text_2 = (
    "จากหญิงงามที่ถูกบังคับแต่งให้คนใกล้ตาย "
    "สู่คู่ครองที่ร่วมใจกันเขียนประวัติศาสตร์หน้าใหม่ "
    "เมื่อรูปโฉมงดงามของ ‘กู้เจี้ยนหลี’ กลับคืนมา "
    "แต่ภัยจากราชบัลลังก์ที่กำลังจะลุกเป็นไฟกลับคืบคลานเข้ามาใกล้ "
    "ยามที่ทุกฝ่ายต่างชิงไหวชิงพริบเพื่อครองอำนาจสูงสุด "
    "จีอู๋จิ้ง... ท่านอาผู้โหดเหี้ยมกลับมีแผนการลับ "
    "เขาจะใช้ฝีมือและเล่ห์กลทั้งหมดเพื่อให้ภรรยาที่รักได้สมหวัง "
    "สองสามีภรรยาผนึกกำลังเป็นหนึ่งเดียว "
    "ร่วมกันวางหมากให้จักรพรรดิองค์น้อยครองบัลลังก์ "
    "แลกกับชีวิตเรียบง่ายไร้พันธนาการที่รอคอยพวกเขาอยู่"
)

generate_thai_voice(
    text_to_speak=text_2,
    output_filename="thai_voice2_v2.wav",
    cfg=2.6     # นิยายยาว เพิ่มเสถียรภาพอีกนิด
)


🎙️ กำลังสร้างเสียง (v2):
จากหญิงงามที่ถูกบังคับแต่งให้คนใกล้ตาย สู่คู่ครองที่ร่วมใจกันเขียนประวัติศาสตร์หน้าใหม่ เมื่อรูปโฉมงดงามของ ‘กู้เจี้ยนหลี’ กลับคืนมา แต่ภัยจากราชบัลลังก์ที่กำลังจะลุกเป็นไฟกลับคืบคลานเข้ามาใกล้ ยามที่ทุกฝ่ายต่างชิงไหวชิงพริบเพื่อครองอำนาจสูงสุด จีอู๋จิ้ง... ท่านอาผู้โหดเหี้ยมกลับมีแผนการลับ เขาจะใช้ฝีมือและเล่ห์กลทั้งหมดเพื่อให้ภรรยาที่รักได้สมหวัง สองสามีภรรยาผนึกกำลังเป็นหนึ่งเดียว ร่วมกันวางหมากให้จักรพรรดิองค์น้อยครองบัลลังก์ แลกกับชีวิตเรียบง่ายไร้พันธนาการที่รอคอยพวกเขาอยู่

Converting audio...
Using custom reference text...

ref_text   เชื่อว่าหลายๆคนต้องเคยเจอ. 
gen_text 0 จากหญิงงามที่ถูกบังคับแต่งให้คนใกล้ตาย สู่คู่ครองที่ร่วมใจกันเขียนประวัติศาสตร์หน้าใหม่ เมื่อรูปโฉม
gen_text 1 งดงามของ ‘กู้เจี้ยนหลี’ กลับคืนมา แต่ภัยจากราชบัลลังก์ที่กำลังจะลุกเป็นไฟกลับคืบคลานเข้ามาใกล้ ยาม
gen_text 2 ที่ทุกฝ่ายต่างชิงไหวชิงพริบเพื่อครองอำนาจสูงสุด จีอู๋จิ้ง ท่านอาผู้โหดเหี้ยมกลับมีแผนการลับ เขาจะใช้
gen_text 3 ฝีมือและเล่ห์กลทั้งหมดเพื่อให้ภรรยาที่รักได้สมหวัง สอ

100%|██████████| 5/5 [00:17<00:00,  3.45s/it]

✅ สร้างไฟล์เสียงสำเร็จ: thai_voice2_v2.wav





True