# 🎬 AI Video Creator

<div style="background: linear-gradient(90deg, #667eea 0%, #764ba2 100%); padding: 20px; border-radius: 10px; color: white; text-align: center; margin: 20px 0;">
  <h2>🚀 Tạo Video AI Chuyên Nghiệp</h2>
  <p>Chuyển văn bản thành video với khuôn mặt nói chân thực bằng công nghệ AI tiên tiến</p>
</div>

## ✨ Tính năng nổi bật:

| Tính năng | Mô tả |
|-----------|-------|
| 🎤 **Text-to-Speech AI** | Tạo giọng nói tự nhiên từ văn bản với 10+ giọng đọc khác nhau |
| 🎭 **AI Talking Head** | Biến hình ảnh thành video với khuôn mặt nói theo âm thanh |
| 🎬 **Video Overlay** | Ghép nhân vật AI vào video nền một cách tự nhiên |
| 📝 **Auto Subtitles** | Tự động tạo phụ đề đồng bộ với âm thanh |
| 🌐 **Web Interface** | Giao diện thân thiện, dễ sử dụng qua trình duyệt |
| ⚡ **GPU Accelerated** | Xử lý nhanh chóng với GPU của Google Colab |

---

## 📋 Hướng dẫn sử dụng:

### 🔥 Chỉ cần 3 bước đơn giản:

1. **🔑 Bước 0:** Nhập API Keys (OpenAI + Pexels)
2. **🔧 Bước 1:** Thiết lập môi trường (3-5 phút)
3. **🚀 Bước 2:** Khởi động ứng dụng và nhận link truy cập

### 💡 Mẹo:
- Chạy từng cell theo thứ tự từ trên xuống dưới
- Đợi cell này hoàn thành trước khi chạy cell tiếp theo
- Không đóng tab Colab trong khi sử dụng

---

In [None]:
#@title 🔑 BƯỚC 0: Cấu hình API Keys {run: "auto", vertical-output: true}

#@markdown ### 📋 Hướng dẫn lấy API Keys:
#@markdown 
#@markdown **🔸 OpenAI API Key:** *(Bắt buộc - để sử dụng AI tạo giọng nói)*
#@markdown 1. Truy cập: https://platform.openai.com/api-keys
#@markdown 2. Đăng nhập/Đăng ký tài khoản OpenAI
#@markdown 3. Tạo API key mới và copy
#@markdown 4. Dán vào ô bên dưới
#@markdown 
#@markdown **🔸 Pexels API Key:** *(Tùy chọn - để tải ảnh/video từ Pexels)*
#@markdown 1. Truy cập: https://www.pexels.com/api/
#@markdown 2. Đăng ký tài khoản miễn phí
#@markdown 3. Copy API key từ dashboard
#@markdown 4. Dán vào ô bên dưới
#@markdown 
#@markdown ---
#@markdown ### 🔐 Nhập API Keys của bạn:

openai_api_key = "" #@param {type:"string", placeholder:"sk-..."}
pexels_api_key = "" #@param {type:"string", placeholder:"Pexels API Key (có thể để trống)"}

#@markdown ---
#@markdown **⚠️ Bảo mật:** API keys chỉ được lưu trong phiên này và không được chia sẻ.

import os
import re

def validate_and_setup_keys():
    """Kiểm tra và thiết lập API keys"""
    
    print("🔍 Đang kiểm tra API Keys...")
    print("=" * 50)
    
    # Kiểm tra OpenAI API Key
    if not openai_api_key.strip():
        print("❌ OpenAI API Key không được để trống!")
        print("💡 Vui lòng lấy API key từ: https://platform.openai.com/api-keys")
        return False
    
    # Kiểm tra format OpenAI key
    if not re.match(r'^sk-[a-zA-Z0-9]{20,}', openai_api_key.strip()):
        print("⚠️ OpenAI API Key có vẻ không đúng format (thường bắt đầu bằng 'sk-')")
        print("🔄 Vẫn tiếp tục thiết lập...")
    
    # Thiết lập biến môi trường
    os.environ['OPENAI_API_KEY'] = openai_api_key.strip()
    
    if pexels_api_key.strip():
        os.environ['PEXELS_API_KEY'] = pexels_api_key.strip()
        print("✅ Pexels API Key đã được thiết lập")
    else:
        print("ℹ️ Pexels API Key để trống - một số tính năng có thể bị hạn chế")
    
    # Hiển thị thông tin đã ẩn
    print("=" * 50)
    print("🎉 API Keys đã được thiết lập thành công!")
    print(f"🔑 OpenAI: ***{openai_api_key[-8:] if len(openai_api_key) >= 8 else openai_api_key}")
    
    if pexels_api_key.strip():
        print(f"🔑 Pexels: ***{pexels_api_key[-8:] if len(pexels_api_key) >= 8 else pexels_api_key}")
    
    print("=" * 50)
    print("✅ Sẵn sàng cho bước tiếp theo!")
    print("👇 Hãy chạy BƯỚC 1 bên dưới")
    
    return True

# Chạy kiểm tra và thiết lập
validate_and_setup_keys()

In [None]:
#@title 🔧 BƯỚC 1: Thiết lập môi trường {vertical-output: true}

#@markdown ### ⏱️ Thời gian ước tính: 3-5 phút
#@markdown 
#@markdown Bước này sẽ:
#@markdown - 📦 Cài đặt các thư viện cần thiết
#@markdown - 🤖 Tải xuống mô hình AI
#@markdown - ⚙️ Cấu hình môi trường
#@markdown - ☁️ Thiết lập CloudFlared tunnel
#@markdown 
#@markdown **Lưu ý:** Đợi cell này hoàn thành trước khi chạy bước tiếp theo!

import subprocess
import sys
import time
from IPython.display import clear_output

def run_with_progress(description, cmd, timeout=600):
    """Chạy lệnh với hiển thị tiến trình"""
    print(f"🔄 {description}...")
    start_time = time.time()
    
    try:
        result = subprocess.run(
            cmd, shell=True, capture_output=True, text=True, 
            timeout=timeout, check=False
        )
        
        elapsed = time.time() - start_time
        
        if result.returncode == 0:
            print(f"✅ {description} hoàn thành ({elapsed:.1f}s)")
            return True
        else:
            print(f"⚠️ {description} có lỗi nhưng tiếp tục...")
            return False
            
    except subprocess.TimeoutExpired:
        print(f"⏰ {description} timeout nhưng tiếp tục...")
        return False
    except Exception as e:
        print(f"❌ {description} lỗi: {str(e)[:100]}...")
        return False

def main_setup():
    """Thiết lập môi trường chính"""
    
    print("🎬 AI VIDEO CREATOR - THIẾT LẬP MÔI TRƯỜNG")
    print("=" * 60)
    print("⏱️ Bắt đầu thiết lập... (3-5 phút)")
    print("☕ Hãy thư giãn và chờ đợi!")
    print("=" * 60)
    
    start_total = time.time()
    
    # 1. Cập nhật hệ thống
    run_with_progress("Cập nhật hệ thống", "apt-get update -qq")
    
    # 2. Cài đặt system dependencies
    run_with_progress(
        "Cài đặt system packages",
        "apt-get install -y ffmpeg libsm6 libxext6 libxrender-dev libglib2.0-0 libgl1-mesa-glx git-lfs wget curl -qq"
    )
    
    # 3. Thiết lập Git LFS
    run_with_progress("Thiết lập Git LFS", "git lfs install")
    
    # 4. Cài đặt Python packages core
    run_with_progress(
        "Cài đặt Python core packages", 
        "pip install --upgrade pip setuptools wheel -q",
        120
    )
    
    run_with_progress(
        "Cài đặt PyTorch với CUDA",
        "pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 -q",
        300
    )
    
    run_with_progress(
        "Cài đặt numpy và opencv",
        "pip install numpy==2.0.1 opencv-python-headless scikit-image -q",
        180
    )
    
    run_with_progress(
        "Cài đặt audio processing",
        "pip install librosa tqdm filetype imageio imageio-ffmpeg -q",
        180
    )
    
    # 5. Cài đặt AI packages
    run_with_progress(
        "Cài đặt TensorRT và CUDA tools",
        "pip install tensorrt==8.6.1 cuda-python polygraphy -q",
        180
    )
    
    run_with_progress(
        "Cài đặt AI packages",
        "pip install cython transparent-background insightface -q",
        180
    )
    
    # 6. Cài đặt web packages
    run_with_progress(
        "Cài đặt web framework",
        "pip install streamlit fastapi uvicorn python-multipart -q",
        120
    )
    
    run_with_progress(
        "Cài đặt video processing",
        "pip install moviepy==2.1.2 pysrt openai edge-tts pillow -q",
        180
    )
    
    # 7. Thiết lập CloudFlared
    cloudflared_success = run_with_progress("Kiểm tra CloudFlared", "cloudflared --version")
    
    if not cloudflared_success:
        run_with_progress(
            "Tải CloudFlared",
            "wget -q https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64"
        )
        run_with_progress("Cài đặt CloudFlared", "chmod +x cloudflared-linux-amd64")
        run_with_progress("Thiết lập CloudFlared", "sudo mv cloudflared-linux-amd64 /usr/local/bin/cloudflared")
    
    # 8. Tải project
    print("\n📥 Tải xuống project...")
    if not run_with_progress(
        "Clone repository",
        "git clone --single-branch --branch colab https://github.com/linhcentrio/ditto-talkinghead.git",
        300
    ):
        print("⚠️ Repository có thể đã tồn tại, tiếp tục...")
    
    # 9. Thiết lập project
    try:
        import os
        os.chdir("ditto-talkinghead")
        print("✅ Đã chuyển đến thư mục project")
        
        # Tạo thư mục cần thiết
        dirs = ["output", "tmp", "example", "logs", "font/Roboto"]
        for d in dirs:
            os.makedirs(d, exist_ok=True)
        
        print("✅ Đã tạo cấu trúc thư mục")
        
    except Exception as e:
        print(f"⚠️ Lỗi thiết lập project: {e}")
    
    # 10. Tải models
    if not os.path.exists("checkpoints"):
        run_with_progress(
            "Tải AI models",
            "git clone https://huggingface.co/digital-avatar/ditto-talkinghead checkpoints",
            600
        )
    else:
        print("✅ Models đã tồn tại")
    
    # 11. Tạo startup script
    startup_script = '''#!/bin/bash
echo "🎬 Khởi động AI Video Creator..."

# Set environment
export STREAMLIT_SERVER_FILE_WATCHER_TYPE=none
export STREAMLIT_SERVER_HEADLESS=true
export STREAMLIT_SERVER_PORT=8501

# Start Streamlit
echo "🚀 Đang khởi động server..."
cd /content/ditto-talkinghead
python -m streamlit run run_streamlit.py --server.port=8501 --server.address=0.0.0.0 --server.headless=true &

# Wait and start tunnel
echo "⏳ Chờ server khởi động..."
sleep 12

echo "☁️ Tạo đường link public..."
echo "🔗 Link của bạn sẽ hiển thị bên dưới:"
echo "="*50
cloudflared tunnel --url http://localhost:8501
'''
    
    with open("start_app.sh", "w") as f:
        f.write(startup_script)
    
    os.chmod("start_app.sh", 0o755)
    print("✅ Đã tạo script khởi động")
    
    # Kết thúc
    total_time = time.time() - start_total
    
    print("\n" + "=" * 60)
    print("🎉 THIẾT LẬP HOÀN TẤT!")
    print("=" * 60)
    print(f"⏱️ Tổng thời gian: {total_time:.1f} giây")
    print("✅ Tất cả components đã được cài đặt")
    print("✅ AI models đã sẵn sàng")
    print("✅ CloudFlared tunnel đã được thiết lập")
    print("\n🚀 SẴNG SÀNG KHỞI ĐỘNG!")
    print("👇 Hãy chạy BƯỚC 2 bên dưới để khởi động ứng dụng")
    print("=" * 60)

# Chạy thiết lập
main_setup()

In [None]:
#@title 🚀 BƯỚC 2: Khởi động AI Video Creator {vertical-output: true}

#@markdown ### 🌐 Khởi động ứng dụng web
#@markdown 
#@markdown Sau khi chạy cell này:
#@markdown 1. ⏳ Đợi 10-15 giây để server khởi động
#@markdown 2. 🔗 CloudFlared sẽ hiển thị link public 
#@markdown 3. 🖱️ Click vào link để mở ứng dụng
#@markdown 4. 🎬 Bắt đầu tạo video AI!
#@markdown 
#@markdown **Lưu ý:** Giữ cell này chạy để duy trì ứng dụng

import subprocess
import os
import time
from pathlib import Path

def launch_app():
    """Khởi động AI Video Creator"""
    
    print("🎬 AI VIDEO CREATOR")
    print("=" * 50)
    print("🚀 Đang khởi động ứng dụng...")
    print("=" * 50)
    
    # Kiểm tra thiết lập
    if not Path("ditto-talkinghead/start_app.sh").exists():
        print("❌ Chưa thiết lập môi trường!")
        print("💡 Vui lòng chạy BƯỚC 1 trước")
        return False
    
    # Kiểm tra API key
    if not os.getenv("OPENAI_API_KEY"):
        print("❌ Chưa thiết lập OpenAI API Key!")
        print("💡 Vui lòng chạy BƯỚC 0 trước")
        return False
    
    # Chuyển đến thư mục project
    try:
        os.chdir("ditto-talkinghead")
        print("✅ Đã vào thư mục project")
    except:
        print("❌ Không thể truy cập thư mục project")
        return False
    
    # Hiển thị thông tin
    print("\n📋 THÔNG TIN KHỞI ĐỘNG:")
    print("🔗 Link sẽ có dạng: https://xxxxx.trycloudflare.com")
    print("⏰ Thời gian khởi động: ~15 giây")
    print("🌐 Giao diện: Streamlit Web App")
    print("⚡ GPU: Được kích hoạt cho xử lý nhanh")
    
    print("\n" + "=" * 50)
    print("🔄 ĐANG KHỞI ĐỘNG...")
    print("📡 Tạo secure tunnel...")
    print("=" * 50)
    
    try:
        # Chạy startup script
        subprocess.run(["./start_app.sh"], check=True)
    except KeyboardInterrupt:
        print("\n⏹️ Ứng dụng đã được dừng bởi người dùng")
        print("🔄 Chạy lại cell này để khởi động lại")
        return True
    except Exception as e:
        print(f"\n❌ Lỗi khởi động: {e}")
        print("🔄 Thử chạy lại cell này")
        return False
    
    return True

# Khởi động ứng dụng
launch_app()

---

## 📖 Hướng dẫn sử dụng chi tiết:

### 🎯 Quy trình tạo video:

1. **📁 Tải lên files:**
   - **MC (Nhân vật):** JPG, PNG, MP4 (hình ảnh/video của người nói)
   - **Background:** MP4 (video nền - landscape)
   - **Audio:** WAV, MP3 hoặc nhập văn bản để tạo giọng nói

2. **⚙️ Tùy chỉnh:**
   - Vị trí MC trên video (góc, giữa)
   - Kích thước MC (tự động hoặc thủ công)
   - Kiểu phụ đề (từng từ hoặc gradient)
   - Giọng đọc AI (10+ lựa chọn)

3. **🎬 Tạo video:**
   - AI sẽ tạo khuôn mặt nói theo audio
   - Ghép MC vào video nền
   - Thêm phụ đề tự động
   - Xuất video MP4 chất lượng cao

### 🎤 Tính năng Text-to-Speech:

| Giọng đọc | Đặc điểm | Phù hợp cho |
|-----------|----------|-------------|
| **Shimmer** | Nữ, tươi sáng, năng động | Giải trí, quảng cáo |
| **Nova** | Nữ, chuyên nghiệp | Tin tức, thông báo |
| **Onyx** | Nam, trầm, sang trọng | Thuyết trình, tài liệu |
| **Echo** | Nam, trẻ, năng động | Quảng cáo, promotion |
| **Ballad** | Nữ, mềm mại, ấm áp | Tư vấn, hướng dẫn |

### 📝 Định dạng đầu ra:

- **Video:** MP4, 1080p, 24fps
- **Audio:** AAC, 192kbps  
- **Phụ đề:** SRT embedded
- **Thời lượng:** Theo audio input

---

## 🔧 Xử lý sự cố:

### ❓ Các vấn đề thường gặp:

| Vấn đề | Nguyên nhân | Giải pháp |
|--------|-------------|----------|
| Setup lỗi | Mạng không ổn định | Restart runtime, chạy lại |
| App không mở | CloudFlared lỗi | Chạy lại BƯỚC 2 |
| Video không tạo được | File input lỗi | Kiểm tra format file |
| Giọng nói không tự nhiên | API key hết quota | Kiểm tra OpenAI balance |
| Xử lý chậm | GPU không khả dụng | Kiểm tra runtime type |

### 💡 Mẹo tối ưu:

- **📷 Ảnh MC:** Sử dụng ảnh rõ nét, góc thẳng, nền đơn giản
- **🎵 Audio:** File chất lượng cao, ít noise
- **📱 Video nền:** Tỷ lệ 16:9, độ phân giải tối thiểu 720p
- **⚡ Performance:** Sử dụng GPU runtime cho xử lý nhanh
- **💾 Storage:** Video sẽ được lưu trong thư mục output

---

## 🆘 Hỗ trợ:

Nếu gặp vấn đề:
1. 🔄 Thử restart runtime (Runtime → Restart runtime)
2. 🔧 Chạy lại từ BƯỚC 0
3. 📋 Kiểm tra API keys có còn hiệu lực
4. 🌐 Đảm bảo kết nối internet ổn định

---

<div style="background: #f0f2f6; padding: 15px; border-radius: 8px; text-align: center; margin: 20px 0;">
  <strong>🎬 AI Video Creator</strong><br>
  <em>Tạo video AI chuyên nghiệp với công nghệ tiên tiến</em>
</div>