# Konfigrasyonlar

In [None]:
# Video dosyasının adı
FILENAME = "demo.mp4"

# Çeviri için kullanılacak API anahtarı dosyasının adı
KEY = "key.json"

# Kaynak dil (video dil)
CURRENT_LANGUAGE = "en"  # Örnek: İngilizce ("en")

# Hedef dil (çevrilecek dil)
TARGET_LANGUAGE = "tr"  # Örnek: Türkçe ("tr")

# Altyazı Parametreleri
font = "Helvetica"  # Metin fontu
color = 'white'  # Metin rengi
highlight_color = 'yellow'  # Vurgulama rengi
stroke_color = 'black'  # Kenarlık rengi
stroke_width = 1.5  # Kenarlık kalınlığı

# Gerekli Kütüphane Kurulumları


In [None]:
!pip install --quiet srt_file_translator

!pip install --quiet ipython-autotime
%load_ext autotime

!pip install --quiet moviepy==2.0.0.dev2
!pip install --quiet imageio==2.25.1
!pip install --quiet ffmpeg-python==0.2.0
!pip install --quiet faster-whisper==0.7.0
!pip install --quiet python-docx

In [None]:
!apt install imagemagick
!cat /etc/ImageMagick-6/policy.xml | sed 's/none/read,write/g'> /etc/ImageMagick-6/policy.xml

# Core Functions

In [None]:
from faster_whisper import WhisperModel
import ffmpeg
import json
from docx import Document
import re
from srt_file_translator import Translator
from moviepy.editor import TextClip, CompositeVideoClip, ColorClip
import numpy as np
from moviepy.editor import TextClip, CompositeVideoClip, concatenate_videoclips,VideoFileClip, ColorClip

In [None]:
#
def extract_sound_file(fileName):
    # MP4 dosya adını MP3 formatına dönüştür
    audiofilename = fileName.replace(".mp4", '.mp3')

    # ffmpeg ile dosyayı okumak için giriş akışı oluştur
    input_stream = ffmpeg.input(fileName)

    # Giriş akışından sadece ses verisini al
    audio = input_stream.audio

    # Çıktı olarak kullanılacak ses dosyasını ve adını ayarla
    output_stream = ffmpeg.output(audio, audiofilename)

    # Eğer hedef dosya zaten varsa üzerine yaz
    output_stream = ffmpeg.overwrite_output(output_stream)

    # ffmpeg işlemini başlat ve ses dosyasını oluştur
    ffmpeg.run(output_stream)

    # Oluşturulan ses dosyasının adını döndür
    return audiofilename

#
# Belirli bir model boyutu için WhisperModel yükler.
# `model_size` parametresi modelin boyutunu belirler (varsayılan olarak "medium").
def load_model(model_size="medium"):
    # İstenen boyutta bir Whisper modeli oluşturur ve döndürür.
    return WhisperModel(model_size)

#
# Verilen model ve ses dosyası adı kullanılarak ses dosyasından segmentler oluşturur.
# `model` parametresi, transkripsiyon yapmak için kullanılacak modeli,
# `audiofilename` parametresi ise transkribe edilecek ses dosyasının adını belirtir.
def create_segments(model, audiofilename):
    # Modelin `transcribe` metodunu çağırarak ses dosyasını transkribe eder.
    # `word_timestamps=True` argümanı, her kelimenin başlangıç ve bitiş zaman damgalarını döndürür.
    segments, info = model.transcribe(audiofilename, word_timestamps=True)
    # Oluşturulan segmentleri döndürür.
    return segments

#
# Verilen alt başlık segmentlerini SRT dosya formatına dönüştür
def segments_to_srt(segments, output_filename="transcription.srt"):
    with open(output_filename, 'w', encoding='utf-8') as file:
        for i, segment in enumerate(segments, start=1):
            for word in segment.words:
                start = word.start
                end = word.end
                # Zamanı SRT formatına çevirme
                start_srt = "%02d:%02d:%02d,%03d" % (int(start / 3600), int(start / 60 % 60), int(start % 60), int(start * 1000 % 1000))
                end_srt = "%02d:%02d:%02d,%03d" % (int(end / 3600), int(end / 60 % 60), int(end % 60), int(end * 1000 % 1000))
                # Sıra numarası yazdır
                file.write(f"{i}\n")
                # Başlangıç ve bitiş zamanlarını yazdır
                file.write(f"{start_srt} --> {end_srt}\n")
                # Kelimeyi yazdır
                file.write(f"{word.word}\n\n")


#
# Transkribe edilmiş segmentlerden kelime düzeyinde bilgileri işler.
# `segments` parametresi, transkribe edilen kelimelerin segmentlerini içerir.
def process(segments):
    segments = list(segments)  # Segmentleri liste olarak işler.

    segments_to_srt(segments)  # Segmentlerden ileride kullanmak için .str dosyası oluştur

    wordlevel_info = []
    # Her bir segment ve içerdiği kelimeler üzerinde döngü yapar.
    for segment in segments:
        for word in segment.words:
            # Her kelimenin metnini, başlangıç ve bitiş zamanlarını içeren bir sözlük oluşturur.
            wordlevel_info.append({'word': word.word, 'start': word.start, 'end': word.end})

    # İşlenmiş kelime düzeyinde bilgileri döndürür.
    return wordlevel_info

#
# Bir JSON dosyasını okur ve içeriğini döndürür.
# `fileName` parametresi, okunacak JSON dosyasının adını belirtir (varsayılan olarak 'data.json').
def read_json(fileName='translated.json'):
    # Belirtilen dosyayı okuma modunda açar.
    with open(fileName, 'r') as f:
        # Dosya içeriğini JSON olarak yükler ve bir değişkene atar.
        wordlevel_info_modified = json.load(f)

    # Yüklenen veriyi döndürür.
    return wordlevel_info_modified

#
# Alt yazıyı satrı satır forma çevirmek için
def split_text_into_lines(data):
    MaxChars = 30  # Bir satırdaki maksimum karakter sayısı.
    MaxDuration = 2.5  # Bir satırın maksimum süresi (saniye cinsinden).
    MaxGap = 1.5  # İki kelime arasındaki maksimum boşluk süresi (saniye cinsinden).

    subtitles = []  # Sonuç alt yazı satırlarını saklamak için liste.
    line = []  # Geçici olarak kelimeleri saklamak için kullanılan liste.
    line_duration = 0  # Geçici satırın toplam süresi.
    line_chars = 0  # Açıklama gereksiz, kullanılmıyor.

    for idx, word_data in enumerate(data):  # Girdi verisindeki her kelime için döngü.
        word = word_data["word"]
        start = word_data["start"]
        end = word_data["end"]

        line.append(word_data)  # Geçici satıra kelime eklenir.
        line_duration += end - start  # Geçici satırın süresi güncellenir.

        temp = " ".join(item["word"] for item in line)  # Geçici satırdaki kelimeler birleştirilir.

        # Yeni bir kelime eklenmesiyle karakter sayısı veya süre sınırını aşılıp aşılmadığının kontrolü.
        new_line_chars = len(temp)
        duration_exceeded = line_duration > MaxDuration
        chars_exceeded = new_line_chars > MaxChars

        # İki kelime arasındaki boşluk süresinin kontrolü.
        if idx > 0:
            gap = word_data['start'] - data[idx-1]['end']
            maxgap_exceeded = gap > MaxGap
        else:
            maxgap_exceeded = False  # İlk kelime için boşluk süresi kontrolü yapılmaz.

        # Karakter sayısı, süre veya boşluk süresi sınırı aşıldıysa, geçici satır sonlandırılır.
        if duration_exceeded or chars_exceeded or maxgap_exceeded:
            if line:  # Eğer geçici satır boş değilse, sonuç listesine eklenir.
                subtitle_line = {
                    "word": " ".join(item["word"] for item in line),
                    "start": line[0]["start"],
                    "end": line[-1]["end"],
                    "textcontents": line
                }
                subtitles.append(subtitle_line)
                line = []  # Geçici satır sıfırlanır.
                line_duration = 0

    # Döngü bittiğinde, kalan son satır (varsa) sonuç listesine eklenir.
    if line:
        subtitle_line = {
            "word": " ".join(item["word"] for item in line),
            "start": line[0]["start"],
            "end": line[-1]["end"],
            "textcontents": line
        }
        subtitles.append(subtitle_line)

    # Altyazıları döndür
    return subtitles

#
# Bu fonksiyonu, metin tabanlı JSON verisini kullanarak, bir video içerisinde altyazılar oluşturmak üzere metin klip nesneleri dizisi üretir.
def create_caption(textJSON, framesize,font=font,color=color, highlight_color=highlight_color,stroke_color=stroke_color,stroke_width=stroke_width):
    wordcount = len(textJSON['textcontents'])  # JSON'da bulunan kelime sayısı.
    full_duration = textJSON['end'] - textJSON['start']  # Altyazının toplam süresi.

    word_clips = []  # Oluşturulan metin kliplerini saklamak için liste.
    xy_textclips_positions = []  # Metin kliplerinin pozisyon bilgilerini saklamak için liste.

    # Başlangıç pozisyonları ve satır genişliği.
    x_pos = 0
    y_pos = 0
    line_width = 0
    frame_width, frame_height = framesize

    x_buffer = frame_width * 0.1  # Çerçevenin kenarlarından boşluk.
    max_line_width = frame_width - 2 * x_buffer  # Maksimum satır genişliği.

    fontsize = int(frame_height * 0.075)  # Font boyutu, video yüksekliğinin %7.5'i olarak ayarlanır.

    for index, wordJSON in enumerate(textJSON['textcontents']):
        duration = wordJSON['end'] - wordJSON['start']  # Kelimenin süresi.
        # Her kelime için bir metin klipi oluşturulur.
        word_clip = TextClip(wordJSON['word'], font=font, fontsize=fontsize, color=color, stroke_color=stroke_color, stroke_width=stroke_width).set_start(textJSON['start']).set_duration(full_duration)
        word_clip_space = TextClip(" ", font=font, fontsize=fontsize, color=color).set_start(textJSON['start']).set_duration(full_duration)
        word_width, word_height = word_clip.size  # Metin klipinin boyutları.
        space_width, space_height = word_clip_space.size  # Boşluk klipinin boyutları.

        # Yeni kelimenin mevcut satıra sığdırılması veya yeni bir satıra geçilmesi.
        if line_width + word_width + space_width <= max_line_width:
            xy_textclips_positions.append({
                "x_pos": x_pos,
                "y_pos": y_pos,
                "width": word_width,
                "height": word_height,
                "word": wordJSON['word'],
                "start": wordJSON['start'],
                "end": wordJSON['end'],
                "duration": duration
            })
            word_clip = word_clip.set_position((x_pos, y_pos))
            x_pos += word_width + space_width  # X pozisyonunu güncelle.
            line_width += word_width + space_width  # Satır genişliğini güncelle.
        else:
            # Yeni satıra geçiş yapılır.
            x_pos = 0
            y_pos += word_height + 10  # Y pozisyonunu güncelle.
            line_width = word_width + space_width  # Satır genişliğini sıfırla.

            xy_textclips_positions.append({
                "x_pos": x_pos,
                "y_pos": y_pos,
                "width": word_width,
                "height": word_height,
                "word": wordJSON['word'],
                "start": wordJSON['start'],
                "end": wordJSON['end'],
                "duration": duration
            })
            word_clip = word_clip.set_position((x_pos, y_pos))
            x_pos += word_width + space_width  # X pozisyonunu güncelle.

        word_clips.append(word_clip)
        word_clips.append(word_clip_space)  # Boşluk klipi de eklenir.

    # Vurgulanan kelimeler için ayrı metin klipleri oluşturulur.
    for highlight_word in xy_textclips_positions:
        word_clip_highlight = TextClip(highlight_word['word'], font=font, fontsize=fontsize, color=highlight_color, stroke_color=stroke_color, stroke_width=stroke_width).set_start(highlight_word['start']).set_duration(highlight_word['duration'])
        word_clip_highlight = word_clip_highlight.set_position((highlight_word['x_pos'], highlight_word['y_pos']))
        word_clips.append(word_clip_highlight)  # Vurgulanan kelime klipleri listeye eklenir.

    return word_clips, xy_textclips_positions

In [None]:
#
def srt_to_docx(srt_file_path="transcription.srt", docx_file_path="transcription.docx"):
    # Yeni bir Word belgesi oluştur
    doc = Document()

    # SRT dosyasından okunan tüm metinleri birleştirmek için boş bir string
    full_text = ''

    # SRT dosyasını oku ve içeriğini bir değişkene ata
    with open(srt_file_path, 'r', encoding='utf-8') as file:
        srt_content = file.read()

    # SRT içeriğini alt yazı girişlerine ayır
    subtitles = re.split(r'\n\n+', srt_content)

    # Her alt yazı girişini işle ve tam metni oluştur
    for subtitle in subtitles:
        # Zaman damgalarını atla ve sadece metin kısmını al
        lines = subtitle.split('\n')[2:]
        # Metin satırlarını birleştir
        subtitle_text = ' '.join(lines)
        # Tam metni güncelle
        full_text += subtitle_text + ' '

    # Tam metni Word belgesine ekle
    doc.add_paragraph(full_text)

    # Word belgesini kaydet
    doc.save(docx_file_path)

#
# SRT zaman formatını saniyeye çevirme işlevi
def parse_time_to_seconds(time_str):
    hours, minutes, seconds, milliseconds = map(int, re.split('[:,]', time_str))
    return hours * 3600 + minutes * 60 + seconds + milliseconds / 1000

# SRT dosyasını JSON formatına dönüştürme işlevi
def srt_to_json(srt_file_path = 'translated.srt', json_file_path = 'translated.json'):
    # SRT dosyasını oku
    with open(srt_file_path, 'r', encoding='utf-8') as file:
        srt_content = file.read()

    entries = []
    # SRT içeriğini bloklara ayır (her bir alt başlık bir bloktur)
    for block in re.split(r'\n\n+', srt_content.strip()):
        lines = block.split('\n')
        if len(lines) >= 3:
            # Zaman aralığını ve metin satırlarını al
            time_range = lines[1]
            text_lines = lines[2:]
            # Başlangıç ve bitiş zamanlarını çıkart
            start_time_str, end_time_str = re.findall(r'(\d{2}:\d{2}:\d{2},\d{3})', time_range)
            start_time = parse_time_to_seconds(start_time_str)
            end_time = parse_time_to_seconds(end_time_str)
            text = ' '.join(text_lines)

            # Metni kelimelere ayır
            words = text.split()
            # Her kelimenin süresini hesapla
            duration = (end_time - start_time) / max(len(words), 1)
            for i, word in enumerate(words):
                word_start_time = start_time + i * duration
                word_end_time = word_start_time + duration
                # Kelime bilgilerini JSON girdisi olarak kaydet
                entries.append({
                    'word': word,
                    'start': round(word_start_time, 2),
                    'end': round(word_end_time, 2)
                })

    # JSON dosyasına yaz
    with open(json_file_path, 'w', encoding='utf-8') as json_file:
        json.dump(entries, json_file, indent=4, ensure_ascii=False)

In [None]:
def find_word_in_srt(search_word, srt_file_path="transcription.srt"):
    """
    Bir SRT dosyasında aranan kelimenin geçtiği tüm satırları bulur.
    - search_word: Aranacak kelime (string).
    - srt_file_path: SRT dosyasının yolu (string). Varsayılan değer 'transcription.srt'.
    - Büyük/küçük harf duyarlılığı olmadan arama yapılır.
    - Kelime tam eşleşmesi aranır (kelimenin tam olarak geçtiği yerler döndürülür).
    - Bulunan satırların temizlenmiş hali (başında/sonunda boşluk olmadan) döndürülür.
    """
    search_word = search_word.lower()  # Arama kelimesini küçük harfe çevir
    matches = []  # Eşleşmeleri saklamak için boş liste

    with open(srt_file_path, 'r', encoding='utf-8') as file:  # SRT dosyasını oku
        for line in file:  # Dosyayı satır satır oku
            line_lower = line.lower()  # Satırı küçük harfe çevir
            # Aranan kelimenin tam eşleşmesini ara (kelime sınırları içinde)
            if re.search(r'\b' + re.escape(search_word) + r'\b', line_lower):
                matches.append(line.strip())  # Eşleşen satırı listeye ekle

    return matches  # Eşleşen satırları döndür

def find_word_and_timestamp_in_srt(search_word, srt_file_path="transcription.srt"):
    """
    Aranan kelimenin geçtiği yerleri ve karşılık gelen zaman bilgilerini SRT dosyasından bulur.
    - search_word: Aranacak kelime (string).
    - srt_file_path: SRT dosyasının yolu (string). Varsayılan değer 'transcription.srt'.
    - Büyük/küçük harf duyarlılığı olmadan arama yapılır.
    - Kelimenin geçtiği yerler ve ilgili zaman damgaları bir liste olarak döndürülür.
    """
    search_word = search_word.lower()  # Arama kelimesini küçük harfe çevir
    results = []  # Sonuçları saklamak için boş liste

    with open(srt_file_path, 'r', encoding='utf-8') as file:
        content = file.read()  # Dosyanın tamamını oku

    subtitles = re.split(r'\n\n+', content)  # Alt yazı bloklarına ayır

    for subtitle in subtitles:  # Her alt yazı bloğu için
        lines = subtitle.split('\n')  # Alt yazıyı satırlara ayır
        if len(lines) < 3:  # Geçersiz alt yazı kontrolü
            continue

        time_info = lines[1]  # Zaman bilgisini al
        text = ' '.join(lines[2:]).lower()  # Metni birleştir ve küçük harfe çevir

        # Aranan kelimenin tam eşleşmesini metinde ara
        if re.search(r'\b' + re.escape(search_word) + r'\b', text):
            results.append((time_info, '\n'.join(lines[2:])))  # Zaman bilgisi ve metni sonuçlara ekle

# Runtime

In [None]:
soundFile = extract_sound_file(FILENAME)  # Ses Dosyasını oluşturuyoruz

In [None]:
model = load_model() # Modeli yüklüyoruz

In [None]:
segments = create_segments(model, soundFile) # Modelden ses üzerinde gelen segmentleri alıyoruz

In [None]:
wli = process(segments) # segmentleri işliyoruz, bu sırasda orjinal dilde .srt dosyası oluşturyuyoruz

In [None]:
#srt dosyası oluşturulana kadar
import time
time.sleep(10)

In [None]:
# Translator sınıfını başlatma ve gerekli anahtarı sağlama
translator = Translator(key_path=KEY)

# Kaynak SRT dosyasının adı ve dil bilgileri
source_file = "transcription.srt"  # Kaynak SRT dosyasının adı
target_file = "translated.srt"  # Hedef SRT dosyasının adı
source_language = CURRENT_LANGUAGE  # Kaynak dil kodu (örneğin: "en" for English)
target_language = TARGET_LANGUAGE  # Hedef dil kodu (örneğin: "fr" for French)

# SRT dosyasını çevirme işlemi
translator.srt_file_translator(
    source_file=source_file,
    target_file=target_file,
    source_language=source_language,
    target_language=target_language
)

In [None]:
#çeviri dosyası oluşturulana kadar bekleme
import time
time.sleep(10)

In [None]:
srt_to_json() # alt yazı ekleme için json formatına dönüştürme

In [None]:
data = read_json() # json.dan dosya çekme

In [None]:
subtitles = split_text_into_lines(data) # alt yazıları oluştur

In [None]:
for line in subtitles:
  json_str = json.dumps(line, indent=4)
  print(json_str)

In [None]:
# Giriş video dosyasını yükle
input_video = VideoFileClip(FILENAME)

# Giriş video çerçevesinin boyutunu al
frame_size = input_video.size

# Tüm alt başlık seviyesi bölümlerini saklamka için boş liste oluşturur
all_linelevel_splits = []

# Her alt başlık için işlem yap
for line in subtitles:
    # Alt başlığı video çerçevesine eklemek için gerekli işlemleri yap
    out_clips, positions = create_caption(line, frame_size)

    # Alt başlıkların konumlarını ve boyutlarını hesapla
    max_width = 0
    max_height = 0
    for position in positions:
        x_pos, y_pos = position['x_pos'], position['y_pos']
        width, height = position['width'], position['height']
        max_width = max(max_width, x_pos + width)
        max_height = max(max_height, y_pos + height)

    # Arka plan rengini ve opaklığını ayarla
    color_clip = ColorClip(size=(int(max_width * 1.1), int(max_height * 1.1)), color=(64, 64, 64))
    color_clip = color_clip.set_opacity(.6)
    color_clip = color_clip.set_start(line['start']).set_duration(line['end'] - line['start'])

    # Alt başlığı ve arka planı birleştir
    clip_to_overlay = CompositeVideoClip([color_clip] + out_clips)
    clip_to_overlay = clip_to_overlay.set_position("bottom")

    # Oluşturulan bölümü listeye ekle
    all_linelevel_splits.append(clip_to_overlay)

# Giriş video süresini al
input_video_duration = input_video.duration

# Nihai videonun oluşturulması
final_video = CompositeVideoClip([input_video] + all_linelevel_splits)

# Nihai videonun sesini giriş videonun sesiyle aynı yap
final_video = final_video.set_audio(input_video.audio)

# Sonuç videoyu belirtilen adla kaydet
final_video.write_videofile("output.mp4", fps=24, codec="libx264", audio_codec="aac")

# Ekstra Özellikler

In [None]:
srt_to_docs() #srt formatın docs fomatına çeviri

In [None]:
# Aranacak kelime
search_word = "pentagon"

# Belirtilen kelimenin SRT dosyasındaki geçtiği satırları bul
matches = find_word_in_srt(search_word)

# Eğer eşleşme bulunduysa
if matches:
    print(f"'{search_word}' kelimesinin bulunduğu satırlar:")
    # Her eşleşmeyi ekrana yazdır
    for match in matches:
        print(match)
else:
    # Eğer eşleşme bulunamadıysa
    print(f"'{search_word}' kelimesi bulunamadı.")

In [None]:
# Aranacak kelime
search_word = 'pentagon'

# Belirtilen kelimenin SRT dosyasındaki zamanlar ve satırlarını bul
matches = find_word_and_timestamp_in_srt(search_word)

# Eğer eşleşme bulunduysa
if matches:
    print(f"'{search_word}' kelimesinin bulunduğu zamanlar ve satırlar:")
    for time_info, match in matches:
        # Zaman bilgisini ve eşleşen metni ekrana yazdır
        print(f"Zaman: {time_info}")
        print(f"Metin: {match}\n")
else:
    # Eğer eşleşme bulunamadıysa
    print(f"'{search_word}' kelimesi bulunamadı.")