In [None]:
# وارد کردن کتابخانه‌های اولیه
import os
import warnings
warnings.filterwarnings("ignore")


In [None]:
# 1. نصب کتابخونه‌های مورد نیاز با نسخه‌های سازگار
def install_dependencies():
    print("نصب کتابخونه‌ها...")
    os.system("pip install -q numpy==1.24.3 librosa==0.10.1 noisereduce==2.0.1 pydub==0.25.1 openai-whisper==20231117 hazm==0.10.0 torch==2.0.1 transformers==4.38.2")


In [None]:
# 2. وارد کردن کتابخونه‌ها
def import_libraries():
    global whisper, AudioSegment, nr, np, files, librosa, Normalizer, WordTokenizer, stopwords_list, AutoTokenizer, AutoModelForTokenClassification, pipeline, torch
    try:
        import whisper
        from pydub import AudioSegment
        import noisereduce as nr
        import numpy as np
        from google.colab import files
        import librosa
        from hazm import Normalizer, WordTokenizer, stopwords_list
        from transformers import AutoTokenizer, AutoModelForTokenClassification, pipeline
        import torch
    except ModuleNotFoundError as e:
        print(f"خطا در وارد کردن کتابخونه‌ها: {e}")
        print("تلاش دوباره برای نصب...")
        install_dependencies()
        import whisper
        from pydub import AudioSegment
        import noisereduce as nr
        import numpy as np
        from google.colab import files
        import librosa
        from hazm import Normalizer, WordTokenizer, stopwords_list
        from transformers import AutoTokenizer, AutoModelForTokenClassification, pipeline
        import torch

In [None]:
# 3. پیدا کردن فایل‌های صوتی آپلودشده
def find_audio_files():
    print("جستجوی فایل‌های صوتی در دایرکتوری Colab...")
    supported_formats = [".wav", ".mp3", ".flac"]
    audio_files = [f for f in os.listdir() if os.path.splitext(f)[1].lower() in supported_formats]
    if not audio_files:
        print("هیچ فایل صوتی پیدا نشد! لطفاً فایل‌ها را آپلود کنید:")
        uploaded = files.upload()
        audio_files = list(uploaded.keys())
    return audio_files

In [None]:
# 4. پردازش و بهینه‌سازی فایل صوتی
def preprocess_audio(audio_path, chunk_duration_ms=30000):
    print(f"پردازش فایل صوتی: {audio_path}")
    try:
        audio = AudioSegment.from_file(audio_path)
        audio = audio.set_channels(1).set_frame_rate(16000)

        chunks = [audio[i:i+chunk_duration_ms] for i in range(0, len(audio), chunk_duration_ms)]
        chunk_paths = []

        for i, chunk in enumerate(chunks):
            chunk_path = f"temp_chunk_{os.path.basename(audio_path)}_{i}.wav"
            chunk.export(chunk_path, format="wav")

            y, sr = librosa.load(chunk_path, sr=16000)
            y_reduced = nr.reduce_noise(y=y, sr=sr, stationary=False)
            AudioSegment(
                y_reduced.tobytes(),
                frame_rate=sr,
                sample_width=y_reduced.dtype.itemsize,
                channels=1
            ).export(chunk_path, format="wav")
            chunk_paths.append(chunk_path)

        return chunk_paths
    except Exception as e:
        raise Exception(f"خطا در پردازش صوت: {str(e)}")


In [None]:
# 5. تبدیل صوت به متن با Whisper
def transcribe_audio(chunk_paths, use_large_model=True):
    print("بارگذاری مدل Whisper...")
    model_name = "large-v3" if use_large_model else "medium"
    try:
        model = whisper.load_model(model_name)
    except Exception as e:
        print(f"خطا در بارگذاری مدل {model_name}: {e}. استفاده از مدل medium...")
        model = whisper.load_model("medium")

    transcribed_text = ""
    timestamps = []

    print("تبدیل صوت به متن...")
    for chunk_path in chunk_paths:
        try:
            result = model.transcribe(
                chunk_path,
                language="fa",
                fp16=False,
                verbose=False,
                task="transcribe"
            )
            transcribed_text += result["text"] + " "
            for segment in result["segments"]:
                timestamps.append({
                    "text": segment["text"],
                    "start": segment["start"],
                    "end": segment["end"]
                })
        except Exception as e:
            print(f"خطا در پردازش چانک {chunk_path}: {e}")

    return transcribed_text.strip(), timestamps


In [None]:
# 6. پردازش NLP با Hazm و ParsBERT
def process_nlp(transcribed_text, enable_ner=True):
    print("پردازش NLP...")

    try:
        normalizer = Normalizer()
        normalized_text = normalizer.normalize(transcribed_text)

        tokenizer = WordTokenizer()
        tokens = tokenizer.tokenize(normalized_text)
        stopwords = stopwords_list()
        filtered_tokens = [token for token in tokens if token not in stopwords]

        entities = []
        if enable_ner:
            print("استخراج موجودیت‌های نام‌دار (NER)...")
            try:
                ner_tokenizer = AutoTokenizer.from_pretrained("HooshvareLab/bert-fa-base-uncased")
                ner_model = AutoModelForTokenClassification.from_pretrained("HooshvareLab/bert-fa-base-uncased")
                ner_pipeline = pipeline("ner", model=ner_model, tokenizer=ner_tokenizer)
                ner_results = ner_pipeline(normalized_text)
                entities = [
                    {"word": entity["word"], "entity": entity["entity"], "score": entity["score"]}
                    for entity in ner_results if entity["entity"].startswith(("B-", "I-"))
                ]
            except Exception as e:
                print(f"خطا در NER: {e}. ادامه بدون NER...")

        return {
            "normalized_text": normalized_text,
            "tokens": filtered_tokens,
            "entities": entities
        }
    except Exception as e:
        print(f"خطا در پردازش NLP: {e}")
        return {
            "normalized_text": transcribed_text,
            "tokens": [],
            "entities": []
        }

In [None]:
# 7. ذخیره و دانلود خروجی‌ها
def save_and_download_results(audio_file, transcribed_text, nlp_results, timestamps):
    print(f"ذخیره نتایج برای {audio_file}...")
    base_name = os.path.splitext(audio_file)[0]

    text_file = f"{base_name}_transcribed.txt"
    with open(text_file, "w", encoding="utf-8") as f:
        f.write(transcribed_text)

    nlp_file = f"{base_name}_nlp_results.txt"
    with open(nlp_file, "w", encoding="utf-8") as f:
        f.write("متن نرمال‌شده:\n")
        f.write(nlp_results["normalized_text"] + "\n\n")
        f.write("توکن‌های فیلترشده:\n")
        f.write(str(nlp_results["tokens"]) + "\n\n")
        f.write("موجودیت‌های نام‌دار:\n")
        f.write(str(nlp_results["entities"]) + "\n")

    timestamps_file = f"{base_name}_timestamps.txt"
    with open(timestamps_file, "w", encoding="utf-8") as f:
        for ts in timestamps:
            f.write(f"Text: {ts['text']} | Start: {ts['start']}s | End: {ts['end']}s\n")

    try:
        files.download(text_file)
        files.download(nlp_file)
        files.download(timestamps_file)
    except Exception as e:
        print(f"خطا در دانلود فایل‌ها: {e}. فایل‌ها در دایرکتوری Colab ذخیره شدند.")

In [None]:
# 8. پاک‌سازی فایل‌های موقت
def cleanup(chunk_paths):
    print("پاک‌سازی فایل‌های موقت...")
    for chunk_path in chunk_paths:
        if os.path.exists(chunk_path):
            os.remove(chunk_path)

In [None]:
# 9. اجرای اصلی
def main():
    try:
        install_dependencies()
        import_libraries()

        audio_files = find_audio_files()
        print(f"فایل‌های صوتی پیدا شده: {audio_files}")

        for audio_file in audio_files:
            print(f"\nپردازش فایل: {audio_file}")
            chunk_paths = preprocess_audio(audio_file)
            transcribed_text, timestamps = transcribe_audio(chunk_paths, use_large_model=True)
            nlp_results = process_nlp(transcribed_text, enable_ner=True)
            save_and_download_results(audio_file, transcribed_text, nlp_results, timestamps)
            cleanup(chunk_paths)

        print("\nپردازش همه فایل‌ها با موفقیت انجام شد!")
    except Exception as e:
        print(f"خطا رخ داد: {str(e)}")

if __name__ == "__main__":
    main()

نصب کتابخونه‌ها...
خطا رخ داد: module 'numpy' has no attribute 'dtypes'


In [None]:
# 1. نصب تمیز کتابخونه‌ها
def install_dependencies():
    print("حذف نسخه‌های قدیمی کتابخونه‌ها...")
    os.system("pip uninstall -y numpy librosa noisereduce pydub openai-whisper hazm torch transformers")
    print("نصب کتابخونه‌ها با نسخه‌های سازگار...")
    os.system("pip install -q numpy==1.24.3 librosa==0.10.1 noisereduce==2.0.1 pydub==0.25.1 openai-whisper==20231117 hazm==0.10.0 torch==2.0.1 transformers==4.38.2")