<a href="https://colab.research.google.com/github/senaayy/imdb/blob/main/Untitled16.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import numpy as np
import gradio as gr
import os

print("--- Film Öneri Sistemi Başlatılıyor ---")

# --- ADIM 1: Veri Seti Yükleniyor ve Keşfediliyor ---
print("ADIM 1: Veri Seti Yükleniyor ve Keşfediliyor...")

csv_file_name = "imdb-top-rated-movies-user-rated.csv" # Yüklediğiniz CSV dosyasının adı
file_path = os.path.join("/content/", csv_file_name)

if not os.path.exists(file_path):
    print(f"HATA: '{csv_file_name}' dosyası '{file_path}' yolunda bulunamadı.")
    print("Lütfen CSV dosyasını Colab'a doğru şekilde yüklediğinizden ve 'csv_file_name' değişkenini doğru ayarladığınızdan emin olun.")
    exit()

df = pd.read_csv(file_path)

print(f"'{csv_file_name}' başarıyla yüklendi. Toplam {len(df)} film bulundu.")
print("\nADIM 1: Veri Seti Keşfi Tamamlandı.")

# --- ADIM 2: Veri Temizliği ve Ön İşleme ---
print("\nADIM 2: Veri Temizliği ve Ön İşleme Başlıyor (Türler Basitleştiriliyor)...")

df_filtered = df[['Title', 'IMDb Rating', 'Tags', 'Director', 'Stars', 'Votes']].copy()

df_filtered['Stars'].fillna('', inplace=True)

# Türleri Basitleştirme için eşleme sözlüğü
genre_mapping = {
    'action': ['action', 'action epic', 'gun fu', 'one-person army action', 'car action', 'kung fu', 'martial arts', 'martial-arts'],
    'adventure': ['adventure', 'adventure epic', 'desert adventure', 'animal adventure', 'space adventure', 'swashbuckler'],
    'comedy': ['comedy', 'romantic comedy', 'buddy comedy', 'sitcom', 'black comedy', 'satire', 'spoof', 'parody', 'slapstick', 'screwball comedy', 'dark comedy', 'body swap comedy'],
    'drama': ['drama', 'period drama', 'cop drama', 'legal drama', 'medical drama', 'teen drama', 'psychological drama', 'melodrama', 'historical drama', 'biography', 'romantic drama', 'showbiz drama', 'tragedy'],
    'thriller': ['thriller', 'crime thriller', 'spy thriller', 'psychological thriller', 'mystery thriller', 'political thriller', 'conspiracy thriller', 'erotic thriller', 'cyber thriller', 'suspense'],
    'sci-fi': ['sci-fi', 'space sci-fi', 'dystopian sci-fi', 'cyberpunk', 'alien invasion', 'mutant', 'robot', 'post-apocalyptic', 'time travel'],
    'fantasy': ['fantasy', 'dark fantasy', 'sword & sorcery', 'fairy tale', 'epic fantasy'],
    'horror': ['horror', 'slasher', 'supernatural horror', 'body horror', 'zombie', 'monster', 'vampire', 'werewolf', 'ghost'],
    'mystery': ['mystery', 'suspense mystery', 'cozy mystery', 'whodunnit', 'detective', 'police procedural'],
    'crime': ['crime', 'gangster', 'heist', 'mob', 'true crime'],
    'romance': ['romance', 'romantic comedy', 'romantic drama'],
    'animation': ['animation', 'adult animation', 'anime', 'computer animation', 'drawn animation', 'stop-motion animation'],
    'family': ['family', 'kids'],
    'western': ['western', 'classic western', 'neo-western'],
    'war': ['war', 'war drama'],
    'history': ['history', 'historical drama', 'biography'],
    'music': ['music', 'musical', 'classic musical', 'concert'],
    'documentary': ['documentary', 'docudrama', 'mockumentary']
}

# Reverse mapping: her bir alt türü ana türe eşleştirelim
reverse_genre_map = {}
for main_genre, sub_genres in genre_mapping.items():
    for sub_genre in sub_genres:
        reverse_genre_map[sub_genre] = main_genre

def map_to_main_genres(tag_list):
    main_genres = set()
    for tag in tag_list:
        # Alt türü ana türe eşle, yoksa orijinalini kullan (veya hiç ekleme)
        # Orijinalini kullanmak yerine, eğer haritalanmamışsa dışarıda bırakalım, böylece daha az gürültü olur
        if tag in reverse_genre_map:
            main_genres.add(reverse_genre_map[tag])
    return list(main_genres)


def clean_and_split(text_series):
    # Eğer değer zaten NaN ise, boş liste döndür
    if pd.isna(text_series):
        return []

    # ensure it's a string before processing
    item = str(text_series)
    item = item.replace('"', '').replace("'", '').strip()
    # "Sci,Fi" gibi hatalı virgülleri düzeltmek için özel durum
    item = item.replace('sci, fi', 'sci-fi')

    split_items = [s.strip().lower() for s in item.split(',') if s.strip()]
    return split_items


df_filtered['Tags_cleaned_raw'] = df_filtered['Tags'].apply(clean_and_split)
df_filtered['Director_cleaned'] = df_filtered['Director'].apply(clean_and_split)
df_filtered['Stars_cleaned'] = df_filtered['Stars'].apply(clean_and_split)

# Yeni basitleştirilmiş türler sütunu
df_filtered['Tags_cleaned'] = df_filtered['Tags_cleaned_raw'].apply(map_to_main_genres)


def convert_votes_to_numeric(votes_str):
    if isinstance(votes_str, str):
        votes_str = votes_str.replace(",", "") # Virgülleri temizle (örn. "1,200,000" -> "1200000")
        if 'K' in votes_str:
            return float(votes_str.replace('K', '')) * 1000
        elif 'M' in votes_str:
            return float(votes_str.replace('M', '')) * 1_000_000
    try: # Zaten sayısal ise veya başka bir formatta ise direkt döndür
        return float(votes_str)
    except ValueError:
        return np.nan # Dönüştürülemezse NaN döndür

df_filtered['Votes_numeric'] = df_filtered['Votes'].apply(convert_votes_to_numeric)
df_filtered.drop('Votes', axis=1, inplace=True)
df_filtered.dropna(subset=['Votes_numeric'], inplace=True) # NaN olanları düşür

print("\nADIM 2: Veri Temizliği ve Ön İşleme Tamamlandı.")


# --- ADIM 3: Film Öneri Sistemi Mantığını Oluşturma ---
print("\nADIM 3: Film Öneri Sistemi Mantığı Oluşturuluyor...")

# all_tags listesini, sadece eşlenmiş ana türlerden oluşturalım
# Bu sayede Gradio arayüzünde çok daha temiz ve yönetilebilir bir tür listesi olacak.
all_tags = sorted(list(set([tag for sublist in df_filtered['Tags_cleaned'] for tag in sublist if tag in genre_mapping])))

all_directors = sorted(list(set([director for sublist in df_filtered['Director_cleaned'] for director in sublist])))
all_stars = sorted(list(set([star for sublist in df_filtered['Stars_cleaned'] for star in sublist])))


def get_movie_recommendations(selected_tags, selected_directors, selected_stars, min_imdb_rating_slider, num_recommendations_slider):

    # Hata ayıklama çıktıları
    print(f"\n--- Öneri İsteği ---")
    print(f"Seçilen Türler (Gradio'dan): {selected_tags}")
    print(f"Seçilen Yönetmenler (Gradio'dan): {selected_directors}")
    print(f"Seçilen Oyuncular (Gradio'dan): {selected_stars}")
    print(f"Minimum IMDb Puanı: {min_imdb_rating_slider}")
    print(f"Öneri Sayısı: {num_recommendations_slider}")
    print(f"Başlangıç DataFrame boyutu: {len(df_filtered)}")

    # Gradio'dan gelen seçili değerler tuple olarak gelebilir, listeye çevirelim
    selected_tags_list = list(selected_tags) if selected_tags else []
    selected_directors_list = list(selected_directors) if selected_directors else []
    selected_stars_list = list(selected_stars) if selected_stars else []

    recommendations_df = df_filtered.copy()

    # 1. IMDb Puanına Göre Filtreleme
    recommendations_df = recommendations_df[recommendations_df['IMDb Rating'] >= min_imdb_rating_slider]
    print(f"IMDb Puanı filtrelemesi sonrası: {len(recommendations_df)} film")

    # 2. Türlere Göre Filtreleme
    if selected_tags_list:
        recommendations_df = recommendations_df[
            recommendations_df['Tags_cleaned'].apply(lambda x: any(tag in x for tag in selected_tags_list))
        ]
        print(f"Tür filtrelemesi sonrası: {len(recommendations_df)} film")

    # 3. Yönetmenlere Göre Filtreleme
    if selected_directors_list:
        recommendations_df = recommendations_df[
            recommendations_df['Director_cleaned'].apply(lambda x: any(director in x for director in selected_directors_list))
        ]
        print(f"Yönetmen filtrelemesi sonrası: {len(recommendations_df)} film")

    # 4. Oyunculara Göre Filtreleme
    if selected_stars_list:
        recommendations_df = recommendations_df[
            recommendations_df['Stars_cleaned'].apply(lambda x: any(star in x for star in selected_stars_list))
        ]
        print(f"Oyuncu filtrelemesi sonrası: {len(recommendations_df)} film")

    # 5. Sonuçları IMDb Puanına (ve Votes_numeric'e) göre sıralama
    recommendations_df = recommendations_df.sort_values(
        by=['IMDb Rating', 'Votes_numeric'],
        ascending=[False, False]
    ).reset_index(drop=True)

    # Sadece belirli sayıda öneri döndür (Slider değeri kullanılıyor)
    top_recommendations = recommendations_df.head(num_recommendations_slider)

    if top_recommendations.empty:
        print("Kriterlere uygun film bulunamadı.")
        return "Üzgünüz, seçtiğiniz kriterlere uygun film bulunamadı."
    else:
        print(f"Toplam {len(top_recommendations)} öneri bulundu.")
        recommendation_list = []
        for idx, row in top_recommendations.iterrows():
            directors_str = ", ".join([d.title() for d in row['Director_cleaned']])
            stars_str = ", ".join([s.title() for s in row['Stars_cleaned']])
            tags_str = ", ".join([t.title() for t in row['Tags_cleaned']])

            recommendation_list.append(
                f"**{row['Title']}** (IMDb: {row['IMDb Rating']:.1f} ⭐️, Oylar: {int(row['Votes_numeric']):,} 🗳️)"
                f"\n  Yönetmen: {directors_str if directors_str else 'Bilinmiyor'}"
                f"\n  Oyuncular: {stars_str if stars_str else 'Bilinmiyor'}"
                f"\n  Türler: {tags_str if tags_str else 'Bilinmiyor'}"
                f"\n---"
            )
        return "\n".join(recommendation_list)

print("\nADIM 3: Film Öneri Sistemi Mantığı Oluşturuldu.")


# --- ADIM 4: Gradio Web Arayüzü Oluşturma ---
print("\nADIM 4: Gradio Web Arayüzü Oluşturuluyor...")

with gr.Blocks(theme=gr.themes.Soft()) as demo:
    gr.Markdown(
        """
        # 🎬 Film Öneri Sistemi
        Favori film özelliklerinizi seçin, yüksek IMDb puanına sahip filmleri keşfedin!
        """
    )

    with gr.Row():
        with gr.Column():
            gr.Markdown("### Film Özelliklerini Seçin:")

            tags_input = gr.CheckboxGroup(
                label="Film Türleri",
                choices=all_tags,
                value=['action', 'drama'], # Varsayılan değerler
                interactive=True
            )

            directors_input = gr.Dropdown(
                label="Yönetmenler",
                choices=all_directors,
                multiselect=True,
                allow_custom_value=False,
                interactive=True
            )

            stars_input = gr.Dropdown(
                label="Oyuncular",
                choices=all_stars,
                multiselect=True,
                allow_custom_value=False,
                interactive=True
            )

            min_imdb_rating_slider = gr.Slider(
                minimum=df_filtered['IMDb Rating'].min(),
                maximum=df_filtered['IMDb Rating'].max(),
                step=0.1,
                value=7.6, # Başlangıçta en düşük puanı varsayılan yapalım, böylece hep sonuç gelir
                label="Minimum IMDb Puanı"
            )

            num_recommendations_slider = gr.Slider(
                minimum=1,
                maximum=20,
                step=1,
                value=10, # Varsayılan öneri sayısı
                label="Öneri Sayısı"
            )

            recommend_btn = gr.Button("🚀 Film Önerilerini Getir", variant="primary", size="lg")

        with gr.Column():
            gr.Markdown("### Önerilen Filmler:")
            output_text = gr.Markdown(label="Önerileriniz burada listelenecektir.", value="Henüz bir öneri yapılmadı. Özellikleri seçip butona tıklayın!")

    # Butonun click olayına fonksiyonu bağla
    recommend_btn.click(
        fn=get_movie_recommendations,
        inputs=[tags_input, directors_input, stars_input, min_imdb_rating_slider, num_recommendations_slider],
        outputs=output_text
    )

    gr.Examples(
        examples=[
            [['action'], [], [], 7.6, 5],
            [['comedy', 'drama'], [], [], 7.8, 3],
            [[], ['christopher nolan'], [], 8.0, 5],
            [[], [], ['leonardo dicaprio'], 7.8, 3],
        ],
        inputs=[tags_input, directors_input, stars_input, min_imdb_rating_slider, num_recommendations_slider],
        outputs=output_text,
        fn=get_movie_recommendations, # Examples için de fonksiyonu belirtmek önemli
        label="Örnek Önerileri Deneyin"
    )

    gr.Markdown(
        """
        ---
        ### ℹ️ Nasıl Kullanılır?
        1.  **Film Türleri, Yönetmenler ve Oyuncular** bölümlerinden istediğiniz filtreleri seçin (birden fazla seçim yapabilirsiniz).
        2.  **Minimum IMDb Puanı** ve **Öneri Sayısı** çubuklarını ayarlayın.
        3.  **"Film Önerilerini Getir"** butonuna tıklayın.
        4.  Öneriler sağ panelde görünecektir!
        """
    )

demo.launch(share=True)
print("\nADIM 4: Gradio Web Arayüzü Başlatıldı.")

--- Film Öneri Sistemi Başlatılıyor ---
ADIM 1: Veri Seti Yükleniyor ve Keşfediliyor...
'imdb-top-rated-movies-user-rated.csv' başarıyla yüklendi. Toplam 950 film bulundu.

ADIM 1: Veri Seti Keşfi Tamamlandı.

ADIM 2: Veri Temizliği ve Ön İşleme Başlıyor (Türler Basitleştiriliyor)...

ADIM 2: Veri Temizliği ve Ön İşleme Tamamlandı.

ADIM 3: Film Öneri Sistemi Mantığı Oluşturuluyor...

ADIM 3: Film Öneri Sistemi Mantığı Oluşturuldu.

ADIM 4: Gradio Web Arayüzü Oluşturuluyor...


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_filtered['Stars'].fillna('', inplace=True)


Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://ab663e1091ce1d1b53.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)



ADIM 4: Gradio Web Arayüzü Başlatıldı.


In [None]:
# Kodu çalıştırmadan önce:
# 1. Colab'da yeni bir not defteri açın (veya mevcut not defterinin tüm çalışma zamanını sıfırlayın: Çalışma Zamanı -> Çalışma zamanını sıfırla).
# 2. Çalışma Zamanı -> Çalışma zamanı türünü değiştir -> Donanım hızlandırıcıyı "None" olarak ayarlayın. (GPU gerekmiyor ama CPU daha stabil çalışabilir)
# 3. 'imdb-top-rated-movies-user-rated.csv' dosyasını sol paneldeki dosya simgesini kullanarak Colab'a yükleyin.

import pandas as pd
import numpy as np
import gradio as gr
import os
from sentence_transformers import SentenceTransformer, util # Sentence Transformers kütüphanesi eklendi
import torch # Embedding'leri Torch tensörü olarak işlemek için

print("--- Film Öneri Sistemi Başlatılıyor (NLP Entegrasyonu ile) ---")

# --- ADIM 0: Gerekli Kütüphaneleri Yükleme (Colab'da genellikle zaten yüklüdür ama emin olmak için) ---
# Bu komutları ayrı bir hücrede çalıştırırsanız daha iyi olur, ancak tek hücrede de sorun çıkarmaz.
# Bu kod bloğu, sadece tek hücrede çalışacak şekilde ayarlandığı için burada bırakılmıştır.
try:
    import sentence_transformers
except ImportError:
    print("sentence-transformers kütüphanesi yüklü değil, yükleniyor...")
    !pip install sentence-transformers # Colab'da ! ile terminal komutu çalıştırırız
    from sentence_transformers import SentenceTransformer, util
    print("sentence-transformers yüklendi.")

# --- ADIM 1: Veri Seti Yükleniyor ve Keşfediliyor ---
print("\nADIM 1: Veri Seti Yükleniyor ve Keşfediliyor...")

csv_file_name = "imdb-top-rated-movies-user-rated.csv" # Yüklediğiniz CSV dosyasının adı
file_path = os.path.join("/content/", csv_file_name)

if not os.path.exists(file_path):
    print(f"HATA: '{csv_file_name}' dosyası '{file_path}' yolunda bulunamadı.")
    print("Lütfen CSV dosyasını Colab'a doğru şekilde yüklediğinizden ve 'csv_file_name' değişkenini doğru ayarladığınızdan emin olun.")
    exit()

df = pd.read_csv(file_path)

print(f"'{csv_file_name}' başarıyla yüklendi. Toplam {len(df)} film bulundu.")
print("ADIM 1: Veri Seti Keşfi Tamamlandı.")


# --- ADIM 2: Veri Temizliği ve Ön İşleme ---
print("\nADIM 2: Veri Temizliği ve Ön İşleme Başlıyor (NLP Entegrasyonu için Hazırlık)...")

df_filtered = df[['Title', 'IMDb Rating', 'Tags', 'Director', 'Stars', 'Votes', 'Description']].copy() # 'Description' sütunu eklendi

df_filtered['Stars'].fillna('', inplace=True)
df_filtered['Description'].fillna('', inplace=True) # Description boş olan filmler için

# Türleri Basitleştirme için eşleme sözlüğü (Öncekiyle aynı)
genre_mapping = {
    'action': ['action', 'action epic', 'gun fu', 'one-person army action', 'car action', 'kung fu', 'martial arts', 'martial-arts'],
    'adventure': ['adventure', 'adventure epic', 'desert adventure', 'animal adventure', 'space adventure', 'swashbuckler'],
    'comedy': ['comedy', 'romantic comedy', 'buddy comedy', 'sitcom', 'black comedy', 'satire', 'spoof', 'parody', 'slapstick', 'screwball comedy', 'dark comedy', 'body swap comedy'],
    'drama': ['drama', 'period drama', 'cop drama', 'legal drama', 'medical drama', 'teen drama', 'psychological drama', 'melodrama', 'historical drama', 'biography', 'romantic drama', 'showbiz drama', 'tragedy'],
    'thriller': ['thriller', 'crime thriller', 'spy thriller', 'psychological thriller', 'mystery thriller', 'political thriller', 'conspiracy thriller', 'erotic thriller', 'cyber thriller', 'suspense'],
    'sci-fi': ['sci-fi', 'space sci-fi', 'dystopian sci-fi', 'cyberpunk', 'alien invasion', 'mutant', 'robot', 'post-apocalyptic', 'time travel'],
    'fantasy': ['fantasy', 'dark fantasy', 'sword & sorcery', 'fairy tale', 'epic fantasy'],
    'horror': ['horror', 'slasher', 'supernatural horror', 'body horror', 'zombie', 'monster', 'vampire', 'werewolf', 'ghost'],
    'mystery': ['mystery', 'suspense mystery', 'cozy mystery', 'whodunnit', 'detective', 'police procedural'],
    'crime': ['crime', 'gangster', 'heist', 'mob', 'true crime'],
    'romance': ['romance', 'romantic comedy', 'romantic drama'],
    'animation': ['animation', 'adult animation', 'anime', 'computer animation', 'drawn animation', 'stop-motion animation'],
    'family': ['family', 'kids'],
    'western': ['western', 'classic western', 'neo-western'],
    'war': ['war', 'war drama'],
    'history': ['history', 'historical drama', 'biography'],
    'music': ['music', 'musical', 'classic musical', 'concert'],
    'documentary': ['documentary', 'docudrama', 'mockumentary']
}

reverse_genre_map = {}
for main_genre, sub_genres in genre_mapping.items():
    for sub_genre in sub_genres:
        reverse_genre_map[sub_genre] = main_genre

def map_to_main_genres(tag_list):
    main_genres = set()
    for tag in tag_list:
        if tag in reverse_genre_map:
            main_genres.add(reverse_genre_map[tag])
    return list(main_genres)

def clean_and_split(text_series):
    if pd.isna(text_series):
        return []

    item = str(text_series)
    item = item.replace('"', '').replace("'", '').strip()
    item = item.replace('sci, fi', 'sci-fi')

    split_items = [s.strip().lower() for s in item.split(',') if s.strip()]
    return split_items


df_filtered['Tags_cleaned_raw'] = df_filtered['Tags'].apply(clean_and_split)
df_filtered['Director_cleaned'] = df_filtered['Director'].apply(clean_and_split)
df_filtered['Stars_cleaned'] = df_filtered['Stars'].apply(clean_and_split)

df_filtered['Tags_cleaned'] = df_filtered['Tags_cleaned_raw'].apply(map_to_main_genres)


def convert_votes_to_numeric(votes_str):
    if isinstance(votes_str, str):
        votes_str = votes_str.replace(",", "")
        if 'K' in votes_str:
            return float(votes_str.replace('K', '')) * 1000
        elif 'M' in votes_str:
            return float(votes_str.replace('M', '')) * 1_000_000
    try:
        return float(votes_str)
    except ValueError:
        return np.nan

df_filtered['Votes_numeric'] = df_filtered['Votes'].apply(convert_votes_to_numeric)
df_filtered.drop('Votes', axis=1, inplace=True)
df_filtered.dropna(subset=['Votes_numeric'], inplace=True) # NaN olanları düşür

# NLP için filmin açıklama metnini birleştirme
df_filtered['Combined_Text'] = df_filtered['Title'] + ". " + \
                               df_filtered['Description'] + ". " + \
                               df_filtered['Tags_cleaned'].apply(lambda x: ", ".join(x)) + ". " + \
                               df_filtered['Director_cleaned'].apply(lambda x: ", ".join(x)) + ". " + \
                               df_filtered['Stars_cleaned'].apply(lambda x: ", ".join(x))

print("\nADIM 2: Veri Temizliği ve Ön İşleme Tamamlandı.")


# --- ADIM 3: NLP Modelini Yükleme ve Film Embedding'lerini Oluşturma ---
print("\nADIM 3: NLP Modelini Yükleniyor ve Embedding'ler Oluşturuluyor...")

# Model yükleme
# Bu model, metinleri sayısal vektörlere dönüştürür.
model_name = 'sentence-transformers/all-MiniLM-L6-v2'
sentence_model = SentenceTransformer(model_name)

# Tüm filmlerin Combined_Text sütunundan embedding'lerini oluşturma
# Bu işlem biraz zaman alabilir (CPU'da birkaç dakika)
print(f"'{model_name}' modelinden {len(df_filtered)} film için embedding'ler oluşturuluyor...")
film_embeddings = sentence_model.encode(df_filtered['Combined_Text'].tolist(), convert_to_tensor=True, show_progress_bar=True)
print("Embedding'ler başarıyla oluşturuldu.")

print("\nADIM 3: NLP Modelini Yükleme ve Film Embedding'lerini Oluşturma Tamamlandı.")


# --- ADIM 4: Film Öneri Sistemi Mantığını Oluşturma (NLP Benzerliği Eklendi) ---
print("\nADIM 4: Film Öneri Sistemi Mantığı Oluşturuluyor (NLP ile)...")

all_tags = sorted(list(set([tag for sublist in df_filtered['Tags_cleaned'] for tag in sublist if tag in genre_mapping])))
all_directors = sorted(list(set([director for sublist in df_filtered['Director_cleaned'] for director in sublist])))
all_stars = sorted(list(set([star for sublist in df_filtered['Stars_cleaned'] for star in sublist])))

def get_movie_recommendations(selected_tags, selected_directors, selected_stars, min_imdb_rating_slider, num_recommendations_slider, search_text=""):

    # Hata ayıklama çıktıları
    print(f"\n--- Öneri İsteği ---")
    print(f"Seçilen Türler: {selected_tags}")
    print(f"Seçilen Yönetmenler: {selected_directors}")
    print(f"Seçilen Oyuncular: {selected_stars}")
    print(f"Minimum IMDb Puanı: {min_imdb_rating_slider}")
    print(f"Öneri Sayısı: {num_recommendations_slider}")
    print(f"Arama Metni: '{search_text}'")
    print(f"Başlangıç DataFrame boyutu: {len(df_filtered)}")

    selected_tags_list = list(selected_tags) if selected_tags else []
    selected_directors_list = list(selected_directors) if selected_directors else []
    selected_stars_list = list(selected_stars) if selected_stars else []

    recommendations_df = df_filtered.copy()

    # 1. IMDb Puanına Göre Filtreleme
    recommendations_df = recommendations_df[recommendations_df['IMDb Rating'] >= min_imdb_rating_slider]
    print(f"IMDb Puanı filtrelemesi sonrası: {len(recommendations_df)} film")

    # 2. Türlere Göre Filtreleme
    if selected_tags_list:
        recommendations_df = recommendations_df[
            recommendations_df['Tags_cleaned'].apply(lambda x: any(tag in x for tag in selected_tags_list))
        ]
        print(f"Tür filtrelemesi sonrası: {len(recommendations_df)} film")

    # 3. Yönetmenlere Göre Filtreleme
    if selected_directors_list:
        recommendations_df = recommendations_df[
            recommendations_df['Director_cleaned'].apply(lambda x: any(director in x for director in selected_directors_list))
        ]
        print(f"Yönetmen filtrelemesi sonrası: {len(recommendations_df)} film")

    # 4. Oyunculara Göre Filtreleme
    if selected_stars_list:
        recommendations_df = recommendations_df[
            recommendations_df['Stars_cleaned'].apply(lambda x: any(star in x for star in selected_stars_list))
        ]
        print(f"Oyuncu filtrelemesi sonrası: {len(recommendations_df)} film")

    # --- NLP Benzerlik Hesaplaması (Sadece arama metni varsa) ---
    if search_text and len(recommendations_df) > 0:
        print(f"'{search_text}' için NLP benzerlik araması yapılıyor...")

        # Arama metninin embedding'ini oluştur
        query_embedding = sentence_model.encode(search_text, convert_to_tensor=True)

        # Mevcut filtrelenmiş filmlerin embedding'lerini al
        # Dikkat: film_embeddings'in indeksi df_filtered'ın indeksiyle eşleşmeli
        # Bu yüzden recommendations_df'in index'ini kullanarak doğru embedding'leri seçiyoruz
        filtered_indices = recommendations_df.index.tolist()
        current_film_embeddings = film_embeddings[filtered_indices]

        # Kosinüs benzerliği hesapla
        cosine_scores = util.cos_sim(query_embedding, current_film_embeddings)[0]

        # Benzerlik skorlarını DataFrame'e ekle
        recommendations_df['Similarity_Score'] = cosine_scores.cpu().numpy() # GPU'dan CPU'ya taşı

        # Benzerlik skoruna göre sırala (NLP filtresi aktifse)
        recommendations_df = recommendations_df.sort_values(
            by=['Similarity_Score', 'IMDb Rating', 'Votes_numeric'],
            ascending=[False, False, False] # Benzerlik, IMDb, Oylar azalan
        ).reset_index(drop=True)
        print(f"NLP benzerlik filtrelemesi sonrası: {len(recommendations_df)} film")


    # 5. Sonuçları IMDb Puanına (ve Votes_numeric'e) göre sıralama (NLP filtresi aktif değilse veya son sırada)
    # Eğer search_text yoksa veya NLP benzerliği zaten kullanıldıysa, IMDb/Votes sıralaması geçerli olacak
    if not search_text: # Eğer arama metni yoksa sadece IMDb ve Votes'a göre sırala
        recommendations_df = recommendations_df.sort_values(
            by=['IMDb Rating', 'Votes_numeric'],
            ascending=[False, False]
        ).reset_index(drop=True)

    # Sadece belirli sayıda öneri döndür (Slider değeri kullanılıyor)
    top_recommendations = recommendations_df.head(num_recommendations_slider)

    if top_recommendations.empty:
        print("Kriterlere uygun film bulunamadı.")
        return "Üzgünüz, seçtiğiniz kriterlere uygun film bulunamadı."
    else:
        print(f"Toplam {len(top_recommendations)} öneri bulundu.")
        recommendation_list = []
        for idx, row in top_recommendations.iterrows():
            directors_str = ", ".join([d.title() for d in row['Director_cleaned']])
            stars_str = ", ".join([s.title() for s in row['Stars_cleaned']])
            tags_str = ", ".join([t.title() for t in row['Tags_cleaned']])

            similarity_info = ""
            if 'Similarity_Score' in row and search_text:
                similarity_info = f", Benzerlik: {row['Similarity_Score']:.2f}"

            recommendation_list.append(
                f"{row['Title']}** (IMDb: {row['IMDb Rating']:.1f} ⭐, Oylar: {int(row['Votes_numeric']):,} 🗳{similarity_info})"
                f"\n  Yönetmen: {directors_str if directors_str else 'Bilinmiyor'}"
                f"\n  Oyuncular: {stars_str if stars_str else 'Bilinmiyor'}"
                f"\n  Türler: {tags_str if tags_str else 'Bilinmiyor'}"
                f"\n---"
            )
        return "\n".join(recommendation_list)

print("\nADIM 4: Film Öneri Sistemi Mantığı Oluşturuldu (NLP Entegrasyonu ile).")


# --- ADIM 5: Gradio Web Arayüzü Oluşturma (Arama Çubuğu Eklendi) ---
print("\nADIM 5: Gradio Web Arayüzü Oluşturuluyor (NLP Arama Çubuğu Eklendi)...")

with gr.Blocks(theme=gr.themes.Soft()) as demo:
    gr.Markdown(
        """
        # 🎬 Film Öneri Sistemi
        Favori film özelliklerinizi seçin, yüksek IMDb puanına sahip filmleri keşfedin!
        İstediğiniz bir film veya konu hakkında yazın, benzerlerini de bulalım.
        """
    )

    with gr.Row():
        with gr.Column():
            gr.Markdown("### Film Özelliklerini Seçin:")

            tags_input = gr.CheckboxGroup(
                label="Film Türleri",
                choices=all_tags,
                value=['action', 'drama'], # Varsayılan değerler
                interactive=True
            )

            directors_input = gr.Dropdown(
                label="Yönetmenler",
                choices=all_directors,
                multiselect=True,
                allow_custom_value=False,
                interactive=True
            )

            stars_input = gr.Dropdown(
                label="Oyuncular",
                choices=all_stars,
                multiselect=True,
                allow_custom_value=False,
                interactive=True
            )

            min_imdb_rating_slider = gr.Slider(
                minimum=df_filtered['IMDb Rating'].min(),
                maximum=df_filtered['IMDb Rating'].max(),
                step=0.1,
                value=7.6, # Başlangıçta en düşük puanı varsayılan yapalım
                label="Minimum IMDb Puanı"
            )

            num_recommendations_slider = gr.Slider(
                minimum=1,
                maximum=20,
                step=1,
                value=10, # Varsayılan öneri sayısı
                label="Öneri Sayısı"
            )

            # Yeni arama metni girişi
            search_text_input = gr.Textbox(
                label="Film Adı veya Konu Hakkında Ara (NLP Tabanlı Benzerlik)",
                placeholder="Örneğin: Batman, uzay filmi, zamanda yolculuk..."
            )

            recommend_btn = gr.Button("🚀 Film Önerilerini Getir", variant="primary", size="lg")

        with gr.Column():
            gr.Markdown("### Önerilen Filmler:")
            output_text = gr.Markdown(label="Önerileriniz burada listelenecektir.", value="Henüz bir öneri yapılmadı. Özellikleri seçip butona tıklayın!")

    recommend_btn.click(
        fn=get_movie_recommendations,
        inputs=[tags_input, directors_input, stars_input, min_imdb_rating_slider, num_recommendations_slider, search_text_input],
        outputs=output_text
    )

    gr.Examples(
        examples=[
            [['action'], [], [], 7.6, 5, ""], # Sadece Aksiyon, arama yok
            [['comedy', 'drama'], [], [], 7.8, 3, ""], # Komedi/Drama, arama yok
            [[], ['christopher nolan'], [], 8.0, 5, ""], # Sadece Christopher Nolan filmleri, arama yok
            [[], [], ['leonardo dicaprio'], 7.8, 3, ""], # Sadece Leonardo DiCaprio filmleri, arama yok
            [[], [], [], 8.0, 5, "kahramanlık ve bilim kurgu"], # Sadece arama metni
            [['action', 'sci-fi'], [], [], 7.8, 5, "uzaylı istilası ve kaçış"], # Tür ve arama metni
        ],
        inputs=[tags_input, directors_input, stars_input, min_imdb_rating_slider, num_recommendations_slider, search_text_input],
        outputs=output_text,
        fn=get_movie_recommendations,
        label="Örnek Önerileri Deneyin"
    )

    gr.Markdown(
        """
        ---
        ### ℹ Nasıl Kullanılır?
        1.  *Film Türleri, Yönetmenler ve Oyuncular* bölümlerinden istediğiniz filtreleri seçin (birden fazla seçim yapabilirsiniz).
        2.  *Minimum IMDb Puanı* ve *Öneri Sayısı* çubuklarını ayarlayın.
        3.  İsterseniz *"Film Adı veya Konu Hakkında Ara"* kutucuğuna bir film adı, konu veya anahtar kelime yazın.
        4.  *"🚀 Film Önerilerini Getir"* butonuna tıklayın.
        5.  Öneriler sağ panelde görünecektir!
        """
    )

demo.launch(share=True)
print("\nADIM 5: Gradio Web Arayüzü Başlatıldı (NLP Arama Aktif).")

--- Film Öneri Sistemi Başlatılıyor (NLP Entegrasyonu ile) ---

ADIM 1: Veri Seti Yükleniyor ve Keşfediliyor...
'imdb-top-rated-movies-user-rated.csv' başarıyla yüklendi. Toplam 950 film bulundu.
ADIM 1: Veri Seti Keşfi Tamamlandı.

ADIM 2: Veri Temizliği ve Ön İşleme Başlıyor (NLP Entegrasyonu için Hazırlık)...

ADIM 2: Veri Temizliği ve Ön İşleme Tamamlandı.

ADIM 3: NLP Modelini Yükleniyor ve Embedding'ler Oluşturuluyor...


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_filtered['Stars'].fillna('', inplace=True)
The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_filtered['Description'].fillna('', inplace=True) # Description boş olan filmler için
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face 

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/612 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/350 [00:00<?, ?B/s]

vocab.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

'sentence-transformers/all-MiniLM-L6-v2' modelinden 950 film için embedding'ler oluşturuluyor...


Batches:   0%|          | 0/30 [00:00<?, ?it/s]

Embedding'ler başarıyla oluşturuldu.

ADIM 3: NLP Modelini Yükleme ve Film Embedding'lerini Oluşturma Tamamlandı.

ADIM 4: Film Öneri Sistemi Mantığı Oluşturuluyor (NLP ile)...

ADIM 4: Film Öneri Sistemi Mantığı Oluşturuldu (NLP Entegrasyonu ile).

ADIM 5: Gradio Web Arayüzü Oluşturuluyor (NLP Arama Çubuğu Eklendi)...
Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://5f7b4566a5152cd5e1.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)



ADIM 5: Gradio Web Arayüzü Başlatıldı (NLP Arama Aktif).
