In [3]:
import pandas as pd
import io
import csv

# Fungsi untuk membaca file CSV dan mengekstrak genre unik
def get_unique_genres(file_path):
    """
    Membaca file CSV yang berisi data film dan mengembalikan set genre unik.

    Args:
        file_path (str): Path ke file CSV.

    Returns:
        set: Set berisi string genre yang unik.
             Mengembalikan set kosong jika ada error atau kolom 'genres' tidak ditemukan.
    """
    unique_genres = set()
    try:
        # Membaca file CSV menggunakan pandas
        # Pandas secara otomatis menangani berbagai macam encoding dan delimiter jika tidak standar
        df = pd.read_csv(file_path)

        # Memastikan kolom 'genres' ada di dalam DataFrame
        if 'genres' not in df.columns:
            print(f"Error: Kolom 'genres' tidak ditemukan di file {file_path}")
            return unique_genres

        # Mengiterasi setiap baris di kolom 'genres'
        for index, row in df.iterrows():
            # Mengambil nilai genre untuk film saat ini
            genre_string = row['genres']

            # Memeriksa apakah nilai genre_string adalah string dan bukan NaN
            if isinstance(genre_string, str):
                # Memisahkan genre jika ada lebih dari satu, dipisahkan dengan koma dan spasi
                # Contoh: "Action, Thriller" akan menjadi ["Action", "Thriller"]
                genres_list = [genre.strip() for genre in genre_string.split(',')]
                
                # Menambahkan setiap genre ke dalam set unique_genres
                # Set secara otomatis hanya akan menyimpan nilai unik
                for genre in genres_list:
                    if genre: # Memastikan genre tidak kosong setelah di-strip
                        unique_genres.add(genre)
            # Jika Anda ingin menangani NaN atau nilai non-string lainnya secara spesifik,
            # Anda bisa menambahkan logika di sini. Untuk saat ini, kita hanya memproses string.

    except FileNotFoundError:
        print(f"Error: File {file_path} tidak ditemukan.")
    except pd.errors.EmptyDataError:
        print(f"Error: File {file_path} kosong.")
    except Exception as e:
        print(f"Terjadi error: {e}")
        
    return unique_genres

# Path ke file CSV Anda
# Pastikan file 'data.csv' berada di direktori yang sama dengan script Python ini,
# atau sediakan path absolut ke file tersebut.
file_path = 'testSample.csv'

# Mendapatkan dan mencetak genre-genre unik
unique_movie_genres = get_unique_genres(file_path)

if unique_movie_genres:
    print("\nGenre film yang unik adalah:")
    for genre in sorted(list(unique_movie_genres)): # Diurutkan agar mudah dibaca
        print(genre)
else:
    print("Tidak ada genre yang ditemukan atau terjadi error saat memproses file.")


Genre film yang unik adalah:
Action
Adventure
Animation
Comedy
Crime
Documentary
Drama
Family
Fantasy
History
Horror
Music
Mystery
Romance
Science Fiction
TV Movie
Thriller
War
Western
