In [21]:
import pandas as pd
import numpy as np
import os

class MovieDataLoader:
    def __init__(self, file_path):
        self.file_path = file_path
        self.extension = os.path.splitext(file_path)[1]
        self.dataframe = None
    def load(self):
        if self.extension == '.txt':
            self.dataframe = pd.read_csv(self.file_path, sep='\t')
        else:
            self.dataframe = pd.read_csv(self.file_path)
        return self.dataframe

class RandomRecommender:
    def __init__(self, rates_loader, movies_loader):
        self.rates_df = rates_loader.load()
        self.movies_df = movies_loader.load()

    def run(self):
        # 랜덤 평점 추가
        self.rates_df['rate_random'] = np.random.rand(len(self.rates_df))

        # 평점 높은 순으로 정렬
        sorted_df = self.rates_df.sort_values(by='rate_random', ascending=False)

        return sorted_df

    def print_top_n(self, n):
        sorted_df = self.run()
        top_n_df = sorted_df.head(n)
        print(top_n_df)


base_path = os.getcwd()

castings_csv_path = base_path + '/data/kmrd/kmr_dataset/datafile/kmrd-small/castings.csv'
countries_csv_path = base_path + '/data/kmrd/kmr_dataset/datafile/kmrd-small/countries.csv'
genres_csv_path = base_path + '/data/kmrd/kmr_dataset/datafile/kmrd-small/genres.csv'
rates_csv_path = base_path + '/data/kmrd/kmr_dataset/datafile/kmrd-small/rates.csv'
movies_txt_path = base_path + '/data/kmrd/kmr_dataset/datafile/kmrd-small/movies.txt'
peoples_txt_path = base_path + '/data/kmrd/kmr_dataset/datafile/kmrd-small/peoples.txt'

# 파일 경로 리스트
db_paths = [
    castings_csv_path,
    countries_csv_path,
    genres_csv_path,
    rates_csv_path,
    movies_txt_path,
    peoples_txt_path
]

# 모든 DataFrame을 저장할 리스트
dataframes = []

# 각 파일을 읽어들여 리스트에 추가
for db_path in db_paths:
    loader = MovieDataLoader(db_path)
    dataframes.append(loader.load())

# 첫 번째 DataFrame의 첫 몇 줄을 출력
print(dataframes[5])

      people    korean        original
0          5    아담 볼드윈    Adam Baldwin
1          8   애드리안 라인     Adrian Lyne
2          9     에이단 퀸     Aidan Quinn
3         13  구로사와 아키라  Akira Kurosawa
4         15     알 파치노       Al Pacino
...      ...       ...             ...
7167  390433       김형진             NaN
7168  398299       이정진             NaN
7169  417051    노만 라이트   Norman Wright
7170  417052  그레이엄 헤이드     Graham Heid
7171  420466       김미란             NaN

[7172 rows x 3 columns]
