In [2]:
# 必要なモジュールをインポート
import pandas as pd
import ast

# CSVファイルを読み込む関数
def load_csv(file_path: str):
    """
    指定されたCSVファイルを読み込む。
    """
    return pd.read_csv(file_path)

# アーティスト名をIDから検索する関数
def map_artist_ids_to_names(artist_ids, all_rappers_df):
    """
    アーティストIDリストをアーティスト名にマッピングする。

    Args:
        artist_ids (str): アーティストIDリスト (文字列形式)
        all_rappers_df (DataFrame): アーティスト情報のDataFrame
    
    Returns:
        str: カンマ区切りのアーティスト名
    """
    # アーティストIDをリストに変換
    artist_ids_list = ast.literal_eval(artist_ids)
    # IDに基づいて名前を取得
    names = [
        all_rappers_df.loc[all_rappers_df['id'] == artist_id, 'name'].values[0]
        for artist_id in artist_ids_list
        if artist_id in all_rappers_df['id'].values
    ]
    return ", ".join(names)

# データを統合して新しいCSVを作成する関数
def create_tracks_with_artist_names(tracks_file: str, rappers_file: str, output_file: str):
    """
    トラック情報とアーティスト情報を統合し、新しいCSVを作成する。

    Args:
        tracks_file (str): トラック情報のCSVファイル
        rappers_file (str): アーティスト情報のCSVファイル
        output_file (str): 出力先のCSVファイル名
    """
    # CSVファイルを読み込む
    tracks_df = load_csv(tracks_file)
    all_rappers_df = load_csv(rappers_file)
    
    # 必要な列をフィルタリング
    tracks_df['artist_names'] = tracks_df['artist_ids'].apply(
        lambda ids: map_artist_ids_to_names(ids, all_rappers_df)
    )
    
    # 必要な列だけを抽出
    result_df = tracks_df[['track_id', 'track_name', 'artist_names']]
    
    # 新しいCSVを保存
    result_df.to_csv(output_file, index=False, encoding='utf-8')
    print(f"データが '{output_file}' に保存されました。")




In [3]:
# 使用例
# 変数にファイル名を指定
tracks_csv = "./wrapper_data/tracks.csv"
all_rappers_csv = "./wrapper_data/all_rappers.csv"
output_csv = "./output/output_tracks.csv"

# 関数を実行
create_tracks_with_artist_names(tracks_csv, all_rappers_csv, output_csv)

データが './output/output_tracks.csv' に保存されました。


# 歌詞取得

In [None]:
# output_tracks.csv を読み込む関数
from get import fetch_lyrics_and_save_to_csv


def get_lyrics_from_output_csv(output_csv: str, token: str, lyrics_output_file: str):
    """
    output_tracks.csv のデータから track_name と最初の artist_name を使用して歌詞を取得。

    Args:
        output_csv (str): 入力元の CSV ファイル (output_tracks.csv)
        token (str): Genius API のトークン
        lyrics_output_file (str): 出力先の CSV ファイル名
    """
    # CSVデータを読み込む
    tracks_df = pd.read_csv(output_csv)

    # track_name と最初の artist_name を取得
    for _, row in tracks_df.iterrows():
        track_name = row['track_name']
        artist_names = row['artist_names']

        # 最初のアーティスト名を取得 (カンマ区切りで複数の場合)
        first_artist = artist_names.split(",")[0].strip()

        # 歌詞を取得して保存
        fetch_lyrics_and_save_to_csv(first_artist, track_name, token, lyrics_output_file)

# 使用例
# Genius API トークンを設定
genius_token = "your_genius_api_token"  # 適切なトークンを入力してください

# 関数を実行
get_lyrics_from_output_csv("output_tracks.csv", genius_token, "lyrics_output.csv")

# ファイル分割

In [1]:
import pandas as pd
import math
import os

# 元のCSVファイルのパス
input_file = './wrapper_data/tracks_rapper.csv'

# 分割後のファイルを保存するディレクトリ（存在しない場合は作成）
output_dir = './output/split_csv_files'
os.makedirs(output_dir, exist_ok=True)

# 分割する行数
chunksize = 1000

# CSVファイルをチャンクごとに読み込み
try:
    # チャンクごとに処理
    for i, chunk in enumerate(pd.read_csv(input_file, chunksize=chunksize), 1):
        output_file = os.path.join(output_dir, f'tracks_rapper_part{i}.csv')
        chunk.to_csv(output_file, index=False)
        print(f'ファイル {output_file} を作成しました。')
    
    print('CSVファイルの分割が完了しました。')

except FileNotFoundError:
    print(f'エラー: ファイル {input_file} が見つかりません。ファイル名とパスを確認してください。')
except pd.errors.EmptyDataError:
    print('エラー: 空のデータが提供されました。CSVファイルの内容を確認してください。')
except Exception as e:
    print(f'予期しないエラーが発生しました: {e}')


ファイル ./output/split_csv_files/tracks_rapper_part1.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part2.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part3.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part4.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part5.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part6.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part7.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part8.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part9.csv を作成しました。
ファイル ./output/split_csv_files/tracks_rapper_part10.csv を作成しました。
CSVファイルの分割が完了しました。
