<a href="https://colab.research.google.com/github/hdorazi/LBNC/blob/main/%5B%EC%9D%91%EC%9A%A9%EC%96%B8%EC%96%B4%ED%95%99%5D%20%EA%B0%80%EC%82%AC%20%ED%98%95%ED%83%9C%EC%86%8C%20%EB%B6%84%EC%84%9D.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# 필요한 라이브러리 설치
!pip install kiwipiepy

import os
from google.colab import files
from kiwipiepy import Kiwi

# 1. 파일 업로드
def upload_files():
    uploaded = files.upload()  # 파일 업로드
    folder_path = './lyrics'  # 가사 파일 저장 폴더
    os.makedirs(folder_path, exist_ok=True)  # 폴더 생성
    for file_name in uploaded.keys():
        os.rename(file_name, os.path.join(folder_path, file_name))
    print(f"{len(uploaded.keys())}개의 파일이 업로드되었습니다.")
    return folder_path

# 2. 파일 하나를 처리하여 형태소 분석 결과를 한 줄씩 저장
def analyze_single_file(file_path):
    kiwi = Kiwi()
    with open(file_path, 'r', encoding='utf-8') as infile:
        text = infile.read()
        # 텍스트가 비었는지 확인
        if not text.strip():
            print(f"파일 {file_path}: 텍스트가 비어 있습니다.")
            return os.path.basename(file_path), "텍스트가 비어 있습니다."

        # 형태소 분석 수행
        analyzed = []
        for line in text.splitlines():
            tokens = kiwi.tokenize(line.strip())
            if tokens:  # 형태소 분석 결과가 있으면 추가
                analyzed.append(" ".join([f"{token.form}{token.tag}" for token in tokens]))
            else:
                analyzed.append("")  # 빈 줄 처리

        result = "\n".join(analyzed)
        return os.path.basename(file_path), result

# 3. 형태소 분석 순차 처리
def analyze_lyrics(folder_path, output_file):
    file_paths = sorted(os.listdir(folder_path))  # 파일 이름 순서로 정렬
    results = []

    for file_name in file_paths:
        file_path = os.path.join(folder_path, file_name)
        result = analyze_single_file(file_path)
        results.append(result)

    with open(output_file, 'w', encoding='utf-8') as outfile:
        for file_name, result in results:
            outfile.write(f"### {file_name} ###\n")
            if result.strip() == "텍스트가 비어 있습니다.":
                outfile.write("텍스트가 비어 있습니다.\n")
            else:
                outfile.write(result + "\n")
    print(f"분석 결과가 '{output_file}'에 저장되었습니다.")

# 4. 결과 파일 다운로드
def download_result_file(output_file):
    files.download(output_file)

# 실행
folder_path = upload_files()  # 1. TXT 파일 업로드
output_file = "kiwi_analysis_results.txt"  # 결과 파일 이름
analyze_lyrics(folder_path, output_file)  # 2~3. 형태소 분석
download_result_file(output_file)  # 4. 결과 파일 다운로드




Saving 2000_song1.txt to 2000_song1.txt
Saving 2000_song2.txt to 2000_song2.txt
Saving 2000_song3.txt to 2000_song3.txt
Saving 2000_song4.txt to 2000_song4.txt
Saving 2000_song5.txt to 2000_song5.txt
Saving 2000_song6.txt to 2000_song6.txt
Saving 2000_song7.txt to 2000_song7.txt
Saving 2000_song8.txt to 2000_song8.txt
Saving 2000_song9.txt to 2000_song9.txt
Saving 2000_song10.txt to 2000_song10.txt
Saving 2000_song11.txt to 2000_song11.txt
Saving 2000_song12.txt to 2000_song12.txt
Saving 2000_song13.txt to 2000_song13.txt
Saving 2000_song14.txt to 2000_song14.txt
Saving 2000_song15.txt to 2000_song15.txt
Saving 2000_song16.txt to 2000_song16.txt
Saving 2000_song17.txt to 2000_song17.txt
Saving 2000_song18.txt to 2000_song18.txt
Saving 2000_song19.txt to 2000_song19.txt
Saving 2000_song20.txt to 2000_song20.txt
Saving 2000_song21.txt to 2000_song21.txt
Saving 2000_song22.txt to 2000_song22.txt
Saving 2000_song23.txt to 2000_song23.txt
Saving 2000_song24.txt to 2000_song24.txt
Saving 200

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>