In [1]:
# 라이브러리 import
# import sys
# !{sys.executable} -m pip install --upgrade googletrans==4.0.0-rc1

In [2]:
# pip list

In [None]:
import pandas as pd
from googletrans import Translator
import os

translator = Translator()

# 번역할 파일과 컬럼 지정
files_and_columns = {
    'shops.csv': 'shop_name',
    'item_categories.csv': 'item_category_name',
}

# 번역 함수
def translate_unique_column(df, column_name):
    print(f"  --번역중입니다-- '{column_name}'...")
    unique_texts = df[column_name].unique() 
    translated_map = {}
    
    for text in unique_texts:
        try:
            # 러시아어 -> 영어로 번역
            translated_text = translator.translate(text, src='ru', dest='en').text
            translated_map[text] = translated_text
        except Exception as e:
            print(f"  --번역Error-- '{text}': {e}")
            # 에러 나면 원본 그대로 반환
            translated_map[text] = text

    # 번역된 컬럼은 원본 컬럼명 뒤에 _en 을 붙여 새로운 컬럼 생성
    df[column_name + '_en'] = df[column_name].map(translated_map)
    return df

# 파일 처리
for file_name, column_name in files_and_columns.items():
    print(f"\n--진행 중-- {file_name}...")
    
    # CSV 읽어기기
    df = pd.read_csv(file_name)
    
    # 번역 수행
    df_translated = translate_unique_column(df, column_name)
    
    # 원본 파일명 뒤에 _2 붙여서 새로운 파일 생성
    new_file_name = file_name.replace('.csv', '_2.csv') 
    df_translated.to_csv(new_file_name, index=False, encoding='utf-8-sig')
    print(f"  번역된 파일 저장: {new_file_name}")

print("\n✅ 번역이 완료되었습니다.")

### 번역 과정 정리
✅ 기존 러시아어 컬럼 ex) shop_name   
✅ 번역 진행  
✅ 원본 컬럼명 뒤에 _en 을 붙여 새로운 컬럼 생성 ex) shop_name_en  
✅ 원본 러시아어 컬럼(shop_name)은 삭제  
✅ 생성된 컬럼명에서 _en을 제거해서 다시 shop_name으로 사용  
  
item_categories.csv에서 'item_category_name' 컬럼도 동일한 방식으로 진행