In [None]:
pip install pandas google-generativeai tqdm



In [None]:
import pandas as pd
import google.generativeai as genai
import time
from tqdm import tqdm

def setup_gemini(api_key):
    """
    Initialize the Gemini API with the provided API key
    """
    genai.configure(api_key=api_key)
    model = genai.GenerativeModel('gemini-pro')
    return model

def translate_text(model, text):
    """
    Translate text from English to Korean using Gemini
    """
    try:
        prompt = f"Translate the following English text to Korean: {text}"
        response = model.generate_content(prompt)
        return response.text
    except Exception as e:
        print(f"Translation error: {e}")
        return None

def translate_csv(input_file, output_file, api_key):
    """
    Translate the 'Question' column in a CSV file from English to Korean

    Args:
        input_file (str): Path to input CSV file
        output_file (str): Path to output CSV file
        api_key (str): Gemini API key
    """
    try:
        # Read the CSV file
        df = pd.read_csv(input_file)

        # Check if 'Question' column exists
        if 'Question' not in df.columns:
            raise ValueError("'Question' column not found in the CSV file")

        # Initialize Gemini
        model = setup_gemini(api_key)

        # Create a new column for translations
        df['Question_Korean'] = None

        # Translate each question with progress bar
        print("Starting translation...")
        for idx in tqdm(range(len(df))):
            # Get English text
            english_text = df.loc[idx, 'Question']

            # Skip empty or null values
            if pd.isna(english_text):
                continue

            # Translate text
            korean_text = translate_text(model, english_text)

            # Store translation
            if korean_text:
                df.loc[idx, 'Question_Korean'] = korean_text

            # Add delay to avoid rate limiting
            time.sleep(2)

        # Save the translated CSV
        df.to_csv(output_file, index=False, encoding='utf-8-sig')
        print(f"Translation completed. Output saved to: {output_file}")

    except Exception as e:
        print(f"An error occurred: {e}")

if __name__ == "__main__":
    # Replace with your API key and file paths
    API_KEY = "AIzaSyBdG8gt0LH3syEDeWK--D3is2QpEPtCopU"
    INPUT_FILE = "YS.csv"
    OUTPUT_FILE = "YS_translated.csv"

    translate_csv(INPUT_FILE, OUTPUT_FILE, API_KEY)

Starting translation...


 68%|██████▊   | 57/84 [03:39<01:42,  3.81s/it]

Translation error: ("Invalid operation: The `response.text` quick accessor requires the response to contain a valid `Part`, but none were returned. The candidate's [finish_reason](https://ai.google.dev/api/generate-content#finishreason) is 3. The candidate's safety_ratings are: [category: HARM_CATEGORY_SEXUALLY_EXPLICIT\nprobability: NEGLIGIBLE\n, category: HARM_CATEGORY_HATE_SPEECH\nprobability: NEGLIGIBLE\n, category: HARM_CATEGORY_HARASSMENT\nprobability: MEDIUM\n, category: HARM_CATEGORY_DANGEROUS_CONTENT\nprobability: NEGLIGIBLE\n].", [category: HARM_CATEGORY_SEXUALLY_EXPLICIT
probability: NEGLIGIBLE
, category: HARM_CATEGORY_HATE_SPEECH
probability: NEGLIGIBLE
, category: HARM_CATEGORY_HARASSMENT
probability: MEDIUM
, category: HARM_CATEGORY_DANGEROUS_CONTENT
probability: NEGLIGIBLE
])




Translation error: 429 POST https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?%24alt=json%3Benum-encoding%3Dint: Resource has been exhausted (e.g. check quota).


100%|██████████| 84/84 [05:25<00:00,  3.87s/it]

Translation completed. Output saved to: YS_translated.csv





In [None]:
import pandas as pd

# Set display options to show all rows and columns
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

# Read the CSV file
df = pd.read_csv('YS_translated.csv')

# Display the DataFrame
print(df['Question_Korean'])


0                                  사무실 안에 많은 종이가 보이는가요?
1                                      출력물이 없이 할 수 있나요?
2     SmartOps 또는 스마트 기기를 사용해서 데이터를 기록하여 종이 사용을 최소화합니다.
3                                         양면 인쇄를 사용하나요?
4                                      재활용된 종이를 사용하십니까?
5                                사용한 종이를 모으고 재활용하고 있나요?
6             색상 인쇄 최소화, 잉크 카트리지 및 토너 e.g. 재활용을 통한 재활용?
7                 인바운드/아웃바운드 프로세스에서 일회용 플라스틱을 사용하고 있나요?
8                          발송 패키지를 위한 포장 기계를 사용하고 있습니까?
9          사이트는 골판지, 수축포장, 팔레트, 종이, 다른 플라스틱, 금속을 회수하나요?
10                           아이템을 적당한 크기 상자에 포장하고 있습니까?
11                     이 사이트에는 폐기물 관리 SOP 및 재활용 맵이 있나요?
12                   재활용 가능한 폐기물과 재활용 불가능한 폐기물을 분류하시나요?
13    폐기물을 처리하는 표준 프로세스가 있나요? 다양한 유형에 대한 재활용 용기가 있고 ...
14                               불필요한 자재와 가구를 찾을 수 있나요?
15                폐기물 발생량이 상당히 높은 영역/공정 단계를 찾아낼 수 있습니까?
16                          고객이 폐기물 목표를 부과했으며, 맞춰 나갑니까?
17                            나무 팔레트는 수리 및 재사용될 