In [3]:
import google.generativeai as genai
import re

def parse_and_format_analysis(analysis_text):
    """
    분석 결과 텍스트를 섹션별로 나누어 포맷팅. 줄바꿈 구분이 아닌 섹션 제목 탐지 기반으로 처리.
    """
    # 섹션 키워드 정의
    sections = {
        "오류 내용 출력": "",
        "영어 문장에서 사용된 문법 규칙": "",
        "의미와 스타일 개선을 위한 제안": "",
        "수정된 한국어 번역": "",
    }

    # 특수문자 제거 (섹션 제목에 영향을 주지 않도록 조정)
    analysis_text = re.sub(r"[^a-zA-Z가-힣0-9\s:()\*\'\".,]+", "", analysis_text)

    # 섹션 구분 패턴 정의
    section_pattern = re.compile(r"\*\*(.+?):\*\*")

    # 섹션 탐지 및 텍스트 추출
    current_section = None
    for line in analysis_text.split("\n"):
        line = line.strip()  # 공백 제거

        # 섹션 제목 감지
        match = section_pattern.match(line)
        if match:
            section_title = match.group(1).strip()
            content = line[match.end():].strip()
            if section_title in sections:
                current_section = section_title
                sections[current_section] = content  # 기존 내용 초기화
            else:
                current_section = None  # 섹션 키워드가 아니라면 무시
        elif current_section:
            # 현재 섹션에 텍스트 추가
            sections[current_section] += " " + line.strip()

    # 각 섹션 값 앞뒤 공백 제거
    for section in sections:
        sections[section] = re.sub(r'["\'*]', '', sections[section]).strip()

    return sections

# Google Generative AI 설정
GOOGLE_API_KEY = "AIzaSyAsTk4zj6gmewYEdZnOBhjChDW2dkb6dwk"
genai.configure(api_key=GOOGLE_API_KEY)

# 영어 문장 생성
google_prompt = "Please make an English sentence."
model = genai.GenerativeModel('gemini-pro')
google_response = model.generate_content(google_prompt)

print("Google Generative AI 응답:")

if google_response and hasattr(google_response, 'text'):
    english_sentence = google_response.text
    print(english_sentence)

    # 생성된 문장의 한국어 번역 입력 받기
    Translate_input = str(input("생성된 영어 문장을 번역하여 입력하세요: "))

    # 상세 문법 분석을 위한 프롬프트 생성
    translated_prompt = f"""
    이 문장을 한국어로 번역하고 분석하세요:
    영어: {english_sentence}
    한국어: {Translate_input}

    아래 양식에 맞추어 영어 문장을 상세히 분석하고 아래 양식과 철저히 똑같이 출력하세요.:
    - 오류 내용 출력(번역된 문장에 오류가 있다면 [의미 오류, 구문 오류, 단어 선택 오류, 어순 오류 ,문화적 오류]중 선택하고 오류 내용 출력, ex **오류 내용 출력 :** 구문 오류 "뜀"은 동작을 나타내는 명사이지만, 영어 문장에서는 동작을 나타내는 동사 "jumps"가 사용되었습니다.) : 
    - 영어 문장에서 사용된 문법 규칙(ex **영어 문장에서 사용된 문법 규칙 :** "the" : 특정 명사를 가리킴 (정관사), "fox" and "dog" : 명사 (사물이나 생물을 나타냄), "jumped" : 과거형 동사 (과거의 동작이나 상태를 나타냄), "over" : 전치사 (위치 관계를 표현함).):
    - 의미와 스타일 개선을 위한 제안(더 명확하거나 자연스러운 표현이 있다면 그 표현에 대해서만 써줘). : 
    - 수정된 한국어 번역(있으면 주고 없으면 없다고 표기) : 
    """

    # 분석 요청
    translated_response = model.generate_content(translated_prompt)
    formatted_analysis = parse_and_format_analysis(translated_response.text if translated_response and hasattr(translated_response, 'text') else "응답을 생성할 수 없습니다.")
    a = translated_response.text if translated_response and hasattr(translated_response, 'text') else "응답을 생성할 수 없습니다."
    for section, content in formatted_analysis.items():
        print(f"\n[{section}]\n{content}\n")
else:
    print("응답을 생성할 수 없습니다.")

  from .autonotebook import tqdm as notebook_tqdm


Google Generative AI 응답:
The quick brown fox jumped over the lazy dog.

[오류 내용 출력]
단어 선택 오류 뜀은 동작을 나타내는 명사이지만, 영어 문장에서는 동작을 나타내는 동사 jumps가 사용되었습니다.


[영어 문장에서 사용된 문법 규칙]
the: 특정 명사를 가리킴 (정관사)  fox and dog: 명사 (사물이나 생물을 나타냄)  jumped: 과거형 동사 (과거의 동작이나 상태를 나타냄)  over: 전치사 (위치 관계를 표현함)


[의미와 스타일 개선을 위한 제안]
뜀 대신 뛰었다를 사용하여 동사로 표현


[수정된 한국어 번역]
개으른 개 위로 갈색 여우가 뛰었다



In [16]:
import re

def parse_and_format_analysis(analysis_text):
    sections = {
        "오류 내용 출력": "",
        "영어 문장에서 사용된 문법 규칙": "",
        "의미와 스타일 개선을 위한 제안": "",
        "수정된 한국어 번역": "",
    }

    analysis_text = re.sub(r"[^a-zA-Z가-힣0-9\s:()\*\'\".,]+", "", analysis_text)
    section_pattern = re.compile(r"\*\*(.+?):\*\*")

    current_section = None
    for line in analysis_text.split("\n"):
        line = line.strip()

        match = section_pattern.match(line)
        if match:
            section_title = match.group(1).strip()
            content = line[match.end():].strip()
            if section_title in sections:
                current_section = section_title
                sections[current_section] = content
            else:
                current_section = None
        elif current_section:
            sections[current_section] += " " + line.strip()

    for section in sections:
        sections[section] = re.sub(r'["]', '', sections[section]).strip()

    # Formatting the "영어 문장에서 사용된 문법 규칙" section for better readability
    if sections["영어 문장에서 사용된 문법 규칙"]:
        grammar_rules = sections["영어 문장에서 사용된 문법 규칙"].split(" ")
        formatted_rules = "<ul>"
        for i in range(0, len(grammar_rules), 4):
            if i + 3 < len(grammar_rules):
                formatted_rules += f"<li><strong>{grammar_rules[i]}</strong>: {grammar_rules[i+1]} ({grammar_rules[i+2]} {grammar_rules[i+3]})</li>"
        formatted_rules += "</ul>"
        sections["영어 문장에서 사용된 문법 규칙"] = formatted_rules

    return sections

parse_and_format_analysis(a)

{'오류 내용 출력': '없음',
 '영어 문장에서 사용된 문법 규칙': '<ul><li><strong>The</strong>: : (특정 명사를)</li><li><strong>가리킴</strong>: (정관사) (fox and)</li><li><strong>dog</strong>: : (명사 (사물이나)</li><li><strong>생물을</strong>: 나타냄) (jumps :)</li><li><strong>현재형</strong>: 동사 ((현재의 동작이나)</li><li><strong>상태를</strong>: 나타냄) (over :)</li><li><strong>전치사</strong>: (위치 (관계를 표현함))</li></ul>',
 '의미와 스타일 개선을 위한 제안': '없음',
 '수정된 한국어 번역': '없음'}

In [13]:
import re

def parse_and_format_analysis(analysis_text):
    """
    분석 결과 텍스트를 섹션별로 나누어 포맷팅. 여러 섹션 패턴 탐지 기반으로 처리.
    """
    # 섹션 키워드 정의
    sections = {
        "오류 내용 출력": "",
        "영어 문장에서 사용된 문법 규칙": "",
        "의미와 스타일 개선을 위한 제안": "",
        "수정된 한국어 번역": "",
    }

    # 섹션 구분 패턴 정의 (여러 패턴 포함)
    section_patterns = [
        re.compile(r"\*\*(.+?):\*\*"),  # **제목:** 형식
        re.compile(r"\*\*(.+?)\*\*:"), # **제목**: 형식
        re.compile(r"(.+?):")           # 제목: 형식 (별표 없는 일반 텍스트)
    ]

    # 특수문자 제거 (섹션 제목에 영향을 주지 않도록 조정)
    analysis_text = re.sub(r"[^a-zA-Z가-힣0-9\s:()\*\'\".,]+", "", analysis_text)
    print("[DEBUG] Cleaned analysis_text:", analysis_text)

    # 섹션 탐지 및 텍스트 추출
    current_section = None
    for line_num, line in enumerate(analysis_text.split("\n"), 1):
        line = line.strip()  # 공백 제거
        print(f"[DEBUG] Processing line {line_num}: {line}")

        # 섹션 제목 감지
        for pattern in section_patterns:
            match = pattern.match(line)
            if match:
                section_title = match.group(1).strip()
                content = line[match.end():].strip()
                print(f"[DEBUG] match found: {match.group(0)}")
                print(f"[DEBUG] Section title: '{section_title}'")
                print(f"[DEBUG] Content after section title: '{content}'")

                # 섹션 제목이 정의된 키워드에 있는지 확인
                if section_title in sections:
                    print(f"[DEBUG] Valid section title found: {section_title}")
                    current_section = section_title
                    sections[current_section] = content  # 기존 내용 초기화
                else:
                    print(f"[DEBUG] Invalid section title: {section_title}. Ignoring.")
                    current_section = None  # 섹션 키워드가 아니라면 무시
                break
        else:
            # 현재 섹션에 텍스트 추가
            if current_section:
                print(f"[DEBUG] Appending to section '{current_section}': {line.strip()}")
                sections[current_section] += " " + line.strip()

    # 각 섹션 값 앞뒤 공백 제거 및 디버그 출력
    print("[DEBUG] Finalizing sections...")
    for section, content in sections.items():
        sections[section] = re.sub(r'["\'*]', '', sections[section]).strip()
        print(f"[DEBUG] Finalized section: '{section}' with content: '{sections[section]}'")

    return sections


parse_and_format_analysis(a)

[DEBUG] Cleaned analysis_text:  오류 내용 출력: 없음

 영어 문장에서 사용된 문법 규칙:
    "The" : 특정 명사를 가리킴 (정관사)
    "fox" and "dog" : 명사 (사물이나 생물을 나타냄)
    "jumps" : 현재형 동사 (현재의 동작이나 상태를 나타냄)
    "over" : 전치사 (위치 관계를 표현함)

 의미와 스타일 개선을 위한 제안: 없음

 수정된 한국어 번역: 없음
[DEBUG] Processing line 1: 오류 내용 출력: 없음
[DEBUG] match found: 오류 내용 출력:
[DEBUG] Section title: '오류 내용 출력'
[DEBUG] Content after section title: '없음'
[DEBUG] Valid section title found: 오류 내용 출력
[DEBUG] Processing line 2: 
[DEBUG] Appending to section '오류 내용 출력': 
[DEBUG] Processing line 3: 영어 문장에서 사용된 문법 규칙:
[DEBUG] match found: 영어 문장에서 사용된 문법 규칙:
[DEBUG] Section title: '영어 문장에서 사용된 문법 규칙'
[DEBUG] Content after section title: ''
[DEBUG] Valid section title found: 영어 문장에서 사용된 문법 규칙
[DEBUG] Processing line 4: "The" : 특정 명사를 가리킴 (정관사)
[DEBUG] match found: "The" :
[DEBUG] Section title: '"The"'
[DEBUG] Content after section title: '특정 명사를 가리킴 (정관사)'
[DEBUG] Invalid section title: "The". Ignoring.
[DEBUG] Processing line 5: "fox" and "dog" : 명사 (사물이나 생

{'오류 내용 출력': '없음',
 '영어 문장에서 사용된 문법 규칙': '',
 '의미와 스타일 개선을 위한 제안': '없음',
 '수정된 한국어 번역': '없음'}

In [5]:
a

'- 오류 내용 출력: 없음\n- 영어 문장에서 사용된 문법 규칙: \n  - definite article "the" : 특정 명사를 가리킴 (정관사)\n  - nouns "rain" and "outside" : 명사 (사물이나 생물을 나타냄)\n  - present continuous tense verb "is falling" : 현재진행형 동사 (지금 진행중인 동작이나 상태를 나타냄)\n  - preposition "in" : 전치사 (위치 관계를 표현함)\n- 의미와 스타일 개선을 위한 제안: 없음\n- 수정된 한국어 번역: 없음'

In [98]:
b = re.sub(r"[^a-zA-Z가-힣0-9\s:(),'\.]", "", a)
b

'오류 내용 출력: 없음\n\n영어 문장에서 사용된 문법 규칙:\n indefinite article a : 불특정 명사를 가리킴 (불정관사)\n present tense verb have : 현재형 동사 (현재의 동작이나 상태를 나타냄)\n possessive pronoun my : 소유격 대명사 (소유 관계를 나타냄)\n noun hand : 명사 (사물이나 생물을 나타냄)\n\n의미와 스타일 개선을 위한 제안: 없음\n\n수정된 한국어 번역: 없음'