In [5]:
from langchain_community.llms.ollama import Ollama
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

# Ollama 모델 초기화
llm = Ollama(model="gemma2")

# 프롬프트 템플릿 생성
prompt = PromptTemplate.from_template("""
너는 한국어 맞춤법 검사 도우미야. 주어진 문장을 분석하여 맞춤법과 띄어쓰기를 수정해줘.
#Input Sentence: {input_sentence}
#Corrected Sentence:""")

# 맞춤법 교정 체인 구성
chain = (
    {"input_sentence": RunnablePassthrough()}  # 입력 문장 그대로 전달
    | prompt  # 프롬프트로 전달
    | llm  # LLM에게 맞춤법 검사 요청
    | StrOutputParser()  # 결과를 문자열로 출력
)

# 실행 함수
def spell_check(sentence):
    print("\n입력 문장:\n", sentence)
    corrected = chain.invoke(sentence)
    print("\n교정된 문장:\n", corrected)
    return corrected

# 테스트 실행
if __name__ == "__main__":
    test_sentence = ' 안녕하세요. 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수둣물에서 고약한 냄새  가 나기 시작했습니다.\
        처음에는 아팔트 물텡크의 문제가  있는 줄 알고 대수롭지 않게 여 겠는데 냄새가 계속 나서 걱정이  돼서 신고합니다. 현재 수돗물에서 흙냄새와 곰팡이  냄새가 나고 그래서 설거지나 세수 는 물론 물을 마실 수가 없습니다.  생수로 대체해서 사용하고 있는데 이 문제로 매우 불편을 겪고 있습니다.  포항시 수돗물 원수의 40%를 공급 하는 경주 안개 때문에서 녹조  현상이 발생했다고 들었고 남조류 에서 발생한 지오스민이 냄새를  유발한다고 합니다. 이 문제에 대한 빠른 대응을 부탁  드립니다. 감사합니다.'
    spell_check(test_sentence)



입력 문장:
  안녕하세요. 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수둣물에서 고약한 냄새  가 나기 시작했습니다.        처음에는 아팔트 물텡크의 문제가  있는 줄 알고 대수롭지 않게 여 겠는데 냄새가 계속 나서 걱정이  돼서 신고합니다. 현재 수돗물에서 흙냄새와 곰팡이  냄새가 나고 그래서 설거지나 세수 는 물론 물을 마실 수가 없습니다.  생수로 대체해서 사용하고 있는데 이 문제로 매우 불편을 겪고 있습니다.  포항시 수돗물 원수의 40%를 공급 하는 경주 안개 때문에서 녹조  현상이 발생했다고 들었고 남조류 에서 발생한 지오스민이 냄새를  유발한다고 합니다. 이 문제에 대한 빠른 대응을 부탁  드립니다. 감사합니다.

교정된 문장:
 안녕하세요. 포항시 오천읍에 거주하는 이강일입니다. 저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새가 나기 시작했습니다. 처음에는 아파트 물 텡크의 문제가 있는 줄 알고 대수롭지 않게 여겼는데, 냄새가 계속 나서 걱정이 되어 신고합니다. 현재 수돗물에서 흙냄새와 곰팡이 냄새가 나고 그래서 설거지나 세수는 물론 물을 마실 수가 없습니다. 생수로 대체해서 사용하고 있는데, 이 문제로 매우 불편을 겪고 있습니다. 포항시 수돗물 원수의 40%를 공급하는 경주 안개 때문에서 녹조 현상이 발생했다고 들었고 남조류에서 발생한 지오스민이 냄새를 유발한다고 합니다. 이 문제에 대한 빠른 대응을 부탁드립니다. 감사합니다.


###  변경 사항

* **띄어쓰기**: 여러 단어 사이에 공백을 추가하여 읽기 쉽게 수정했습니다.
* **맞춤법**: "수둣물", "아팔트 물텡크" 와 같은 오타를 수정하고, "여겠는데", "돼서",  등  문맥상 적절한 맞춤법으로 변경했습니다.
* **문장 구조**: 어색한 문장을 조정하여 자연스러운 문장 구조로 만들었습니다. 






In [None]:
import requests

# Ollama API URL
url = "http://localhost:11434/api/generate"

# 입력 텍스트
text = ' 안녕하세요. 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새  가 나기 시작했습니다. 처음에는 아파트 물탱크의 문제가  있는 줄 알고 대수롭지 않게 여 겠는데 냄새가 계속 나서 걱정이  돼서 신고합니다. 현재 수돗물에서 흙냄새와 곰팡이  냄새가 나고 그래서 설거지나 세수 는 물론 물을 마실 수가 없습니다.  생수로 대체해서 사용하고 있는데 이 문제로 매우 불편을 겪고 있습니다.  포항시 수돗물 원수의 40%를 공급 하는 경주 안개 때문에서 녹조  현상이 발생했다고 들었고 남조류 에서 발생한 지오스민이 냄새를  유발한다고 합니다. 이 문제에 대한 빠른 대응을 부탁  드립니다. 감사합니다.'

# 요청 데이터
payload = {
    "model": "gemma2",
    "prompt": f"""
            너는 한국어 맞춤법 검사 도우미야. 주어진 문장을 분석하여 맞춤법과 띄어쓰기를 수정해줘.
            설명은 괜찮고 수정한 문장만 보내줘

문장: "{text}"

형식:
{{
    "원본 문장": "문장",
    "맞춤법 및 띄어쓰기 수정 결과": "맞춤법과 띄어쓰기를 수정한 문장"
}}
    """
}

response = requests.post(url, json=payload) # stream (stream = True)은 응답이 실시간으로 처리되지만 gpu 없이 처리하면 오히려 속도 저하

# 응답 처리
if response.status_code == 200:
    final_response = ""
    for line in response.iter_lines(decode_unicode=True):
        if line:
            data = requests.models.complexjson.loads(line)
            final_response += data.get("response", "")
    print("최종 응답:", final_response.strip())
else:
    print(f"Error {response.status_code}: {response.text}")


최종 응답: ```json
{
    "원본 문장": "안녕하세요. 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새  가 나기 시작했습니다. 처음에는 아파트 물탱크의 문제가  있는 줄 알고 대수롭지 않게 여 겠는데 냄새가 계속 나서 걱정이  돼서 신고합니다. 현재 수돗물에서 흙냄새와 곰팡이  냄새가 나고 그래서 설거지나 세수 는 물론 물을 마실 수가 없습니다.  생수로 대체해서 사용하고 있는데 이 문제로 매우 불편을 겪고 있습니다.  포항시 수돗물 원수의 40%를 공급 하는 경주 안개 때문에서 녹조  현상이 발생했다고 들었고 남조류 에서 발생한 지오스민이 냄새를  유발한다고 합니다. 이 문제에 대한 빠른 대응을 부탁  드립니다. 감사합니다.",
    "맞춤법 및 띄어쓰기 수정 결과": "안녕하세요. 포항시 오천읍에 거주하는 이강일입니다. 저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새가 나기 시작했습니다. 처음에는 아파트 물탱크의 문제가 있다고 생각했는데 냄새가 계속 나서 걱정이 되어 신고합니다. 현재 수돗물에서 흙냄새와 곰팡이 냄새가 나고 그래서 설거지나 세수는 물론, 물을 마실 수가 없습니다. 생수로 대체해서 사용하고 있는데 이 문제로 매우 불편을 겪고 있습니다. 포항시 수돗물 원수의 40%를 공급하는 경주 안개 때문에서 녹조 현상이 발생했다고 들었고, 남조류에서 발생한 지오스민이 냄새를 유발한다고 합니다. 이 문제에 대한 빠른 대응을 부탁드립니다. 감사합니다."
}
```


**변경 사항:**

* **띄어쓰기:**  주제 간격, 문장 내 단어 분리 등 적절한 띄어쓰기를 추가했습니다.
* **맞춤법:**  '여겠는데'를 '생각했는데'로 변경하고, '공급 하는'을 '공급하는', '드립니다'를 '부탁드립니다'로 수정했습니다.


In [11]:
import requests
import json
import re

def ensure_list(value):
    """
    입력값이 리스트가 아니면 리스트로 변환하고, 입력값이 None이면 빈 리스트를 반환합니다.
    """
    if value is None:
        return []
    return [value] if not isinstance(value, list) else value

def spacing_and_spelling(maf_idx, cleaned_text_res):
    """
    Ollama API를 호출하여 문장에서 띄어쓰기 및 맞춤법 교정을 하는 함수
    """
    result = {
        'maf_idx': maf_idx, 
        'voice_to_text': cleaned_text_res['voice_to_text'], 
        'spacing_spelling_res': None
    }
    
    # Ollama API URL
    url = "http://61.37.153.212:11434/api/generate"
    
    # Request payload
    payload = {
        "model": "gemma2",
        "prompt": f"""
        너는 한국어 맞춤법 검사 도우미야. 주어진 문장을 분석하여 맞춤법과 띄어쓰기를 수정해주세요.
        설명은 괜찮고 수정한 문장만 보내주세요.

        문장: "{cleaned_text_res['cleaned_text']}"

        형식:
        "맞춤법 및 띄어쓰기 수정 결과": "맞춤법과 띄어쓰기를 수정한 문장"
        """
    }

    try:
        # API call
        response = requests.post(url, json=payload, stream=True)
        
        if response.status_code != 200:
            result['spacing_spelling_res'] = {
                'error': f"API Error {response.status_code}: {response.text}"
            }
            return result

        full_response = ""
        for line in response.iter_lines(decode_unicode=True):
            if line:
                try:
                    data = json.loads(line)
                    full_response += data.get("response", "")
                except json.JSONDecodeError:
                    continue
        
        # JSON 추출 정규 표현식
        json_match = re.search(r'(?:"맞춤법 및 띄어쓰기 수정 결과": ".*?")', full_response, re.DOTALL)
        if json_match:
            corrected_text = json_match.group(0)
            result['spacing_spelling_res'] = corrected_text.split(': ')[1].strip('"')
            
        else:
            result['spacing_spelling_res'] = {
                'error': 'No matching corrected text found',
                'raw_response': full_response
            }
        
        return result
    
    except Exception as e:
        result['spacing_spelling_res'] = {
            'error': str(e)
        }
        return result


In [12]:
if __name__ == "__main__":
    maf_idx = 1
    cleaned_text_res = {'maf_idx': '1', 
                        'voice_to_text': ' 안녕하세요 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새가 나기 시작했습니다.',
                        'cleaned_text': ' 안녕하세요 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새가 나기 시작했습니다.'}
    
    res = spacing_and_spelling(maf_idx, cleaned_text_res)
    print(res)

{'maf_idx': 1, 'voice_to_text': ' 안녕하세요 포항시 오천읍에 거주하는 이강일입니다.  저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새가 나기 시작했습니다.', 'spacing_spelling_res': '안녕하세요, 포항시 오천읍에 거주하는 이강일입니다. 저는 지난 11월 13일 이후로 집에서 나오는 수돗물에서 고약한 냄새가 나기 시작했습니다.'}
