In [1]:
import cv2
import numpy as np

In [2]:
def find_text_contours(image):
  """
  이미지에서 글씨 윤곽선을 찾아 반환합니다.

  Args:
    image: 입력 이미지 (BGR 채널)

  Returns:
    글씨 윤곽선 리스트
  """

  # 이미지를 그레이스케일로 변환합니다.
  gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

  # 가우시안 블러 적용으로 노이즈 제거
  blurred = cv2.GaussianBlur(gray, (5, 5), 0)

  # Canny 에지 검출 알고리즘 적용
  edges = cv2.Canny(blurred, 100, 200)

  # 윤곽선 추출
  contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

  return contours

In [3]:
def mark_text_regions(image, contours):
  """
  이미지에 글씨 영역을 사각형으로 표시합니다.

  Args:
    image: 입력 이미지 (BGR 채널)
    contours: 글씨 윤곽선 리스트

  Returns:
    글씨 영역이 표시된 이미지
  """

  for contour in contours:
    # 최소 외곽 사각형 계산
    x, y, w, h = cv2.boundingRect(contour)

    # 사각형 표시
    cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)

  return image

In [4]:
# 이미지 불러오기
image = cv2.imread("../dataset_dir/13.한국어글자체/01.손글씨/01_handwriting_sentence_images/1_sentence/00000002.png")

# 글씨 윤곽선 찾기
contours = find_text_contours(image)

# 글씨 영역 표시
marked_image = mark_text_regions(image, contours)

In [5]:
from time import time

# 결과 이미지 출력
cv2.imwrite(f'./image/untitle13-{time()}.jpg', marked_image)

True