In [10]:
import cv2
import numpy as np

def extract_and_draw_bboxes(image_path, output_path):
    # 이미지 읽기
    img = cv2.imread(image_path)
    if img is None:
        print('이미지를 불러올 수 없습니다.')
        return

    # 그레이스케일 변환
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # 임계값 처리(이진화) - 배경과 그림 분리
    _, thresh = cv2.threshold(gray, 240, 255, cv2.THRESH_BINARY_INV)

    # 윤곽선 검출
    contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # 각 윤곽선에 대해 바운딩 박스 계산 및 그리기
    for cnt in contours:
        x, y, w, h = cv2.boundingRect(cnt)
        # 너무 작은 노이즈는 무시
        if w > 10 and h > 10:
            cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)  # 초록색 사각형

    # 결과 이미지 저장
    cv2.imwrite(output_path, img)
    print(f'결과 이미지가 {output_path}에 저장되었습니다.')

# 예시 사용법
extract_and_draw_bboxes('output/page_3.jpg', 'page_3_bbox1.jpg')


결과 이미지가 page_3_bbox1.jpg에 저장되었습니다.


In [8]:
import cv2
import numpy as np

def extract_and_draw_bboxes(image_path, output_path):
    img = cv2.imread(image_path)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    _, thresh = cv2.threshold(gray, 240, 255, cv2.THRESH_BINARY_INV)
    # 팽창 연산으로 인접 글자 병합
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (15, 5))
    dilated = cv2.dilate(thresh, kernel, iterations=1)
    contours, _ = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    for cnt in contours:
        x, y, w, h = cv2.boundingRect(cnt)
        area = w * h
        aspect_ratio = w / h
        # 넓이와 비율 조건으로 노이즈 및 글자 제외
        if area > 1000 and 0.3 < aspect_ratio < 3.0:
            cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
    cv2.imwrite(output_path, img)
extract_and_draw_bboxes('output/page_3.jpg', 'page_3_bbox.jpg')
