In [119]:
import cv2
import numpy as np

### Canny edge detection and Probabilistic Hough Line Transform

In [132]:
#image = cv2.imread("images/table-text/text_table.png")
#image = cv2.imread("images/transcript/pun_20240817_0001.jpg")
image = cv2.imread("images/eng-text/eng_text.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

thresh, th = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY_INV)

# ใช้ Canny edge detection เพื่อหาขอบในภาพ
edges = cv2.Canny(th, 150, 200, apertureSize=3)

# ใช้ Hough Line Transform เพื่อตรวจจับเส้นตรง
lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=100, minLineLength=150, maxLineGap=5)

# ลบเส้นตรงออกจากภาพ
if lines is not None:
    for line in lines:
        x1, y1, x2, y2 = line[0]
        cv2.line(image, (x1, y1), (x2, y2), (255, 255, 255), 3)  # วาดเส้นตรงเป็นสีขาวเพื่อลบ

"""
# วาดเส้นที่ตรวจจับได้ลงบนภาพ
for line in lines:
    x1, y1, x2, y2 = line[0]
    cv2.line(image, (x1, y1), (x2, y2), (0, 255, 0), 2)
"""

#cv2.imshow("Original", gray)
cv2.imwrite('THRESH_BINARY.jpg', th)
#cv2.imshow('Hough Line Transform', image)
cv2.imwrite('Hough Line Transform.jpg', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

### Dilation

In [115]:
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh, th = cv2.threshold(gray, 170, 255, cv2.THRESH_BINARY_INV)

kernel = np.ones((3,3), np.uint8)
dilation = cv2.dilate(th, kernel, iterations=1)
cv2.imwrite('Dilation.jpg', dilation)

True

### Contours

In [133]:
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh, th = cv2.threshold(gray, 170, 255, cv2.THRESH_BINARY_INV)
contours, _ = cv2.findContours(th, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
#contours, _ = cv2.findContours(dilation, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# วาดกรอบล้อมรอบข้อความ
for contour in contours:
    x, y, w, h = cv2.boundingRect(contour)
    # กำหนดเงื่อนไขเพิ่มเติมสำหรับการเลือก contour ที่เป็นตัวอักษรหรือคำ
    if w > 1 and h > 1:
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 1)

cv2.imwrite("contour.jpg", image)

True

In [71]:
#image = cv2.imread("images/table-text/text_table.png")
image = cv2.imread("images/transcript/pun_20240817_0001.jpg")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (3, 3), 0)

#thresh, th1 = cv2.threshold(blurred, 150, 255, cv2.THRESH_BINARY_INV)
thresh2, th2 = cv2.threshold(gray, 170, 255, cv2.THRESH_BINARY_INV)

kernel = np.ones((2, 2), np.uint8)

contours, _ = cv2.findContours(th2, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

for contour in contours:
    x, y, w, h = cv2.boundingRect(contour)
    
    # ตรวจสอบเงื่อนไขให้เหมาะสม เช่น ละเว้นพื้นที่ที่กว้างมากและแคบมาก ซึ่งมักจะเป็นเส้นตรงหรือตาราง
    aspect_ratio = w / float(h)
    if aspect_ratio < 1 and w > 1 and h > 1:  # ละเว้นวัตถุที่มีความกว้างมากๆ
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 1)


cv2.imshow("base", image)
#cv2.imshow("GaussianBlur", blurred)
#cv2.imshow("threshold and blurred", th1)
#cv2.imshow("threshold", th2)
cv2.imwrite("GaussianBlur.jpg", image)
#cv2.imshow("Opening", morph_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.0
1.0
1.5
1.5
1.0
0.6666666666666666
0.6
1.0
0.8666666666666667
0.5
0.26666666666666666
0.5
0.6666666666666666
0.8
0.7333333333333333
0.6
0.8666666666666667
0.26666666666666666
0.4
0.8666666666666667
0.7333333333333333
0.7333333333333333
0.3333333333333333
0.8125
0.5625
0.4
0.8
0.8
0.7333333333333333
0.8666666666666667
0.7333333333333333
0.7333333333333333
0.3333333333333333
0.8666666666666667
0.9333333333333333
0.6666666666666666
0.8
0.6875
0.5
0.625
0.8125
0.5882352941176471
0.3888888888888889
0.5882352941176471
0.6470588235294118
0.5555555555555556
0.6111111111111112
0.5882352941176471
0.5882352941176471
0.5882352941176471
0.5555555555555556
0.5555555555555556
0.4444444444444444
2.2
2.2
2.2
2.0
1.8333333333333333
1.6666666666666667
2.0
1.5714285714285714
0.25
0.25
1.3333333333333333
0.3333333333333333
0.3333333333333333
1.6666666666666667
0.3333333333333333
1.0
2.0
1.0
1.0
0.9333333333333333
0.6666666666666666
0.6
1.0
0.35714285714285715
0.8666666666666667
0.5333333333333333
0.8
0

In [1]:
for contour in contours:
    x, y, w, h = cv2.boundingRect(contour)
    
    # กำหนดเงื่อนไขเพิ่มเติมสำหรับการเลือก contour ที่เป็นตัวอักษรหรือคำ (เช่น ความสูง/ความกว้างขั้นต่ำ)
    if w > 2 and h > 2:
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 1)

NameError: name 'contours' is not defined

In [None]:
import cv2

image = cv2.imread("images/table-text/text_table.png")
#image = cv2.imread("test/Image_20240817_0001.png")|

# แปลงภาพเป็นสีเทา
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# ใช้ GaussianBlur เพื่อลด noise
blurred = cv2.GaussianBlur(gray, (3, 3), 0)

# ใช้ threshold เพื่อแยกข้อความออกจากพื้นหลัง
thresh, th1 = cv2.threshold(blurred, 150, 255, cv2.THRESH_BINARY_INV)

# ค้นหา Contours ในภาพที่ threshold แล้ว
contours, _ = cv2.findContours(th1, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# วาดกรอบล้อมรอบข้อความ
for contour in contours:
    x, y, w, h = cv2.boundingRect(contour)
    
    # กำหนดเงื่อนไขเพิ่มเติมสำหรับการเลือก contour ที่เป็นตัวอักษรหรือคำ (เช่น ความสูง/ความกว้างขั้นต่ำ)
    if w > 2 and h > 2:
        cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 1)

cv2.imshow("THRESH", image)
#cv2.imwrite("prepro.png", image)
#cv2.imwrite("th1.png", th1)
cv2.waitKey(0)
cv2.destroyAllWindows(0)