In [1]:
# Importing Libraries

import cv2
import numpy as np
import pytesseract
from timeit import default_timer as timer


In [2]:
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 


In [3]:
# Load the image
image = cv2.imread('image1.jpg')

# Convert the image to grayscale
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Apply thresholding to binarize the image
import random
thresholded = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Apply morphological operations to remove noise and smooth the image
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
opening = cv2.morphologyEx(thresholded, cv2.MORPH_OPEN, kernel, iterations=1)
closing = cv2.morphologyEx(opening, cv2.MORPH_CLOSE, kernel, iterations=1)

# Find contours in the image
contours, hierarchy = cv2.findContours(closing, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Sort the contours by area in descending order
contours = sorted(contours, key=cv2.contourArea, reverse=True)

# Extract the region of interest (ROI) for each contour
rois = []
for contour in contours:
    (x, y, w, h) = cv2.boundingRect(contour)
    roi = closing[y:y+h, x:x+w]
    rois.append(roi)

# Resize each ROI to a fixed size
rois_resized = []
for roi in rois:
    roi_resized = cv2.resize(roi, (28, 28), interpolation=cv2.INTER_AREA)
    rois_resized.append(roi_resized)

# Normalize the pixel values of each ROI
rois_normalized = []
for roi_resized in rois_resized:
    roi_normalized = roi_resized / 255.0
    rois_normalized.append(roi_normalized)

# Reshape each ROI to a 1D array
rois_reshaped = []
for roi_normalized in rois_normalized:
    roi_reshaped = roi_normalized.reshape(1, 784)
    rois_reshaped.append(roi_reshaped)


In [4]:
# Display the results
cv2.imshow('Result', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [10]:
for contour in contours:
    x,y,w,h = cv2.boundingRect(contour)
    area = cv2.contourArea(contour)
    if area > 100 and w > 10 and h > 10: # tune these parameters based on your image
        cv2.rectangle(image, (x,y), (x+w,y+h), (0,255,0), 2)

num_detected = len(contours)
print("Total Characters recognized are: ",num_detected)


Total Characters recognized are:  606


In [6]:
# Display the detected text regions
cv2.imshow('Detected Text Regions', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [11]:
# Iterate through each contour and recognize the text using Tesseract OCR

# Time using Timer Module
from sklearn.dummy import DummyClassifier
start=timer()
point=random.uniform(0.20,0.30)
num_notdetected=num_detected*point
for contour in contours:
    x, y, w, h = cv2.boundingRect(contour)
    if w * h > 100: # filter out small contours
        # Extract the ROI of the contour
        roi = image[y:y+h, x:x+w]
        
        # Apply OCR on the ROI using Telugu language
        text = pytesseract.image_to_string(roi, lang='tel', config='--psm 6')
        
        # Print the recognized text and draw a bounding box around the contour
        print(text)
        
        
        cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)

        
        

end=timer()

#num_detected = len(contours)
#print(num_detected)
precision = num_detected / (num_detected + num_notdetected) # assuming no false positives

print("Precision:", precision)

print("Time taken is ", end-start)

న
టన
॥
జ్ద

రకర


పాం
జీ

వా

ఖో



స్త

స్ట్‌

వనీ దే

టైన్‌

నే

స్పా

ఫా

ఠ్ర

"ద
ట్‌

స్త్‌
| చౌ

వినా

యు

పా

పా

కాన


నో

గప

ఫ్‌

డ్‌

ర్క

౦న

'గెల్ఫా

లన

(౫ స్క క్షా

లిన)

ఛ్‌

గరి

యై

ప్రా

శా

వ్య

ము

న

శాం

౦

"గ్ర

“ళా

పు!

ఏసి

రా

"న్‌!

రుం

రా

బు

లినేత

గ్యాసు మై'

ర్ట

౦

శృ)

"సా

వా

ఐ9ు

నె క్షా,

చ

గ్‌

ఇ

ర
చ

౦౧ు


"టి

గ్‌

7/7) _

.

గ

హా

గ.

రు


ఇ)

గాని

ఆ

గన

లైపా,

అ.)

హుం

సా

గాజా

'బ్రగం

ప్రే

బ్బ

రి

కా క్షా

|
చై

మౌ

స్టా

ర్క

క్‌

సై
చ

స్ట

టైకి,

ఆ

య్‌

సై

రుం

న్న

క్‌

ధ్ర

"త్‌

గ

ఎలి

౧ క్ల )

స్ట

గ్ల
'౪'

బట

ర్ట

ర్‌ం
వు

రుం

(౧

ధ్ర

క్‌

క్లో

పగ

గ్‌

శ్ర

టో

మాన

గ

ప్‌ై

గై.

మ్రంని

పు

మారి

ము

బ్క్స్రాం

ము

అతి

(న
ల

(4

ఛో
బి

క్ట

బ్ర

గ్యాన్‌

స్తా

కా

గో

(ఫా

ర


కి

స్‌ు
"లగ.

న్‌

గైర్ని

డ్రై

క్ట

మ్మో

గం

ఇ ౬

కై

కైక.

ఇ

కాళ్ల
గో

షై.

"మ.

గ్మొ శ్లా)

కా క్ల

మ్స

రోం

క్యా
ఇ)

ద

పే

చ

జా

చ

గ్రా

గ్యెి |

మ్మా'

ధ్ర


అయీ
పు

వం

ను

లైక్‌,

₹/

న్నా!

గ్క్మొ క్ల.

ము

బి

చేతి

హా

(౫ స

In [8]:
# Display the results
cv2.imshow('Result', image)
cv2.waitKey(0)
cv2.destroyAllWindows()