In [131]:
import easyocr
import pytesseract

from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe" # for Windows users

In [135]:
def text_recognition(file_path, text_file_name="result-easyOCR.txt"):
    reader = easyocr.Reader(['ru','en'])
    result = reader.readtext(file_path, detail=0, paragraph=True)

    with open(text_file_name, "w") as file: # тут возвращается список, поэтому пробегаемся по нему
        for line in result:
            file.write(f"{line}\n\n")

    return f"Result wrote into {text_file_name}"

In [136]:
def main():
    file_path = "images-for-test/2-languages.png"
    print(text_recognition(file_path=file_path))

Ошибка возникает из-за того, что у меня на ноуте встройка. Бывают в жизни огорчения

In [138]:
main()

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.


Result wrote into result-easyOCR.txt


Это работает все круто и сразу, но есть ровно одна проблема: мне не понравилось, как он считывает большие текста. Он теряет символы, отступы, странно разбивает на абзацы. Я могу конечно добавить в Reader параметр ch_simv, но он доступен для использования только с английским языком. В общем, EasyOCR подходит для считывания текста с табличек на фотографиях, например, но не для большого текста. А мне это и нужно.

Поэтому перейдем к другой реализации - tesseract

In [110]:
file_path = "images-for-test/phone-number.png"
img = Image.open(file_path)

text = pytesseract.image_to_string(img)
print(text)

8 921 999-09-92



Как мы можем заметить, у нас появилась лишняя цифра. Попробуем исправить это с помощью конфига

In [139]:
def text_recognition_tesseract(file_path, text_file_name="result.txt"):
    img = Image.open(file_path)

    custom_config = r'--oem 3 --psm 6'

    text = pytesseract.image_to_string(img, config=custom_config)
    print(text)

    with open(text_file_name, "w") as file:
        file.write(f"{text}")

    return f"Result wrote into {text_file_name}"

In [140]:
def main():
    file_path = "images-for-test/phone-number.png"
    print(text_recognition_tesseract(file_path))

In [142]:
main()

8 921 999-09-92

Result wrote into result.txt


Теперь результат точный, попробуем считать наш любимый текст по английскому

In [145]:
print(text_recognition_tesseract("images-for-test/eng-text.png"))

of the cylinders on each stroke of the cycle. A further
increase in power and smoothness is obtained in engines
of 6, 8,12, and 16 cylinders, which are arranged in either
a straight line or two banks assembled in the form of a V.
Carburation
Air is mixed with the vapour of the petrol in the
carburettor. To prevent the air and the carburettor from
becoming too cold for successful evaporation of the fuel,
the air for the carburettor is usually taken from a point
close to a heated part of the engine. Modern carburet-
tors are fitted with a so-called float-feed chamber and a
mixing or spraying chamber. The first is a small cham-
ber in which a small supply of petrol is maintained at a
constant level. The petrol is pumped from the main tank
to this chamber, the float rising as the petrol flows in
until the desired level is reached, when the inlet closes.
/ The carburettor is equipped with such devices as accel-
erating pumps and economizer valves, which automati-
cally control the mixture r