# 오픈소스 OCR라이브러리

## EasyOCR

In [7]:
!pip install easyocr

Collecting easyocr
  Downloading easyocr-1.7.2-py3-none-any.whl.metadata (10 kB)
Collecting opencv-python-headless (from easyocr)
  Downloading opencv_python_headless-4.12.0.88-cp37-abi3-win_amd64.whl.metadata (20 kB)
Collecting python-bidi (from easyocr)
  Downloading python_bidi-0.6.6-cp313-cp313-win_amd64.whl.metadata (5.0 kB)
Collecting Shapely (from easyocr)
  Downloading shapely-2.1.1-cp313-cp313-win_amd64.whl.metadata (7.0 kB)
Collecting pyclipper (from easyocr)
  Downloading pyclipper-1.3.0.post6-cp313-cp313-win_amd64.whl.metadata (9.2 kB)
Collecting ninja (from easyocr)
  Downloading ninja-1.13.0-py3-none-win_amd64.whl.metadata (5.1 kB)
Downloading easyocr-1.7.2-py3-none-any.whl (2.9 MB)
   ---------------------------------------- 0.0/2.9 MB ? eta -:--:--
   ---------------------------------------- 2.9/2.9 MB 19.0 MB/s eta 0:00:00
Downloading ninja-1.13.0-py3-none-win_amd64.whl (309 kB)
Downloading opencv_python_headless-4.12.0.88-cp37-abi3-win_amd64.whl (38.9 MB)
   ---------

In [None]:
import cv2
import numpy as np
import easyocr
import os # 파일 존재 여부 확인을 위해 추가

# --- 1. 이미지 파일 경로 설정 ---
# Raw string(r'')을 사용하여 경로를 지정하는 것이 안전합니다.
image_path = r'C:\Users\MYNOTE\AllerGuard\Data\차지예_009.jpg'

# --- 2. 한글 경로를 포함한 이미지 안전하게 불러오기 ---
image = None # 이미지 변수 초기화

# 파일이 실제로 존재하는지 먼저 확인합니다.
if os.path.exists(image_path):
    try:
        # 파일을 바이너리(binary) 모드로 읽어서 numpy 배열로 변환합니다.
        bytes_array = np.fromfile(image_path, np.uint8)
        # numpy 배열을 OpenCV 이미지 객체로 디코딩합니다.
        image = cv2.imdecode(bytes_array, cv2.IMREAD_COLOR)
    except Exception as e:
        print(f"이미지 디코딩 중 오류 발생: {e}")
else:
    print(f"파일을 찾을 수 없습니다: {image_path}")


# --- 3. 이미지가 성공적으로 로드되었을 경우 OCR 실행 ---
if image is not None:
    print("✅ 이미지 로딩 성공! OCR을 실행합니다...")
    
    # EasyOCR 리더 객체 생성 (한국어, 영어 모델 사용)
    # 최초 실행 시 모델 다운로드로 인해 시간이 걸릴 수 있습니다.
    reader = easyocr.Reader(['ko', 'en'])
    
    # 이미지에서 텍스트 추출
    result = reader.readtext(image, detail=0, paragraph=True)
    
    # 추출된 텍스트 결과 출력
    print("\n--- OCR 추출 결과 ---")
    if result:
        for line in result:
            print(line)
    else:
        print("이미지에서 텍스트를 찾지 못했습니다.")
        
else:
    print("이미지 로딩 실패. OCR을 실행할 수 없습니다.")

Neither CUDA nor MPS are available - defaulting to CPU. Note: This module is much faster with a GPU.


✅ 이미지 로딩 성공! OCR을 실행합니다...





--- OCR 추출 결과 ---
존품명 백설돼지갈비양염 식품의유형 소스살준제품) 내용황하 제조원 [ 시a트}트 논산시 실_침 출하도 [포장재질 용기-유리 (내면 뚜껑-플리엽화비닐 센기한 하단 표기일_지 보방법 실혼 보관 통호 냉장토관j 품목보-번호 [20020464088 38 @필통- 흘입문장하미도--물자뒤 @국프양도탕장원액 달플대드-외국& 제제소금 '기타과당} 설탕 기타과당 배퓨레 (국산), ) 비타민C} , 정제수 양파퓨래중국씩 k과루래사과국하) )비타민C} 다진마늘다 [진생강 '후춧가루 향미증진제 제 [소금 {카라델색소, "콤콤_스 훌킬동 불륭기 [진제)= 잔단검 '청양고추액기스C 감쨌히추출물 때륙 말함유 [반품뜻 교환장소 전로매점 7 0 러E= D로 . D85 도-; : ;


# GCP ORC

In [11]:
!pip install google-cloud-vision

Collecting google-cloud-vision
  Downloading google_cloud_vision-3.10.2-py3-none-any.whl.metadata (9.6 kB)
Collecting google-api-core!=2.0.*,!=2.1.*,!=2.10.*,!=2.2.*,!=2.3.*,!=2.4.*,!=2.5.*,!=2.6.*,!=2.7.*,!=2.8.*,!=2.9.*,<3.0.0,>=1.34.1 (from google-api-core[grpc]!=2.0.*,!=2.1.*,!=2.10.*,!=2.2.*,!=2.3.*,!=2.4.*,!=2.5.*,!=2.6.*,!=2.7.*,!=2.8.*,!=2.9.*,<3.0.0,>=1.34.1->google-cloud-vision)
  Downloading google_api_core-2.25.1-py3-none-any.whl.metadata (3.0 kB)
Collecting google-auth!=2.24.0,!=2.25.0,<3.0.0,>=2.14.1 (from google-cloud-vision)
  Downloading google_auth-2.40.3-py2.py3-none-any.whl.metadata (6.2 kB)
Collecting proto-plus<2.0.0,>=1.22.3 (from google-cloud-vision)
  Downloading proto_plus-1.26.1-py3-none-any.whl.metadata (2.2 kB)
Collecting googleapis-common-protos<2.0.0,>=1.56.2 (from google-api-core!=2.0.*,!=2.1.*,!=2.10.*,!=2.2.*,!=2.3.*,!=2.4.*,!=2.5.*,!=2.6.*,!=2.7.*,!=2.8.*,!=2.9.*,<3.0.0,>=1.34.1->google-api-core[grpc]!=2.0.*,!=2.1.*,!=2.10.*,!=2.2.*,!=2.3.*,!=2.4.*,!=

In [12]:
import io
import os
from google.cloud import vision

key_path = r"C:\Users\MYNOTE\Desktop\새 폴더\ocr-project-470906-7ffeebabeb09.json"
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = key_path
# -----------------------------------------


def detect_text(path):
    """이미지 파일에서 텍스트를 감지합니다."""
    
    # 환경 변수가 설정되어 있으면 클라이언트가 자동으로 인증 정보를 찾습니다.
    client = vision.ImageAnnotatorClient()

    # 파일이 존재하는지 확인
    if not os.path.exists(path):
        print(f"오류: 파일을 찾을 수 없습니다. 경로를 확인하세요: {path}")
        return

    with io.open(path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    response = client.text_detection(image=image)
    
    if response.error.message:
        raise Exception(
            '{}\nFor more info on error messages, check: '
            'https://cloud.google.com/apis/design/errors'.format(
                response.error.message))

    texts = response.text_annotations
    if texts:
        print('추출된 전체 텍스트:')
        print(texts[0].description)
    else:
        print('텍스트를 찾을 수 없습니다.')



image_path = r'C:\Users\MYNOTE\AllerGuard\Data\차지예_009.jpg'
detect_text(image_path)

추출된 전체 텍스트:
제품명 백설 돼지갈비양념
식품의 유형 소스(살균제품) 내용량 500g
제조원
씨제이제일제당(주) 충청남도
논산시 연무읍 죽본2길 16
포장재질 용기-유리
(내면)
뚜껑-폴리염화비닐
소비기한 하단 표기일까지
보관방법 실온 보관, 개봉 후 냉장보관 권장
품목보고번호 20020464088-38
원재료명 혼합간장{아미노산액(탈지대두:
●외국산),양조간장원액(탈지대두:외국산),정
•제소금, 기타과당}, 설탕, 기타과당,배퓨레(배)
(국산),비타민C},정제수,양파퓨레(중국산),
사과퓨레(사과(국산), 비타민C}, 다진마늘, 디
진생강,카라멜색소 III, 후춧가루, 향미증진제,정
•진제), 잔탄검, 청양고추엑기스C, 감귤류추출물
●제소금,산도조절제,L-글루탐산나트륨(향미증
대두, 밀 함유
•반품 및 교환장소 전국판매점
2026.02.18
DB5
GAL


In [14]:
import io
import os
from google.cloud import vision

key_path = r"C:\Users\MYNOTE\Downloads\ocr-project-470906-7ffeebabeb09.json"
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = key_path
# -----------------------------------------


def detect_text(path):
    """이미지 파일에서 텍스트를 감지합니다."""
    
    # 환경 변수가 설정되어 있으면 클라이언트가 자동으로 인증 정보를 찾습니다.
    client = vision.ImageAnnotatorClient()

    # 파일이 존재하는지 확인
    if not os.path.exists(path):
        print(f"오류: 파일을 찾을 수 없습니다. 경로를 확인하세요: {path}")
        return

    with io.open(path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    response = client.text_detection(image=image)
    
    if response.error.message:
        raise Exception(
            '{}\nFor more info on error messages, check: '
            'https://cloud.google.com/apis/design/errors'.format(
                response.error.message))

    texts = response.text_annotations
    if texts:
        print('추출된 전체 텍스트:')
        print(texts[0].description)
    else:
        print('텍스트를 찾을 수 없습니다.')


image_path = r'C:\Users\MYNOTE\AllerGuard\Data\차지예_002.jpg'
detect_text(image_path)

추출된 전체 텍스트:
팔도 틈새라면 빨계떡 식품유형 유탕면 내용량 120g(500 kcal) 소비기한 후면표기일까지
원재료, 건/소맥분(밀:미국산,호주산),팜유(말레이시아산), 감자전분(덴마크산, 독일산), 변성전분1
변성전분2, 글루틴, 정제소금, 감미유S, 시즈닝조미액,면류첨가알칼리제(탄산칼륨, 탄산나트륨, 피로인산
나트) 구아검, 혼합제제(폴리인산나트륨, 메타인산나트륨, 메타인산칼륨), 녹차풍미액, 비타민B2, 알긴
사ㅍ 필렌글리콜 스프/정제소금,고춧가루1,건양배추, 건청경채, 고춧가루2,비프시즈닝분말, L-글루탐
산나트륨(향미증진제), 장국베이스, 쇠고기조미분말, 불고기맛분말, 핫스파이스분말,소고기전골에스,조
미분에이, 건파, 설탕, 매운풍미분, 매운양념분말, 사골설렁탕분말,양조간장분말, 건표고버섯, 조미마늘분,
앙지베이스분말,덱스트린, 흑후추분말,효모조미액분말, 핫베이스분말,표고버섯엑기스분말,건홍피망,계
리후레이크, 우마미베이스,산도조절제,매운맛베이스,조미맛분, 파프리카추출색소, 향미증진제1, 향미증
진제2, 시즈닝조미액, 비프시즈닝오일
계란, 우유, 대두,밀,돼지고기,쇠고기 함유
포장재질 폴리프로필렌(내면) 품목보고번호 19830358021-262(F1)/ 20120512055-16(F2)
업소명 및 (주)팔도 이천공장 F1: 경기도 이천시 부발읍 중부대로 1655
소재지 (주)팔도 나주공장 F2 : 전남 나주시 동수농공단지길 62-107


# 허깅페이스 ddobokki/ko-trocr

https://huggingface.co/ddobokki/ko-trocr

In [None]:
from transformers import TrOCRProcessor, VisionEncoderDecoderModel, AutoTokenizer
import unicodedata
from PIL import Image

# 모델과 프로세서, 토크나이저 불러오기 (이 부분은 동일)
processor = TrOCRProcessor.from_pretrained("ddobokki/ko-trocr")
model = VisionEncoderDecoderModel.from_pretrained("ddobokki/ko-trocr")
tokenizer = AutoTokenizer.from_pretrained("ddobokki/ko-trocr")


# 1. 이미지 파일의 전체 경로를 변수에 저장합니다.
file_path = r"C:\Users\MYNOTE\AllerGuard\Data\차지예_009.jpg"

# 2. PIL 라이브러리의 Image.open()으로 파일을 직접 엽니다.
try:
    img = Image.open(file_path)
except FileNotFoundError:
    print(f"오류: '{file_path}' 경로에 파일이 없습니다. 경로를 다시 확인해주세요.")
    exit()

# 이미지 처리 및 텍스트 생성 (이 부분은 동일)
pixel_values = processor(img, return_tensors="pt").pixel_values
generated_ids = model.generate(pixel_values, max_length=64)
generated_text = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
generated_text = unicodedata.normalize("NFC", generated_text)

print(generated_text)

Fetching 1 files:   0%|          | 0/1 [00:00<?, ?it/s]

Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.52, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.


지방토목주사


In [1]:
!pip install transformers torch torchvision Pillow



In [15]:
import torch
from transformers import TrOCRProcessor, VisionEncoderDecoderModel
from PIL import Image

def extract_text_from_image(image_path, processor, model, device):
    """
    미리 로드된 TrOCR 모델을 사용하여 이미지에서 텍스트를 추출합니다.

    Args:
        image_path (str): 텍스트를 추출할 이미지 파일의 경로.
        processor: TrOCR 프로세서 객체.
        model: TrOCR 모델 객체.
        device: 연산에 사용할 디바이스 ('cuda' 또는 'cpu').
    
    Returns:
        str: 추출된 텍스트.
    """
    try:
        image = Image.open(image_path).convert("RGB")
        pixel_values = processor(images=image, return_tensors="pt").pixel_values.to(device)
        generated_ids = model.generate(pixel_values, max_length=1024, num_beams=4)
        
        generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
        return generated_text

    except FileNotFoundError:
        return f"오류: '{image_path}' 파일을 찾을 수 없습니다. 파일 경로를 확인해주세요."
    except Exception as e:
        return f"오류가 발생했습니다: {e}"

# --- 메인 코드 실행 ---
if __name__ == "__main__":
    # --- 1. 초기 설정 ---
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print(f"사용 중인 디바이스: {device}")

    print("모델을 로드하는 중입니다... (처음 실행 시 시간이 걸릴 수 있습니다)")
    processor = TrOCRProcessor.from_pretrained("ddobokki/ko-trocr")
    model = VisionEncoderDecoderModel.from_pretrained("ddobokki/ko-trocr").to(device)
    print("모델 로드 완료.")

    # --- 2. 텍스트 추출 실행 ---
    image_file_path = r"C:\Users\MYNOTE\AllerGuard\Data\차지예_009.jpg"
    extracted_text = extract_text_from_image(image_file_path, processor, model, device)
    
    # --- 3. 결과 출력 ---
    print("\n--- OCR 추출 결과 ---")
    print(extracted_text)

사용 중인 디바이스: cpu
모델을 로드하는 중입니다... (처음 실행 시 시간이 걸릴 수 있습니다)


Fetching 1 files:   0%|          | 0/1 [00:00<?, ?it/s]

모델 로드 완료.

--- OCR 추출 결과 ---
끝을
