OCR 글자 검출 프로젝트

2024.01.24 ~ 2024.02.01
네이버 커넥트 재단 및 Upstage에서 주관하는 비공개 대회

Members

공통 : EDA, Annotation 가이드 제작, 리라벨링, 모델 학습

김세진: 학습데이터 피클화를 통한 모델 학습시간 경량화

박혜나: 추론 결과 분석, Noise Data Augmentation

이동우: Valid set, DetEval 연구 및 코드 제작

진민주: CVAT 세팅, 외부 데이터셋 학습 진행

허재영: Pepper noise Augmentation, Noise Reduction

문제 정의(대회소개) & Project Overview

스마트폰으로 카드를 결제하거나, 카메라로 카드를 인식할 경우 자동으로 카드 번호가 입력되는 경우가 있습니다. 또 주차장에 들어가면 차량 번호가 자동으로 인식되는 경우도 흔히 있습니다. 이처럼 OCR (Optimal Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술로, 컴퓨터 비전 분야에서 현재 널리 쓰이는 대표적인 기술 중 하나입니다.

이번 프로젝트에서는 OCR을 이용해 의료 영수증의 글자 영역을 Detecting하는 것이 목표입니다.

대회 결과

Public 5등 | Private 2등

Dataset

전체 이미지 개수 : Train set 100장, Test set 100장
이미지 종류 : 진료비 영수증
이미지 크기 : Various

Metric

F1 score

Model

EAST

Tools

Github
Notion
Slack
Wandb

Project Outline

Data Augmentations

CIE Ich Noise
Median Blur
명도 확산
Pepper Noise

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
.github		.github
text-detector		text-detector
utils		utils
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OCR 글자 검출 프로젝트

Members

문제 정의(대회소개) & Project Overview

대회 결과

Dataset

Metric

Model

Tools

Project Outline

Data Augmentations

About

Releases

Packages

Languages

freenozero/level2-cv-datacentric-cv-12

Folders and files

Latest commit

History

Repository files navigation

OCR 글자 검출 프로젝트

Members

문제 정의(대회소개) & Project Overview

대회 결과

Dataset

Metric

Model

Tools

Project Outline

Data Augmentations

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages