GitHub

A PyTorch implementation of DTrOCR: Decoder-only Transformer for Optical Character Recognition.

This repository uses Masato Fujitake's DTrOCR research as a basis for training a model used for Japanese text OCR.

Acknowledgments

The project is based on Arvind Rajan's implementation of original research (https://github.com/arvindrajan92/DTrOCR). It utilizes ViT by hugging face and a language model Japanese GPT-2-medium by Rinna Co (https://huggingface.co/rinna/japanese-gpt2-small).

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.github		.github
dtrocr		dtrocr
examples		examples
kanjivg		kanjivg
kmnist		kmnist
tests		tests
text_renderer		text_renderer
.gitignore		.gitignore
CITATION.cff		CITATION.cff
LICENSE		LICENSE
README.md		README.md
image.png		image.png
logo.png		logo.png
requirements.txt		requirements.txt
setup.py		setup.py
shapeCheck.py		shapeCheck.py
test.py		test.py