Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Train mới bị lỗi #26

Closed
ducnguyent opened this issue Dec 25, 2020 · 5 comments
Closed

Train mới bị lỗi #26

ducnguyent opened this issue Dec 25, 2020 · 5 comments

Comments

@ducnguyent
Copy link

Em cần train tiếp với bộ data anh cung cấp. Nhưng lúc train bị lỗi như vầy
Em để nguyên các folder vi_00,vi_01,.. và tạo mới file train_annotation.txt và test annotation.txt nên các file này sẽ như v: vi_00 abc
vi_01 aksk
....
Em không biết nên sửa sao
image

@pbcquoc
Copy link
Owner

pbcquoc commented Dec 26, 2020

Hi e,
cho a xem full lỗi thử.
file annotation thì tên ảnh với label cách nhau bằng tab e nhé.

@ducnguyent
Copy link
Author

image
Dạ đây a. Em chỉ dụng được data trong file Inkdataline
Em có tab và sử dụng nhưng bị lỗi khi train những ảnh trong folder vi_00, vi_01.... thì bị như v ạ

@pbcquoc
Copy link
Owner

pbcquoc commented Dec 26, 2020

Hi e,
kí tự nó báo không có trong tập từ điển nên nó thường là kí tự lạ, e nên remove nó ra trước nhé.
các kí tự phổ biến của tiếng việt a đã thêm đủ rồi. e có thể lấy tại config['vocab'] nhé

@ducnguyent
Copy link
Author

Dạ cảm ơn a.
Em đã sửa và chạy được rồi ạ.
Mà a cho e hỏi thêm 1 câu: là cái data khoảng 1m ảnh tự phát sinh là do cơ chế nào nó phát sinh ra vậy a. Em cảm ơn a

@pbcquoc
Copy link
Owner

pbcquoc commented Dec 26, 2020

A phát sinh dựa vào thư viện này. https://github.com/Belval/TextRecognitionDataGenerator
Tuy nhiên đó chỉ là một phần dữ liệu mà a dùng để train mô hình đang cung cấp e nhé.

@pbcquoc pbcquoc closed this as completed Dec 29, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants