Extraction de contacts à partir d'images

Troisième projet lors de la formation en BUT Informatique, j'ai réalisé avec mon équipe un système automatisé permettant d'extraire une liste de contacts pour une entreprise à partir de captures d'écrans ou de scans. Le système propose un rendu en HTML, en PDF ou en CSV.

Technologies

Le projet utilise une suite de conteneurs Docker, qui permet de gérer des systèmes indépendants mais bien moins gourmands en ressources que des systèmes virtualisés. Chaque conteneur effectue une tâche simple et tous sont reliés à un volume commun, c'est-à-dire une zone de dépot de fichiers. Les conteneurs ont été préalablement conçus, nous n'avions plus qu'à les utiliser.

Le premier conteneur se sert de la technologie de reconnaissance de caractères de Google, Tesseract OCR, dans le but d'extraire les textes des captures d'écran. Ensuite, le deuxième conteneur entre en jeu et transforme ce résultat brut en un fichier CSV. Enfin, le dernier conteneur utilise un ensemble d'outils de conversion, dont Weasyprint pour la conversion HTML vers PDF.

Documentation

Pour plus d'informations sur le fonctionnement, regarder la documentation

Équipe

Enzo MAROS (Chef de Projet)
Alexie GROSBOIS
Noah BROHAN
Ronan BRAGATO

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
src		src
test		test
README.md		README.md
Schéma.png		Schéma.png
documentation.md		documentation.md
documentation.pdf		documentation.pdf
envoyer		envoyer
recuperer		recuperer
start		start
stop		stop

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Extraction de contacts à partir d'images

Technologies

Documentation

Équipe

About

Releases 1

Packages

Languages

zothma/docker-ocr

Folders and files

Latest commit

History

Repository files navigation

Extraction de contacts à partir d'images

Technologies

Documentation

Équipe

About

Resources

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages