Apache Tika est un toolkit développé par la fondation Apache qui permet de détecter, d'extraire des métadonnées, et de structurer le contenu textuel de nombreux types de documents
Ce repo contient les dockerfiles nécessaires à la mise en place d'un service Tika, inspiré de la distribution officielle d'Apache.
Les éléments de ce repo sont directement inspirés et repris du docker officiel d'Apache Tika
Pour instancier localement une image Tika d'Openjustice :
# Avec OCR
$ docker run --rm -it -p 9998:9998 --name tika openjustice/tika:1.25-ocr
# Sans OCR
$ docker run --rm -it -p 9998:9998 --name tika openjustice/tika:1.25