# AWS Textract

## Descrição do Projeto
Este repositório foi criado para demonstrar como utilizar o AWS Textract para transcrever textos de imagens em formato de texto estruturado. O AWS Textract é um serviço da Amazon Web Services que utiliza machine learning para extrair texto, formulários e tabelas de documentos digitalizados.

In [None]:
# Instale o Boto3 (AWS SDK para Python)
!pip install boto3

In [None]:
import boto3

# Configuração das credenciais da AWS
# Substitua pelos seus próprios valores
aws_access_key_id = ''
aws_secret_access_key = ''
region_name = 'us-east-1'

# Inicializa o cliente do Textract
client = boto3.client('textract', 
                      aws_access_key_id=aws_access_key_id, 
                      aws_secret_access_key=aws_secret_access_key, 
                      region_name=region_name)

In [5]:
def extract_text_from_image(image_path):
    """
    Extrai texto de uma imagem usando o AWS Textract.
    
    :param image_path: Caminho da imagem no sistema de arquivos.
    :return: Texto extraído da imagem.
    """
    # Lê a imagem em formato binário
    with open(image_path, 'rb') as image_file:
        image_bytes = image_file.read()

    # Chama o Textract para detectar texto
    response = client.detect_document_text(Document={'Bytes': image_bytes})

    # Extrai e retorna o texto detectado
    extracted_text = []
    for item in response['Blocks']:
        if item['BlockType'] == 'LINE':
            extracted_text.append(item['Text'])
    
    return '\n'.join(extracted_text)

In [7]:
# Caminho da imagem de exemplo
image_path = 'img.png'

# Extrai o texto da imagem
texto_extraido = extract_text_from_image(image_path)

# Exibe o texto extraído
print("Texto extraído da imagem:")
print(texto_extraido)

Texto extraído da imagem:
Lista de Material Escolar
.3 rolos de fita crepe
.1 bloco de canson A4
.1 fita adesiva
.5 folhas de cartolina
.3 placas de EVA
.1 EVA com gliter
.5 papel colorset
.1 caneta permanente
.1 pacote palito de sorvete
.4 papel cartão
.1 kit leoni n. 1
.1 dicionário
.1 pincel n.14
.1 pasta 20mm
