In [None]:
import boto3
import os

os.environ["AWS_ACCESS_KEY_ID"] = "XXXXXXXXXXXXX"
os.environ["AWS_SECRET_ACCESS_KEY"] = "XXXXXXXXXXXXXx"
os.environ["AWS_DEFAULT_REGION"] = "us-east-1"

def detect_text_in_image(image_bytes):
    """
    Detecta texto en una imagen usando Amazon Rekognition.

    +
    Parámetros:
    - image_bytes: Contenido de la imagen en bytes.
    
    Retorna:
    - Lista de textos detectados con sus coordenadas.
    """
    # Crear cliente de Rekognition
    rekognition_client = boto3.client('rekognition')

    # Llamar a DetectText
    response = rekognition_client.detect_text(
        Image={'Bytes': image_bytes}
    )

    # Extraer texto detectado
    detected_texts = []
    for item in response['TextDetections']:
        detected_texts.append({
            "Texto": item['DetectedText'],
            "Confianza": item['Confidence'],
            "Tipo": item['Type'],  # 'LINE' o 'WORD'
            "Coordenadas": item['Geometry']['BoundingBox']
        })

    return detected_texts

# Leer imagen y ejecutar detección
image_path = "foto_marquesina.jpg"  # Ruta de la imagen
with open(image_path, "rb") as image_file:
    image_bytes = image_file.read()

# Detectar texto
result = detect_text_in_image(image_bytes)

# Imprimir resultado
for text in result:
    print(f"Texto: {text['Texto']} - Confianza: {text['Confianza']:.2f}% - Tipo: {text['Tipo']}")

Texto: COLOMBIA - Confianza: 98.79% - Tipo: LINE
Texto: POTENCIA DE LA - Confianza: 98.80% - Tipo: LINE
Texto: TIC - Confianza: 100.00% - Tipo: LINE
Texto: VIDA - Confianza: 100.00% - Tipo: LINE
Texto: INTELIGENCIA - Confianza: 99.60% - Tipo: LINE
Texto: ARTIFICIAL - Confianza: 99.25% - Tipo: LINE
Texto: ¡Ya vienen las pruebas - Confianza: 98.76% - Tipo: LINE
Texto: de conocimiento! - Confianza: 96.80% - Tipo: LINE
Texto: EDUCA - Confianza: 99.16% - Tipo: LINE
Texto: 16, 17 y 18 de diciembre - Confianza: 99.26% - Tipo: LINE
Texto: TECH - Confianza: 71.15% - Tipo: LINE
Texto: TALENTO - Confianza: 98.36% - Tipo: LINE
Texto: COLOMBIA - Confianza: 98.79% - Tipo: WORD
Texto: POTENCIA - Confianza: 97.48% - Tipo: WORD
Texto: DE - Confianza: 99.28% - Tipo: WORD
Texto: LA - Confianza: 99.63% - Tipo: WORD
Texto: TIC - Confianza: 100.00% - Tipo: WORD
Texto: VIDA - Confianza: 100.00% - Tipo: WORD
Texto: INTELIGENCIA - Confianza: 99.60% - Tipo: WORD
Texto: ARTIFICIAL - Confianza: 99.25% - Tipo: WOR

In [9]:
for text in result:
    print(f"Texto: {text['Texto']} - Confianza: {text['Confianza']:.2f}% - Tipo: {text['Tipo']} - Coordenadas: {text['Coordenadas']}")

Texto: COLOMBIA - Confianza: 98.79% - Tipo: LINE - Coordenadas: {'Width': 0.0668402761220932, 'Height': 0.0283203125, 'Left': 0.0889756977558136, 'Top': 0.0986328125}
Texto: POTENCIA DE LA - Confianza: 98.80% - Tipo: LINE - Coordenadas: {'Width': 0.0655381977558136, 'Height': 0.017578125, 'Left': 0.0898437350988388, 'Top': 0.1298828125}
Texto: TIC - Confianza: 100.00% - Tipo: LINE - Coordenadas: {'Width': 0.0533854179084301, 'Height': 0.05859375, 'Left': 0.9171006679534912, 'Top': 0.1142578125}
Texto: VIDA - Confianza: 100.00% - Tipo: LINE - Coordenadas: {'Width': 0.0655381977558136, 'Height': 0.044921875, 'Left': 0.08984375, 'Top': 0.15234375}
Texto: INTELIGENCIA - Confianza: 99.60% - Tipo: LINE - Coordenadas: {'Width': 0.0607638880610466, 'Height': 0.01953125, 'Left': 0.49609375, 'Top': 0.25}
Texto: ARTIFICIAL - Confianza: 99.25% - Tipo: LINE - Coordenadas: {'Width': 0.0473090261220932, 'Height': 0.0205078125, 'Left': 0.5143229365348816, 'Top': 0.27734375}
Texto: ¡Ya vienen las prueb