# Ejemplo práctico - Imagen a Texto

In [1]:
import warnings
warnings.filterwarnings("ignore")

In [2]:
import os

GOOGLE_API_KEY=os.getenv("GOOGLE_API_KEY")

import google.generativeai as genai
from google.api_core.client_options import ClientOptions
genai.configure(
    api_key=GOOGLE_API_KEY,
    transport="rest", #  protocolo de comunicacion REST (Representational State Transfer)
    client_options=ClientOptions(
        api_endpoint=os.getenv("GOOGLE_API_BASE"),
    )
)

## Vision Function

In [3]:
import textwrap
import PIL.Image
from IPython.display import Markdown, Image
'''reemplaza los puntos (•) por asteriscos (*) para formato de lista en Markdown, 
y luego aplica un sangrado de ">" al texto, formateándolo como un bloque de cita en Markdown.'''
def to_markdown(text):
    text = text.replace("•", "  *")
    return Markdown(textwrap.indent(text, "> ", predicate=lambda _: True))

def call_LMM(image_path: str, prompt: str, plain_text: bool=False) -> str:
    img = PIL.Image.open(image_path)
    genai.configure(api_key=GOOGLE_API_KEY)
    model = genai.GenerativeModel("gemini-1.5-flash")
    response = model.generate_content([prompt, img], stream=True)
    response.resolve()
    
    if(plain_text):
        return response.text
    else:
        return to_markdown(response.text)

## Extracción de información estructurada de imagen
### Análisis del presupuesto

In [None]:
from IPython.display import Image

Image(url="factura.png")

In [None]:

call_LMM("factura.png",
    """Identifica los artículos en la factura. Asegúrate de que la salida sea en formato 
    JSON con la cantidad, descripción, precio unitario y monto.""")

In [None]:
call_LMM("factura.png",
    """¿Cuánto costarían cuatro juegos de brazos de pedal y 6 horas de mano de obra?""",
    plain_text=True
)

### Extracción de tablas de imagenes

In [None]:
Image("telecentro.png")

In [None]:
call_LMM("telecentro.png", 
    "Imprime el contenido de la imagen como una tabla en markdown.")

In [None]:
call_LMM("telecentro.png", 
    """Analiza el contenido de la imagen como una tabla en markdown. Cuál es el plan
    que tiene el precio mas bajo por GB?""")

### Análisis de  Flow Charts

In [None]:
Image("diagrama.png")

In [None]:
call_LMM("diagrama.png", 
    """Proporciona un desglose resumido del diagrama de flujo en la imagen en formato de lista numerada. 
    En español""")

In [None]:
call_LMM("diagrama.png", 
    """Analiza el diagrama de flujo en la imagen, luego genera un
      código en Python que implemente este flujo lógico en una función""")