In [None]:
import os
import dotenv
import pathlib
import textwrap
import PIL.Image as pillow
import google.generativeai as genai 

from typing import (
  Dict,
  List
)
from IPython.display import (
  display,
  display_jpeg,
  Markdown
)

def to_markdown(text):
  text = text.replace('•', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

In [49]:
dotenv.load_dotenv()
api_key = os.environ.setdefault ('google_api_key', os.getenv('google_api_key'))
genai.configure(api_key=api_key)

In [50]:
model = genai.GenerativeModel(
  model_name='models/gemini-1.5-pro'
)

In [51]:
messages = [
  """
  Que es un LLM?
  """,
  """
  Un LLM es un modelo de aprendizaje profundo?
  """
]

In [52]:
response = model.generate_content(messages)
response.resolve()

In [53]:
to_markdown(response.text)

> Un LLM, o Modelo de Lenguaje Grande (Large Language Model en inglés), es un modelo de aprendizaje automático que ha sido entrenado con cantidades masivas de datos de texto.  Son capaces de generar texto, traducir idiomas, escribir diferentes tipos de contenido creativo y responder a tus preguntas de forma informativa.
> 
> Sí, un LLM **es** un tipo específico de modelo de aprendizaje profundo. Utiliza una arquitectura de red neuronal profunda, a menudo basada en transformadores, para procesar y generar lenguaje. La "grandeza" en LLM se refiere tanto a la gran cantidad de datos con los que se entrena como a la gran cantidad de parámetros que componen su arquitectura de red neuronal, lo que le permite aprender patrones y estructuras complejas en el lenguaje.


In [None]:
data_path_split = os.getcwd().split('\\')
ROOT_PATH = "\\".join(data_path_split[:len(data_path_split)-2])
DATA_PATH = ROOT_PATH + '\\_data\\private\\'

# modificar: tiene 3 for 
def get_files (directory: str, fmt: List[str]):
  dict_files:Dict = { f:[] for f in fmt }

  for root,_,files in os.walk (directory):
    for file in files:
      for f in fmt:
        if file.endswith(f):
          dict_files[f].append(os.path.join(root,file))

  return dict_files

files = get_files(DATA_PATH, ['.pdf','.jpg'])
files

{'.pdf': ['d:\\Study\\- PROYECTOS\\python-code-vault\\main\\_data\\private\\documents\\experimental-functions.pdf',
  'd:\\Study\\- PROYECTOS\\python-code-vault\\main\\_data\\private\\documents\\Martin George R R - Cancion De Hielo Y Fuego 01 - Juego de Tronos.pdf',
  'd:\\Study\\- PROYECTOS\\python-code-vault\\main\\_data\\private\\documents\\results_02_acapulco.pdf'],
 '.jpg': ['d:\\Study\\- PROYECTOS\\python-code-vault\\main\\_data\\private\\img\\img_1.jpg']}

In [56]:
imgs = [
  pillow.open( files.get('.jpg')[0] )
]

In [None]:
# display img
for i in imgs:
  display_jpeg(i)

In [57]:
messages = [
  "que nos dice cada imagen?"
]
messages = messages + imgs

In [58]:
response = model.generate_content( messages )
response.resolve ()

In [59]:
to_markdown(response.text)

> La imagen representa una reunión futurista o un centro de control donde los participantes colaboran utilizando tecnología avanzada.  Aquí te doy un desglose de lo que sugiere la imagen:
> 
> * **Visualización de datos:** Las pantallas muestran una variedad de gráficos, tablas y otros tipos de visualizaciones de datos, lo que indica un enfoque en el análisis y la toma de decisiones basadas en datos.
> * **Colaboración:** Las personas están sentadas alrededor de una mesa circular, lo que sugiere un entorno colaborativo donde todos los participantes tienen igual acceso a la información y pueden contribuir a la discusión.
> * **Tecnología holográfica:** Las figuras holográficas en el centro de la mesa sugieren el uso de tecnología avanzada para representar datos o información de una manera interactiva y tridimensional.  Podría ser una representación de datos demográficos, perfiles de clientes, o cualquier otra información relevante para la reunión.
> * **Futurista:** El diseño general de la sala, con sus pantallas transparentes y la tecnología holográfica, crea una impresión futurista, lo que sugiere que la imagen representa una visión del futuro del trabajo y la colaboración.
> * **Diversidad:** La imagen muestra una variedad de personas con diferentes etnias y géneros, lo que sugiere un ambiente de trabajo inclusivo y diverso.
> * **Toma de decisiones:** La combinación de datos, colaboración y tecnología sugiere que este espacio está diseñado para facilitar la toma de decisiones informadas y estratégicas.
> 
> En resumen, la imagen nos habla del potencial de la tecnología para transformar la forma en que trabajamos y colaboramos, utilizando la visualización de datos y la interacción holográfica para mejorar la toma de decisiones en un entorno diverso e inclusivo.
