Notebook 1: Trabajas en una compañía en el departamento de soporte TI. Ya llevas varios años y te das cuenta de que el trabajo es repetitivo y los usuarios suelen cometer los mismo errores. Con el tiempo el trabajo se va volviendo muy fácil y estás buscando como hacerlo más interesante de acuerdo a tus habilidades.

Has pensado en utilizar tus conocimientos avanzados en Python y las sofisticadas herrarmientas de Inteligencia Artifical de Google para automatizar tu trabajo! En especial la plataforma de tickets (Trello).

Objetivo: Crear una solución que tome los videos de los problemas de los usuarios, cree, resuma, etiquete y gestione targetas en Trello (Herramienta de tickets de desarrollo y soporte) automáticamente.

Instalamos dependencias

In [None]:
%pip install --upgrade --quiet google-cloud-discoveryengine

In [None]:
# Podemos explicar para que se instala esto?
!pip install google-api-python-client

In [None]:
# Instalamos paquetes para conectarnos a los servicios de Google
!pip install google-auth
!pip install google-auth-oauthlib

In [None]:
# Instalamos Vertex AI (Plataforma de desarrollo de soluciones de AI Generativa).
# Con esta plataforma podremos acceder a los differentes modelos de Gemini de Google y a otros servicios de Agentes y Chat.
!pip install vertexai

In [None]:
# Instalarémos un paquete para que Langchain interactue con Google Vertex AI
!pip install langchain-core
!pip install -qU langchain-google-vertexai



In [None]:
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory()

#### Mencionar de donde se saca la service account y su paso a paso
Importamos las librerías de Google que instalamos previamente, y configuramos las credenciales de Google para autenticarnos con Google Cloud Platform a través de una cuenta de servicio.


In [None]:
from google.oauth2 import service_account

# Path to your service account key file
SERVICE_ACCOUNT_FILE = "prj-uc-genai-labs-8859d31dca67.json"

# Define the scopes
SCOPES = ["https://www.googleapis.com/auth/cloud-platform"]

# Authenticate and construct service
credentials = service_account.Credentials.from_service_account_file(
        SERVICE_ACCOUNT_FILE, scopes=SCOPES)

Importamos Vertex AI, y desde Vertex AI obtenemos los constructores de las clases GenerativeModel y Part, que nos permitiran interactuar fácilmente con la API y diferentes tipos de formatos con los que podremos interactuar con el modelo (Texto, Imágenes, Audio, etc.)

Crear storage bucket y subir archivo de video a Storage Bucket. 

Tener cuidado de indicar el project_id correcto.

In [None]:
import vertexai
from vertexai.generative_models import GenerativeModel, Part

def generate_video_description(project_id, location, model_name, video_file_uri, prompt):
    vertexai.init(project=project_id, location=location)

    model = GenerativeModel(model_name)

    video_file = Part.from_uri(video_file_uri, mime_type="video/mov")

    contents = [video_file, prompt]

    response = model.generate_content(contents)
    return response.text

# Configuramos los parametros de la API para que funcione con nuestro proyecto de Google Cloud
project_id = "prj-uc-genai-labs"
location = "us-central1"

# Configuramos los parametros del modelo y el tipo de input que le entregarémos.
model_name = "gemini-1.5-pro-preview-0409"
video_file_uri = (
    "gs://workshop-bucket-elgueta-2024/Screen Recording 2024-04-26 at 14.35.40.mov"
)
prompt = """
  Provide a description of the video.
  The description should also contain anything important which people say in the video.
  Output a json with this schema:
  {
    "description": "The description of the problem the user is facing",
    }
"""

description = generate_video_description(project_id, location, model_name, video_file_uri, prompt)

# Pequeño Debug para ver que nos está devolviendo la API
print(description)

In [None]:
from langchain_core.messages import HumanMessage
from langchain_google_vertexai import ChatVertexAI

# Configuramos los parametros de la API para que funcione con nuestro proyecto de Google Cloud
project_id = "prj-uc-genai-labs"
location = "us-central1"

# Configuramos los parametros del modelo y el tipo de input que le entregarémos.
model_name = "gemini-1.5-pro-preview-0409"
video_file_uri = "gs://workshop-bucket-elgueta-2024/0424.mp4"

# Define the text message with the formatted prompt
text_message = {
    "type": "text",
    "text": """ Provide a description of the video.
  The description should also contain anything important which people say in the video.""",
}
image_message = {"type": "media", "mimeType": "video/mp4", "video_url": video_file_uri}
message = HumanMessage(content=[text_message, image_message])
llm = ChatVertexAI(model_name=model_name)

# Invoke the API client with the message
output = llm.invoke([prompt])
response = output.content

In [None]:
print(response)

Ahora que tenemos configurado Google Cloud, Vertex AI, el Modelo y sus Parámetros, querémos interactuar con la API de trello para que Gemini pueda gestionar los tickets. Para esto debemos

1. Crear una cuenta de Trello en https://www.trello.com
2. Creamos un Power App, una especie de conector entre un tablero de trello y su API
3. Generámos y copiamos la API Key para interactuar con la plataforma sin credenciales

In [None]:
# Esta función podrá ser llamada por el modelo utilizando xxxxxxx
def create_trello_card(name, due, start):
    import requests
    import json

    url = "https://api.trello.com/1/cards"

    headers = {"Accept": "application/json"}

    query = {
        "idList": "662a0837e895ddb3063a6277", # Reemplazar por valores propios
        "key": "28c3d510ab4b942cf31f2993d4059942", # Reemplazar por valores propios
        "token": "ATTAf9894d9fcfa1a44dd9653a65f141f58e7503c196515909dd2eea97fe41b3ed43D5A5A316", # Reemplazar por valores propios
        "name": name,
        "due": due,
        "start": start,
    }

    response = requests.request("POST", url, headers=headers, params=query)

    print(
        json.dumps(
            json.loads(response.text), sort_keys=True, indent=4, separators=(",", ": ")
        )
    )


Creamos el modelo Pydantic #QUE NOS PERMITIRÁ..............

In [None]:
from pydantic import BaseModel, Field
from typing import Optional
from datetime import datetime
from langchain_community.retrievers import (
    GoogleVertexAISearchRetriever,
)

class CreateTrelloCardandAnswer(BaseModel):
    """
    Function that calls the Trello API to create a new card.
    
    """
    name: str = Field(..., description="Short description of the user problem")
    due: Optional[datetime] = Field(...,description="Name of the card")
    start: Optional[datetime] = Field(...,description="Name of the card")
    query: str = Field(..., description="Query to search")

In [None]:
def retrieve_from_search(query):

    PROJECT_ID = project_id  # Set to your Project ID
    LOCATION_ID = "global"  # Set to your data store location
    DATA_STORE_ID = "workshop-datastore_1714130543853"  # Set to your data store ID
    retriever = GoogleVertexAISearchRetriever(
        project_id=PROJECT_ID,
        location_id=LOCATION_ID,
        data_store_id=DATA_STORE_ID,
        max_documents=3,
        engine_data_type=1,
    )
    result = retriever.invoke(query)
    return result

Establecemos una connexión entre Langchain y el Chat de Vertex AI

In [None]:
from langchain_google_vertexai import ChatVertexAI
from langchain_core.prompts import ChatPromptTemplate

In [None]:
initial_prompt = """
Output json. Call the Trello Tool to create a new ticket and the RetrieveSearch to find the answer.
User input: {input}
"""

In [None]:
tools = [CreateTrelloCardandAnswer]
llm = ChatVertexAI(
    model="gemini-1.5-pro-preview-0409",
    credentials=credentials,
    project_id="prj-uc-genai-labs",
    location="us-central1",
)

prompt = ChatPromptTemplate.from_template(initial_prompt)

llm_with_tools = llm.bind_tools(tools)
chain = prompt | llm_with_tools

result = chain.invoke({"input": description})

print(result.additional_kwargs)

Creamos el Search Engine en Google Cloud Console:

Autenticamos en Google Colab

In [None]:
from langchain_core.messages.base import message_to_dict
import json

response_dict = message_to_dict(result)
function_call = response_dict.get("data", {}).get("additional_kwargs", {}).get("function_call", {})


# Assuming 'arguments' is a JSON string, we need to parse it
arguments_str = function_call.get("arguments", "{}")  # Default to empty JSON object if not found
try:
    arguments = json.loads(arguments_str)  # Attempt to parse the string as JSON
except json.JSONDecodeError:
    arguments = {}  # If parsing fails, default to an empty dictionary


if function_call.get("name") == "CreateTrelloCardandAnswer":
    print(type(arguments))  # This should now be 'dict' if the JSON was parsed successfully
    create_trello_card(
        name=arguments.get("name"),
        due=arguments.get("due"),
        start=arguments.get("start"),
    )
    answer = retrieve_from_search(arguments.get("query"))


In [None]:
print(answer)

In [None]:
initial_prompt = """
Based on the user input, and the content retrieved from the search engine, output a response that resolves the user problem.
User input: {input}
Search result: {search_result}
"""
llm = ChatVertexAI(
    model="gemini-1.5-pro-preview-0409",
    credentials=credentials,
    project_id="prj-uc-genai-labs",
    location="us-central1",
)

prompt = ChatPromptTemplate.from_template(initial_prompt)

chain = prompt | llm

result = chain.invoke({"input": description, "search_result": answer})

print(result)