# Clasificación y resumen de datos usando IBM Granite

Este proyecto utiliza un modelo de lenguaje de IBM Granite a través de la API de Replicate para analizar reseñas de productos.

## Objetivos:
- Clasificar reseñas como positivas, negativas o mixtas.
- Identificar aspectos clave (pantalla, batería, rendimiento...).
- Generar una explicación automática de la clasificación.

Este notebook fue desarrollado como parte del programa IBM SkillsBuild.

## Paquetes necesarios:

In [5]:
!pip install langchain_community
!pip install replicate



## Clasificación de datos

In [6]:
from langchain_community.llms import Replicate
import os
from google.colab import userdata

# Establecer el token de API
api_token = userdata.get('api_token')
os.environ["REPLICATE_API_TOKEN"] = api_token

# Configuración del modelo
model = "ibm-granite/granite-3.3-8b-instruct"

output = Replicate(
    model = model,
    replicate_api_token = api_token,
)

# Definir las reviews de los customers
customer_reviews = [
    "The battery lasts all day, bnut the phone gets hot during gaming.",
    "The screen is too dim outdoors, but I love the colors indoors.",
    "This phone is fast, but it keeps crashing when I open certain apps."

]

# Refinar la solicitud para incluir reseñas
reviews_text = "\n".join([f'Review {i+1}: {review}' for i, review in enumerate (customer_reviews)])

#prompt = f"""
#Classify these reviewa as positive, negative or mixed, and tag relevant categories (battery life, screen quality or performance):

#{reviews_text}
#"""

#multitask_prompt = f"""
#Complete the task in 2 steps.

#Step 1: Classify these reviews as positive, negative or mixed.
#Step 2: For each review, identify relevant categories: battery life, screen quality or performance,

formatted_prompt = f"""
Classify these reviews as Positive, Negative or Mixed, and tag relevant categories. Use this format:

- Sentiment: [Sentiment]
- Categories: [Categories]

{reviews_text}
"""

# Invocar el modelo con la solicitud de ejemplo
response = output.invoke(formatted_prompt)

# Imprimir la respuesta
print("Granite Model Response:\n")
print(response)

Granite Model Response:

- Sentiment: Mixed
  - Categories: Battery life, Heat generation, Display quality

- Sentiment: Mixed
  - Categories: Display quality (outdoor visibility), Indoor display quality

- Sentiment: Negative
  - Categories: Performance stability, App compatibility


## Resumen de datos

In [None]:
from langchain_community.llms import Replicate
import os
from google.colab import userdata

# Establecer el token de API
api_token = userdata.get('api_token')
os.environ["REPLICATE_API_TOKEN"] = api_token

# Configuración del modelo
model = "ibm-granite/granite-3.3-8b-instruct"

output = Replicate(
    model = model,
    replicate_api_token = api_token,
)

# Definir las reviews de los customers
customer_meetings = [
"""
La reunión comenzó con una discusión sobre el presupuesto de
marketing del tercer trimestre. Se decidió que el 40 % del
presupuesto se destinará a anuncios digitales, el 30 % a eventos y
el 30 % a campañas en redes sociales. El equipo enfatizó la
necesidad de concretar asociaciones con influencers para aumentar
la visibilidad de la marca y el marketing por correo electrónico
para impulsar la interacción directa. El próximo mes se lanzará un
programa piloto para probar nuevos formatos de anuncios y el
equipo revisará los resultados a finales del tercer trimestre.
Posteriormente, el equipo discutió las métricas de rendimiento de
la campaña. El seguimiento del ROI será una máxima prioridad y se
realizarán ajustes en función de los datos de rendimiento.
El equipo de eventos planteó inquietudes sobre la asignación de
recursos para las próximas ferias comerciales y se acordó que se
reasignarían $10.000 adicionales para cubrir estos gastos.
Por último, el equipo revisó nuevos conceptos creativos para la
próxima campaña y decidió continuar con el Concepto 8, que tuvo
mejores resultados entre los focus groups. Se ultimaron los plazos
para la entrega de los activos de campaña: todos los entregables
deben presentarse a más tardar el 15 de julio.
"""
]

# Refine the prompt to include reviews
reviews_text = "\n".join([f"Review {i+1}: {review}" for i, review in enumerate (customer_meetings)])

# prompt = f"""
# Resume esta reunión:

# refined_prompt = f"""
# Resume esta reunión en tres frases:

# refined_focusarea_prompt = f"""
# Resume esta reunión centrándote en los puntos clave, las decisiones tomadas y las acciones pendiente:

refined_outputformat_prompt = f"""
Resume esta reunión en un formato estructurado, utilizando los siguientes títulos: Puntos clave discutidos, Decisiones tomadas y Acciones pendientes.
Menciona los cronogramas.
Incluye solo dos viñetas concisas para cada título.

{reviews_text}
"""

# Invocar el modelo con la solicitud de ejemplo
respuesta = output.invoke(refined_outputformat_prompt)

# Imprimir la respuesta
print("Granite Model Response:\n")

print(respuesta)

Granite Model Response:

**Puntos clave discutidos:**

- Asignación del presupuesto de marketing para el TQ3: 40% a anuncios digitales, 30% a eventos y 30% a campañas en redes sociales.
- Priorizar asociaciones con influencers y marketing por correo electrónico para aumentar la interacción directa.

**Decisiones tomadas:**

- Lanzar un programa piloto para nuevos formatos de anuncios en el próximo mes, con revisión de resultados a finales del TQ3.
- Realizar un seguimiento del ROI y ajustar estrategias según los datos de rendimiento.
- Asignar $10,000 adicionales para eventos, abordando las preocupaciones del equipo de eventos sobre recursos.
- Seleccionar Concepto 8 para la próxima campaña, basado en resultados positivos de los grupos focales.

**Acciones pendientes:**

- Presentar todos los activos de campaña para el 15 de julio, cumpliendo con el plazo establecido.
- Continuar monitoreando el ROI y realizar ajustes estratégicos en función de los datos de rendimiento recopilados.


## Conclusiones

Este proyecto demuestra cómo se puede usar IBM Granite y LangChain para realizar análisis automatizado de texto en el contexto de reseñas de productos.

Es una muestra sólida del potencial de los LLMs en tareas prácticas de clasificación y explicación.
