<a href="https://colab.research.google.com/github/gfdiazc/AI_Agent/blob/main/Crew_AI_An%C3%A1lisis_Competitivo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Celda 1: Importaci√≥n y Configuraci√≥n de Dependencias

In [1]:
import warnings
warnings.filterwarnings('ignore')

In [3]:
!pip install crewai crewai_tools -q -U pypdf chromadb google-generativeai langchain langchain-google-genai google-generativeai spider-client firecrawl-py

In [70]:
import os
import time
import logging
import google.generativeai as genai
from google.colab import userdata
from spider import Spider
from crewai import LLM, Agent, Task, Crew, Process
from crewai_tools import (
    SerperDevTool,
    ScrapeWebsiteTool,
    PDFSearchTool,
    SpiderTool,
    WebsiteSearchTool,
    FirecrawlCrawlWebsiteTool,
    FirecrawlScrapeWebsiteTool,
    FirecrawlSearchTool
)
from dotenv import load_dotenv
from langchain_google_genai import ChatGoogleGenerativeAI
from openai import OpenAI
from crewai.tools import BaseTool
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from firecrawl import FirecrawlApp

# üîë Configurar las claves API desde Google Colab
load_dotenv()
os.environ["OPENAI_API_KEY"] = userdata.get('OPEN_AI_KEY')  # OpenAI GPT
os.environ["GOOGLE_API_KEY"] = userdata.get('GEMINI_2')  # Gemini
os.environ["SERPER_API_KEY"] = userdata.get('SERPER_KEY')  # Serper
os.environ["SPIDER_API_KEY"] = userdata.get('spider_key')  # Spider
os.environ["FIRECRAWLER_API_KEY"] = userdata.get('TU_FIRECRAWL_API_KEY')  # Firecrawler
os.environ["ANTHROPIC_API_KEY"] = userdata.get("anthropic")
os.environ["DEEPSEEK_API_KEY"] = userdata.get("DEEPSEEK_API_KEY")

firecrawl_app = FirecrawlApp(api_key=userdata.get('TU_FIRECRAWL_API_KEY'))

In [69]:
deepseek_llm = LLM(
    model="deepseek/deepseek-chat",
    api_key=os.environ["DEEPSEEK_API_KEY"],
    temperature=1.5,
)


gemini_llm = LLM(
    model="gemini/gemini-1.5-pro-latest",
    api_key=os.environ["GOOGLE_API_KEY"],
    temperature=1.5,
)

claude_llm = LLM(
    model="anthropic/claude-2",
    api_key=os.environ["ANTHROPIC_API_KEY"],
    temperature=1.5,
)

In [68]:
# üîπ Herramienta para investigaci√≥n
search_tool = SerperDevTool()
scrape_tool = ScrapeWebsiteTool()
spider_tool = SpiderTool()
firecrawl_crawl_tool = FirecrawlCrawlWebsiteTool(api_key=os.environ.get('FIRECRAWLER_API_KEY'))
firecrawl_scrape_tool = FirecrawlScrapeWebsiteTool(api_key=os.environ.get('FIRECRAWLER_API_KEY'))


class FirecrawlSearchTool:
    def __init__(self, api_key, **kwargs):
        super().__init__(**kwargs)
        self.api_key = api_key
        self._initialize_firecrawl()

    def _initialize_firecrawl(self) -> None:
        try:
            # Removed the FIRECRAWL_AVAILABLE check
            # Directly initialize FirecrawlApp with the provided api_key
            self._firecrawl = FirecrawlApp(api_key=self.api_key)
        except Exception as e:
            raise ImportError(f"Could not initialize FirecrawlApp: {e}") from e


# Configurar Website tool LLM
website_search_tool = WebsiteSearchTool(
    config=dict(
        llm=dict(
            provider="google",  # Se usa Google como proveedor de LLM
            config=dict(
                model="gemini-1.5-pro-latest",  # Modelo de √∫ltima generaci√≥n
                temperature=0.5,
            ),
        ),
        embedder=dict(
            provider="google",  # Se usa Google para embeddings
            config=dict(
                model="models/embedding-001",  # Mejor modelo de embeddings disponible
                task_type="retrieval_document",
            ),
        ),
    )
)

# Configurar PDF tool LLM
pdf_tool_industria = PDFSearchTool(
    pdf="/content/Telco industry breakfast (Google).pdf",
    config=dict(
        llm=dict(
            provider="google", # or google, openai, anthropic, llama2, ...
            config=dict(
                model="gemini/gemini-1.5-pro-latest",
                temperature=0.5,
                # top_p=1,
                # stream=true,
            ),
        ),
        embedder=dict(
            provider="google", # or openai, ollama, ...
            config=dict(
                model="models/embedding-001",
                task_type="retrieval_document",
                # title="Embeddings",
            ),
        ),
    )
)


# Configurar PDF tool LLM
pdf_tool_satisfaccion = PDFSearchTool(
    pdf="/content/19221.24Q3 SatisfaccioÃÅn 2024 - PresentacioÃÅn v3.pptx.pdf",
    config=dict(
        llm=dict(
            provider="google", # or google, openai, anthropic, llama2, ...
            config=dict(
                model="gemini/gemini-1.5-pro-latest",
                temperature=0.5,
                # top_p=1,
                # stream=true,
            ),
        ),
        embedder=dict(
            provider="google", # or openai, ollama, ...
            config=dict(
                model="models/embedding-001",
                task_type="retrieval_document",
                # title="Embeddings",
            ),
        ),
    )
)



In [71]:
# ‚úÖ Configuraci√≥n centralizada de par√°metros
CONFIG = {
    "cliente": "M√°sM√≥vil",
    "industria": "Telecomunicaciones",
    "competidores": ["Movistar", "Vodafone", "Digi movil", "lowi", "jazztel", "Yoigo"],
    "pais": "Espa√±a",
}

In [73]:
analista_industria = Agent(
    role="Analista de Inteligencia de Mercado en {industria}",
    goal="Identificar oportunidades estrat√©gicas y tendencias emergentes en la industria para {cliente}.",
    backstory=(
        "Eres un experimentado analista con a√±os de experiencia en investigaci√≥n de mercados "
        "y tendencias en el sector de {industria}. Tu especialidad es identificar cambios en el panorama competitivo, "
        "nuevas tecnolog√≠as y factores regulatorios que impactan la industria."
    ),
    tools=[pdf_tool_industria],
    llm=deepseek_llm,
    max_iter=5
)

tarea_industria = Task(
    description=(
        "Analiza el documento de industria correspondiente a {cliente}. Extrae informaci√≥n sobre:\n"
        "- Factores de crecimiento y evoluci√≥n del sector.\n"
        "- Impacto de regulaciones gubernamentales y tecnol√≥gicas.\n"
        "- Principales riesgos y oportunidades estrat√©gicas.\n\n"
        "El an√°lisis debe ser detallado, destacando insights accionables para la toma de decisiones."
    ),
    expected_output="Un informe detallado en markdown con tendencias, riesgos y oportunidades estrat√©gicas.",
    agent=analista_industria,
    output_file="analisis_industria_{cliente}.md"
)


In [75]:
analista_satisfaccion = Agent(
    role="Especialista en Experiencia del Cliente y Retenci√≥n",
    goal="Evaluar m√©tricas de satisfacci√≥n y detectar oportunidades para mejorar la lealtad del cliente en {cliente}.",
    backstory=(
        "Como experto en experiencia del cliente, has trabajado con m√∫ltiples empresas del sector "
        "analizando patrones de satisfacci√≥n y recomendando estrategias para mejorar la retenci√≥n. "
        "Tienes un enfoque basado en datos y sabes interpretar m√©tricas clave para ofrecer recomendaciones concretas."
    ),
    tools=[pdf_tool_satisfaccion],
    llm=deepseek_llm
)

tarea_satisfaccion = Task(
    description=(
        "Realiza un an√°lisis profundo de los datos de satisfacci√≥n del cliente en {cliente}. Identifica:\n"
        "- Puntos cr√≠ticos de insatisfacci√≥n y sus causas.\n"
        "- Comparaci√≥n con est√°ndares del sector.\n"
        "- Acciones prioritarias para mejorar la experiencia del cliente.\n\n"
        "Incluye m√©tricas clave, gr√°ficos y conclusiones que respalden tus hallazgos."
    ),
    expected_output="Un reporte con an√°lisis cuantitativo y cualitativo, incluyendo gr√°ficos y recomendaciones accionables.",
    agent=analista_satisfaccion,
    output_file="reporte_satisfaccion_{cliente}.md"
)

In [1]:
analista_pricing = Agent(
    role="Especialista en Estrategia de Precios y Competencia",
    goal="Definir una estrategia de precios competitiva y rentable para {cliente}, considerando el panorama actual del mercado.",
    backstory=(
        "Eres un estratega de precios con amplia experiencia en el sector telecomunicaciones. "
        "Tu conocimiento en estructuras tarifarias, promociones y elasticidad del precio te permite identificar "
        "oportunidades para mejorar la rentabilidad y competitividad de los planes de servicio."
    ),
    tools=[search_tool, firecrawl_scrape_tool],
    llm=gemini_llm
)

tarea_pricing = Task(
    description=(
        "Realiza un an√°lisis completo de la estrategia de precios en telecomunicaciones en {pais}, "
        "comparando a {cliente} con sus principales competidores: {competidores}.\n\n"
        "El an√°lisis debe incluir:\n"
        "1Ô∏è‚É£ Descripci√≥n de los planes m√°s representativos de cada operador (prepago, pospago, convergentes, etc.).\n"
        "2Ô∏è‚É£ Comparaci√≥n cualitativa de estrategias de precios (¬ølow-cost? ¬øpremium? ¬ødiferenciaci√≥n por servicio?).\n"
        "3Ô∏è‚É£ Identificaci√≥n de ventajas competitivas de cada operador (promociones, descuentos, exclusivas, etc.).\n"
        "4Ô∏è‚É£ Tendencias generales del mercado y c√≥mo afectan la estrategia de {cliente}.\n"
        "5Ô∏è‚É£ Sugerencias estrat√©gicas basadas en oportunidades detectadas."
    ),
    expected_output=(
        "Un informe detallado en formato markdown con:\n"
        "‚úî Un an√°lisis por cada operador (precios, posicionamiento, estrategias clave).\n"
        "‚úî Gr√°ficos o visualizaciones de tendencias si es posible.\n"
        "‚úî Recomendaciones personalizadas para {cliente}, segmentadas por tipo de usuario (ej. heavy data users, familias, low-cost seekers).\n"
    ),
    agent=analista_pricing,
    output_file="estrategia_pricing_{cliente}.md"
)


NameError: name 'Agent' is not defined

In [82]:
investigador_web = Agent(
    role="Investigador de Inteligencia Competitiva",
    goal="Descubrir estrategias de mercado de {competidores} y evaluar su impacto en {cliente}.",
    backstory=(
        "Eres un analista de mercado con experiencia en estudios de competencia en telecomunicaciones. "
        "Dominas la investigaci√≥n en l√≠nea y sabes c√≥mo identificar informaci√≥n clave sobre las estrategias de los competidores, "
        "incluyendo campa√±as de marketing, innovaciones y movimientos estrat√©gicos."
    ),
    tools=[search_tool, firecrawl_scrape_tool],
    llm=deepseek_llm,
)

tarea_navegacion = Task(
    description=(
        "Realiza un an√°lisis de la competencia para {cliente}, investigando las estrategias de {competidores} en {pais}.\n"
        "- ¬øQu√© campa√±as de marketing est√°n ejecutando?\n"
        "- ¬øQu√© innovaciones han introducido recientemente?\n"
        "- ¬øCu√°les son sus fortalezas y debilidades en comparaci√≥n con {cliente}?\n\n"
        "El informe debe incluir un an√°lisis profundo con capturas de informaci√≥n relevante y tendencias identificadas."
    ),
    expected_output="Un dossier detallado con informaci√≥n clave sobre la competencia, incluyendo estrategias y fuentes verificables.",
    agent=investigador_web,
    output_file="analisis_competitivo_{cliente}.md"
)


In [83]:
manager_agent = Agent(
    role="Coordinador de Inteligencia Estrat√©gica",
    goal="Integrar y sintetizar todos los an√°lisis en un informe consolidado con insights estrat√©gicos para {cliente}.",
    backstory=(
        "Eres un ejecutivo senior con experiencia en la toma de decisiones estrat√©gicas basadas en datos. "
        "Tu capacidad de sintetizar informaci√≥n compleja y traducirla en recomendaciones accionables "
        "es fundamental para definir el rumbo de {cliente} en el mercado."
    ),
    llm=gemini_llm,
    max_iter=7
)

tarea_manager = Task(
    description=(
        "Elabora un reporte ejecutivo consolidado con los hallazgos de cada an√°lisis:\n"
        "- Resumen ejecutivo con insights clave.\n"
        "- Principales desaf√≠os y oportunidades detectadas.\n"
        "- Recomendaciones estrat√©gicas para mejorar la posici√≥n competitiva de {cliente}.\n\n"
        "El informe debe estar bien estructurado y listo para ser presentado a directivos."
    ),
    expected_output="Un reporte ejecutivo en markdown con insights clave, gr√°ficos y estrategias accionables.",
    agent=manager_agent,
    output_file="reporte_final_{cliente}.md"
)


In [85]:
# üöÄ Configuraci√≥n de la Crew
project_crew = Crew(
    agents=[
        analista_industria,
        analista_satisfaccion,
        analista_pricing,
        investigador_web
    ],
    tasks=[
        tarea_navegacion,
        tarea_industria,
        tarea_pricing,
        tarea_satisfaccion,
        tarea_manager  # ‚úÖ A√±adimos la tarea del manager
    ],
    manager_agent=manager_agent,
    process=Process.hierarchical,
    verbose=True,
    planning=False  # ‚úÖ Desactivamos planificaci√≥n para evitar errores
)



In [None]:
# ‚ö° Ejecuci√≥n de la Crew
resultados = project_crew.kickoff(inputs=CONFIG)

# üìå Mostrar resultados
print("\n" + "="*50)
print("Resultados del An√°lisis Competitivo")
print("="*50)
print(resultados)

[1m[95m# Agent:[00m [1m[92mCoordinador de Inteligencia Estrat√©gica[00m
[95m## Task:[00m [92mRealiza un an√°lisis de la competencia para M√°sM√≥vil, investigando las estrategias de ['Movistar', 'Vodafone', 'Digi movil', 'lowi', 'jazztel', 'Yoigo'] en Espa√±a.
- ¬øQu√© campa√±as de marketing est√°n ejecutando?
- ¬øQu√© innovaciones han introducido recientemente?
- ¬øCu√°les son sus fortalezas y debilidades en comparaci√≥n con M√°sM√≥vil?

El informe debe incluir un an√°lisis profundo con capturas de informaci√≥n relevante y tendencias identificadas.[00m
[1m[95m# Agent:[00m [1m[92mInvestigador de Inteligencia Competitiva[00m
[95m## Task:[00m [92mPlease research the following competitors of M√°sM√≥vil in Spain: Movistar, Vodafone, Digi Mobil, Lowi, Jazztel, and Yoigo. For each competitor, investigate their current marketing campaigns, recent innovations, and their strengths and weaknesses compared to M√°sM√≥vil. Please provide verifiable sources for all information.  Th