In [1]:
import pandas as pd
import os

def load_and_clean_data(filepath: str) -> pd.DataFrame:
    """Carga, limpia y prepara el DataFrame de avisos desde un archivo Excel."""
    try:
        df = pd.read_excel(filepath)
    except FileNotFoundError:
        print(f"¡ERROR! No se encontró el archivo con nombre: '{filepath}'")
        return None
    df.columns = df.columns.str.lower().str.replace(' ', '_').str.replace('.', '', regex=False)
    date_columns = ['creado_el', 'inicio_deseado', 'fin_deseado', 'fecha_de_cierre']
    for col in date_columns:
        df[col] = pd.to_datetime(df[col], errors='coerce')
    df['indicador_abc'].fillna('No Especificado', inplace=True)
    print("✅ Datos cargados y limpiados exitosamente.")
    return df

df = load_and_clean_data('avisos_prueba_tecnica.xlsx')
if df is not None:
    print("DataFrame listo para el agente.")

✅ Datos cargados y limpiados exitosamente.
DataFrame listo para el agente.


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['indicador_abc'].fillna('No Especificado', inplace=True)


In [8]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_experimental.agents.agent_toolkits import create_pandas_dataframe_agent
from dotenv import load_dotenv
import os

# --- PREPARACIÓN DE LA API KEY ---
# 1. Crea un archivo llamado '.env' en la carpeta raíz de tu proyecto.
# 2. Dentro de ese archivo, escribe: GOOGLE_API_KEY="AIzaSy...tu_clave_aqui"
# 3. La siguiente línea carga esa clave de forma segura.
load_dotenv('../.env')

# 1. Inicializamos el Modelo (LLM)
llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash", temperature=0)

# 2. Creamos el Agente de Pandas
agent_executor = create_pandas_dataframe_agent(
    llm,
    df, # Usamos el DataFrame 'df' cargado en la celda anterior
    verbose=True,
    allow_dangerous_code=True
)

# 3. ¡Hacemos una pregunta!
pregunta = "¿Cuántos avisos se crearon en el año 2021?"
respuesta = agent_executor.invoke({"input": pregunta})

print("\n\n--- RESPUESTA FINAL ---")
print(respuesta["output"])

E0000 00:00:1760143566.473081 22313971 alts_credentials.cc:93] ALTS creds ignored. Not running on GCP and untrusted ALTS is not enabled.




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mAction: python_repl_ast
Action Input:
df['creado_el'] = pd.to_datetime(df['creado_el'])
avisos_2021 = df[df['creado_el'].dt.year == 2021]
count_2021 = len(avisos_2021)
print(count_2021)[0m[36;1m[1;3mNameError: name 'pd' is not defined[0m[32;1m[1;3mAction: python_repl_ast
Action Input:
import pandas as pd
df['creado_el'] = pd.to_datetime(df['creado_el'])
avisos_2021 = df[df['creado_el'].dt.year == 2021]
count_2021 = len(avisos_2021)
print(count_2021)[0m[36;1m[1;3m23
[0m[32;1m[1;3mFinal Answer: 23[0m

[1m> Finished chain.[0m


--- RESPUESTA FINAL ---
23


In [9]:
pip install langchain-deepseek

Collecting langchain-deepseek
  Downloading langchain_deepseek-0.1.4-py3-none-any.whl.metadata (1.1 kB)
Collecting langchain-openai<1.0.0,>=0.3.28 (from langchain-deepseek)
  Downloading langchain_openai-0.3.35-py3-none-any.whl.metadata (2.4 kB)
Collecting openai<3.0.0,>=1.104.2 (from langchain-openai<1.0.0,>=0.3.28->langchain-deepseek)
  Downloading openai-2.3.0-py3-none-any.whl.metadata (29 kB)
Collecting tiktoken<1.0.0,>=0.7.0 (from langchain-openai<1.0.0,>=0.3.28->langchain-deepseek)
  Downloading tiktoken-0.12.0-cp311-cp311-macosx_11_0_arm64.whl.metadata (6.7 kB)
Collecting distro<2,>=1.7.0 (from openai<3.0.0,>=1.104.2->langchain-openai<1.0.0,>=0.3.28->langchain-deepseek)
  Downloading distro-1.9.0-py3-none-any.whl.metadata (6.8 kB)
Collecting jiter<1,>=0.10.0 (from openai<3.0.0,>=1.104.2->langchain-openai<1.0.0,>=0.3.28->langchain-deepseek)
  Downloading jiter-0.11.0-cp311-cp311-macosx_11_0_arm64.whl.metadata (5.2 kB)
Collecting regex>=2022.1.18 (from tiktoken<1.0.0,>=0.7.0->lang