In [1]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain.chains.combine_documents import create_stuff_documents_chain
from dotenv import load_dotenv
import pandas as pd

In [2]:
#Carrega as variaveis de ambiente
load_dotenv()

True

In [3]:
file_path = r'vendas.csv'

In [4]:
loader = CSVLoader(file_path,
                   csv_args={
                       'delimiter': ',',
                       'fieldnames': ['mes',
                                      'ano',
                                      'medicamentos',
                                      'qtd_vendas',
                                      'trimestre',
                                      'semestre',
                                      'data']
                        }
                    )
data = loader.load()

In [5]:
llm = ChatOpenAI(
    model = "gpt-4o",
    temperature=0.3,
    max_tokens=1000,
    verbose=True
)

In [6]:
prompt = ChatPromptTemplate.from_template(
    """
        Você é um assistente para um gerente de uma farmácia de manipulação, chamado FarmaBot, 
        você será responsável por responder as perguntas do seu gerente 
        da maneira mais clara e precisa possível.
        
        O seu trabalho é ler o arquivo csv passado para você e responder as perguntas do seu gerente.
        com base nos dados do arquivo csv.
        
        Context: {context}
        
        Question: {input}
    """
)

In [7]:
chain = create_stuff_documents_chain(
    llm = llm,
    prompt= prompt,
    output_parser= StrOutputParser()
)

In [9]:
response = chain.invoke({
    "input": "Qual o seu nome ?",
    "context": data  
})

response

'Meu nome é FarmaBot, sou seu assistente virtual para gestão de dados da farmácia de manipulação. Como posso ajudar você hoje?'

## Usando Agent

In [18]:
from langchain_experimental.agents.agent_toolkits import create_csv_agent
from langchain_openai import ChatOpenAI

In [19]:
llm = ChatOpenAI(
    model = "gpt-4o",
    temperature=0.3,
    max_tokens=1000,
    verbose=True
)

In [21]:
agent = create_csv_agent(llm, file_path, verbose=True,allow_dangerous_code=True)

In [None]:
question = """
        Você é um assistente para um gerente de uma farmácia de manipulação, chamado FarmaBot, 
        você será responsável por responder as perguntas do seu gerente 
        da maneira mais clara e precisa possível, sempre respondendo em PT-BR.
        
        O seu trabalho é ler o arquivo csv passado para você e responder as perguntas do seu gerente.
        com base nos dados do arquivo csv.
        
        Qual foi o remédio mais vendido no ano de 2023?
"""

In [None]:
agent.invoke(question)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: To find the most sold medicine in 2023, I need to filter the dataframe for the year 2023 and then find the medicine with the highest sales.
Action: python_repl_ast
Action Input: df[df['ano'] == 2023].groupby('medicamentos')['qtd_vendas'].sum().idxmax()[0m[36;1m[1;3mAtenolol[0m[32;1m[1;3mEu agora sei a resposta final.

Final Answer: Atenolol[0m

[1m> Finished chain.[0m


{'input': '\n        Você é um assistente para um gerente de uma farmácia de manipulação, chamado FarmaBot, \n        você será responsável por responder as perguntas do seu gerente \n        da maneira mais clara e precisa possível, sempre respondendo em PT-BR.\n        \n        O seu trabalho é ler o arquivo csv passado para você e responder as perguntas do seu gerente.\n        com base nos dados do arquivo csv.\n        \n        Qual foi o remédio mais vendido no ano de 2023?\n',
 'output': 'Atenolol'}

In [None]:
df = pd.read_csv(file_path)

In [None]:
region_vins_count = df.groupby(['ano', 'medicamentos'])['qtd_vendas'].sum().reset_index()

In [None]:
region_vins_count[region_vins_count['ano']==2022].sort_values(by=['qtd_vendas'])

Unnamed: 0,ano,medicamentos,qtd_vendas
9,2022,Simvastatina,142
0,2022,Amoxicilina,153
4,2022,Ibuprofeno,156
2,2022,Atenolol,162
7,2022,Omeprazol,183
1,2022,Aspirina,197
5,2022,Losartana,204
6,2022,Metformina,217
8,2022,Paracetamol,218
3,2022,Captopril,234


In [2]:
import pandas as pd
df = pd.read_csv('vendas.csv')

In [4]:
dict_data = {col: df[col].tolist() for col in df.columns}
dict_data

{'mes': ['Junho',
  'Junho',
  'Junho',
  'Junho',
  'Junho',
  'Junho',
  'Junho',
  'Junho',
  'Junho',
  'Junho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Julho',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Agosto',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Setembro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Outubro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Novembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Dezembro',
  'Janeiro',
  'Janeiro',
  'Janeiro',
  'Janeiro',
  'Janeiro',
  'Janeiro',
  'Janeiro',
  'Janeiro',