In [2]:
from langchain_ollama import ChatOllama
from llms import get_llama
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import PyMuPDFLoader
from langchain_core.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain_chroma import Chroma

from config import Config

In [3]:
def split_documents(file_path, page_start=None, page_end=None):
    loader = PyMuPDFLoader(file_path=file_path)
    doc = loader.load()[page_start:page_end]

    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=Config.SPLITTER_CHUNK_SIZE,
        chunk_overlap=Config.SPLITTER_CHUNK_OVERLAP
    )
    docs = text_splitter.split_documents(doc)
    return docs

In [4]:
from pprint import pprint
from langchain_ollama import OllamaEmbeddings
from langchain.chains import create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain


def stuff(docs, host, results, key, prompt):
    llm: ChatOllama = get_llama(host=host)

    embeddings_model = OllamaEmbeddings(
        base_url=Config.OLLAMA_EMBEDDINGS_BASE_URL,
        model=Config.OLLAMA_EMBEDDINGS_MODEL
    )
    vectorstore = Chroma(
        collection_name='acordaos',
        embedding_function=embeddings_model,
    )
    vectorstore.add_documents(documents=docs)
    retriever = vectorstore.as_retriever()

    document_chain = create_stuff_documents_chain(llm, prompt)
    retrieval_chain = create_retrieval_chain(retriever, document_chain)



    # format_template = PromptTemplate.from_template(
    #     '''
    #     Separe o texto em dois a três parágrafos, mantendo a ordem, o tom e a coerência:

    #     ```
    #     {context}
    #     ```

    #     (responda apenas com o texto separado, e nada mais)
    #     '''
    # )
    # format_chain = LLMChain(llm=llm, prompt=format_template)


    print(f"calling {host}")

    result = retrieval_chain.invoke(
        {'input':
            'Comece.'}
    )
    pprint(result)
    # result = format_chain.invoke({'context': result['output_text']})

    print('\a')
    print(f"\nHOST {host}:\n")
    pprint(result)

    # simplificar_prompt = PromptTemplate.from_template(
    #     '''
    #     Simplifique a linguagem usada no texto. Para isso, siga as seguintes diretrizes
    #     '''
    # )

    results[key]['response'] = result['answer']
    results[key]['prompt'] = [
        str(prompt),
    ]

    # history.save('mapreduce', '', result['text'])
    return result

In [6]:
results = {
    "cabecalho": {},
    "relatorio": {},
    "voto": {},
    "decisao": {},
}

In [None]:
file_path = "documentos/acordaos/0600012-49_REl_28052024_1.pdf"

In [18]:
start_page = 0
end_page = 1
doc = split_documents(file_path, start_page, end_page)

In [19]:
cabecalho_prompt = PromptTemplate.from_template(
    """
    ### SISTEMA
    
    Você é um especialista jurídico com foco em simplificação de textos legais. Sua tarefa é analisar acórdãos judiciais e gerar um resumo simplificado, acessível ao público geral, sem perder a precisão jurídica. O formato do documento simplificado deve ser claro, objetivo e seguir uma estrutura pré-definida.

    Preencha o acórdão simplificado utilizando as informações fornecidas em cada bloco. Siga o formato abaixo para garantir que todos os elementos necessários sejam cobertos e organizados conforme a estrutura do acórdão:

    ```
    ### **1. Cabeçalho**
    
    Preencha as seguintes informações:
    
    - Data do Julgamento: Dia em que o tribunal julgou o processo (em texto contínuo).
    - Nº DO PROCESSO: Código único para identificar o processo.
    - Origem: Juízo e Cidade
    - Relator(a): Juiz responsável pelo relatório e voto do caso.
    - Recorrente: Parte que entrou com o recurso.
    - Recorrido: Parte que defende a decisão anterior.
    - Assunto: Indique apenas a questão jurídica central do processo de forma objetiva.
    ```

    ### CONTEXTO

    {context}

    ### RESPOSTA
    """
)

In [20]:
result = stuff(doc, 0, results, 'cabecalho', cabecalho_prompt)

calling 0
{'answer': '### **1. Cabeçalho**\n'
           '\n'
           '*   Data do Julgamento: 28 de maio de 2024.\n'
           '*   Nº DO PROCESSO: RECURSO ELEITORAL N. '
           '0600012-49.2024.6.06.0033\n'
           '*   Origem: Tribunal Regional Eleitoral do Ceará, Canindé/CE\n'
           '*   Relator(a): Desembargador Eleitoral Daniel Carvalho Carneiro\n'
           '*   Recorrente: Antônio Ilomar Vasconcelos Cruz\n'
           '*   Recorrido: Promotoria Eleitoral\n'
           '*   Assunto: Existência de propaganda eleitoral antecipada por '
           'parte do Representado',
 'context': [Document(metadata={'author': '', 'creationDate': "D:20240604121301-03'00'", 'creator': '', 'file_path': 'documentos/acordaos/0600012-49_REl_28052024_1.pdf', 'format': 'PDF 1.7', 'keywords': '', 'modDate': "D:20240604121301-03'00'", 'page': 2, 'producer': 'iText® 7.1.16 ©2000-2021 iText Group NV (AGPL-version)', 'source': 'documentos/acordaos/0600012-49_REl_28052024_1.pdf', 'subject': 

In [5]:
start_page = 2
end_page = 5
doc = split_documents(file_path, start_page, end_page)

In [9]:
relatorio_prompt = PromptTemplate.from_template(
    """
    ### SISTEMA
    Você é um especialista jurídico com foco em simplificação de textos legais. Sua tarefa é analisar acórdãos judiciais e gerar um resumo simplificado, acessível ao público geral, sem perder a precisão jurídica. O formato do documento simplificado deve ser claro, objetivo e seguir uma estrutura pré-definida.

    Preencha o acórdão simplificado utilizando as informações fornecidas em cada bloco. Siga o formato abaixo para garantir que todos os elementos necessários sejam cobertos e organizados conforme a estrutura do acórdão:

    ```
    **2. Relatório (O Caso)**

    Resuma de forma objetiva os fatos apresentados no acórdão, destacando em 3 parágrafos, com no máximo 3 linhas cada um, e, quando for o caso, caixa de texto explicativa, tudo em texto contínuo.

    O QUE DEVE CONTER EM CADA PARÁGRAFO:

    2.1. Parágrafo 1: Descreva as informações do processo inicial analisado pelo juiz, indicando:

    ◦ **O que o autor pediu?**

    **◦ O que o réu alegou para se defender?**

    2.2. Parágrafo 2: Apresente a decisão do juiz no processo inicial, descrevendo o que o juiz decidiu e as justificativas legais usadas, Cite artigos de lei e fundamentos jurídicos relevantes, considerando:

    ◦ **O que o juiz decidiu?**

    **◦ Quais foram as justificativas legais da decisão?**

    **◦ Cite artigos de lei e fundamentos jurídicos relevantes**

    2.3. Parágrafo 3: Descreva de forma simples quem recorreu e o que alegou, indicando:

    ◦ **Quem recorreu?**

    **◦ O que alegou para recorrer?**

    2.4. Parágrafo 4: Caixa de Texto Explicativa com Termos Jurídicos Relevante para compreensão do assunto principal

    ◦ **A caixa de texto explicativa tem o objetivo de fornecer definições e explicações simples de termos, expressões ou assuntos jurídicos relevantes para a compreensão do assunto principal do acórdão, ajudando o leitor a entender o contexto e o conteúdo legal envolvido.**

    **◦ Exemplo: “Propaganda antecipada negativa: A propaganda eleitoral antecipada negativa acontece quando, antes de 16 de agosto do ano eleitoral (art. 36 da Lei nº 9.504/1997), alguém faz críticas para prejudicar adversários políticos e influenciar eleitores. Essa prática é proibida e pode resultar em multa”.**
    ```

    ### CONTEXTO

    {context}

    ### RESPOSTA
    """
)

In [10]:
result = stuff(doc, 0, results, 'relatorio', relatorio_prompt)

calling 0
{'answer': '**2. Relatório (O Caso)**\n'
           '\n'
           '### **Parágrafo 1: Descrição do Processo Inicial**\n'
           '\n'
           'O autor, Antônio Ilomar Vasconcelos Cruz, lançou sua '
           'pré-candidatura ao cargo de prefeito do município de Canindé e '
           'realizou um evento com infraestrutura indicativa de ampliar o '
           'alcance da mensagem de sua pré-candidatura. O recorrente pediu '
           'explícito votos e buscou influenciar a opinião dos eleitores e '
           'promover sua imagem política antes do período oficial de '
           'campanha.\n'
           '\n'
           '### **Parágrafo 2: Decisão do Juiz**\n'
           '\n'
           'O juiz decidiu que o recorrente praticou ato típico de campanha '
           'eleitoral não abrangido no rol do art. 36-A da Lei 9.504/97, como '
           'excludentes da conduta ilícita de prática de propaganda eleitoral '
           'antecipada. A decisão foi fundamentada na exist

In [12]:
start_page = 5
end_page = 11
doc = split_documents(file_path, start_page, end_page)

In [14]:
voto_prompt = PromptTemplate.from_template(
    """
    ### SISTEMA
    Você é um especialista jurídico com foco em simplificação de textos legais. Sua tarefa é analisar acórdãos judiciais e gerar um resumo simplificado, acessível ao público geral, sem perder a precisão jurídica. O formato do documento simplificado deve ser claro, objetivo e seguir uma estrutura pré-definida.

    Preencha o acórdão simplificado utilizando as informações fornecidas em cada bloco. Siga o formato abaixo para garantir que todos os elementos necessários sejam cobertos e organizados conforme a estrutura do acórdão:

    ```
    ### 3. Voto (Argumentação/ Motivação/ Fundamentação)

    Apresente as razões jurídicas que embasaram a decisão do Tribunal, destacando, em 2 parágrafos, com no máximo 3 linhas, de texto contínuo, considerando:
    
    ◦ **Quais foram os princípios legais aplicados.**
    
    **◦ A interpretação dada à legislação.**
    
    **◦ Argumentos relevantes usados na motivação.**
    
    **◦ Use uma linguagem simples e evite jargões técnicos sempre que possível.**
    
    O QUE DEVE CONTER EM CADA PARÁGRAFO:
    
    3.1. Parágrafo 1: Fundamentação de Fato e de Direito: 
    
    ◦ **Explique os fatos relevantes.**
    
    **◦ Apresente a fundamentação jurídica, citando artigos de lei, precedentes jurisprudenciais que embasam a decisão do Tribunal.**
    
    3.2. Parágrafo 2: Conclusão e Decisão:
    
    ◦ **Conclusão do Voto.**
    
    **◦ Decisão Final com possíveis implicações.**
    ```

    ### CONTEXTO

    {context}

    ### RESPOSTA
    """
)

In [17]:
result = stuff(doc, 0, results, 'voto', voto_prompt)

calling 0
{'answer': '### 3. Voto (Argumentação/Motivação/Fundamentação)\n'
           '\n'
           '#### 3.1. Parágrafo 1: Fundamentação de Fato e de Direito:\n'
           '\n'
           'O caso em julgamento envolveu a realização de propaganda eleitoral '
           'antecipada por parte do representado, Antônio Ilomar Vasconcelos '
           'Cruz, durante o lançamento de sua pré-candidatura ao cargo de '
           'prefeito do município de Canindé. A fundamentação jurídica é '
           'baseada na Lei 9.504/97, que estabelece regras para a campanha '
           'eleitoral. O artigo 36-A da lei define os atos abrangidos pela '
           'propaganda eleitoral, e o artigo 36, § 3º, trata de penalidades '
           'por condutas ilícitas.\n'
           '\n'
           '#### 3.2. Parágrafo 2: Conclusão e Decisão:\n'
           '\n'
           'A conclusão do voto é que a realização de propaganda eleitoral '
           'antecipada pelo representado constituiu ato típico não ab

In [26]:
start_page = 10
end_page = 12
doc = split_documents(file_path, start_page, end_page)

In [28]:
decisao_prompt = PromptTemplate.from_template(
    """
    ### SISTEMA
    Você é um especialista jurídico com foco em simplificação de textos legais. Sua tarefa é analisar acórdãos judiciais e gerar um resumo simplificado, acessível ao público geral, sem perder a precisão jurídica. O formato do documento simplificado deve ser claro, objetivo e seguir uma estrutura pré-definida.

    Preencha o acórdão simplificado utilizando as informações fornecidas em cada bloco. Siga o formato abaixo para garantir que todos os elementos necessários sejam cobertos e organizados conforme a estrutura do acórdão:

    ```
    ### **4. Resultado do Julgamento (Dispositivo):**

    Informe de maneira direta e clara o resultado final da decisão, incluindo em 2 parágrafos, com no máximo 3 linhas em cada um, em texto contínuo:
    
    4.1. Parágrafo 1: Resultado do Julgamento
    
    Aqui, deverá ser informado o resultado final da decisão, se a decisão foi unânime ou não, se manteve a decisão original ou a modificou.
    
    **◦ Resuma o resultado do julgamento de forma clara e objetiva.**
    
    **◦ Exemplo: “O Tribunal Regional Eleitoral do Ceará, por unanimidade, decidiu manter a decisão original, entendendo que...".**
    
    4.2. Parágrafo 2: Decisão Clara e Direta
    
    **◦ Indique de forma concisa apenas uma das opções considerando o PDF ou texto inserido:
    - Recurso Negado;
    - Recurso Aceito;
    - Recurso Parcialmente Aceito.**
    
    **◦ Exemplo: "Recurso Negado."**
    ```

    ### CONTEXTO

    {context}
    """
)

In [29]:
result = stuff(doc, 0, results, 'decisao', decisao_prompt)

calling 0
{'answer': '### **4. Resultado do Julgamento (Dispositivo):**\n'
           '\n'
           '#### 4.1. Parágrafo 1: Resultado do Julgamento\n'
           '\n'
           'O Tribunal Regional Eleitoral do Ceará, por unanimidade, decidiu '
           'manter a decisão original, entendendo que não houve propaganda '
           'eleitoral antecipada por parte do representado.\n'
           '\n'
           '#### 4.2. Parágrafo 2: Decisão Clara e Direta\n'
           '\n'
           'Recurso Negado.',
 'context': [Document(metadata={'author': '', 'creationDate': "D:20240604121301-03'00'", 'creator': '', 'file_path': 'documentos/acordaos/0600012-49_REl_28052024_1.pdf', 'format': 'PDF 1.7', 'keywords': '', 'modDate': "D:20240604121301-03'00'", 'page': 2, 'producer': 'iText® 7.1.16 ©2000-2021 iText Group NV (AGPL-version)', 'source': 'documentos/acordaos/0600012-49_REl_28052024_1.pdf', 'subject': '', 'title': '', 'total_pages': 12, 'trapped': ''}, page_content='decisum os trechos adia

In [34]:
prompts = f"""# Cabeçalho

{results['cabecalho']['prompt']}

# Relatório

{results['relatorio']['prompt']}

# Voto

{results['voto']['prompt']}

# Decisão

{results['decisao']['prompt']}
"""
print(len(prompts))
pprint(prompts)

8192
('# Cabeçalho\n'
 '\n'
 '["input_variables=[\'context\'] input_types={} partial_variables={} '
 "template='\\\\n    ### SISTEMA\\\\n    \\\\n    Você é um especialista "
 'jurídico com foco em simplificação de textos legais. Sua tarefa é analisar '
 'acórdãos judiciais e gerar um resumo simplificado, acessível ao público '
 'geral, sem perder a precisão jurídica. O formato do documento simplificado '
 'deve ser claro, objetivo e seguir uma estrutura pré-definida.\\\\n\\\\n    '
 'Preencha o acórdão simplificado utilizando as informações fornecidas em cada '
 'bloco. Siga o formato abaixo para garantir que todos os elementos '
 'necessários sejam cobertos e organizados conforme a estrutura do '
 'acórdão:\\\\n\\\\n    ```\\\\n    ### **1. Cabeçalho**\\\\n    \\\\n    '
 'Preencha as seguintes informações:\\\\n    \\\\n    - Data do Julgamento: '
 'Dia em que o tribunal julgou o processo (em texto contínuo).\\\\n    - Nº DO '
 'PROCESSO: Código único para identificar o processo.\\\\

In [38]:
acordao = f"""{results['cabecalho']['response']}

{results['relatorio']['response']}

{results['voto']['response']}

{results['decisao']['response']}
"""
print(len(acordao))
pprint(acordao)

4927
('### **1. Cabeçalho**\n'
 '\n'
 '*   Data do Julgamento: 28 de maio de 2024.\n'
 '*   Nº DO PROCESSO: RECURSO ELEITORAL N. 0600012-49.2024.6.06.0033\n'
 '*   Origem: Tribunal Regional Eleitoral do Ceará, Canindé/CE\n'
 '*   Relator(a): Desembargador Eleitoral Daniel Carvalho Carneiro\n'
 '*   Recorrente: Antônio Ilomar Vasconcelos Cruz\n'
 '*   Recorrido: Promotoria Eleitoral\n'
 '*   Assunto: Existência de propaganda eleitoral antecipada por parte do '
 'Representado\n'
 '\n'
 '**2. Relatório (O Caso)**\n'
 '\n'
 '### **Parágrafo 1: Descrição do Processo Inicial**\n'
 '\n'
 'O autor, Antônio Ilomar Vasconcelos Cruz, lançou sua pré-candidatura ao '
 'cargo de prefeito do município de Canindé e realizou um evento com '
 'infraestrutura indicativa de ampliar o alcance da mensagem de sua '
 'pré-candidatura. O recorrente pediu explícito votos e buscou influenciar a '
 'opinião dos eleitores e promover sua imagem política antes do período '
 'oficial de campanha.\n'
 '\n'
 '### **Par

In [49]:
simplificar_prompt = PromptTemplate.from_template("""
    ### SISTEMA

    Simplifique o texto, mantendo sua estrutura original e seguindo as seguintes diretivas:

    1. Utilize sempre uma linguagem simples e direta, evitando termos técnicos desnecessários. Caso seja imprescindível usar um termo jurídico específico, certifique-se de explicá-lo claramente.

    2. Mantenha o número de parágrafos e linhas conforme indicado para cada seção.
    
    3. Assegure-se de que as informações jurídicas sejam precisas e que a fundamentação legal esteja diretamente relacionada ao caso em discussão.
    
    4. Siga as regras de linguagem simples: seja empático e cordial, use frases curtas, escreva na ordem direta e em voz ativa, coloque as informações mais importantes no início e utilize verbos de ação.
    
    5. Revise o texto para garantir que seja claro e acessível, evitando siglas, jargões e termos técnicos. Confirme se todas as diretrizes e restrições foram cumpridas.
    
    6. Adote uma escrita humanizada, procurando aproximar o texto da forma como um ser humano se expressaria, para tornar a comunicação mais próxima e compreensível.

    ### CONTEXTO

    {context}
""")

In [51]:
simplificar_chain = simplificar_prompt | get_llama(0)

In [52]:
result = simplificar_chain.invoke({'context': acordao})

In [55]:
pprint(result.content)

('### SISTEMA\n'
 '\n'
 '**1. Cabeçalho**\n'
 '\n'
 '*   Data do Julgamento: 28 de maio de 2024.\n'
 '*   Nº DO PROCESSO: RECURSO ELEITORAL N. 0600012-49.2024.6.06.0033\n'
 '*   Origem: Tribunal Regional Eleitoral do Ceará, Canindé/CE\n'
 '*   Relator(a): Desembargador Eleitoral Daniel Carvalho Carneiro\n'
 '*   Recorrente: Antônio Ilomar Vasconcelos Cruz\n'
 '*   Recorrido: Promotoria Eleitoral\n'
 '*   Assunto: Existência de propaganda eleitoral antecipada por parte do '
 'Representado\n'
 '\n'
 '**2. Relatório (O Caso)**\n'
 '\n'
 '### **Parágrafo 1: Descrição do Processo Inicial**\n'
 '\n'
 'O autor, Antônio Ilomar Vasconcelos Cruz, lançou sua pré-candidatura ao '
 'cargo de prefeito do município de Canindé e realizou um evento com '
 'infraestrutura indicativa de ampliar o alcance da mensagem de sua '
 'pré-candidatura. O recorrente pediu explícito votos e buscou influenciar a '
 'opinião dos eleitores e promover sua imagem política antes do período '
 'oficial de campanha.\n'
 '\