
## **Projeto: Resumo de Textos Jurídicos**

### **Introdução**
Com o crescimento do volume de documentos jurídicos e contratuais, advogados, profissionais de compliance e outros especialistas frequentemente enfrentam dificuldades para analisar e compreender rapidamente grandes volumes de texto. Contratos, termos de uso, cláusulas de privacidade e outros documentos legais geralmente contêm informações essenciais, mas sua leitura e interpretação exigem tempo e atenção detalhada. 

Este projeto visa criar uma solução automatizada para resumir documentos jurídicos, como contratos e termos de uso, extraindo as partes mais importantes e simplificando a compreensão do conteúdo. O objetivo é proporcionar uma ferramenta que ajude profissionais da área jurídica a economizar tempo e melhorar a análise de documentos, sem comprometer a precisão ou as informações essenciais.

### **Objetivo**
O objetivo principal deste projeto é desenvolver uma aplicação que:
- Resuma documentos jurídicos de forma concisa, destacando as cláusulas mais relevantes, como prazos, valores monetários, obrigações, direitos e responsabilidades.
- Permita que advogados, profissionais de compliance ou qualquer outro usuário com necessidade de interpretar documentos legais de forma rápida e eficiente, utilizem o sistema para acelerar sua análise.
- Ofereça a possibilidade de identificar e destacar informações críticas, como **prazos** e **valores monetários**, que frequentemente exigem atenção especial em contratos e acordos.

### **Funcionalidades Principais**
Este protótipo implementa as seguintes funcionalidades:
 **Entrada de Documento:**
   - Suporte para documentos em formatos PDF, Word (.docx) ou texto simples (.txt).
   - Opção para o usuário carregar um documento ou colar texto diretamente na interface.
  
 **Processamento de Texto:**
   - Extração do texto do documento carregado.
   - Geração de um resumo conciso usando a API da OpenAI (GPT-4), com foco em cláusulas importantes e prazos.
   - Extração de informações específicas, como **prazos**, **valores monetários** e outras cláusulas críticas.
  
 **Exibição de Resultados:**
   - Exibição do resumo gerado de forma clara e objetiva.
   - Exibição de prazos e valores destacados, facilitando a análise e compreensão do conteúdo crítico.
   - Opção para exportar o resumo em formato PDF, para que o usuário possa salvar ou compartilhar os resumos gerados.

### **Justificativa**
A necessidade de ferramentas que ajudem na **análise e resumo de textos jurídicos** é crescente, especialmente em um ambiente jurídico que lida com grandes volumes de documentos e que exige precisão. Resumir textos de maneira automatizada não só melhora a eficiência, mas também permite que o profissional se concentre nas questões mais importantes do documento, economizando tempo e esforço.

Este projeto faz uso de **técnicas de Processamento de Linguagem Natural (NLP)** e **inteligência artificial** para analisar documentos complexos e gerar resumos relevantes de maneira rápida e eficaz.



# Carregando Bibliotecas

In [1]:
import os 
import requests
from dotenv import load_dotenv 
from bs4 import BeautifulSoup 
from IPython.display import Markdown, display
from openai import OpenAI


# Conectando-se ao OpenAI

In [2]:
# Carrega variáveis de ambiente em um arquivo chamado .env
load_dotenv(override=True)
api_key = os.getenv('OPENAI_API_KEY')

# Verificando a chave

if not api_key:
    print("Nenhuma chave de API foi encontrada - acesse o bloco de notas de solução de problemas nesta pasta para identificar e corrigir!")
elif not api_key.startswith("sk-proj-"):
    print("Uma chave de API foi encontrada, mas não inicia o sk-proj-; verifique se você está usando a chave correta - consulte o caderno de solução de problemas")
elif api_key.strip() != api_key:
    print("Uma chave de API foi encontrada, mas parece que ela pode ter espaços ou caracteres de tabulação no início ou no final. Remova-os. Consulte o bloco de notas de solução de problemas.")
else:
    print("Chave de API encontrada e parece boa até agora!")

Chave de API encontrada e parece boa até agora!


In [3]:
# instância para interagir com a API
openai = OpenAI()

## Extração de Texto de Arquivo PDF

In [4]:
import PyPDF2

def extract_text_from_pdf(file_path):
    with open(file_path, 'rb') as file:
        reader = PyPDF2.PdfReader(file)
        text = ""
        for page in reader.pages:
            text += page.extract_text()
    return text


## Extração de Texto de Arquivo Word

In [5]:
import docx

def extract_text_from_docx(file_path):
    doc = docx.Document(file_path)
    text = ""
    for para in doc.paragraphs:
        text += para.text + "\n"
    return text


## Extração de Texto de Arquivo TXT (Texto Puro)

In [6]:
def extract_text_from_txt(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        text = file.read()
    return text


## Testando a extração de texto com um arquivo de exemplo:

In [7]:
# Testando a extração de um PDF (CV PAULO ADM.pdf)
pdf_text = extract_text_from_pdf(r"C:\Users\User\Documents\Curso de Dados\LLM Engineer\llm_engineering\week1\LLM projects\Documento juridico.pdf")
print(pdf_text[:500])  # Exibe os primeiros 500 caracteres do texto extraído do PDF

 
CONTRATO DE PRESTAÇÃO DE SERVIÇOS  
Pelo presente instrumento particular de contrato de prestação de serviços , as 
partes:  
Contratante : [Nome completo do contratante], [nacionalidade], [estado civil], 
[profissão], portador(a) do CPF nº [xxx.xxx.xxx -xx], residente e domiciliado(a) à 
[endereço completo], doravante denominado(a) "Contratante";  
Contratado : [Nome completo do contratado], [nacionalidade], [estado civil], 
[profissão], portador(a) do CPF nº [xxx.xxx.xxx -xx], residente e do


In [8]:
# Testando a extração de um DOCX (CV PAULO EDU.docx)
docx_text = extract_text_from_docx(r"C:\Users\User\Documents\Curso de Dados\LLM Engineer\llm_engineering\week1\LLM projects\Documento juridico.docx")
print(docx_text[:500])  # Exibe os primeiros 500 caracteres do texto extraído do DOCX


CONTRATO DE PRESTAÇÃO DE SERVIÇOS
Pelo presente instrumento particular de contrato de prestação de serviços, as partes:
Contratante: [Nome completo do contratante], [nacionalidade], [estado civil], [profissão], portador(a) do CPF nº [xxx.xxx.xxx-xx], residente e domiciliado(a) à [endereço completo], doravante denominado(a) "Contratante";
Contratado: [Nome completo do contratado], [nacionalidade], [estado civil], [profissão], portador(a) do CPF nº [xxx.xxx.xxx-xx], residente e domiciliado(a) à [


## Prompt do sistema

In [9]:
system_prompt = """
    Você é um assistente jurídico especializado em documentos legais. Seu objetivo é fornecer um resumo conciso de um documento jurídico, destacando cláusulas importantes, como prazos, valores monetários, e condições que possam ser relevantes para um contrato ou termo de uso.
    Responda de maneira clara e objetiva, removendo informações irrelevantes como cabeçalhos, rodapés e dados de navegação.
    """



##  Função para Gerar Resumo com a OpenAI

In [10]:
# Função para gerar o resumo com a OpenAI
def messages_for(text):
    # Definindo o prompt do sistema
    system_prompt = """
    Você é um assistente jurídico especializado em documentos legais. Seu objetivo é fornecer um resumo conciso de um documento jurídico, destacando cláusulas importantes, como prazos, valores monetários, e condições que possam ser relevantes para um contrato ou termo de uso.
    Responda de maneira clara e objetiva, removendo informações irrelevantes como cabeçalhos, rodapés e dados de navegação.
    """
    
    # Construindo a mensagem do usuário com o conteúdo extraído
    prompt_usuario = f"""
    O seguinte é um documento jurídico:
    {text}
    """
    
    return [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": prompt_usuario}
    ]

# Função para enviar as mensagens para o modelo OpenAI e obter o resumo
def generate_summary_with_openai(text):
    # Criar as mensagens
    messages = messages_for(text)
    
    # Chamada à API da OpenAI para gerar o resumo
    response = openai.chat.completions.create(
        model="gpt-4o-mini",  # Use "gpt-4" ou "gpt-3.5-turbo" conforme necessário
        messages=messages
    )
    
    # Acessando a resposta corretamente
    return response.choices[0].message.content

In [11]:
# Testando com o texto extraído do PDF
pdf_summary = generate_summary_with_openai(pdf_text)

# Exibindo o resumo gerado
print("Resumo do Documento Jurídico PDF:")
print(pdf_summary)

Resumo do Documento Jurídico PDF:
**Resumo do Contrato de Prestação de Serviços**

- **Partes**: 
  - **Contratante**: [Nome completo, dados pessoais].
  - **Contratado**: [Nome completo, dados pessoais].

- **Objeto**: Prestação de serviços de [descrição detalhada do serviço].

- **Prazo**: 
  - Duração: [xx] dias.
  - Início: [data de início].
  - Término: [data de término].

- **Valor e Forma de Pagamento**:
  - Valor: R$ [valor].
  - Forma de pagamento: [detalhar, ex. à vista, parcelado, datas de vencimento].

- **Obrigações do Contratante**: [Descrever obrigações, ex. fornecer materiais].

- **Obrigações do Contratado**: [Descrever obrigações, ex. cumprir prazo e qualidade do serviço].

- **Rescisão**:
  - Pode ser rescindido nas seguintes hipóteses: [situações específicas de rescisão].

- **Confidencialidade**: Manter a confidencialidade sobre informações compartilhadas durante a execução do contrato.

- **Disposições Gerais**:
  - Alterações e aditivos só válidos por escrito e a

In [12]:
# Função para gerar e exibir o resumo em Markdown
def display_summary_in_markdown(text):
    summary = generate_summary_with_openai(text)
    
    # Convertendo o resumo para Markdown
    markdown_summary = f"### Resumo do Documento Jurídico PDF:\n\n{summary}"
    
    # Exibindo o resumo como Markdown
    display(Markdown(markdown_summary))

# Testando com o texto extraído do PDF
pdf_summary = generate_summary_with_openai(pdf_text)

# Exibindo o resumo gerado em Markdown
display_summary_in_markdown(pdf_text)


### Resumo do Documento Jurídico PDF:

**Resumo do Contrato de Prestação de Serviços**

**Partes Contratantes:**
- **Contratante:** [Nome completo, nacionalidade, estado civil, profissão, CPF, endereço]
- **Contratado:** [Nome completo, nacionalidade, estado civil, profissão, CPF, endereço]

**Cláusulas Importantes:**

1. **Objeto do Contrato:** Prestação de serviços de [descrição detalhada do serviço].

2. **Prazo:**
   - Duração: [xx] dias.
   - Início: [data de início].
   - Término: [data de término].

3. **Valor e Forma de Pagamento:**
   - Montante: R$ [valor].
   - Forma de pagamento: [detalhar método – ex., à vista, parcelado, vencimentos].

4. **Obrigações do Contratante:**
   - [Descrever obrigações, como fornecimento de materiais e informações].

5. **Obrigações do Contratado:**
   - [Descrever obrigações, como cumprimento de prazos e qualidade dos serviços].

6. **Rescisão:**
   - Possibilidade de rescisão nas seguintes situações: [descrever condições, como descumprimento].

7. **Confidencialidade:**
   - As partes devem manter a confidencialidade das informações trocadas.

8. **Disposições Gerais:**
   - Alterações devem ser feitas por escrito e assinadas por ambas as partes.
   - Regido pelas leis da [jurisdição, ex., "República Federativa do Brasil"].

**Local e Data da Assinatura:**
- [Local e Data]

**Assinaturas:**
- [Nome do Contratante]
- [Nome do Contratado]
- Testemunhas: [Nome Testemunha 1], [Nome Testemunha 2]