In [2]:
import pandas as pd
import re
from typing import Dict, Union, List

In [3]:
colunas = ['cd_causa', 'cd_atendimento', 'ds_Acao_Judicial', 'ds_fatos', 'ds_Pedidos', 'ds_Qualificacao']

# LINHA DE SELECAO DO INPUT
df = pd.read_csv(
    "dataset_clinica20252.csv",
    sep="|",               
    encoding="utf-8"     
)

print(df.shape)
print(df.head(20))

(19800, 6)
      cd_causa             cd_atendimento                 ds_Acao_Judicial  \
0   CIB0500064  0825789-84.2025.8.18.0140  90 - ACAO DE REPARACAO DE DANOS   
1   CIB0505587  1004697-72.2025.8.26.0066  90 - ACAO DE REPARACAO DE DANOS   
2   CIB0508201  0800423-07.2025.8.15.0761  90 - ACAO DE REPARACAO DE DANOS   
3   CIB0514647  1004875-69.2025.8.26.0438  90 - ACAO DE REPARACAO DE DANOS   
4   CIB0500604  0010630-50.2025.8.27.2706  90 - ACAO DE REPARACAO DE DANOS   
5   CIB0511068  0092601-36.2025.8.05.0001  90 - ACAO DE REPARACAO DE DANOS   
6   CIB0515030  0801575-51.2025.8.18.0068  90 - ACAO DE REPARACAO DE DANOS   
7   CIB0515018  0801452-38.2025.8.18.0073  90 - ACAO DE REPARACAO DE DANOS   
8   CIB0515702  0800895-81.2025.8.10.0038  90 - ACAO DE REPARACAO DE DANOS   
9   CIB0514229  0148716-17.2025.8.04.1000  90 - ACAO DE REPARACAO DE DANOS   
10  CIB0514230  0148734-38.2025.8.04.1000  90 - ACAO DE REPARACAO DE DANOS   
11  CIB0524760  0161843-22.2025.8.04.1000  90 - ACAO 

In [9]:
def extrair_cnpj(texto):
    padroes = [
        # Padrão 1: Formato completo (aceita . ou , como separador, / ou \ como barra)
        # Ex: 60.746.948/0001-12 ou 60,746,948\0001-12
        r'(\d{2}[.,]\d{3}[.,]\d{3}[/\\]\d{4}[-\s]?\d{2})',
        
        # Padrão 2: Formato sem barra (com pontos ou vírgulas)
        # Ex: 60.746.948.0001-12 ou 60,746,948,0001-12
        r'(\d{2}[.,]\d{3}[.,]\d{3}[.,]\d{4}[-\s]?\d{2})',
        
        # Padrão 3: Com espaços ao redor dos separadores
        # Ex: 60.746.948 / 0001-12 ou 60,746,948 \ 0001 - 12
        r'(\d{2}\s*[.,]\s*\d{3}\s*[.,]\s*\d{3}\s*[/\\]\s*\d{4}\s*[-\s]?\s*\d{2})',
        
        # Padrão 4: Com espaços e ponto no lugar de barra
        # Ex: 60.746.948 . 0001-12
        r'(\d{2}\s*[.,]\s*\d{3}\s*[.,]\s*\d{3}\s*[.,]\s*\d{4}\s*[-\s]?\s*\d{2})',
        
        # Padrão 5: Formato flexível (qualquer combinação de separadores)
        # Ex: 60 746 948/0001-12 ou 60.746,948\0001 12
        r'(\d{2}[\s.,]*\d{3}[\s.,]*\d{3}[\s.,/\\]*\d{4}[\s\-]*\d{2})',
        
        # Padrão 6: CNPJ com "nº" ou "n°" ou "no" antes
        # Ex: CNPJ nº 60.746.948/0001-12
        r'(?:CNPJ|cnpj)[\s:]*(?:n[ºo°]?\.?[\s:]*)(\d{2}[.,\s]*\d{3}[.,\s]*\d{3}[/\\.,\s]*\d{4}[-\s]*\d{2})',
        
        # Padrão 7: Apenas 14 dígitos seguidos
        r'\b(\d{14})\b',
    ]
    
    for padrao in padroes:
        match = re.search(padrao, texto)
        if match:
            cnpj_bruto = match.group(1)
            cnpj_limpo = re.sub(r'\D', '', cnpj_bruto)
            
            if len(cnpj_limpo) == 14:
                return cnpj_limpo
    return None 
    
    

In [18]:
def extrair_valor_causa(texto: str) -> Dict[str, Union[str, float, List[str], bool, None]]:
    """
    Extrai o valor da causa de textos de petições judiciais brasileiras.
    
    Versão 3.0 - Melhorada para capturar valores sem formatação completa.
    """
    if not texto or not isinstance(texto, str) or texto.strip() == '':
        return {
            'valor_encontrado': None,
            'valor_numerico': None,
            'padrao_usado': None,
            'confianca': None,
            'todos_valores': [],
            'sucesso': False,
            'qtd_valores': 0
        }

    # Padrões em ordem de prioridade
    padroes = [
        # NOVOS PADRÕES v3.0 (alta confiança) ================================
        
        # Padrão 1: "Dá-se à causa[,] o valor [de] R$" (aceita vírgula após "causa")
        {
            'nome': 'dá-se à causa (com vírgula)',
            'regex': r'(?:dar-se-á|dar-se-a|dá-se|da-se|dão|dando-se)\s+(?:à|a)\s+(?:presente\s+)?(?:causa|demanda|ação)\s*,?\s+o\s+valor\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 2: "valor total da pretensão condenatória" / "ou seja, a quantia de"
        {
            'nome': 'valor da pretensão/quantia',
            'regex': r'(?:valor\s+(?:do\s+)?total\s+da\s+pretensão\s+condenatória|ou\s+seja,?\s+a\s+quantia)\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 3: "todos os efeitos de direito" (comum no final)
        {
            'nome': 'para efeitos de direito',
            'regex': r'para\s+(?:todos\s+os\s+)?efeitos\s+de\s+direito[\.,]?\s*R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 4: "Dá-se/dando-se à causa/demanda"
        {
            'nome': 'dá-se/dando-se à causa/demanda',
            'regex': r'(?:dar-se-á|dar-se-a|dá-se|da-se|dão|dando-se)\s+(?:à|a)\s+(?:presente\s+)?(?:causa|demanda|ação)\s+o\s+valor\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },

        # Padrão 5: "Valor da causa com por extenso"
        {
            'nome': 'valor da causa com por extenso',
            'regex': r'(?:valor|valor\s+da\s+causa|valor\s+da\s+demanda|valor\s+da\s+ação)\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})\s*\([A-Za-zÀ-ÿ\s]+\)',
            'confianca': 'alta'
        },

        # Padrão 6: "Fins fiscais/alçada antes"
        {
            'nome': 'fins fiscais/alçada antes',
            'regex': r'para\s+(?:os\s+)?fins\s+(?:fiscais|de\s+alçada|fiscais\s+e\s+de\s+alçada)[\.,]?\s*R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 7: "Dando-se à causa"
        {
            'nome': 'dando-se à causa',
            'regex': r'dando-se\s+(?:à|a)\s+causa\s+o\s+valor\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 8: "Dar-se-á à causa"
        {
            'nome': 'dar-se-á à causa',
            'regex': r'(?:dar-se-á|dar-se-a|dá-se|da-se|dão)\s+(?:à|a)\s+causa\s+o\s+valor\s+de\s+R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 9: "Valor da causa explícito"
        {
            'nome': 'valor da causa explícito',
            'regex': r'valor\s+da\s+causa[:\s]+R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 10: "Atribui-se à causa"
        {
            'nome': 'atribui-se à causa',
            'regex': r'atribui[r-]?se\s+(?:à|a)\s+causa\s+o\s+valor\s+de\s+R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # Padrão 11: "Seção valor da causa"
        {
            'nome': 'seção valor da causa',
            'regex': r'(?:DO|DA)\s+VALOR\s+DA\s+CAUSA.*?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'alta'
        },
        
        # PADRÕES DE MÉDIA CONFIANÇA ==========================================
        
        {
            'nome': 'contexto causa-valor',
            'regex': r'(?:atribui|atribuir|atribuído|atribuindo).*?causa.*?valor.*?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'média'
        },
        
        {
            'nome': 'fins fiscais (contexto)',
            'regex': r'(?:para\s+fins|para\s+efeitos).*?(?:fiscais|meramente\s+fiscais).*?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            'confianca': 'média'
        },
    ]

    resultado = {
        'valor_encontrado': None,
        'valor_numerico': None,
        'padrao_usado': None,
        'confianca': None,
        'todos_valores': [],
        'sucesso': False,
        'qtd_valores': 0
    }

    padrao_geral = r'R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2}|[0-9]+,[0-9]{2})'
    todos_valores_brutos = re.findall(padrao_geral, texto)
    
    todos_valores = []
    for valor in todos_valores_brutos:
        # Se não tem ponto, adicionar formatação
        if '.' not in valor:
            # Extrair apenas números
            numeros = re.sub(r'\D', '', valor)
            if len(numeros) >= 3:  # Tem pelo menos 3 dígitos
                parte_inteira = numeros[:-2]
                centavos = numeros[-2:]
                
                if len(parte_inteira) > 3:
                    parte_inteira_formatada = ''
                    for i, digito in enumerate(reversed(parte_inteira)):
                        if i > 0 and i % 3 == 0:
                            parte_inteira_formatada = '.' + parte_inteira_formatada
                        parte_inteira_formatada = digito + parte_inteira_formatada
                    valor_formatado = f"{parte_inteira_formatada},{centavos}"
                else:
                    valor_formatado = f"{parte_inteira},{centavos}"
                
                todos_valores.append(valor_formatado)
            else:
                todos_valores.append(valor)
        else:
            todos_valores.append(valor)
    
    resultado['todos_valores'] = todos_valores
    resultado['qtd_valores'] = len(todos_valores)

    if not todos_valores:
        return resultado

    for padrao in padroes:
        regex_modificado = padrao['regex'].replace(
            r'([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
            r'([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2}|[0-9]+,[0-9]{2})'
        )
        
        match = re.search(regex_modificado, texto, re.IGNORECASE | re.DOTALL | re.MULTILINE)
        if match:
            valor_str = match.group(1)
            
            if '.' not in valor_str:
                numeros = re.sub(r'\D', '', valor_str)
                if len(numeros) >= 3:
                    parte_inteira = numeros[:-2]
                    centavos = numeros[-2:]
                    
                    if len(parte_inteira) > 3:
                        parte_inteira_formatada = ''
                        for i, digito in enumerate(reversed(parte_inteira)):
                            if i > 0 and i % 3 == 0:
                                parte_inteira_formatada = '.' + parte_inteira_formatada
                            parte_inteira_formatada = digito + parte_inteira_formatada
                        valor_str = f"{parte_inteira_formatada},{centavos}"
                    else:
                        valor_str = f"{parte_inteira},{centavos}"
            
            resultado['valor_encontrado'] = f"R$ {valor_str}"
            resultado['padrao_usado'] = padrao['nome']
            resultado['confianca'] = padrao['confianca']
            resultado['sucesso'] = True
            
            try:
                resultado['valor_numerico'] = float(valor_str.replace('.', '').replace(',', '.'))
            except ValueError:
                resultado['valor_numerico'] = None
            
            return resultado

    # Heurística: último valor encontrado (baixa confiança)
    valor_str = todos_valores[-1]
    resultado['valor_encontrado'] = f"R$ {valor_str}"
    resultado['padrao_usado'] = 'último valor (heurística)'
    resultado['confianca'] = 'baixa'
    resultado['sucesso'] = True
    
    try:
        resultado['valor_numerico'] = float(valor_str.replace('.', '').replace(',', '.'))
    except ValueError:
        resultado['valor_numerico'] = None

    return resultado

In [19]:
df['valor_encontrado'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['valor_encontrado'])
df['valor_numerico'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['valor_numerico'])
df['padrao_usado'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['padrao_usado'])
df['confianca'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['confianca'])
df['todos_valores'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['todos_valores'])
df['sucesso'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['sucesso'])
df['qtd_valores'] = df['ds_Pedidos'].apply(lambda x: extrair_valor_causa(str(x))['qtd_valores'])

print("✅ Processamento concluído!")

# Ver os primeiros resultados
print("\n📊 Primeiros 10 resultados:")
print(df[['valor_encontrado', 'valor_numerico', 'confianca', 'padrao_usado']].head(10))

# Estatísticas
print("\n📈 Estatísticas:")
print(f"Total de processos: {len(df)}")
print(f"Extrações bem-sucedidas: {df['sucesso'].sum()}")
print(f"Taxa de sucesso: {(df['sucesso'].sum() / len(df)) * 100:.1f}%")
print(f"\nDistribuição de confiança:")
print(df['confianca'].value_counts())

✅ Processamento concluído!

📊 Primeiros 10 resultados:
  valor_encontrado  valor_numerico confianca                    padrao_usado
0     R$ 21.906,64        21906.64      alta     dá-se à causa (com vírgula)
1     R$ 10.000,00        10000.00      alta     dá-se à causa (com vírgula)
2     R$ 11.409,08        11409.08      alta     dá-se à causa (com vírgula)
3      R$ 1.256,04         1256.04      alta  valor da causa com por extenso
4     R$ 15.215,42        15215.42      alta     dá-se à causa (com vírgula)
5     R$ 15.000,00        15000.00      alta     dá-se à causa (com vírgula)
6      R$ 5.159,84         5159.84      alta     dá-se à causa (com vírgula)
7             None             NaN      None                            None
8             None             NaN      None                            None
9     R$ 16.804,00        16804.00      alta     dá-se à causa (com vírgula)

📈 Estatísticas:
Total de processos: 19800
Extrações bem-sucedidas: 19467
Taxa de sucesso: 98.3%



In [11]:
df['cnpj_extraido'] = df['ds_Qualificacao'].apply(lambda x: extrair_cnpj(x))

print(f"Total de CNPJs não encontrados: {len(df[df['cnpj_extraido'].isnull()])}")
print(f"Quantidade de CNPJs extraídos com sucesso: {len(df) - len(df[df['cnpj_extraido'].isnull()])}")
print(f"Porcentagem de CNPJs extraídos com sucesso: {((len(df) - len(df[df['cnpj_extraido'].isnull()])) / len(df)) * 100:.1f}%")

Total de CNPJs não encontrados: 606
Quantidade de CNPJs extraídos com sucesso: 19194
Porcentagem de CNPJs extraídos com sucesso: 96.9%


In [17]:
pd.set_option('display.max_colwidth', None)

filtro_baixa = df['confianca'].fillna('').str.lower().eq('baixa')
vis = df.loc[filtro_baixa, ['cd_atendimento', 'ds_Pedidos']].reset_index(drop=True).head(20)

display(vis) 

Unnamed: 0,cd_atendimento,ds_Pedidos
0,0800248-16.2025.8.18.0054,"DOS PEDIDOS 1. QUE SEJA DEFERIDA A GRATUIDADE DA JUSTIÇA, nos termos do art. 5o, inciso LXXIV, da Constituição Federal c/c art. 98 do Código de Processo Civil (Lei 13.105/2015), por não ter condições de arcar com custas processuais e honorárias advocatícios, na medida em que, conforme comprovam os documentos anexos, a parte autora sobrevive com menos de um salário-mínimo mensal; 2. Que seja concedida a INVERSÃO DO ÔNUS PROBATÓRIO, nos termos do CDC, art. 6o, VIII; 3. A citação da empresa requerida, na forma da lei, para apresentar resposta à presente, caso queiram, sob pena de revelia e confissão quanto à matéria fática alegada; 4. A dispensa da realização de audiência de conciliação na medida em que a experiência tem demonstrado que, nos casos da espécie, a probabilidade de composição é ínfima, atrasando por demais o deslinde da causa. 5. Condenada a requerida a arcar com as custas processuais e honorários de sucumbência no importe de 20%; 6. Que, ao final, verificada a ilegalidade praticada pela parte requerida, SEJA A PRESENTE DEMANDA JULGADA TOTALMENTE PROCEDENTE E DECLARANDO A INEXISTÊNCIA DO Num. 72795590 - Pág. 11 Assinado eletronicamente por: ROSANA ALMEIDA COSTA - 22/03/2025 19:16:28 Número do documento: 25032219162839300000067996993 SUPOSTO CONTRATO DE SEGURO, BEM COMO SEUS EFEITOS, E, CONSEQUENTEMENTE, a condenação da Requerida ao pagamento de: · VALORES RECEBIDOS, RESSARCINDO EM DOBRO A PARTE AUTORA, nos moldes previstos no art. 42 do CDC, valor este que atualmente corresponde a R$750,52, com juros e atualização monetária a conta do evento danoso (súmulas 43 e 54 do STJ), sem prejuízo ao ressarcimento de valores que vierem ainda a serem descontados no curso da ação. · DANO MORAL NO VALOR DE R$10000; a contar do evento danoso, conforme prescreve as Súmulas 43 e 54 do STJ. A Parte Requerente não possui interesse na audiência de conciliação, por se tratar de matéria exclusiva de direito, em virtude o princípio da cooperação processual, princípio da celeridade, princípio da razoabilidade e princípio da economia processual, caso seja o entendimento de vossa excelência a presente matéria comporta o julgamento após apresentação da contestação, sem necessidade de audiências.  Seja o réu condenado ao pagamento de custas processuais e honorários advocatícios; Busca-se o uso de todos os meios de prova permitidas por direito, em especial pelos documentos juntados, bem como pelo depoimento pessoal do(s) representante(s)/preposto(s) da(s) parte(s) Requerida(s) e, juntada de novos documentos, eventualmente obtidos, tudo desde já requerido. Dá-se à presente demanda o valor de R$10750,52 (dez mil, setecentos e cinquenta reais e cinquenta e dois centavos), para os fins fiscais e de alçada. Nestes termos, Pede e espera deferimento. Teresina/PI, Data certificada pelo sistema. Rosana Almeida Costa OAB/PI n° 21550 Num. 72795590 - Pág. 12 Assinado eletronicamente por: ROSANA ALMEIDA COSTA - 22/03/2025 19:16:28 Número do documento: 25032219162839300000067996993"
1,0801427-95.2025.8.20.5108,"DOS PEDIDOS: Diante do exposto, a parte Autora REQUER: a) A concessão dos benefícios da justiça gratuita, com fulcro na Lei n° 1.060/50, uma vez que a parte Autora não possui condições de arcar com as custas processuais e os honorários advocatícios. b) A inversão do ônus da prova, em favor da parte Autora, nos termos do Art. 6o, inciso VIII da Lei 8.078/90 (CDC); c) A citação das Requeridas (banco por AR) para, querendo, comparecer à audiência designada por este Juízo, bem como, apresentar defesa, no prazo legal, sob pena de ser declarada sua revelia e cominada a pena de confissão quanto a matéria de fato; d) Requer que seja o demandado condenado a reparar os danos materiais sofridos pela parte Autora com a consequente repetição do indébito, Num. 146194077 - Pág. 8 Pág. Total - 8 Assinado eletronicamente por: BRUNO RAFAEL ALBUQUERQUE MELO GOMES - 21/03/2025 14:56:59 Número do documento: 25032114565958500000136301722 BRUNO RAFAEL ALBUQUERQUE MELO GOMES ELZIRA NAZARÉ MAIA SILVA Advogados RUA DEPUTADO DALTON CUNHA, BAIRRO RODOVIÁRIA, APODI/RN RUA 7 DE SETEMBRO, N° 319, BAIRRO CENTRO, SEVERIANO MELO/RN RUA DA INDEPENDÊNCIA, No1990, SALA 01, CENTRO, PAU DOS FERROS/RN totalizando a importância de R$ 541,20 (quinhentos e quarenta e um reais e vinte centavos) e) Condenar as Instituições Financeiras, BANCO BRADESCO S.A a compensar a parte Autora pelos inúmeros danos morais sofridos e comprovados, no valor que Vossa Excelência entender como justo e equitativo, sugestionando para tanto, o montante de R$ 5.000,00 (cinco mil reais). f) Que seja a Requerida compelida a pagar quaisquer eventuais despesas advindas deste feito, bem como honorários advocatícios; g) A parte Autora protesta pela produção de todas as provas admissíveis em direito, notadamente a juntada de novos documentos; bem como pelo depoimento pessoal do representante legal da Ré, sob pena de confissão; oitiva testemunhal; vistorias; laudos e perícias  se necessidade houver, para todos os efeitos de direito. h) Requer, por fim, que seja a requerida condenada ao pagamento das custas e honorários advocatícios no importe de 20%. Dá-se à causa, o valor de R$ 5.541,20 (cinco mil, quinhentos e quarenta e um reais e vinte centavos) para todos os efeitos de direito. Termos em que, Pede, aguarda e confia no deferimento. Severiano Melo/RN, data do protocolo no PJE. Bruno Rafael Albuquerque Melo Gomes OAB/RN 14.511 Num. 146194077 - Pág. 9 Pág. Total - 9 Assinado eletronicamente por: BRUNO RAFAEL ALBUQUERQUE MELO GOMES - 21/03/2025 14:56:59 Número do documento: 25032114565958500000136301722"
2,5000974-63.2025.8.13.0607,"DOS PEDIDOS E REQUERIMENTOS Em arremate, requer a Autora que Vossa Excelência se digne de tomar as seguintes providências: 3.1. Requerimentos a) A parte Promovente opta pela realização de audiência conciliatória ( CPC, art. 319, inc. VII), razão qual requer a citação da Promovida, por carta (CPC, art. 247, caput) para comparecer à audiência designada para essa finalidade (CPC, art. 334, caput c/c § 5o); b) requer, ademais, seja deferida a inversão do ônus da prova, já que a hipótese em estudo é abrangida pelo CDC, bem assim a concessão dos benefícios da Justiça Gratuita e prioridade na tramitação do processo. PEDIDOS: Num. 10405274857 - Pág. 14 Assinado eletronicamente por: MIGUEL FREDERICO DIAS BOHME - 06/03/2025 16:00:15 Número do documento: 25030616001516700010401222176 a) A concessão da TUTELA DE URGÊNCIA, com fulcro nos artigos 497 de 300, ambos do Código de Processo Civil para o fim de determinar o pagamento da apólice de No 865867 no valor de qual seja R$ 38326,00 (trinta e oito mil, duzentos e vinte e seis reais) com a devida correção monetária desde a época da contratação. E que ao final da demanda essa tutela se estabilize em decisão de mérito que reconheceu o direito da autora. b) Pleiteia a condenação da Ré pelos danos morais causados à requerida no importe de R$20.000,00 (vinte mil reais). ( iv ) solicita que seja definida, por sentença, a extensão da obrigação condenatória, o índice de correção monetária e seu termo inicial, os juros moratórios e seu prazo inicial (CPC, art. 491, caput); Súmula 43 do STJ  Incide correção monetária sobre dívida por ato ilícito a partir da data do efetivo prejuízo. Súmula 54 do STJ  Os juros moratórios fluem a partir do evento danoso, em caso de responsabilidade extracontratual. b) por fim, seja a Ré condenada em custas e honorários advocatícios, esses arbitrados em 20%(vinte por cento) sobre o valor da condenação ( CPC, art. 82, § 2o, art. 85 c/c art. 322, § 1o), além de outras eventuais despesas no processo ( CPC, art. 84). Num. 10405274857 - Pág. 15 Assinado eletronicamente por: MIGUEL FREDERICO DIAS BOHME - 06/03/2025 16:00:15 Número do documento: 25030616001516700010401222176 Com a inversão do ônus da prova, face à hipossuficiência técnica do Autor frente à Requerida ( CDC, art. 6o, inciso VIII), protesta e requer a produção de provas admissíveis à espécie, em especial a oitiva do representante legal da requerida e de testemunhas, bem como perícia, se o caso assim o requerer. Dá-se à causa o valor do total da pretensão condenatória, ou seja, a quantia de R$ 58326,00 (cinquenta e oito mil, trezentos e vinte e seis reais) Respeitosamente, pede deferimento. Santos Dumont 28 de fevereiro de 2025 MIGUEL FREDERICO DIAS BÖHME OAB/MG 203.995"
3,0800468-62.2025.8.10.0207,"DOS PEDIDOS). SOLIMAR ALVES LIMA (a), inscrito (a) no CPF no 483.008.613-00, residente e domiciliado (a) em RUA 21 DE ABRIL, No 41 PIAUI / CEP: 65695-000, FORTUNA - MA vem, por seu por seu advogado in fine assinado, constituídos ut procuração anexa, endereço no rodapé para receber intimações, sob pena de nulidade, vem, respeitosamente perante V. Exa., propor a presente, Em face do BANCO BRADESCO S.A, inscrita no CNPJ sob o no. 60.746.948/0001-12, com endereço na Cidade de Deus, S/N, Vila Yara, Osasco/Sp, Cep: 06029 - 900, pelos substratos fáticos e jurídicos expostos a seguir delineados.: PRELIMINARMENTE 1. DOS BENEFÍCIOS DA JUSTIÇA GRATUITA OPÇÃO PELO JUÍZO 100% DIGITAL AÇÃO DE INDENIZAÇÃO POR DANOS MATERIAIS E MORAIS POR COBRANÇA INDEVIDA DE TAXAS E TARIFAS BANCÁRIAS (PRODUTO/SERVIÇO BANCÁRIO NÃO CONTRATADO) Num. 141895907 - Pág. 2 Assinado eletronicamente por: SAVIO SANTOS NEGREIROS - 20/02/2025 18:32:50 Número do documento: 25022018324999200000131775113 De plano, declara a parte autora que é pobre na forma da lei, consoante se depreende da declaração ora colacionada, de maneira que requer à V.Exa a dispensa do pagamento relativo as custas processuais com lastro no artigo 4o, §§ 1o e 2o da Lei 1060/50, cominado com o art. 5o, inciso LXXIV, da Carta Magna vigente. 1.2- DA NECESSIDADE DO SEGREDO DE JUSTIÇA: Nos termos do artigo 1o, § 3o, da Lei Complementar no 105/2001 e do artigo 189, inciso III, do Código de Processo Civil de 2015, o Autor requer a decretação do segredo de justiça no presente feito, dada a necessidade de resguardar o sigilo bancário e proteger as informações financeiras sensíveis nos autos, incluindo seus extratos bancários. Uma ampla publicidade do feito poderia exportar indevidamente os dados financeiros do Autor, comprometendo sua privacidade e segurança, além de contrariar a legislação que resguarda o sigilo das transações bancárias. A divulgação dessas informações pode gerar riscos patrimoniais e violar direitos fundamentais constitucionalmente protegidos, como a intimidação e a vida privada. Desta forma, é essencial que o acesso ao processo seja restrito às partes e aos seus procuradores, garantindo-se a proteção adequada dos dados sigilosos. Diante do exposto, requer-se a Vossa Excelência que seja determinada a tramitação do processo em segredo de justiça, com fundamento no artigo 1o, § 3o, da LC 105/2001 e no artigo 189, inciso III, do CPC/2015, assegurando-se a confidencialidade das informações bancárias do Autor. 2. DESINTERESSE NA DESIGNAÇÃO DE AUDIÊNCIA DE CONCILIAÇÃO E MEDIAÇÃO A parte autora manifesta, expressamente, o seu desinteresse na Num. 141895907 - Pág. 3 Assinado eletronicamente por: SAVIO SANTOS NEGREIROS - 20/02/2025 18:32:50 Número do documento: 25022018324999200000131775113 designação da audiência de conciliação e mediação, nos termos do art. 334, §5o do CPC2 . Assim, em homenagem aos Princípios da Razoável Duração do Processo, Celeridade e Economia Processual, requer a imediata instrução e julgamento do feito 3. DOS FATOS Inicialmente há de se destacar que a parte autora é correntista do banco demandado e até recentemente, não tinha o hábito de olhar os extratos de movimentação de sua conta, razão pela qual se justifica o lapso de tempo de alguns descontos indevidos até o protocolo da presente ação. Conforme já mencionado, a parte autora possui sua conta bancária junto ao banco demandado (Agência: 5256 / Conta: 1390-0 ), para o recebimento da sua verba alimentar. Recentemente analisar os extratos de sua conta bancária identificou descontos abusivos e ilegais intitulados de: EXTRATO POR PERÍODO DATA NOME DO DESCONTO VALOR DO DESCONTO 07/01/2020 MORA CREDITO PESSOAL R$ 76,35 06/02/2020 MORA CREDITO PESSOAL R$ 83,22 06/04/2020 MORA CREDITO PESSOAL R$ 84,64 07/05/2020 MORA CREDITO PESSOAL R$ 75,95 04/06/2020 MORA CREDITO PESSOAL R$ 84,59 06/07/2020 MORA CREDITO PESSOAL R$ 84,86 12/08/2020 MORA CREDITO PESSOAL R$ 76,13 06/10/2020 MORA CREDITO PESSOAL R$ 80,96 14/10/2020 MORA CREDITO PESSOAL R$ 74,28 25/11/2020 MORA CREDITO PESSOAL R$ 80,41 04/02/2021 ENCARGOS LIMITE DE CRED R$ 17,64 04/03/2021 ENCARGOS LIMITE DE CRED R$ 28,64 07/04/2021 ENCARGOS LIMITE DE CRED R$ 28,50 06/05/2021 ENCARGOS LIMITE DE CRED R$ 29,52 07/06/2021 ENCARGOS LIMITE DE CRED R$ 26,84 06/07/2021 ENCARGOS LIMITE DE CRED R$ 28,71 05/08/2021 ENCARGOS LIMITE DE CRED R$ 30,49 02/09/2021 ENCARGOS LIMITE DE CRED R$ 3,68 06/09/2021 ENCARGOS LIMITE DE CRED R$ 22,96 06/10/2021 ENCARGOS LIMITE DE CRED R$ 27,53 Num. 141895907 - Pág. 4 Assinado eletronicamente por: SAVIO SANTOS NEGREIROS - 20/02/2025 18:32:50 Número do documento: 25022018324999200000131775113 05/11/2021 ENCARGOS LIMITE DE CRED R$ 29,17 06/12/2021 ENCARGOS LIMITE DE CRED R$ 29,61 05/01/2021 MORA CREDITO PESSOAL R$ 78,59 04/02/2021 MORA CREDITO PESSOAL R$ 84,47 04/03/2021 MORA CREDITO PESSOAL R$ 83,78 07/04/2021 MORA CREDITO PESSOAL R$ 80,87 07/06/2021 MORA CREDITO PESSOAL R$ 85,21 06/07/2021 MORA CREDITO PESSOAL R$ 83,30 05/08/2021 MORA CREDI"
4,0801411-08.2025.8.20.5120,"IV- DOS PEDIDOS: Diante do exposto, requer de Vossa Excelência, que digne-se a: a) Conceder os benefícios da justiça gratuita ao requerente, eis que esta é pobre na forma da lei, não podendo arcar com custas judiciais e, honorários advocatícios sem prejuízo de seu próprio sustento e de sua família; b) Determinar a citação dos requeridos nos endereços já citados nas qualificações, nas pessoas de seus representantes legais, para virem responder, querendo no prazo legal a presente ação, sob pena de aplicação dos efeitos da revelia; c) No mérito, julgar totalmente procedente a presente demanda, declarando a inexistência do débito objeto da lide; bem como, condenando o requerido ao pagamento de indenização por danos morais no importe de R$ 5.000,00 (cinco mil reais) e; por fim, condenar os requeridos a efetuarem a restituição em dobro de toda quantia descontada indevidamente do benefício do requerente, o que soma a quantia de R$ 1.783,18 (Um mil, setecentos e oitenta e três reais e dezoito centavos), acrescidas de juros e correção monetária, com aplicação desde a data do evento danoso, nos termos da Súmula 54 do STJ; d) Condenar o requerido ao pagamento de custas processuais e, honorários advocatícios no importe de 20% sobre o valor da condenação; e) Inverter o ônus da prova, com fulcro no art. 6º, VIII, da Lei 8.078/90, eis que a parte autora não tem acesso aos cadastros do requerido, nem aos seus documentos, bem como em virtude de sua hipossuficiência econômica em relação à estes, determinado que o requerido apresente em juízo todos os documentos indispensáveis para fazer prova da existência e validade do negócio jurídico questionado nos autos. Determinando que o requerente apresente os extratos bancários do requerente referente aos últimos 60 (sessenta) meses. Protesta pela produção de todos os tipos de prova em direito admitidas, notadamente depoimento pessoal do representante legal do requerido, oitiva de testemunhas, documentos que ora se acosta, e prova pericial. Dá-se ao presente feito o valor de R$ 6.783,18 (Seis mil, setecentos e oitenta e três reais e dezoito centavos), para os devidos fins de direito. Nesses termos, Confia deferimento. Pau dos Ferros/RN, 21 de Julho de 2025. Raul Vinníccius de Morais Advogado - OAB/RN 11186"
5,0802713-11.2025.8.20.5108,"DOS PEDIDOS: Diante do exposto, requer de Vossa Excelência, que digne-se a: a) Conceder os benefícios da justiça gratuita ao requerente, eis que esta é pobre na forma da lei, não podendo arcar com custas judiciais e, honorários advocatícios sem prejuízo de seu próprio sustento e de sua família; b) Determinar a citação dos requeridos nos endereços já citados nas qualificações, nas pessoas de seus representantes legais, para virem responder, querendo no prazo legal a presente ação, sob pena de aplicação dos efeitos da revelia; c) No mérito, julgar totalmente procedente a presente demanda, declarando a inexistência do débito objeto da lide; bem como, condenando o requerido ao pagamento de indenização por danos morais no importe de R$ 5.000,00 (cinco mil reais) e; por fim, condenar o requerido a efetuar a restituição em dobro de toda quantia descontada indevidamente do benefício do requerente, o que soma a quantia de R$783,62 (setecentos e oitenta e três reais e sessenta e dois centavos), acrescidas de juros e correção monetária, com aplicação desde a data do evento danoso, nos termos da Súmula 54 do STJ; d) Condenar o requerido ao pagamento de custas processuais e, honorários advocatícios no importe de 20% sobre o valor da condenação; e) Inverter o ônus da prova, com fulcro no art. 6o, VIII, da Lei 8.078/90, Num. 154973424 - Pág. 8 Pág. Total - 8 Assinado eletronicamente por: RAUL VINNICCIUS DE MORAIS - 17/06/2025 09:20:16 Número do documento: 25061709201596400000144323843 eis que a parte autora não tem acesso aos cadastros do requerido, nem aos seus documentos, bem como em virtude de sua hipossuficiência econômica em relação à estes, determinado que o requerido apresente em juízo todos os documentos indispensáveis para fazer prova da existência e validade do negócio jurídico questionado nos autos. Determinando que o requerente apresente os extratos bancários do requerente referente aos últimos 60 (sessenta) meses. Protesta pela produção de todos os tipos de prova em direito admitidas, notadamente depoimento pessoal do representante legal do requerido, oitiva de testemunhas, documentos que ora se acosta, e prova pericial. Dá-se ao presente feito o valor de R$ 5.783,62 (cinco mil, setecentos e oitenta e três reais e sessenta e dois centavos), para os devidos fins de direito. Nesses termos, Confia deferimento. Pau dos Ferros/RN, 16 de Junho de 2025. Raul Vinníccius de Morais Advogado  OAB/RN 11186 Num. 154973424 - Pág. 9 Pág. Total - 9 Assinado eletronicamente por: RAUL VINNICCIUS DE MORAIS - 17/06/2025 09:20:16 Número do documento: 25061709201596400000144323843"
6,5002590-61.2025.8.13.0611,"Diante do exposto, requer: a) A concessão da tutela de urgência para determinar ao banco Requerido que suspenda imediatamente os débitos mensais relacionados ao seguro residencial, sob pena de multa diária; b) A citação do Requerido para, querendo, contestar a presente ação, sob pena de revelia; c) Ao final, seja a ação julgada totalmente procedente, para: c.I - Declarar a inexistência de relação jurídica entre as partes no tocante ao seguro residencial; c.II - Condenar o Requerido à restituição em dobro do valor indevidamente debitado da conta do Autor, com juros e correção monetária; c.III - Condenar o Requerido ao pagamento de indenização por danos morais, em valor não inferior a R$ 10.000,00 (dez mil reais), ou conforme entender Vossa Excelência; d) A condenação do Requerido ao pagamento das custas processuais e honorários advocatícios, se houver; e) Por fim, requer que seja enviado o link para audiência de conciliação via e-mail: carlosdecarvalhojunior@gmail.com. Dá-se à presente causa, o valor de R$ 10.447,62 (dez mil, quatrocentos e quarenta e sete reais e sessenta e dois centavos). Nestes termos, Pede deferimento. São Francisco/MG, 1º de agosto de 2025. CARLOS PEREIRA DE CARVALHO JUNIOR OAB/MG 150.401"
7,0800366-73.2025.8.18.0027,"DOS PEDIDOS 1. QUE SEJA DEFERIDA A GRATUIDADE DA JUSTIÇA, nos termos do art. 5o, inciso LXXIV, da Constituição Federal c/c art. 98 do Código de Processo Civil (Lei 13.105/2015), por não ter condições de arcar com custas processuais e honorárias advocatícios, na medida em que, conforme comprovam os documentos anexos, a parte autora sobrevive com menos de um salário-mínimo mensal; 2. Que seja concedida a INVERSÃO DO ÔNUS PROBATÓRIO, nos termos do CDC, art. 6o, VIII; 3. A citação da empresa requerida, na forma da lei, para apresentar resposta à presente, caso queiram, sob pena de revelia e confissão quanto à matéria fática alegada; 4. A dispensa da realização de audiência de conciliação na medida em que a experiência tem demonstrado que, nos casos da espécie, a probabilidade de composição é ínfima, atrasando por demais o deslinde da causa. 5. Condenada a requerida a arcar com as custas processuais e honorários de sucumbência no importe de 20%; 6. Que, ao final, verificada a ilegalidade praticada pela parte requerida, SEJA A PRESENTE DEMANDA JULGADA TOTALMENTE PROCEDENTE E DECLARANDO A INEXISTÊNCIA DO SUPOSTO CONTRATO DE PREVIDÊNCIA PRIVADA, BEM COMO SEUS EFEITOS, E, CONSEQUENTEMENTE, a condenação da Requerida ao pagamento de: · VALORES RECEBIDOS, RESSARCINDO EM DOBRO A PARTE AUTORA, nos moldes previstos no art. 42 do CDC, valor este que atualmente corresponde a R$102,98, com juros e atualização monetária a conta do evento danoso (súmulas 43 e 54 do STJ), sem prejuízo ao ressarcimento de valores que vierem ainda a serem descontados no curso da ação. Num. 71809495 - Pág. 13 Assinado eletronicamente por: EDUARDO MARTINS VIEIRA - 05/03/2025 20:21:45 Número do documento: 25030520214488100000067090661 · DANO MORAL NO VALOR DE R$10000; a contar do evento danoso, conforme prescreve as Súmulas 43 e 54 do STJ. A Parte Requerente não possui interesse na audiência de conciliação, por se tratar de matéria exclusiva de direito, em virtude o princípio da cooperação processual, princípio da celeridade, princípio da razoabilidade e princípio da economia processual, caso seja o entendimento de vossa excelência a presente matéria comporta o julgamento após apresentação da contestação, sem necessidade de audiências.  Seja o réu condenado ao pagamento de custas processuais e honorários advocatícios; Busca-se o uso de todos os meios de prova permitidas por direito, em especial pelos documentos juntados, bem como pelo depoimento pessoal do(s) representante(s)/preposto(s) da(s) parte(s) Requerida(s) e, juntada de novos documentos, eventualmente obtidos, tudo desde já requerido. Dá-se à presente demanda o valor de R$10102,98 (dez mil, cento e dois reais e noventa e oito centavos), para os fins fiscais e de alçada. Nestes termos, Pede e espera deferimento. Corrente/PI, Data certificada pelo sistema. Eduardo Martins Vieira OAB/PI n° 15843 Num. 71809495 - Pág. 14 Assinado eletronicamente por: EDUARDO MARTINS VIEIRA - 05/03/2025 20:21:45 Número do documento: 25030520214488100000067090661"
8,0177511-33.2025.8.04.1000,"4) Que se julgue procedente a presente demanda e declare a inexistência dos débitos acima e condene a Requerida a restituir em dobro o valor cobrado a título de SEGURO RESEIDENCIAL BRADESCO - VENDA CASADA, perfazendo assim a quantia de, R$ 2.432,21 (dois mil, quatrocentos e trinta e dois reais e vinte e um centavos) que em dobro perfaz a quantia de R$ 4.564,42 (quatro mil, quinhentos e sessenta e quatro reais e quarenta e dois centavos), REFERENTE AO DANO MATERIAL SOFRIDO, além de incidir índice de correção monetária pelo INPC/IBGE e juros de 1% ao mês, ambos devem contar de cada descontos, conforme art. 395 do CC e Sumula 43 do STJ; 7) Seja a ré condenação ainda, ao pagamento de valor pecuniário R$ 10.000,00 (dez MIL REAIS), a título de reparação pelos danos morais causados a Requerente; 9) Requer a condenação do banco-réu no pagamento de todas as despesas processuais e em honorários advocatícios a base de 20% (vinte por cento). Dá-se à presente causa, o valor de R$ 14.564,42 (quatro mil, quinhentos e sessenta e quatro reais e quarenta e dois centavos), para efeitos meramente fiscais. ANDREWS MARTINS SIQUEIRA OAB/AM 11.954 CÁSSIO MANAUS DE OLIVEIRA RUIZ OAB/AM 11.760"
9,0800629-21.2025.8.18.0055,"DOS PEDIDOS Ante o exposto, requer o seguinte: PRIORIDADE PROCESSUAL DE ACORDO COM O ART. 71 DO ESTATUTO DO IDOSO. a) A concessão dos benefícios da justiça gratuita, nos termos da lei no 1.060\50 e art. 98, NCPC; b) A citação da empresa demandada para contestar aos termos da inicial, sob pena de revelia e, em sua contestação que traga toda a documentação pertinente ao caso, inclusive o suposto contrato/autorização de descontos, objeto da lide, e a quantidade de parcelas que foram descontadas a esse título; c) A aplicação do código de defesa do consumidor ao caso, com todas as consequências legais, inclusive facilitação da defesa do consumidor, inversão do ônus da prova, etc; d) A TOTAL PROCEDÊNCIA DA DEMANDA, de modo a determinar ao requerido que cancele o contrato objeto sobre PAGTO ELETRON COBRANCA BRADESCO SEG - RESID/OUTROS e devolva ao autor todo o valor descontado indevidamente, sob essa rubrica e em dobro, devidamente atualizada, o que hoje perfaz a quantia de R$ 599,70 (quinhentos e noventa e nove reais e setenta centavos), além de condenar ao pagamento ao requerente da quantia de R$ 10.000,00 (dez mil reais), a título de danos morais; Num. 78050336 - Pág. 11 12 Assinado eletronicamente por: MAYARA DE MOURA MARTINS - 25/06/2025 23:04:21 Número do documento: 25062523042069100000072807226"


In [20]:
def analisa_regex(pedido: str, qualificacao: str):
    """
    Analisa texto de pedido e qualificação para extrair valor da causa e CNPJ.
    
    Args:
        pedido (str): Texto da coluna ds_Pedidos
        qualificacao (str): Texto da coluna ds_Qualificacao
        
    Returns:
        dict: {
            'valor_numerico': float ou None,
            'confianca': 'alta', 'média', 'baixa' ou None,
            'cnpj': str (14 dígitos) ou None
        }
    """
    
    # ========================================================================
    # EXTRAÇÃO DO VALOR DA CAUSA
    # ========================================================================
    
    valor_numerico = None
    confianca = None
    
    if pedido and isinstance(pedido, str) and pedido.strip() != '':
        padroes = [
            # NOVOS PADRÕES v3.0 (alta confiança) ================================
            
            # Padrão 1: "Dá-se à causa[,] o valor [de] R$" (aceita vírgula após "causa")
            {
                'nome': 'dá-se à causa (com vírgula)',
                'regex': r'(?:dar-se-á|dar-se-a|dá-se|da-se|dão|dando-se)\s+(?:à|a)\s+(?:presente\s+)?(?:causa|demanda|ação)\s*,?\s+o\s+valor\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 2: "valor total da pretensão condenatória" / "ou seja, a quantia de"
            {
                'nome': 'valor da pretensão/quantia',
                'regex': r'(?:valor\s+(?:do\s+)?total\s+da\s+pretensão\s+condenatória|ou\s+seja,?\s+a\s+quantia)\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 3: "todos os efeitos de direito" (comum no final)
            {
                'nome': 'para efeitos de direito',
                'regex': r'para\s+(?:todos\s+os\s+)?efeitos\s+de\s+direito[\.,]?\s*R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 4: "Dá-se/dando-se à causa/demanda"
            {
                'nome': 'dá-se/dando-se à causa/demanda',
                'regex': r'(?:dar-se-á|dar-se-a|dá-se|da-se|dão|dando-se)\s+(?:à|a)\s+(?:presente\s+)?(?:causa|demanda|ação)\s+o\s+valor\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 5: "Valor da causa com por extenso"
            {
                'nome': 'valor da causa com por extenso',
                'regex': r'(?:valor|valor\s+da\s+causa|valor\s+da\s+demanda|valor\s+da\s+ação)\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})\s*\([A-Za-zÀ-ÿ\s]+\)',
                'confianca': 'alta'
            },
            
            # Padrão 6: "Fins fiscais/alçada antes"
            {
                'nome': 'fins fiscais/alçada antes',
                'regex': r'para\s+(?:os\s+)?fins\s+(?:fiscais|de\s+alçada|fiscais\s+e\s+de\s+alçada)[\.,]?\s*R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 7: "Dando-se à causa"
            {
                'nome': 'dando-se à causa',
                'regex': r'dando-se\s+(?:à|a)\s+causa\s+o\s+valor\s+(?:de\s+)?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 8: "Dar-se-á à causa"
            {
                'nome': 'dar-se-á à causa',
                'regex': r'(?:dar-se-á|dar-se-a|dá-se|da-se|dão)\s+(?:à|a)\s+causa\s+o\s+valor\s+de\s+R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 9: "Valor da causa explícito"
            {
                'nome': 'valor da causa explícito',
                'regex': r'valor\s+da\s+causa[:\s]+R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 10: "Atribui-se à causa"
            {
                'nome': 'atribui-se à causa',
                'regex': r'atribui[r-]?se\s+(?:à|a)\s+causa\s+o\s+valor\s+de\s+R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # Padrão 11: "Seção valor da causa"
            {
                'nome': 'seção valor da causa',
                'regex': r'(?:DO|DA)\s+VALOR\s+DA\s+CAUSA.*?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'alta'
            },
            
            # PADRÕES DE MÉDIA CONFIANÇA ==========================================
            
            {
                'nome': 'contexto causa-valor',
                'regex': r'(?:atribui|atribuir|atribuído|atribuindo).*?causa.*?valor.*?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'média'
            },
            
            {
                'nome': 'fins fiscais (contexto)',
                'regex': r'(?:para\s+fins|para\s+efeitos).*?(?:fiscais|meramente\s+fiscais).*?R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                'confianca': 'média'
            },
        ]
        
        padrao_geral = r'R\$\s*([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2}|[0-9]+,[0-9]{2})'
        todos_valores_brutos = re.findall(padrao_geral, pedido)
        
        todos_valores = []
        for valor in todos_valores_brutos:
            if '.' not in valor:
                numeros = re.sub(r'\D', '', valor)
                if len(numeros) >= 3:
                    parte_inteira = numeros[:-2]
                    centavos = numeros[-2:]
                    
                    if len(parte_inteira) > 3:
                        parte_inteira_formatada = ''
                        for i, digito in enumerate(reversed(parte_inteira)):
                            if i > 0 and i % 3 == 0:
                                parte_inteira_formatada = '.' + parte_inteira_formatada
                            parte_inteira_formatada = digito + parte_inteira_formatada
                        valor_formatado = f"{parte_inteira_formatada},{centavos}"
                    else:
                        valor_formatado = f"{parte_inteira},{centavos}"
                    
                    todos_valores.append(valor_formatado)
                else:
                    todos_valores.append(valor)
            else:
                todos_valores.append(valor)
        
        if todos_valores:
            for padrao in padroes:
                regex_modificado = padrao['regex'].replace(
                    r'([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2})',
                    r'([0-9]{1,3}(?:\.[0-9]{3})*,[0-9]{2}|[0-9]+,[0-9]{2})'
                )
                
                match = re.search(regex_modificado, pedido, re.IGNORECASE | re.DOTALL | re.MULTILINE)
                if match:
                    valor_str = match.group(1)
                    
                    if '.' not in valor_str:
                        numeros = re.sub(r'\D', '', valor_str)
                        if len(numeros) >= 3:
                            parte_inteira = numeros[:-2]
                            centavos = numeros[-2:]
                            
                            if len(parte_inteira) > 3:
                                parte_inteira_formatada = ''
                                for i, digito in enumerate(reversed(parte_inteira)):
                                    if i > 0 and i % 3 == 0:
                                        parte_inteira_formatada = '.' + parte_inteira_formatada
                                    parte_inteira_formatada = digito + parte_inteira_formatada
                                valor_str = f"{parte_inteira_formatada},{centavos}"
                            else:
                                valor_str = f"{parte_inteira},{centavos}"
                    
                    confianca = padrao['confianca']
                    
                    try:
                        valor_numerico = float(valor_str.replace('.', '').replace(',', '.'))
                    except ValueError:
                        valor_numerico = None
                    
                    break
            
            if valor_numerico is None and todos_valores:
                valor_str = todos_valores[-1]
                confianca = 'baixa'
                
                try:
                    valor_numerico = float(valor_str.replace('.', '').replace(',', '.'))
                except ValueError:
                    valor_numerico = None
    
    # ========================================================================
    # EXTRAÇÃO DO CNPJ
    # ========================================================================
    
    cnpj = None
    
    if qualificacao and isinstance(qualificacao, str):
        padroes_cnpj = [
            # Padrão 1: Formato completo (aceita . ou , como separador, / ou \ como barra)
            # Ex: 60.746.948/0001-12 ou 60,746,948\0001-12
            r'(\d{2}[.,]\d{3}[.,]\d{3}[/\\]\d{4}[-\s]?\d{2})',
            
            # Padrão 2: Formato sem barra (com pontos ou vírgulas)
            # Ex: 60.746.948.0001-12 ou 60,746,948,0001-12
            r'(\d{2}[.,]\d{3}[.,]\d{3}[.,]\d{4}[-\s]?\d{2})',
            
            # Padrão 3: Com espaços ao redor dos separadores
            # Ex: 60.746.948 / 0001-12 ou 60,746,948 \ 0001 - 12
            r'(\d{2}\s*[.,]\s*\d{3}\s*[.,]\s*\d{3}\s*[/\\]\s*\d{4}\s*[-\s]?\s*\d{2})',
            
            # Padrão 4: Com espaços e ponto no lugar de barra
            # Ex: 60.746.948 . 0001-12
            r'(\d{2}\s*[.,]\s*\d{3}\s*[.,]\s*\d{3}\s*[.,]\s*\d{4}\s*[-\s]?\s*\d{2})',
            
            # Padrão 5: Formato flexível (qualquer combinação de separadores)
            # Ex: 60 746 948/0001-12 ou 60.746,948\0001 12
            r'(\d{2}[\s.,]*\d{3}[\s.,]*\d{3}[\s.,/\\]*\d{4}[\s\-]*\d{2})',
            
            # Padrão 6: CNPJ com "nº" ou "n°" ou "no" antes
            # Ex: CNPJ nº 60.746.948/0001-12
            r'(?:CNPJ|cnpj)[\s:]*(?:n[ºo°]?\.?[\s:]*)(\d{2}[.,\s]*\d{3}[.,\s]*\d{3}[/\\.,\s]*\d{4}[-\s]*\d{2})',
            
            # Padrão 7: Apenas 14 dígitos seguidos
            r'\b(\d{14})\b',
        ]
        
        for padrao_cnpj in padroes_cnpj:
            match = re.search(padrao_cnpj, qualificacao)
            if match:
                cnpj_bruto = match.group(1)
                cnpj_limpo = re.sub(r'\D', '', cnpj_bruto)
                
                if len(cnpj_limpo) == 14:
                    cnpj = cnpj_limpo
                    break
    
    return {
        'valor_numerico': valor_numerico,
        'confianca': confianca,
        'cnpj': cnpj
    }
