In [1]:
import re
from collections import namedtuple

In [2]:
CPF =  r'\d{3}\.?\d{3}\.?\d{3}\-?\d{2}'
DATA = r'\d{1,2}\/\d{1,2}\/\d{2,4}'
TELEFONE = r'\(?\d{2,3}\)?\s*\d{4,5}\-?\.?\s?\d{4}'
EMAIL = '[a-zA-Z0-9]+[_a-z0-9-\.]*@[a-z0-9-]+\.[a-z0-9\.]*'
REGEX = r'(?P<data>\d{1,2}\/\d{1,2}\/\d{2,4})|(?P<cpf>\d{3}\.?\d{3}\.?\d{3}\-?\d{2})|(?P<telefone>\(?\d{2,3}\)?\s*\d{4,5}\-?\.?\s?\d{4})'

In [3]:
string = 'Meu cpf é 385.141.378-40 e hoje é 07/12/2018 e amanha é 08/12/2018 e meu telefone é 11 94569-9198 '\
         'ou (11) 4442 0649, e meu email é evertontomalok123@gmail.com'

In [4]:
Data = namedtuple('Data', 'data inicio fim')
Cpf = namedtuple('CPF', 'cpf inicio fim')
Telefone = namedtuple('Telefone', 'telefone inicio fim')

iterador = re.finditer(REGEX, string) 

items = []

for item in iterador:
    if item.group('data'):
        items.append(Data(item.group('data'), item.start(), item.end()))
    elif item.group('telefone'):
        items.append(Telefone(item.group('telefone'), item.start(), item.end()))
    elif item.group('cpf'):
        items.append(Cpf(item.group('cpf'), item.start(), item.end()))
        
items

[CPF(cpf='385.141.378-40', inicio=10, fim=24),
 Data(data='07/12/2018', inicio=34, fim=44),
 Data(data='08/12/2018', inicio=56, fim=66),
 Telefone(telefone='11 94569-9198', inicio=84, fim=97),
 Telefone(telefone='(11) 4442 0649', inicio=101, fim=115)]

In [5]:
re.findall(CPF, string)

['385.141.378-40']

In [6]:
string = re.sub(CPF, 'xxx.xxx.xxx-xx', string)
string

'Meu cpf é xxx.xxx.xxx-xx e hoje é 07/12/2018 e amanha é 08/12/2018 e meu telefone é 11 94569-9198 ou (11) 4442 0649, e meu email é everton.tomalok@ramper.com.br'

In [7]:
re.findall(DATA, string)

['07/12/2018', '08/12/2018']

In [8]:
string = re.sub(DATA, 'dd/mm/aaaa', string)
string

'Meu cpf é xxx.xxx.xxx-xx e hoje é dd/mm/aaaa e amanha é dd/mm/aaaa e meu telefone é 11 94569-9198 ou (11) 4442 0649, e meu email é everton.tomalok@ramper.com.br'

In [9]:
re.findall(TELEFONE, string)

['11 94569-9198', '(11) 4442 0649']

In [10]:
string = re.sub(TELEFONE, '(xx) xxxxx-xxxx', string)
string

'Meu cpf é xxx.xxx.xxx-xx e hoje é dd/mm/aaaa e amanha é dd/mm/aaaa e meu telefone é (xx) xxxxx-xxxx ou (xx) xxxxx-xxxx, e meu email é everton.tomalok@ramper.com.br'

In [11]:
re.findall(EMAIL, string)

['everton.tomalok@ramper.com.br']

In [12]:
string = re.sub(EMAIL, 'email@email.com', string)
string

'Meu cpf é xxx.xxx.xxx-xx e hoje é dd/mm/aaaa e amanha é dd/mm/aaaa e meu telefone é (xx) xxxxx-xxxx ou (xx) xxxxx-xxxx, e meu email é email@email.com'

In [13]:
title = 'Andamento do Processo n. 0004671-82.2016.8.21.0022 - 08/11/2018 do TJRS'

corpo = """
1ª Vara Cível da Comarca de Pelotas Nota de Expediente Nº 1166/2018022/1.16.0002364-7 (CNJ 0004671-82.2016.8.21.0022) - ANDRE LUIS RICKES FISCHER (PP. MARCELO SOARES MENDES 83483/RS) X ESCAVADOR (PP. CAROLINA BICIGO 63961/RS E LEONARDO VALVERDE SUSART 35295/BA) E GOOGLE BRASIL (PP. EDUARDO LUIZ BROCK 91311/SP) .

VISTOS. DIGAM AS PARTES SE PRETENDEM A PRODUÇÃO DE OUTRAS PROVAS, ESPECIFICANDO AS E JUSTIFICANDO AS. CASO SEJA POSTULADA A PROVA ORAL, DEVERÃO AS

PARTES INFORMAR O NÚMERO DE TESTEMUNHAS A SEREM OUVIDAS PARA A ADEQUAÇÃO DA PAUTA. NO SILÊNCIO, O FEITO SERÁ JULGADO NO ESTADO EM QUE SE ENCONTRA. DILIGÊNCIAS LEGAIS. 022/1.16.0016756-8 (CNJ 0031981-63.2016.8.21.0022) - DELVAIR BILHALVA DE OLIVEIRA (PP. GIULIANE BECKER DARLEY 46989/RS E ROSANA CORREA RIBEIRO 48189/RS) X COOP. DE

CRÉD. DE LIVRE ADM. DE ASSOC. DA ZONA SUL - SICREDI ZONA SUL (PP. CESAR CAZAUBON ARRIECHE 9809/RS E MARISTELA FEKSA NEUENFELDT 48139/RS).

VISTOS. VISTA AO APELADO PARA APRESENTAR CONTRARRAZÕES, QUERENDO, NO PRAZO DE 15 DIAS. DILIGÊNCIAS LEGAIS.
"""

In [14]:
NUM_PROCESSO = r'\d{7}-\d{2}\.\d{4}\.\d\.\d{2}\.\d{4}'

re.findall(NUM_PROCESSO, title)

['0004671-82.2016.8.21.0022']

In [15]:
re.findall(NUM_PROCESSO, corpo)

['0004671-82.2016.8.21.0022', '0031981-63.2016.8.21.0022']

In [16]:
re.sub(NUM_PROCESSO, 'REMOVIDO', title)

'Andamento do Processo n. REMOVIDO - 08/11/2018 do TJRS'

In [17]:
print(re.sub(NUM_PROCESSO, '<< REMOVIDO >>', corpo))


1ª Vara Cível da Comarca de Pelotas Nota de Expediente Nº 1166/2018022/1.16.0002364-7 (CNJ << REMOVIDO >>) - ANDRE LUIS RICKES FISCHER (PP. MARCELO SOARES MENDES 83483/RS) X ESCAVADOR (PP. CAROLINA BICIGO 63961/RS E LEONARDO VALVERDE SUSART 35295/BA) E GOOGLE BRASIL (PP. EDUARDO LUIZ BROCK 91311/SP) .

VISTOS. DIGAM AS PARTES SE PRETENDEM A PRODUÇÃO DE OUTRAS PROVAS, ESPECIFICANDO AS E JUSTIFICANDO AS. CASO SEJA POSTULADA A PROVA ORAL, DEVERÃO AS

PARTES INFORMAR O NÚMERO DE TESTEMUNHAS A SEREM OUVIDAS PARA A ADEQUAÇÃO DA PAUTA. NO SILÊNCIO, O FEITO SERÁ JULGADO NO ESTADO EM QUE SE ENCONTRA. DILIGÊNCIAS LEGAIS. 022/1.16.0016756-8 (CNJ << REMOVIDO >>) - DELVAIR BILHALVA DE OLIVEIRA (PP. GIULIANE BECKER DARLEY 46989/RS E ROSANA CORREA RIBEIRO 48189/RS) X COOP. DE

CRÉD. DE LIVRE ADM. DE ASSOC. DA ZONA SUL - SICREDI ZONA SUL (PP. CESAR CAZAUBON ARRIECHE 9809/RS E MARISTELA FEKSA NEUENFELDT 48139/RS).

VISTOS. VISTA AO APELADO PARA APRESENTAR CONTRARRAZÕES, QUERENDO, NO PRAZO DE 15 DIAS. 