In [1]:
rotulos = ['EXP', 'BAN', 'OIG', 'DAN', 'SEG', 'CON']

In [2]:
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.preprocessing import FunctionTransformer

from sklearn.externals import joblib

pipelines = []

dense = FunctionTransformer(lambda x: x.todense(), accept_sparse=True, validate=True)

def load_model(file):
    return joblib.load(file)

for rotulo in rotulos:
    vect = load_model('../modelos/CountVectorizer-' + rotulo + '.pkl')
    tfidf = load_model('../modelos/TfidfTransformer-' + rotulo + '.pkl')
    clf = load_model('../modelos/Modelo-' + rotulo + '.pkl') 
    p = Pipeline([
        ('vect', vect),
        ('tfidf', tfidf),
        ('dense', dense),
        ('clf', clf)
    ])
    pipelines.append(p)

In [3]:
processos = [
    '0025142-07.2016.8.24.0000', #EXP
    '0301056-30.2017.8.24.0042', #BAN
    '0502658-08.2012.8.24.0023' #OIG
]

In [4]:
import ipywidgets as widgets

dropdown = widgets.Dropdown(
    options=processos,
    description='Processo:',
    disabled=False,
)
dropdown

Dropdown(description='Processo:', options=('0025142-07.2016.8.24.0000', '0301056-30.2017.8.24.0042', '0502658-…

In [6]:
import crawler
import limpeza

nomalizador = limpeza.Limpeza()

c = crawler.Crawler()
acordaos = c.get_acordaos(dropdown.value)

for acordao in acordaos:
    print('\n{}'.format(acordao['texto']))

    ementa = nomalizador.normalizar(acordao['ementa'])
    
    print('\n{}'.format(acordao['ementa']))
    
    for p in pipelines:
        resultado = p.predict([ementa])
        if resultado != 'NONE':
            print('Classificado como ' + resultado)
    


Processo: 0502658-08.2012.8.24.0023 (Acórdão)
Relator: Newton Varella Júnior
Origem: Capital
Orgão Julgador: Segunda Câmara de Direito Comercial
Julgado em: Tue Oct 02 00:00:00 BRT 2018  
Classe: Apelação Cível

APELAÇÕES CÍVEIS. AÇÃO DE ADIMPLEMENTO CONTRATUAL. DIREITO À COMPLEMENTAÇÃO DO NÚMERO DE AÇÕES SUBSCRITAS. SENTENÇA DE PROCEDÊNCIA. RECURSO INTERPOSTO POR AMBAS AS PARTES.    AGRAVO RETIDO. NÃO CONHECIMENTO. AUSÊNCIA DE PEDIDO EXPRESSO CONFORME EXIGÊNCIA DO ART. 523, § 1º DO CÓDIGO DE PROCESSO CIVIL VIGENTE À ÉPOCA DE INTERPOSIÇÃO.   RECURSO DE APELAÇÃO DA RÉ   PRELIMINAR DE ILEGITIMIDADE PASSIVA AFASTADA. APELANTE QUE É SUCESSORA DA TELESC, TENDO LEGITIMIDADE PARA FIGURAR NO POLO PASSIVO DA DEMANDA.    CARÊNCIA DA AÇÃO QUANTO AOS DIVIDENDOS E JUROS SOBRE O CAPITAL PRÓPRIO. INOCORRÊNCIA. CONSECTÁRIOS LÓGICOS DEVIDOS (Resp. N. 1034255/RS).    PRESCRIÇÃO. MATÉRIA QUE SE REGE PELOS ARTS. 177 DO CÓDIGO CIVIL/1916 E ARTS. 205 E 2.028 DO CÓDIGO CIVIL/2002. ENTENDIMENTO DO SUPERIOR T