### Imports 

In [9]:
import os

os.chdir('../')

# HTML PARSER
from bs4 import BeautifulSoup as soup

# INITIALIZE DRIVER
from selenium import webdriver

# WAIT AND CONDITIONS METHODS
# available since 2.26.0
from selenium.webdriver.support.ui import Select

# Exceptions
from selenium.common.exceptions import TimeoutException


# METHODS
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

from locators import Login, Base, LatMenu, \
    Main, ListaBlocos, Bloco, Processo, Envio


from base import Page

import re

In [10]:
def login_SEI(driver, usr, pwd):
        """
        Esta função recebe um objeto Webdrive e as credenciais  
        do usuário, loga no SEI - ANATEL e retorna uma instância da classe  
        SEI. 
        """

        page = Page(driver)
        page.driver.get(Login.URL)
        page.driver.maximize_window()

        usuario = page.wait_for_element_to_click(Login.LOGIN)
        senha = page.wait_for_element_to_click(Login.SENHA)

        # Clear any clutter on the form
        usuario.clear()
        usuario.send_keys(usr)

        senha.clear()
        senha.send_keys(pwd)

        # Hit Enter
        senha.send_keys(Keys.RETURN)

        return SEI(page.driver)

In [77]:
class SEI(Page):
    """
    Esta subclasse da classe Page define métodos de execução de ações na 
    página principal do SEI e de resgate de informações
    """
    
    processos = []
    
    def ver_proc_detalhado(self):
        """
        Expands the visualization from the main page in SEI
        """
        try:
            ver_todos = self.wait_for_element_to_click(Main.FILTROATRIBUICAO)
            
            if ver_todos.text =="Ver todos os processos":
                ver_todos.click()
        
        except TimeoutException:
            
            print("A página não carregou no tempo limite ou cheque o link\
                  'ver todos os processos'")
            
        try:
            
            visual_detalhado = self.wait_for_element_to_click(Main.TIPOVISUALIZACAO)
        
            if visual_detalhado.text == "Visualização detalhada":
                visual_detalhado.click()
                
        except TimeoutException:
            
            print("A página não carregou no tempo limite ou cheque o link\
            de visualização detalhada")
            
    def isPaginaInicial(self):
        """Retorna True se a página estiver na página inicial do SEI, False
        caso contrário"""        
        return self.get_title() == 'SEI - Controle de Processos'

    def go_to_initial_page(self):
        """
        Navega até a página inicial do SEI caso já esteja nela 
        a página é recarregada
        Assume que o link está presente em qualquer subpágina do SEI
        """
        self.wait_for_element_to_click(
            Base.INITIALPAGE).click()

    def exibir_menu_lateral(self):
        """
        Exibe o Menu Lateral á Esquerda no SEI para acessos aos seus diversos
        links
        Assume que o link está presente em qualquer subpágina do SEI
        """
        menu = self.wait_for_element(Base.EXIBIRMENU)

        if menu.get_attribute("title") == "Exibir Menu do Sistema":
            menu.click()
            
    def itera_processos(self):
        """
        Navega as páginas de processos abertos no SEI e guarda as tags
        html dos processos como objeto soup no atributo processos_abertos
        """     
        # assegura que está inicial
        if not self.isPaginaInicial():
            self.go_to_initial_page()

        # Mostra página com informações detalhadas
        self.ver_proc_detalhado()
        
        contador = Select(self.wait_for_element(Main.CONTADOR))

        pages = [pag.text for pag in contador.options]

        for pag in pages:
            
            # One simple repetition to avoid more complex code
            contador = Select(self.wait_for_element(Main.CONTADOR))
            contador.select_by_visible_text(pag)
            html_sei = soup(self.driver.page_source, "lxml")
            self.processos += html_sei("tr", {"class": 'infraTrClara'})
            break
            
        self.processos = [[tag for tag in line.contents if tag !='\n'] for line in self.processos]
        
        for i, lista in enumerate(self.processos):
            
           
                
                
def extrai_tags_processo(lista_tags):

    dict_tags = {}

    assert len(lista_tags) == 6, "Verifique o nº de tags de cada linha do processo, valor diferente de 10"

    dict_tags['checkbox'] = lista_tags[0].find(class_='infraCheckbox')

    controles = lista_tags[1].find_all('a')
    
    for tag_a in controles:
        
        if tag_a.find(src=re.compile("imagens/sei_anotacao")).parent:
            dict_tags['anotacao'] = tag_a
            
        elif tag_a.find(src = re.compile("imagens/sei_situacao")).parent:
            dict_tags['situacao'] = tag_a
            
        elif tag_a.find(src= re.compile("imagens/marcador")).parent:
            dict_tags['marcador'] = tag_a
            
        elif tag_a.find(src = re.compile("imagens/exclamacao")).parent:
            dict_tags['aviso'] = tag_a
            
        elif tag_a.find(src = re.compile("imagens/peticionamento")).parent:
            dict_tags['peticionamento'] = tag_a
            
    dict_tags['processo'] = lista_tags[2].find('a')
    
    dict_tags['atribuicao'] = lista_tags[3].find('a')
    
    
        


            
    #def cataloga_processo()
            
    
    
    

In [13]:
driver = webdriver.Chrome()
sei = login_SEI(driver, 'rsilva', 'Savorthemom3nts')

In [78]:
sei = SEI(sei.driver)

In [79]:
sei.itera_processos()

In [100]:
sei.processos[3][3]

<td align="left" valign="top">(<a class="ancoraSigla" href="controlador.php?acao=procedimento_atribuicao_listar&amp;acao_retorno=procedimento_controlar&amp;id_usuario_atribuicao=100001287&amp;id_procedimento=2379630&amp;infra_sistema=100000100&amp;infra_unidade_atual=110001005&amp;infra_hash=f276f20111581bc84cc69ee98598195821c3ec42cf63043434780485a362f523" title="Atribuído para Rodrigo Ferraz de Melo">rodrigoferraz</a>)</td>

In [94]:
sei.processos[3][1].find(src=re.compile("imagens/sei_anotacao")).parent

<a href="controlador.php?acao=anotacao_registrar&amp;acao_origem=procedimento_controlar&amp;acao_retorno=procedimento_controlar&amp;id_protocolo=2379630&amp;infra_sistema=100000100&amp;infra_unidade_atual=110001005&amp;infra_hash=b2fce00dfcbdc437bd42dcf1619c5abb2cc3e2725cf50e1424e7d24c9bacb212" onmouseout="return infraTooltipOcultar();" onmouseover="return infraTooltipMostrar('ANALISADO','rodrigoferraz');"><img class="imagemStatus" src="imagens/sei_anotacao_pequeno.gif"/></a>

In [41]:
sei.processos[2].contents

[<td align="center" valign="top"><a id="lnkDetalhadoID-2379630" name="ID-2379630"></a><input class="infraCheckbox" id="chkDetalhadoItem2" name="chkDetalhadoItem2" onclick="infraSelecionarItens(this,'Detalhado');" title="53504.012141/2017-17" type="checkbox" value="2379630"/></td>,
 '\n',
 <td align="center" valign="top"><a href="controlador.php?acao=anotacao_registrar&amp;acao_origem=procedimento_controlar&amp;acao_retorno=procedimento_controlar&amp;id_protocolo=2379630&amp;infra_sistema=100000100&amp;infra_unidade_atual=110001005&amp;infra_hash=b2fce00dfcbdc437bd42dcf1619c5abb2cc3e2725cf50e1424e7d24c9bacb212" onmouseout="return infraTooltipOcultar();" onmouseover="return infraTooltipMostrar('ANALISADO','rodrigoferraz');"><img class="imagemStatus" src="imagens/sei_anotacao_pequeno.gif"/></a><a href="controlador.php?acao=andamento_situacao_gerenciar&amp;acao_origem=procedimento_controlar&amp;acao_retorno=procedimento_controlar&amp;id_procedimento=2379630&amp;infra_sistema=100000100&amp;