### Automatização de preenchimento de formulário com Python.

Automatizar a escrita de notas é uma tarefa que pode ser bastante útil para professores e educadores em geral. Com Python, é possível criar um programa capaz de acessar um sistema de notas, ler e processar informações, e finalmente escrever as notas dos alunos em um documento ou planilha.

Para isso, é necessário ter conhecimento de programação em Python, além de ter acesso ao sistema de notas que se deseja automatizar. O Selenium é uma biblioteca Python muito utilizada para automatizar tarefas em navegadores web, o que a torna uma excelente opção para este tipo de projeto.

Através da utilização do Selenium, é possível automatizar a navegação no site de notas, realizar login e busca pelos alunos, ler informações, como notas, e até mesmo escrever as notas em um arquivo. Com isso, é possível economizar tempo e reduzir erros humanos, tornando o processo de escrita de notas mais eficiente.

A seguir, veremos um exemplo prático de como automatizar a escrita de notas utilizando o Selenium em Python.

In [1]:
# selenium

# import webdriver
from selenium import webdriver
from selenium.webdriver.common.by import By


# Cria um Chrome
driver = webdriver.Chrome()
# Estou usando o Chrome, mas podia ser firefox ou outro

# Entra no site
driver.get("https://ec2galileu.com.br/professor")


Tenha certeza de que o site carregou para executar o próximo passo

In [2]:
# encontra o campo de usuário e preenche com o nome de usuário
user_input = driver.find_element(By.ID ,"identity")
user_input.send_keys("Usuario")

# encontra o campo de senha e preenche com a senha
password_input = driver.find_element(By.ID ,"credential")
password_input.send_keys("Senha")

# encontra o botão de login e clica nele
#login_button = driver.find_element(By.ID ,"btn btn-primary")
#login_button.click()
entrar_button = driver.find_element(By.XPATH, "//button[contains(.,' Entrar')]")
entrar_button.click()




In [3]:
# Entra no registro de notas
driver.get("https://ec2galileu.com.br/professor/registro-nota")
# Daria pra ter feito o Selenium clicar no botão "Registro de nota", mas assim é mais rápido.

## Automação da seleção de curso, turma e período escolar com Selenium

Essa parte do código usa a biblioteca Selenium para automatizar a seleção do curso, turma e período escolar no site. É possível selecionar o curso e turma usando o valor do atributo `value` do elemento HTML `option` correspondente. A seleção do período escolar é feita da mesma forma.

O comando `time.sleep(5)` é usado para aguardar 5 segundos após cada seleção para permitir que a página seja carregada corretamente antes de prosseguir.


In [35]:
import time
from selenium.webdriver.support.ui import Select
# Seleciona entre Fundamental ou Médio
Select(driver.find_element(By.ID ,"id_curso")).select_by_value('3533')
time.sleep(5)  # aguarda 5 segundos
# 3533 é Fund2 e 3532 é Médio

# Seleciona a turma
Select(driver.find_element(By.ID ,"id_turma")).select_by_value('30054424')
time.sleep(5)  # aguarda 5 segundos
## Fund
# value='30054424' 2023 / 6º ANO A-6º ANO-09/01/2023 a 15/12/2023	 
# value='30054425' 2023 / 6º ANO B-6º ANO-09/01/2023 a 15/12/2023	 
# value='30054426' 2023 / 7º ANO A-7º ANO-09/01/2023 a 15/12/2023	 
# value='30054427' 2023 / 7º ANO B-7º ANO-09/01/2023 a 15/12/2023
## Médio
# value='30054434' 2023 / 2ª SERIE A -2ª SÉRIE-09/01/2023 a 15/12/2023	 
# value='30054435' 2023 / 3ª SERIE -3ª SÉRIE-09/01/2023 a 15/12/2023	 
# value='30054436' 2023 / 2ª SERIE B-2ª SÉRIE-09/01/2023 a 15/12/2023

# # Seleciona a Disciplina
# Select(driver.find_element(By.ID ,"id_disciplina")).select_by_value('14926')
# time.sleep(5)  # aguarda 5 segundos
# # value='14926' MATEMÁTICA

# # Seleciona o professor
# Select(driver.find_element(By.ID ,"id_funcionario")).select_by_value('xxxxxxx')
# time.sleep(5)  # aguarda 5 segundos

# Seleciona o período
Select(driver.find_element(By.ID ,"nr_periodo")).select_by_value('1')
time.sleep(5)  # aguarda 5 segundos
# value='1'para 1º Trimestre
# value='2'para 2º Trimestre 
# value='3'para 3º Trimestre


## Obtendo os dados dos alunos usando Selenium

Para extrair os dados dos alunos da página, empregamos a biblioteca Selenium para realizar a raspagem das informações da tabela de faltas. O processo é realizado da seguinte forma:

1. **Localização da tabela:** Utilizamos o método `find_element()` do Selenium para localizar a tabela de alunos na página, identificada pelo ID `gridAlunos`.

2. **Extração das linhas:** Extraímos todas as linhas da tabela encontrada utilizando o método `find_elements()` com o argumento `By.TAG_NAME` para encontrar todos os elementos `<tr>` (linhas) dentro da tabela.

3. **Iteração sobre as linhas:** Iteramos sobre cada linha da tabela e extraímos os dados das células correspondentes.

4. **Extração de dados das células:** Para cada linha, utilizamos o método `find_elements()` novamente para encontrar todas as células `<td>` (colunas) dentro da linha. A partir dessas células, extraímos o nome do aluno da primeira coluna e os dados das demais células que contêm inputs.

5. **Armazenamento dos dados:** Os dados extraídos são armazenados em listas para posterior processamento e análise.

O código utilizado para realizar essas operações está apresentado abaixo. Este código extrai os dados dos alunos da tabela e os armazena em DataFrames do Pandas para facilitar a manipulação posterior.

In [126]:
from selenium import webdriver
from selenium.webdriver.common.by import By
import pandas as pd
from openpyxl import Workbook
import re

# Localize a tabela pelo id
tabela = driver.find_element(By.ID, "gridAlunos")

# Extraia todas as linhas da tabela
linhas = tabela.find_elements(By.TAG_NAME, "tr")

# Listas para armazenar os dados da tabela
dados_tabela = []
dados_tabela_interna = []

# Itera sobre as linhas da tabela e extrai os dados das células
for linha in linhas:
    colunas = linha.find_elements(By.TAG_NAME, "td")
    if colunas:
        nome_aluno = colunas[0].text.strip().split("\n")[0]  # Limpa o nome do aluno
        dados_linha = [nome_aluno]
        dados_linha_interna = [nome_aluno]

        # Extrai dados das células subsequentes que têm inputs
        for coluna in colunas[1:]:
            if coluna.find_elements(By.CSS_SELECTOR, "input"):
                input_value = coluna.find_element(By.CSS_SELECTOR, 'input').get_attribute("value")
                input_name = coluna.find_element(By.CSS_SELECTOR, 'input').get_attribute("name")
                dados_linha.append(input_value)  # Para o usuário final
                dados_linha_interna.append(input_name)  # Para uso interno
        
        dados_tabela.append(dados_linha)
        dados_tabela_interna.append(dados_linha_interna)

# Nomes das colunas, conforme especificado
nomes_colunas = ["Aluno", "VERIFICAÇÃO PARCIAL", "VERIFICAÇÃO GLOBAL", "ATIVIDADE 1", "ATIVIDADE 2", "ATIVIDADE 3", "ATIVIDADE 4", "PONTO OLIMPÍADA","MÉDIA MANUAL"]

# Criação dos DataFrames com dados e colunas
df_usuario = pd.DataFrame(dados_tabela, columns=nomes_colunas[:len(dados_tabela[0])])  # DataFrame do usuário
df_interno = pd.DataFrame(dados_tabela_interna, columns=nomes_colunas[:len(dados_tabela_interna[0])])  # DataFrame interno

# Encontra o elemento select e a opção selecionada para nomear o arquivo
select_turma = driver.find_element(By.ID, "id_turma")
turma_selecionada = select_turma.find_element(By.CSS_SELECTOR, "option:checked").text.strip()

# Tratamento do nome da turma para usar como nome do arquivo
nome_arquivo_base = re.sub(r'\d{2}/\d{2}/\d{4} a \d{2}/\d{2}/\d{4}', '', turma_selecionada)
nome_arquivo_base = re.sub(r'[^A-Za-z0-9\s]+', '', nome_arquivo_base)
nome_arquivo_base = re.sub(r'\s+', '_', nome_arquivo_base.strip())
nome_arquivo_excel_usuario = f"{nome_arquivo_base}_Usuario.xlsx"
nome_arquivo_excel_interno = f"{nome_arquivo_base}_Interno.xlsx"

# Salvando os DataFrames em arquivos Excel
df_usuario.to_excel(nome_arquivo_excel_usuario, index=False)
# df_interno.to_excel(nome_arquivo_excel_interno, index=False)

# print(f"Tabela do usuário extraída e salva como {nome_arquivo_excel_usuario}")
# print(f"Tabela interna extraída e salva como {nome_arquivo_excel_interno}")


### Processamento de notas de alunos com Pandas em Python

Este código utiliza a biblioteca Pandas para manipular dados de um arquivo Excel contendo as notas dos alunos. Primeiramente, o arquivo Excel é lido utilizando a função `read_excel()` do Pandas e os dados são armazenados na variável `notas`. 

Em seguida, o código percorre as células do DataFrame usando dois loops `for` para converter os valores de float para string, substituindo os pontos decimais por vírgulas. 

Posteriormente, é feita a substituição de todos os valores "nan" por `np.nan` em todo o DataFrame, utilizando o método `replace()`. Finalmente, a primeira linha é transformada em cabeçalho e removida do DataFrame para manter apenas os dados dos alunos.

In [127]:
import pandas as pd

# Lê o arquivo Excel
#####################################################
# Sobre o arquivo de Excel:                         #
#####################################################
# Baixe a planilha do site Galileu, edite ele em    #
# seu computador, com as notas dos alunos, e salve  #
# em formato .xlsx                                  #
#####################################################
# notas = pd.read_excel('C:\\Users\\gdelg\\OneDrive\\Jupyter Notebook\\6_ANO_A_20246_ANO_Usuario.xlsx', sheet_name=0, header=None, skiprows=1)
notas = pd.read_excel('C:\\Users\\gdelg\\8_ANO_B_20248_ANO_Usuario.xlsx', sheet_name=0, header=None)

# Percorre as células do DataFrame e converte os valores de float para string com vírgula
for i in range(len(notas)):
    for j in range(1, 8):
        nota = notas.iloc[i, j]  # Acessa o valor da célula na linha i e coluna j
        if isinstance(nota, float):  # Verifica se o valor é do tipo float
            notas.iloc[i, j] = str(nota).replace('.', ',')  # Substitui o ponto por vírgula
            
# Substitui "nan" por np.nan em todo o DataFrame
notas = notas.replace("nan", np.nan)
# Transforma a primeira linha em cabeçalho (header)
notas.columns = notas.iloc[0]
notas = notas[1:]

Em seguida, para processar esses dados e preencher as notas dos alunos em um formulário online, outro trecho de código é utilizado. Este código percorre o DataFrame `df_interno`, que contém os IDs das caixas de texto e checkboxes do formulário. Ele verifica se a célula correspondente em `notas` não é `NaN`, obtém a nota correspondente e preenche a caixa de texto com a nota. Caso contrário, verifica se o checkbox correspondente não está selecionado e o seleciona, rolando a página até a posição do elemento, se necessário.


**Problemas conhecidos:** Se o `Selenium` tentar preencher ou selecionar algum dado fora de vista, o programa indicará erro, nesse caso basta rodar novamente.


In [125]:
import numpy as np
from selenium.webdriver.common.by import By
from selenium.common.exceptions import NoSuchElementException

# Verifica o número de linhas no DataFrame df_interno
num_alunos = len(df_interno)

# Percorre as linhas do DataFrame df_interno
for i in range(num_alunos):
    # Percorre as colunas do DataFrame df_interno
    for j in range(1, len(df_interno.columns)):  # Começa de 1 para pular a primeira coluna 'Aluno'
        # Obtém o ID da caixa de texto a partir do DataFrame df_interno
        id_caixa_texto = df_interno.iloc[i, j]  # A primeira coluna contém os IDs das caixas de texto
        # Verifica se o ID da caixa de texto não contém "media-manual"
        if "media-manual" not in df_interno.iloc[i, j]:
            # Verifica se a célula correspondente em notas não é NaN
            if not pd.isna(notas.iloc[i, j]):
                # Obtém a nota da célula correspondente em notas e converte para string
                nota = str(notas.iloc[i, j])
                # Encontra e preenche a caixa de texto com a nota
                try:
                    caixa_texto = driver.find_element(By.ID, id_caixa_texto)
                    caixa_texto.clear()
                    caixa_texto.send_keys(nota)
                except NoSuchElementException:
                    print(f"Elemento com ID {id_caixa_texto} não encontrado.")
            else:
                id_checkbox = f"chk-nc-{id_caixa_texto.lower()}"
                checkbox = driver.find_element(By.ID, id_checkbox)
                if not checkbox.is_selected():
                    checkbox.click()
