Este mini projeto tem como objetivo ler o "calendário acadêmico 2022 - 1º Semestre" disponiblizado pela Universidade Estácio de Sá no formato de PDF e consequentemente inserir os eventos do sementre na ferramenta de calendário da Microsoft. Claro que este mesmo projeto servira tambem para os futuros calendários.

Resolvi utilizar o calendário da Microsoft pois a universidade tem uma parceria com ela, sendo assim nós alunos temos acesso gratuito ao office 365 através do email institucional oferecido pela universidade. Então se você é aluno da Estácio, aproveita que é de graça, detalhe, enquanto for aluno,rs.

Pré-Requistos:

1. Ativar sua conta Microsoft Azure (Azure for Students Starter) com seu email institucional.
2. Aplicativo registrado na plataforma com as devidas permissões (Passo a passo abaixo)

Registrar um aplicativo na plataforma Azure (Passo a Passo)

1. Acessar https://portal.azure.com/#blade/Microsoft_AAD_RegisteredApps/ApplicationsListBlade;
2. Registrar um novo app;
3. Definir o nome (A seu critério);
4. Tipos de conta com suporte (Contas em qualquer diretório organizacional (Qualquer diretório do Azure AD – Multilocatário) e
contas pessoais da Microsoft (por exemplo, Skype, Xbox));
5. Uri de Redirecionamento:
    - Opção: Web
    - URI: https://login.microsoftonline.com/common/oauth2/nativeclient
6. Botão registrar;
7. Anote o 'ID do aplicativo (cliente)';
8. Em 'Certificados e segredos':
    - Gerar 'Novo segredo do cliente'
    - Defina uma descrição 
    - Escolha a expiração mais longa possivel 
    - Anote o valor do segredo criado pois ele será escondido mais tarde
9. Em 'Permissões de APIs':
    - Provavelemnte já vai ter uma permissão para Microsof Graph adicionada, senão é só clicar em 'Adicionar uma permissão'
    - Microsoft Graph
    - Permissões delegadas
    - Selecionar permissões (Digite 'Calendar' na barra de pesquisa) 
    - selecione a permissão 'Calendars.ReadWrite' 
    - Digite tambem offline_access e marque a permissão 
    - Finalize clicando em Adicionar permissões. 
    - Caso já exista a permissão Microsoft Graph basta clicar nela e seguir os passos acima e finalizar clicando em Atualizar permissões;
10. Pronto

O projeto esta divido em três partes:

1. Processamento do PDF
2. Autenticação através do gateway Microsoft Graph
3. Inserir os eventos no calendário




# Parte 1 - Processamento do PDF

Para essa etapa é necessário ter o módulo tabula-py (https://pypi.org/project/tabula-py/) instalado em seu ambiente.

Pré-Requistos:
- Java 8+
- Python 3.6+

Instalação:
pip install tabula-py
Exemplos de utilização: https://nbviewer.org/github/chezou/tabula-py/blob/master/examples/tabula_example.ipynb

Vamos importar as bibliotecas necessárias para essa primeira etapa

In [68]:
# Como o tabula retorna um objeto pandas precisamos dele instalado
import pandas as pd
pd.set_option('display.max_columns', 200)
pd.set_option('display.max_rows', 100)
pd.set_option('display.min_rows', 100)
pd.set_option('display.expand_frame_repr', True)

import numpy as np
import tabula as tb

# Manipulacao de diretorios
from pathlib import Path

# Ignorando os warnings
import warnings
warnings.filterwarnings('ignore')

from colorama import Fore, Back, Style #For text colors
y_ = Fore.CYAN
m_ = Fore.WHITE


Como as bibliotecas importadas vamos iniciar o processamento. 
Antes de executar o trecho do codigo abaixo crie uma pasta e coloque o PDF do candelário nele.

In [2]:
# Definindo as variaveis que armazenam o caminho para o PDF
path = Path(f'{Path.cwd()}/assets') # Se for o caso mude para o nome do diretorio que você criou
file_name = 'CALENDÁRIO ACADÊMICO 2022.1 Estácio.pdf' 

In [7]:
# Metodo do module tabula-py responsavel por ler o PDF.
# Esse metodo retorna um objeto pandas
data = tb.io.read_pdf((path / file_name), pages='1', stream=True)[0]
data

Unnamed: 0.1,Unnamed: 0,Unnamed: 1,Calendário Acadêmico 2022.1 EAD
0,,,Cursos de Graduação e Cursos Superiores de Tecnologia
1,MÊS,DIA,DESCRIÇÃO
2,DEZEMBRO,06/12/2021,Renovação de matrícula (aceite do contrato e pagamento do boleto de renovação) - Veteranos
3,JANEIRO,19/01/2022,Inclusão e exclusão de disciplinas - Veteranos (a partir das 14hs)
4,FEVEREIRO,15/02/2022,Início do semestre letivo (Calouros e Veteranos)
5,,23/03/2022,Início do período de realização do 1o simulado
6,MARÇO,,
7,,31/03/2022,Fim do período de renovação de matrícula - Veteranos
8,,24/04/2022,Fim do período de inclusão e exclusão de disciplinas - Veteranos
9,,25/04/2022,Início do lançamento das horas AAC - EX


Para criar os eventos precisamos somente de duas informações: Data e Titulo.
Então vamos tratar o dataframe para que ele fique somente com essas informações.
 
1. Renomear e Filtrar as colunas
2. Excluir as linhas sem data
3. Excluir as duas primeiras linhas, pois não nos interessam


In [8]:
# Renomeando as colunas
data.rename(columns={'Unnamed: 1': 'Data', 'Calendário Acadêmico 2022.1 EAD':'Titulo'}, inplace=True)
# Reconstruindo o dataframe somente com as colunas Data e Titulo
data = data[['Data', 'Titulo']]
# Reconstruindo o dataframe mas agora somente com as linhas que contem data
data = data[data['Titulo'].notna()]
# Excluindo as duas primeiras linhas do dataframe
data = data.iloc[2:]
data

Unnamed: 0,Data,Titulo
2,06/12/2021,Renovação de matrícula (aceite do contrato e pagamento do boleto de renovação) - Veteranos
3,19/01/2022,Inclusão e exclusão de disciplinas - Veteranos (a partir das 14hs)
4,15/02/2022,Início do semestre letivo (Calouros e Veteranos)
5,23/03/2022,Início do período de realização do 1o simulado
7,31/03/2022,Fim do período de renovação de matrícula - Veteranos
8,24/04/2022,Fim do período de inclusão e exclusão de disciplinas - Veteranos
9,25/04/2022,Início do lançamento das horas AAC - EX
11,25/04/2022,Início do período de avaliação (AV) - 100% EAD
12,25/04/2022,"Início do trancamento, cancelamento de matrícula ou transferência externa com cobrança de multa (vide contrato)"
13,01/05/2022,Fim do período de realização do 1o simulado


O metodo info() do pandas nos mostra os tipos de dados do nosso dataframe. Precisamos mudar o tipo de dado (object) da coluna Data para datetime.
Isso é necessário pois o método que será usado para armazenar os eventos no calendário espera a data com essa tipagem.

In [14]:
data.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 23 entries, 2 to 28
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Data    23 non-null     object
 1   Titulo  23 non-null     object
dtypes: object(2)
memory usage: 552.0+ bytes


In [15]:
# Vamos usar o metodo do proprio pandas para alterar o tipo de dado da coluna Data
data['Data'] =pd.to_datetime(data['Data'], dayfirst=True)
data.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 23 entries, 2 to 28
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype         
---  ------  --------------  -----         
 0   Data    23 non-null     datetime64[ns]
 1   Titulo  23 non-null     object        
dtypes: datetime64[ns](1), object(1)
memory usage: 552.0+ bytes


Prontinho. Dataframe processado, agora vamos para a segunda parte.

# Parte 2 - Autenticação

Para facilitar nossa vida vamos usar a biblioteca O365 (https://pypi.org/project/O365/) que está prontinha para interagir com a Microsoft Graph e o Office 365.

Pré-Requisitos:
- Python 3.4+

Dependências:
- requests
- requests-oauthlib
- beatifulsoup4
- stringcase
- python-dateutil
- tzlocal
- pytz

Instalação:
pip install O365

In [18]:
# Importando o modulo que vamos utilizar
from O365 import Account

A autenticação é divida em dois passos.

1. Aplicativo registrado na Azure (Suponho que já registrou o seu)
2. Autorizar o acesso para obter o token

Um breve explicação desse procedimento:

1. Preencher as variáveis ID_APP e VALUE_KEY
1. Executar o código abaixo
2. Copiar e colar a URL do output em um navegador
3. Aceitar a 'solicitação de permissões'
4. Após aceitar você será redirecionado(a) a uma pagina em branco. Copie o link dessa página e cole no 'message box' do código
5. Pronto


In [19]:
ID_APP = '83641c05-07e1-43ae-84e5-d0f80650617b' # Obtido quando registrou um app na azure
VALUE_KEY = 'hoC7Q~rlLMOcOZpkyJ4H1WxNbUl5x794R2FAa' # Obtido na etapa Certificados e Segredos

credential = (ID_APP, VALUE_KEY)

scope = ['https://graph.microsoft.com/Calendars.ReadWrite']

account = Account(credential)

if account.authenticate(scopes=scope):
   print('Authenticated!')

Visit the following url to give consent:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize?response_type=code&client_id=83641c05-07e1-43ae-84e5-d0f80650617b&redirect_uri=https%3A%2F%2Flogin.microsoftonline.com%2Fcommon%2Foauth2%2Fnativeclient&scope=https%3A%2F%2Fgraph.microsoft.com%2FCalendars.ReadWrite&state=DPCKDj11EoFloB1afIHYFk6dHyrgFt&access_type=offline
Authentication Flow Completed. Oauth Access Token Stored. You can now use the API.
Authenticated!


# Parte 3 - Inserir os eventos no calendário

Inserir eventos no calendário

In [72]:
# Vamos instanciar o objeto Schedule através do método schedule do modulo Account
schedule = account.schedule()

calendar = schedule.get_default_calendar()

for index, row in data.iterrows():
    new_event = calendar.new_event()
    new_event.subject = row['Titulo']
    new_event.location = 'EAD - Universidade Estácio'
    new_event.start = row['Data'].to_pydatetime()
    new_event.remind_before_minutes = 30
    result = new_event.save()

    if result:
        print(f'{y_}Inserido com sucesso: {m_}{new_event}: ')
    

[36mInserido com sucesso: [37mSubject: Renovação de matrícula (aceite do contrato e pagamento do boleto de renovação) - Veteranos (on: 2021-12-06 from: 00:00:00 to: 00:30:00): 
[36mInserido com sucesso: [37mSubject: Inclusão e exclusão de disciplinas - Veteranos (a partir das 14hs) (on: 2022-01-19 from: 00:00:00 to: 00:30:00): 
[36mInserido com sucesso: [37mSubject: Início do semestre letivo (Calouros e Veteranos) (on: 2022-02-15 from: 00:00:00 to: 00:30:00): 
[36mInserido com sucesso: [37mSubject: Início do período de realização do 1o simulado (on: 2022-03-23 from: 00:00:00 to: 00:30:00): 
[36mInserido com sucesso: [37mSubject: Fim do período de renovação de matrícula - Veteranos (on: 2022-03-31 from: 00:00:00 to: 00:30:00): 
[36mInserido com sucesso: [37mSubject: Fim do período de inclusão e exclusão de disciplinas - Veteranos (on: 2022-04-24 from: 00:00:00 to: 00:30:00): 
[36mInserido com sucesso: [37mSubject: Início do lançamento das horas AAC - EX (on: 2022-04-25 fro

Se você quiser visualizar os eventos do seu calendário segue exemplo.

In [61]:
import datetime as dt

schedule = account.schedule()

calendar = schedule.get_default_calendar()

# Precisamos definir uma query para obter os eventos
q = calendar.new_query('start').greater_equal(dt.datetime(2022, 1, 1))
q.chain('and').on_attribute('end').less_equal(dt.datetime(2022, 12, 31))

events = calendar.get_events(include_recurring=True, query=q, limit=50)

for i,event in enumerate(events):
    print(event)

Subject: Inclusão e exclusão de disciplinas - Veteranos (a partir das 14hs) (on: 2022-01-19 from: 00:00:00 to: 00:30:00)
Subject: Início do semestre letivo (Calouros e Veteranos) (on: 2022-02-15 from: 00:00:00 to: 00:30:00)
Subject: Início do período de realização do 1o simulado (on: 2022-03-23 from: 00:00:00 to: 00:30:00)
Subject: Fim do período de renovação de matrícula - Veteranos (on: 2022-03-31 from: 00:00:00 to: 00:30:00)
Subject: Fim do período de inclusão e exclusão de disciplinas - Veteranos (on: 2022-04-24 from: 00:00:00 to: 00:30:00)
Subject: Início do lançamento das horas AAC - EX (on: 2022-04-25 from: 00:00:00 to: 00:30:00)
Subject: Início do período de avaliação (AV) - 100% EAD (on: 2022-04-25 from: 00:00:00 to: 00:30:00)
Subject: Início do trancamento, cancelamento de matrícula ou transferência externa com cobrança de multa (vide contrato) (on: 2022-04-25 from: 00:00:00 to: 00:30:00)
Subject: Fim do período de realização do 1o simulado (on: 2022-05-01 from: 00:00:00 to: 

Delentando TODOS os eventos do calendário

In [73]:
q = calendar.new_query('start').greater_equal(dt.datetime(2022, 1, 1))
q.chain('and').on_attribute('end').less_equal(dt.datetime(2022, 12, 31))
events = calendar.get_events(include_recurring=True, query=q, limit=50)

for i, event in enumerate(events, 1):
    e = event
    result = event.delete()

    if result:
        print(f'{y_}Deletado com sucesso: Evento {m_}{e}')
    else:
        print(f'{y_}Falha ao deletar: Evento {m_}{e}:')


[36mDeletado com sucesso: Evento [37mSubject: Inclusão e exclusão de disciplinas - Veteranos (a partir das 14hs) (on: 2022-01-19 from: 00:00:00 to: 00:30:00)
[36mDeletado com sucesso: Evento [37mSubject: Início do semestre letivo (Calouros e Veteranos) (on: 2022-02-15 from: 00:00:00 to: 00:30:00)
[36mDeletado com sucesso: Evento [37mSubject: Início do período de realização do 1o simulado (on: 2022-03-23 from: 00:00:00 to: 00:30:00)
[36mDeletado com sucesso: Evento [37mSubject: Fim do período de renovação de matrícula - Veteranos (on: 2022-03-31 from: 00:00:00 to: 00:30:00)
[36mDeletado com sucesso: Evento [37mSubject: Fim do período de inclusão e exclusão de disciplinas - Veteranos (on: 2022-04-24 from: 00:00:00 to: 00:30:00)
[36mDeletado com sucesso: Evento [37mSubject: Início do lançamento das horas AAC - EX (on: 2022-04-25 from: 00:00:00 to: 00:30:00)
[36mDeletado com sucesso: Evento [37mSubject: Início do período de avaliação (AV) - 100% EAD (on: 2022-04-25 from: 00:0