## 

___

## Introdução:

  O conceito fundamental por trás de qualquer implementação com o intuito de automatizar um processo é a eficiência.
  
  De um modo bem amplo, automatizar é fazer um processo mais eficiente, seja essa eficiência baseada no consumo de matérias primas e energia, na complexidade de realizar determinada etapa de um processo ou o tempo que um processo leva para reiniciar (pensando em um processo cíclico).
  
   Faz parte do senso-comum pensar em automatização em linhas de produção de grandes indústrias, processos de grandes empresas e serviços de larga escala no geral em diversos setores. Além disso, é comum pensar em automatização de uma visão negativa, associando a corte de gastos e desempregos por causa da substituição do trabalho humano, sendo algo indesejado e que somente beneficia grandes corporações.
   
   Entretanto a automatização não é um inimigo da sociedade mas sim uma ferramenta para levar a mesma mais longe, podendo ser aplicada nos mais diversos problemas e situações, buscando não a substituição do trabalho humano, mas sim a redução de esforço para um indivíduo, melhor condições de trabalho, redução de riscos e potenciais problemas futuros que podem ser por vezes fatais para um ser humano.
   
   Neste trabalho, o razão que motiva a automação  não é redução de custos e de riscos, nem nada a ponto de modificar uma sociedade inteira mas que não deixa de ser menos válida e é ainda positiva: realizar uma tarefa entediante, cíclica, monótona e estressante no lugar de um ser humano.
   
   Essa tarefa é algo muito comum e que provavelmente muitas pessoas praticam: baixar filmes ou episódios de uma determinada série. O processo de baixar um filme tem várias etapas problemáticas que podem ser divididas em três categorias (ou etapas). São elas:
   
**1. Navegação**

Nessa etapa são incluídas todos as dificuldades entre abrir o navegador e iniciar o *download* do arquivo, como por exemplo:
* clicar em cada link de cada episódio
* Lidar com:
    * ads e pop-ups
    * redirecionamentos para sites incorretos e/ou mal intencionados
    * Verificações diversar para evitar *bots*
    
**2. Monitoramento**

Nessa etapa são incluídas as dificuldades durante o processo de *download*, como por exemplo:
* Baixar vários arquivos de uma vez
* Falha de conexão com a rede (geralmente causado pelo problema acima)
* Geração de um arquivo corrompido ou imcompleto (geralmente causado pelo problema acima)


**3. Gestão**

Nessa etapa são incluídas as dificuldades após o processo de *download*, como por exemplo:
* Manter o diretório *Downloads* do computador organizado, ordenando corretamente cada arquivo na pasta correspondente
* Lidar com arquivos incompletos (além de deletar o arquivo fazer com que o programa reinicie o processo)

___

## Objetivos:

O projeto tem como **objetivo  principal** acessar um site definido para baixar automaticamente episódios de uma determinada série ou filme.

Também existem tem alguns **objetivos secundários** relativos à eficiência (em termos de tempo, redução de recursos),  autonomia, controle e geração de relatórios. São eles:

* **Eficiência:** Fazer todos os passos que um usuário faria mais rapidamente (e consequentemente reduzir o trabalho do usuário)

* **Autonomia:** Conseguir rodar sozinho por longos períodos e estar pronto pra lidar com problemas externos (queda de conexão, por exemplo)

* **Controle:** Capaz de monitorar monitorar qual *download* está sendo executado (evitar baixar diversos episódios de uma vez e acabar reduzindo a velocidade de conexão da rede)

* **Geração de Relatórios:** registrar medidas para posterior análise como, por exemplo, quais episódios já foram baixados, tempo para concluir o *download*, velocidade média de *download*, se o *download* precisou ser reiniciado e quantas vezes isso ocorreu, etc.

Por fim, existem **objetivos bônus** relacionados a usabilidade:

* **Biblioteca:** Estruturar o código para que ele funcione como uma biblioteca (estrutura `Class`) e que possa ser 

* **Navegadores:** Rodar o programa em diferentes navegadores (Google Chrome, Opera, Edge etc.)

* **Interface:** Elaborar uma interface com a qual o usuário possa interagir sem a necessidade de alterar o código e/ou fazer *inputs* no console

___

## Limitações:

A biblioteca `Selenium` do Python será utilizada, funcionando como WebDriver que assume o controle de uma janela do navegador e navega através da estrutura (HTML) do *site* (baseando-se nos elementos em HTML e os parâmetros atribuídos a eles). Como cada *site* possui uma estrutura, elementos e atributos distintos o programa será elaborado baseando-se em um apenas um.

O *site* escolhido para esse projeto será o https://saikoanimes.com pelos seguintes motivos:

* Páginas bem organizadas, com pouca propaganda e com estrutura base bem definida
* Páginas de fácil reconhecimento dos elementos
* Os links redirecionam diretamente para a página de download, sem precisar lidar com pop-ups ou verificações anti-bots

Além disso, outra limitação que deve ser comentada é o navegador. `Selenium` foi inicialmente desenvolvido para funcionar através Google Chrome, portanto há muito mais documentação e a implementação é mais simples usando esse navegador em específico. Por causa disso será necessário intalar esse o Google Chrome, caso já não tenha feito isso. Entretanto atualmente o `Selenium` tem suporte para diversos navegadores, podendo aplicar os mesmos comandos em quaisquer destes navegadores.

___

## Estrutura dos *Databases*:

O programa contará com dois *databases* distintos elaborados em **JSON** (um dos formatos de dados mais usados para armazenagem de dados, pois diversas linguagens de programação conseguem ler os arquivos ), cada qual com funções e comandos para interação específicos (utilizando a biblioteca `json`). Abaixo da descrição dos *databases* há exemplos da estrutura dos arquivos, para melhor entendimentimento e consulta durante a elaboração dos códigos (quando necessário).

* ***anime_data*:** Armazenamento dos dados extraídos através do `Selenium` de forma organizada para que o programa saiba corretamente

>```
>anime_data = {
>    'anime_name': {'page-url':'anime_page.com',
>                   'episodes':{
>                               '01':{link: 'anime_ep_01.com', 'status': 'downloaded', ''},
>                               '02':{link: 'anime_ep_02.com', 'status': 'not downloaded'},
>                               '03':{link: 'anime_ep_03.com', 'status': 'not downloaded'}
>                              }
>                  }
>             }
>```


* ***analysis_data:*** Armazenamento de dados para posterior análise e levantamentos sobre a eficiência do programa

>```
>analysis_data = {
>
>
>
>
>                }
>```

___

In [9]:
list_a = [0,15,85,42,8,52,87,475]
val_a = 78
list_total = []
for val in list_a:
    list_total.append(val)
list_total.append(val_a)

mean_1 = sum(list_total)/len(list_total)

mean_2 = (sum(list_a)/len(list_a) + val_a)/2


print(mean_1)
print(mean_2)

[0, 15, 85, 42, 8, 52, 87, 475, 78]
93.55555555555556
86.75


In [None]:
analysis_data = {'anime_pages_extracted':0,
                 'anime_pages_acessed':0,
                 'links_extracted':0,
                 'links_acessed':0,
                 'downloads_complete':0,
                 'downloads_restarted':0,
                 'errors_detected':0,
                 '':0,
                 '':0




                }

### Importing Libraries

In [1]:
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome import service
from selenium import webdriver
from pprint import pprint
import requests
import json
import time
import os

### Defining Functions

* #### JSON Database Interaction:

In [None]:
json.

In [4]:
def create_databases():
    clean_data = {}
    
    with open("../anime_data.json", 'w') as anime_file:
        json.dump(clean_data, anime_file)
        
    with open("../analysis_data.json", 'w') as analyis_file:
        json.dump(clean_data, analysis_file)
        

def load_database(database_file):
    with open("../{}.json".format(database_file), 'w') as file:
        return json.load(file)

* #### Loading Selenium:

In [9]:
create_databases()

FileNotFoundError: [Errno 2] No such file or directory: '../analysis_data.json'

In [3]:
driver = webdriver.Chrome()

WebDriverException: Message: unknown error: cannot find Chrome binary
  (Driver info: chromedriver=2.45.615291 (ec3682e3c9061c10f26ea9e5cdcf3c53f3f74387),platform=Windows NT 10.0.17134 x86_64)


In [14]:
url = 'https://saikoanimes.com/kenja-no-mago/'
# Loads Seleninum webdriver:
driver = webdriver.Chrome()
# Open the url's webpage on a browser:
driver.get(url)

driver.find_element
# # Finds the close button and clicks on it:
# driver.find_element_by_class_name('close').click()
# time.sleep(5)
# # Switches to the original browser tab:
# driver.switch_to.window(driver.window_handles[0])
# # Finds the donwload button and clicks on it
# driver.find_element_by_link_text('Zippyshare (Rápido)').click()

time.sleep(60)
driver.quit()

NoSuchElementException: Message: no such element: Unable to locate element: {"method":"link text","selector":"Zippyshare (Rápido)"}
  (Session info: chrome=71.0.3578.98)
  (Driver info: chromedriver=2.45.615291 (ec3682e3c9061c10f26ea9e5cdcf3c53f3f74387),platform=Windows NT 10.0.16299 x86_64)


In [23]:
help(driver.switch_to_window)

Help on method switch_to_window in module selenium.webdriver.remote.webdriver:

switch_to_window(window_name) method of selenium.webdriver.chrome.webdriver.WebDriver instance
    Deprecated use driver.switch_to.window



In [11]:
webdriver_service = service.Service(executable_path=r'C:\Users/duals/Documents/Python Scripts/operadriver.exe')
webdriver_service.start()

options = webdriver.ChromeOptions()
options.binary_location = "/usr/bin/opera"


driver = webdriver.Opera(executable_path=webdriver_service.service_url,
                         desired_capabilities=webdriver.DesiredCapabilities.OPERA,
                         options=options)

driver.get('https://www.google.com/xhtml');
input_text = driver.find_element_by_name('q')
input_txt = driver.send_keys('operadriver\n')

time.sleep(7)
driver.quit()

TypeError: __init__() missing 1 required positional argument: 'executable_path'