## 

___

## Introdução:

  O conceito fundamental por trás de qualquer implementação com o intuito de automatizar um processo é a eficiência.
  
  De um modo bem amplo, automatizar é fazer um processo mais eficiente, seja essa eficiência baseada no consumo de matérias primas e energia, na complexidade de realizar determinada etapa de um processo ou o tempo que um processo leva para reiniciar (pensando em um processo cíclico).
  
   Faz parte do senso-comum pensar em automatização em linhas de produção de grandes indústrias, processos de grandes empresas e serviços de larga escala no geral em diversos setores. Além disso, é comum pensar em automatização de uma visão negativa, associando a corte de gastos e desempregos por causa da substituição do trabalho humano, sendo algo indesejado e que somente beneficia grandes corporações.
   
   Entretanto a automatização não é um inimigo da sociedade mas sim uma ferramenta para levar a mesma mais longe, podendo ser aplicada nos mais diversos problemas e situações, buscando não a substituição do trabalho humano, mas sim a redução de esforço para um indivíduo, melhor condições de trabalho, redução de riscos e potenciais problemas futuros que podem ser por vezes fatais para um ser humano.
   
   Neste trabalho, o razão que motiva a automação  não é redução de custos e de riscos, nem nada a ponto de modificar uma sociedade inteira mas que não deixa de ser menos válida e é ainda positiva: realizar uma tarefa entediante, cíclica, monótona e estressante no lugar de um ser humano.
   
   Essa tarefa é algo muito comum e que provavelmente muitas pessoas praticam: baixar filmes ou episódios de uma determinada série. O processo de baixar um filme tem várias etapas problemáticas que podem ser divididas em três categorias (ou etapas). São elas:
   
**1. Navegação**

Nessa etapa são incluídas todos as dificuldades entre abrir o navegador e iniciar o *download* do arquivo, como por exemplo:
* clicar em cada link de cada episódio
* Lidar com:
    * ads e pop-ups
    * redirecionamentos para sites incorretos e/ou mal intencionados
    * Verificações diversar para evitar *bots*
    
**2. Monitoramento**

Nessa etapa são incluídas as dificuldades durante o processo de *download*, como por exemplo:
* Baixar vários arquivos de uma vez
* Falha de conexão com a rede (geralmente causado pelo problema acima)
* Geração de um arquivo corrompido ou imcompleto (geralmente causado pelo problema acima)


**3. Gestão**

Nessa etapa são incluídas as dificuldades após o processo de *download*, como por exemplo:
* Manter o diretório *Downloads* do computador organizado, ordenando corretamente cada arquivo na pasta correspondente
* Lidar com arquivos incompletos ou corrompidos (deletar o arquivo e reiniciar o processo)

___

## Objetivos:

O projeto tem como **objetivo  principal** acessar um site definido para baixar automaticamente episódios de uma determinada série ou filme.

Também existem tem alguns **objetivos secundários** relativos à eficiência (em termos de tempo, redução de recursos),  autonomia, controle e geração de relatórios. São eles:

* **Eficiência:** Fazer todos os passos que um usuário faria mais rapidamente (e consequentemente reduzir o trabalho do usuário)

* **Autonomia:** Conseguir rodar sozinho por longos períodos e estar pronto pra lidar com problemas externos (queda de conexão, por exemplo)

* **Controle:** Capaz de monitorar qual *download* está sendo executado (evitar baixar diversos episódios de uma vez e acabar reduzindo a velocidade de conexão da rede)

* **Geração de Relatórios:** registrar medidas para posterior análise como, por exemplo, quais episódios já foram baixados, tempo para concluir o *download*, velocidade média de *download*, se o *download* precisou ser reiniciado e quantas vezes isso ocorreu, etc.

Por fim, existem **objetivos bônus** relacionados a usabilidade:

* **Biblioteca:** Estruturar o código para que ele funcione como uma biblioteca (estrutura `Class`)

* **Navegadores:** Rodar o programa em qualquer navegador (Google Chrome, FireFox, Safari etc.) de forma '*headless*'

* **Interface:** Elaborar uma interface com a qual o usuário possa interagir sem a necessidade de alterar o código e/ou fazer *inputs* no console

___

## Limitações:

A biblioteca `Selenium` do Python será utilizada, funcionando em conjunto com um WebDriver , assume o controle de uma janela do navegador e navega através da estrutura (HTML) do *site* (baseando-se nos elementos em HTML e os parâmetros atribuídos a eles). Como cada *site* possui uma estrutura, elementos e atributos distintos o programa será elaborado baseando-se em um apenas um.

O *site* escolhido para esse projeto será o https://saikoanimes.com pelos seguintes motivos:

* Páginas bem organizadas, com pouca propaganda e com estrutura base bem definida
* Páginas de fácil reconhecimento dos elementos
* Os links redirecionam diretamente para a página de download, sem precisar lidar com pop-ups ou verificações anti-bots

Além disso, outra limitação que deve ser comentada é o navegador. O `Selenium` necessita de um WebDriver específico para cada navegador e que também precisa ser salvo em uma localização específica, onde cada qual possui dificuldades específicas de instalação. Por tanto, não será necessário que o programa rode em diferentes navegadores por não haver necessidade para tal.

Esse projeto foi desenvolvido no Ubuntu 18 e, por comodidade, será testado no navegador Mozilla FireFox. Para baixar o WebDriver correspondente basta baixar o arquivo correspondente ao seu sistema no link a seguir: https://github.com/mozilla/geckodriver/releases

Após baixar e descompactar o arquivo, abra o terminal e acesse o diretório onde se encontra o WebDriver e execute o seguinte comando:
> `sudo cp geckodriver /usr/local/bin`

___

## Estrutura do *Database*:

O programa contará com dois *databases* distintos em um mesmo arquivo elaborado em **JSON** (um dos formatos de dados mais comuns, pois diversas linguagens de programação possuem suporte para ler e manipular esse formato de dado). Cada uma dessas duas partes terá funções e comandos para interação específicos. Abaixo da descrição dos *databases* há exemplos da estrutura dos arquivos, para melhor entendimentimento e consulta durante a elaboração dos códigos (quando necessário).

* ***anime_data*:** Armazenamento dos dados extraídos através do `Selenium` de forma organizada, escalável e replicável (uma vez que serão vários animes diferentes que serão armazenados baseando-se na mesma estrutura)

>```
>anime_data = {
>    'anime_name': {'page_url':'anime_page.com',
>                   'episodes':{
>                               '01':{'link': 'anime_ep_01.com', 'status': 'downloaded'},
>                               '02':{'link': 'anime_ep_02.com', 'status': 'not downloaded'},
>                               '03':{'link': 'anime_ep_03.com', 'status': 'not downloaded'}
>                              }
>                  }
>             }
>```


* ***analysis_data:*** Armazenamento de dados para posterior análise e monitoria sobre o funcionamento e eficiência do programa

>```
>analysis_data = {{'anime_pages_extracted': 0,
>                   'anime_pages_acessed': 0,
>                   'links_extracted': 0,
>                   'links_acessed': 0,
>                   'completed_downloads': 0,
>                   'restarted_downloads': 0,
>                   'errors_detected': 0,
>                  }
>                }
>```

___

## Importando Bibliotecas:

In [1]:
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome import service
from selenium import webdriver
from pprint import pprint
import shutil
import json
import time
import os

## Test Area:

In [13]:
class Download_Bot:
    """"""
    # Class Initialization:
    def __init__(self):
        # Importing Libraries:

        # Structural Variables:
        self.database_filename = "download_bot_database"
        self.database_structure = {"Anime_Data_Partition":{},
                                   "Analysis_Partition":{}}
        self.anime_data_structure = {"page_url":"",
                                     "episodes":{}}
        self.episode_structure = {"link":"",
                                  "status":"not downloaded"}
        self.analysis_data_structure = {"anime_pages_acessed":0,
                                        "completed_downloads":0,
                                        "restarted_downloads":0,
                                        "total_enlapsed_time":0,
                                        "errors_detected":0,
                                        "enlapsed_time_records":[]}
        # Path Variables:
        self.current_path = os.getcwd()
        self.user_path = self.find_user_path(self.current_path)
        self.download_path = self.user_path + 'Downloads'
        self.video_path = self.user_path + 'Videos'
        # Class Global Variables:
        self.database = self.check_database()
        
        self.home_page_url = 'https://saikoanimes.net/'
    
    # JSON Manipulation Methods (Interactions with the JSON file used as database):
    def create_database(self):
        """Creates the two database partitions on a single file outside the current directory
        (prevents to accidentaly publish your data)"""
        with open("../{}.json".format(self.database_filename), 'w+') as main_file:
            data_copy = self.database_structure.copy()
            data_copy['Analysis_Partition'] = self.analysis_data_structure.copy()
            return json.dump(data_copy, main_file)
        
    def load_database(self):
        """Reads the database and returns it as a dictionary"""
        with open("../{}.json".format(self.database_filename), 'r+') as main_file:
            return json.loads(main_file.read())
            
    def update_database(self):
        """Reads the database and overwirtes it"""
        with open("../{}.json".format(self.database_filename), 'w+') as main_file:
            return json.dump(self.database.copy(), main_file)
        
    def check_database(self):
        """Acess the database file (in case of empty or inexistent file creates a new one and then acess it)"""
        try:
            return self.load_database()
        except:
            self.create_database()
            return self.load_database()
            
    # Dict Manipulation Methods (Updates and additions to the database as a dictionary):
    def update_analysis_partition(self):
        """Updates the 'Analysis Partition' structure"""
        data_copy = self.database.copy()
        data_copy['Analysis_Partition'] = self.analysis_data_structure.copy()
        self.database = data_copy
    
    def create_section(self, anime_name, url):
        """Creates a new section on the database data"""
        data_copy = self.anime_data_structure.copy()
        data_copy['page_url'] = url
        self.database['Anime_Data_Partition'][anime_name] = data_copy
        
    def remove_section(self, anime_name):
        """Removes an existing section or do nothing otherwise"""
        self.database['Anime_Data_Partition'].pop(anime_name, None)
        
    def check_section(self, anime_name):
        """Checks if the database contains section of a given anime"""
        if anime_name not in self.database['Anime_Data_Partition'].keys():
            self.create_section(anime_name)
        
    def add_page_url(self, url, anime_name):
        """Adds the url of a given anime into the 'page_url' key"""
        data_copy = self.database['Anime_Data_Partition'][anime_name].copy()
        data_copy['page_url'] = url
        self.database['Anime_Data_Partition'][anime_name] = data_copy
        
    def add_episode(self, url, ep_number, anime_name):
        """Adds the whole structure of an episode updated with the current episode number and download link"""
        episode_dict = self.episode_structure.copy()
        episode_dict['link'] = url
        data_copy = self.database['Anime_Data_Partition'][anime_name]['episodes'].copy()
        data_copy[ep_number] = episode_dict
        self.database['Anime_Data_Partition'][anime_name]['episodes'] = data_copy
        
    def update_episode_attribute(self, key, value, ep_number, anime_name):
        """Updates (or create in case it doesn't exist) an attribute for a given episode"""
        data_copy = self.database['Anime_Data_Partition'][anime_name]['episodes'][ep_number].copy()
        data_copy[key] = value
        self.database['Anime_Data_Partition'][anime_name]['episodes'][ep_number] = data_copy
    
    def update_analysis_attribute(self, key, value, iterator=False):
        """Updates an attribute for a given analysis attribute (if no iterator is given, attribute is overwritten)"""
        data_copy = self.database['Analysis_Partition'].copy()
        if key != 'enlapsed_time_records':
            if iterator == True:
                data_copy[key] = data_copy[key] + value
            else:
                data_copy[key] = value
        else:
            data_copy[key].append(value)
        self.database['Analysis_Partition'] = data_copy
        
    # Path Manipulation Methods (Use paths to find files and folders):
    def find_file_by_type(self, file_type, path):
        """Find all files with a certain file type"""
        return [filename for filename in os.listdir(path) if filename.endswith(file_type) == True]
        
    def find_user_path(self, path):
        usual_dirs = ['Documents', 'Pictures', 'Videos', 'Downloads', 'Music', 'Desktop']
        for usual_dir in usual_dirs:
            splited_path = path.split(usual_dir)
            if len(splited_path) > 1:
                return splited_path[0]
                break
        print("Invalid Path: Nothing to return")
        
    def find_filesize(self, path, filename):
        """Returns the size of a given file in bytes (1Mb = 2^20 bytes)"""
        return os.path.getsize(path+"/"+filename)
        
    # Directory Manipulation Methods (Modifications on a given directory's files and folders):
    def new_directory(self, dir_name, path):
        """Creates a new folder in a given path"""
        os.mkdir(path + "/" + dir_name)
        
    def move_file(self, filename, from_path, to_path):
        """Moves a file from a path to another"""
        shutil.move(from_path + "/" + filename, to_path)
    
    def find_download_file(self, file_name, file_type, path, endswith_state = False):
        """Finds the download file on a given directory
           Temporary file: exists while the download process is running (endswith_state = False)
           Final file: exists after the download process finishes (endswith_state = True)"""
        partial_filename = self.partial_file_name(file_name)
        for filename in os.listdir(path):
            if (partial_filename in filename) and (file_type in filename) and (filename.endswith(file_type) == endswith_state):
                return filename
                break
                
    def check_anime_directory(self, file_name, anime_name, from_path, to_path):
        """Checks if exist a anime name's folder (if it doesn't exists, creates a new one) and moves a file to this folder"""
        if anime_name not in os.listdir(to_path):
            self.new_directory(anime_name, to_path)
        self.move_file(file_name, from_path, to_path+"/"+anime_name)
                
    def check_download_file(self, file_name, path, ep_number, anime_name):
        """Checks if the downloaded file has the expected file size.
           If the size IS correct the program moves the file to the correspondent anime folder and returns TRUE (or creates an anime folder in case it doesn't exists) :
           If the size IS NOT correct the program deletes the file and returns FALSE"""
        current_file_size = self.convert_file_size(self.find_filesize(path, file_name))
        expected_file_size = self.convert_file_size(self.database['Anime_Data_Partition'][anime_name]['episodes'][ep_number]['file_size'])
        if current_file_size >= expected_file_size:
            self.check_anime_directory(file_name, anime_name, self.download_path, self.video_path)
            return True
        else:
            os.remove(file_name)
            return False
        
    # String Manipulation Methods (String manipulations):
    def convert_file_size(self, file_size):
        if type(file_size) == str:
            return int(float(file_size[:-3]))
        elif type(file_size) == int:
            return int((file_size/2**20))
        
    def convert_page_to_name(self, page_url):
        return ' '.join([word.capitalize() for word in page_url.split('/')[-2].split('-')])
    
    def convert_title_to_filename(self, page_title):
        return page_title.split(' - ')[0].split('.')
        
    def partial_file_name(self, file_name_string):
        if file_name_string.endswith('...') == True:
            return file_name_string[:-3]
        else:
            return file_name_string
        
    # Manual Override (Manually execute entire commands):
    def manual_insert(self, url):
        """Manually creates a new anime section"""
        anime_name = self.convert_page_to_name(url)
        self.check_section(anime_name)
        self.add_page_url(url, anime_name)
        self.update_database()
        
    def manual_delete(self, url):
        """Manually removes an existent anime section"""
        anime_name = self.convert_page_to_name(url)
        self.remove_section(anime_name)
        self.update_database()
                
    # Browser Manipulation (Navigate and extract data using Selenium WebDriver):
    def open_new_tab(self, driver):
        """Open a new tab using Selenium WebDriver"""
        driver.execute_script('''window.open("","_blank");''')
        
    def driver_start_firefox(self):
        """Open Firefox browser under Selenium webdriver's control"""
        return webdriver.Firefox()
    
    def driver_end(self, driver):
        """Closes Firefox browser under Selenium webdriver's control"""
        driver.quit()
        
    def driver_update_controllers(self, controllers_dict, controllers):
        """Updates a given dictionary with the anime boxes' controllers as value and their number id as key. Also check if the cotroller was already added"""
        for controller in controllers:
            index = controller.get_attribute('data-page')
            if index not in controllers_dict.keys():
                controllers_dict[index] = controller
        return controllers_dict       
    
    def main(self, mode='download'):
        # initializes time counter:
        timer = time.time()
        # Opens Firefox browser under Selenium webdriver's control:
        driver = self.driver_start_firefox()
        # Acesses Saiko Animes' home page and extracts all new anime links:
        new_animes = self.acess_home_page(driver)
        #del new_animes[new_animes.index('https://saikoanimes.net/diamond-no-ace-act-ii-33/')]
        link = 'https://saikoanimes.net/diamond-no-ace-act-ii-33/'
        del new_animes[new_animes.index(link)]
        # Open a new tab:
        self.open_new_tab(driver)
        self.open_new_tab(driver)
        # For each one of the extracted links:
        for anime_page in new_animes:
            if mode == 'display': print('Acessing {} of {} anime pages'.format(new_animes.index(anime_page)+1, len(new_animes)))
            # Makes driver analyse on the new tab:
            driver.switch_to.window(driver.window_handles[1])
            # Acesses the anime page and finds all necessary variables
            self.acess_anime_page(driver, anime_page, mode)
        # Closes the window's browser:
        driver.quit()
        # Finishes the timer:
        enlapsed_time = time.time() - timer
        # Updates analysis counters:
        self.update_analysis_attribute('total_enlapsed_time', enlapsed_time, iterator=True)
        self.update_analysis_attribute('enlapsed_time_records', enlapsed_time)
        # Update database file:
        self.update_database()
        if mode == 'display': print('Database exported')
        
    def acess_home_page(self, driver):
        try:
            # List to store all pages' urls:
            new_anime_urls = []
            # Dictionary to store all page's controllers in order:
            page_controllers = {}
            # Acesses main page:
            driver.get(self.home_page_url)
            # Finds the fist and last id value from the section's controllers:
            last_controller_id = driver.find_element_by_id('pag_sa').find_element_by_class_name('facetwp-pager').find_element_by_class_name('last-page').get_attribute('data-page')            
            current_controller_id = driver.find_element_by_id('pag_sa').find_element_by_class_name('facetwp-pager').find_element_by_class_name('active').get_attribute('data-page')
            # Runs until reaches the last section:
            while current_controller_id != last_controller_id:
                # Finds new anime's area:
                anime_area = driver.find_element_by_id('pag_sa')
                # Gets and stores all anime pages' urls:
                anime_links = [box.find_element_by_tag_name('a').get_attribute('href') for box in anime_area.find_element_by_class_name('facetwp-template').find_elements_by_id('content')]
                _ = [new_anime_urls.append(url) for url in anime_links if url not in new_anime_urls] 
                # Gets and stores all section's controllers:
                boxes_controllers = anime_area.find_element_by_class_name('facetwp-pager').find_elements_by_class_name('facetwp-page')
                for key, value in zip([controller.get_attribute('data-page') for controller in boxes_controllers], boxes_controllers):
                    page_controllers[key] = value
                # Updates the 'while loop' controller:
                current_controller_id = str(int(current_controller_id)+1)
                # Clicks on the next section controller:
                page_controllers[current_controller_id].click()
                # Waits until section's update:
                time.sleep(10)    
        finally:
            return new_anime_urls
        
    def acess_anime_page(self, driver, page_url, mode='download'):
        """Accesses the anime main page, finds episode's links and execute download_manager for each one of them"""
        try:
            partial_name = None
            file_extension = None
            file_size = None
            
            # Accesses the anime's page:
            driver.get(page_url)
            # Gets the redirected url (correct url for anime name extraction):
            page_url = driver.current_url
            
            if mode == 'display': print('\n'+page_url)
            # Extracts the anime name from the page's url:
            anime_name = self.convert_page_to_name(page_url)
            # Checks if there is an anime section (if not, creates a new section):
            if anime_name not in self.database['Anime_Data_Partition'].keys():
                self.create_section(anime_name, page_url)
                if mode == 'display': print('New anime section created')
            # Extracts all episode buttons:
            buttons = driver.find_element_by_class_name('bnt-area').find_elements_by_tag_name('a')
            # Accesses episodes' number and episodes' download page link:
            ep_numbers = [button.text for button in buttons]
            ep_download_pages = [button.get_attribute('href') for button in buttons]
            # Makes driver analyse on the new tab:
            driver.switch_to.window(driver.window_handles[2])
            # Repeats the process for every episode link:
            for ep_number, ep_download_page in zip(ep_numbers, ep_download_pages):
                # Checks if there is a episode section (if not, creates a new section):
                if ep_number not in self.database['Anime_Data_Partition'][anime_name]['episodes'].keys():
                    # Creates a new episode section:
                    self.add_episode(ep_download_page, ep_number, anime_name)
                    if mode == 'display': print('New episode section created')
                # Checks if the episode was already downloaded:
                if self.database['Anime_Data_Partition'][anime_name]['episodes'][ep_number]['status'] == 'not downloaded':
                    if mode == 'display': print('Acessing {} of {} episode pages'.format(ep_numbers.index(ep_number)+1, len(ep_numbers)))
                    # Accesses the episode download page:
                    driver.get(ep_download_page)
                    # Filters the partial file name and extension:
                    partial_name, file_extension = self.convert_title_to_filename(driver.title)
                    # Gets file size:
                    file_size = driver.find_elements_by_class_name('fileinfo')[1].text
                    # Exports file size:
                    self.update_episode_attribute('file_size', file_size, ep_number, anime_name)
                    # 
                    if mode == 'download': self.download_manager(driver, anime_name, ep_number, ep_download_page, partial_name, file_size)
                else:
                    if mode == 'display': print('Episode {} of {} already downloaded'.format(ep_numbers.index(ep_number)+1, len(ep_numbers)))
                    
        #except:
         #   self.update_analysis_attribute('errors_detected', 1, iterator=True)
        finally:
            # Updates analysis counters:
            self.update_analysis_attribute('anime_pages_acessed', 1, iterator=True)
            
            
    def download_manager(self, driver, anime_name, ep_number, ep_download_page, partial_name, file_size):
        # While loop and control variable:
        controller = True
        while controller:
            # Only updates the controller status if all the other commands were properly executed, otherwise the loop continues:
            try:
                # Gets episode direct link:
                download_button = driver.find_element_by_class_name('bnt-down')
                download_link = download_button.get_attribute('href')
                # Starts download file process:
                download_button.send_keys(Keys.ENTER)
                # Waits in order to the browser starts downloading:
                time.sleep(15)
                # Checks if the temporary file still exists and updates the controller variable(while the temporary file exists the download didn't finish yet):
                temporary_file = ' '
                while temporary_file is not None:
                    # Waits some time for new verification:
                    time.sleep(5)
                    # Gets the temporary file name (if it still exists):
                    temporary_file = self.find_download_file(partial_name, file_extension, self.download_path)

                    print("Temporary file found")
                print("Temporary file not found")
                # Gets the downloded file name:
                downloaded_file = self.find_download_file(partial_name, file_extension, self.download_path, endswith_state=True)
                # Waits some time until the download file be ready:
                time.sleep(15)
                # Checks if the downloaded file has the expected size:
                if self.check_download_file(downloaded_file, self.download_path, ep_number, anime_name) == True:
                    # Updates episode status:
                    self.database['Anime_Data_Partition'][anime_name]['episodes'][ep_number]['status'] = 'downloaded'
                    # Updates analysis counters:
                    self.update_analysis_attribute('completed_downloads', 1, iterator=True)
                    pprint(self.database)
                    # Updates controller variable and end the loop:
                    controller = False
                    print("Clean Process")
            #In case of any error (suposes a internet connection error, not a programming error):
#                        except:
#                            self.update_analysis_attribute('restarted_downloads', 1, iterator=True)
#                            print("Error detected, reinitializing process...")
            finally:
                pass
        


In [14]:
bot = Download_Bot()

In [16]:
bot.main(mode='display')

Acessing 1 of 49 anime pages

https://saikoanimes.net/anime/shinchou-yuusha-kono-yuusha-ga-ore-tueee-kuse-ni-shinchou-sugiru/
New anime section created
New episode section created
Acessing 1 of 6 episode pages
New episode section created
Acessing 2 of 6 episode pages
New episode section created
Acessing 3 of 6 episode pages
New episode section created
Acessing 4 of 6 episode pages
New episode section created
Acessing 5 of 6 episode pages
New episode section created
Acessing 6 of 6 episode pages
Acessing 2 of 49 anime pages

https://saikoanimes.net/anime/nanatsu-no-taizai-kamigami-no-gekirin/
New anime section created
New episode section created
Acessing 1 of 6 episode pages
New episode section created
Acessing 2 of 6 episode pages
New episode section created
Acessing 3 of 6 episode pages
New episode section created
Acessing 4 of 6 episode pages
New episode section created
Acessing 5 of 6 episode pages
New episode section created
Acessing 6 of 6 episode pages
Acessing 3 of 49 anime page

Acessing 15 of 49 anime pages

https://saikoanimes.net/anime/stand-my-heroes-piece-of-truth/
New anime section created
New episode section created
Acessing 1 of 6 episode pages
New episode section created
Acessing 2 of 6 episode pages
New episode section created
Acessing 3 of 6 episode pages
New episode section created
Acessing 4 of 6 episode pages
New episode section created
Acessing 5 of 6 episode pages
New episode section created
Acessing 6 of 6 episode pages
Acessing 16 of 49 anime pages

https://saikoanimes.net/anime/phantasy-star-online-2-episode-oracle/
New anime section created
New episode section created
Acessing 1 of 6 episode pages
New episode section created
Acessing 2 of 6 episode pages
New episode section created
Acessing 3 of 6 episode pages
New episode section created
Acessing 4 of 6 episode pages
New episode section created
Acessing 5 of 6 episode pages
New episode section created
Acessing 6 of 6 episode pages
Acessing 17 of 49 anime pages

https://saikoanimes.net/anim

NoSuchWindowException: Message: Browsing context has been discarded


In [35]:
pprint(bot.database['Anime_Data_Partition'].keys())

[u'Ore Wo Suki Nano Wa Omae Dake Ka Yo',
 u'Assassins Pride',
 u'Z X Code Reunion',
 u'Chihayafuru 3',
 u'Honzuki No Gekokujou Shisho Ni Naru Tame Ni Wa Shudan Wo Erandeiraremasen',
 u'Keishichou Tokumubu Tokushu Kyouakuhan Taisakushitsu Dainanaka Tokunana',
 u'Diamond No Ace Act Ii',
 u'Radiant 2',
 u'Kandagawa Jet Girls',
 u'Arifureta Shokugyou De Sekai Saikyou',
 u'Granblue Fantasy The Animation Season 2',
 u'Ahiru No Sora',
 u'Hataage Kemono Michi',
 u'Dr Stone',
 u'Black Clover',
 u'Kono Yo No Hate De Koi Wo Utau Shoujo Yu No',
 u'Mugen No Juunin Immortal',
 u'Cop Craft']


In [36]:
pprint(bot.database['Analysis_Partition'])
pprint(bot.database['Anime_Data_Partition'])

{u'anime_pages_acessed': 32,
 u'completed_downloads': 30,
 u'enlapsed_time_records': [2964.694150209427,
                            1694.315230846405,
                            192.69595408439636,
                            78.08989477157593,
                            19.71363401412964,
                            6.828780174255371,
                            272.8862018585205,
                            36.77133297920227,
                            90.34762597084045,
                            268.65851283073425],
 u'errors_detected': 6,
 u'restarted_downloads': 2,
 u'total_enlapsed_time': 5625.001317739487}
{u'Ahiru No Sora': {u'episodes': {u'1': {u'file_size': u'168.95 MB',
                                         u'link': u'https://cloud.saikoanimes.net/Ez0',
                                         u'status': u'not downloaded'},
                                  u'2': {u'file_size': u'125.12 MB',
                                         u'link': u'https://cloud.saikoanim

In [48]:
bot.acess_anime_page(bot.driver_start_firefox(), 'https://saikoanimes.net/anime/black-clover/', mode='display')

https://saikoanimes.net/anime/black-clover/



IndexError: list index out of range

In [9]:
def manual_links_display():
    """Displays all the anime names and corresponding pages' url"""
    anime_urls = [bot.database['Anime_Data_Partition'][anime_name]['page_url'] for anime_name in bot.database['Anime_Data_Partition'].keys()]
    tuple_list = [(anime_name, page_url) for anime_name, page_url in zip(anime_names, anime_urls)]
    return {key:value for (key,value) in tuple_list}
    
manual_links_display()

[u'https://saikoanimes.net/anime/assassins-pride/',
 u'https://saikoanimes.net/anime/kono-yo-no-hate-de-koi-wo-utau-shoujo-yu-no/',
 u'https://saikoanimes.net/anime/granblue-fantasy-the-animation-season-2/',
 u'https://saikoanimes.net/anime/dr-stone/',
 u'https://saikoanimes.net/anime/arifureta-shokugyou-de-sekai-saikyou/',
 u'https://saikoanimes.net/anime/keishichou-tokumubu-tokushu-kyouakuhan-taisakushitsu-dainanaka-tokunana/',
 u'https://saikoanimes.net/anime/cop-craft/']


{u'Arifureta Shokugyou De Sekai Saikyou': u'https://saikoanimes.net/anime/arifureta-shokugyou-de-sekai-saikyou/',
 u'Assassins Pride': u'https://saikoanimes.net/anime/assassins-pride/',
 u'Cop Craft': u'https://saikoanimes.net/anime/cop-craft/',
 u'Dr Stone': u'https://saikoanimes.net/anime/dr-stone/',
 u'Granblue Fantasy The Animation Season 2': u'https://saikoanimes.net/anime/granblue-fantasy-the-animation-season-2/',
 u'Keishichou Tokumubu Tokushu Kyouakuhan Taisakushitsu Dainanaka Tokunana': u'https://saikoanimes.net/anime/keishichou-tokumubu-tokushu-kyouakuhan-taisakushitsu-dainanaka-tokunana/',
 u'Kono Yo No Hate De Koi Wo Utau Shoujo Yu No': u'https://saikoanimes.net/anime/kono-yo-no-hate-de-koi-wo-utau-shoujo-yu-no/'}