Skip to content

victorhqc/ARCHIVED_canvas-scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

canvas-scraper

Web Scraper para la plataforma de educación "Canvas"

UPDATE:

Canvas necesita Javascript para funcionar. Esto quiere decir que Rust no es un buen candidato para solucionar el problema de scraping. Para esto se va a a necesitar una de dos opciones:

  1. Utilizar un browser en headless mode.
  2. Utilizar pupeteer.

En cualquier caso, la mejor opción a utilizar es Node.js

Motivación

La plataforma "Canvas" es una herramienta de educación utilizada por la Universidad de la Rioja Internacional (https://mexico.unir.net/). La manera en que el material para el estudiante se sube, no es la forma más ergonómica que existe, ya que sólo se puede leer en el navegador, y carece de funcionalidades como buscador, marcatextos, etc.

En mi opinión personal, es mejor tener el texto con las imágenes en un formato "Markdown" y poder exportar ese texto a cualquier otro formato que sea necesario, como PDF, Doc, etc.

Alcance

El proyecto tiene como alcance generar una aplicación para la terminal (CLI) que pueda:

  • Iniciar sesión en Canvas (Necesario para poder realizar el scraping)
  • Convertir el material en HTML a un archivo Markdown
  • Automáticamente descargar las imágenes y usarlas en el archivo Markdown.

El formateo post Markdown no forma parte de la especificación y se recomienda utilizar otras herramientas como Pandoc y LateX.

Desarrollo

Requisitos

  • Rust >= 1.39

Ejecución

cargo run

cargo run login

cargo run login -- --help

## Debug mode
CARGO_LOG=canvas-scraper=debug cargo run

About

Web Scraper para la plataforma de educación "Canvas"

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages