Web Scrapping

Sobre los autores

Nombre y Apellidos	Correo	GitHub
Ariel Plasencia Díaz	arielplasencia00@gmail.com	@ArielXL
Adriana Plasencia Díaz	adricivilpd@gmail.com	@fcadrianapladia

Sobre el Scrapper

El objetivo de esta pequeña tarea es proporcionar un scrapper para páginas web con el objetivo de poder descargar todo su contenido. También con esta técnica podemos extraer información y transformarla en información estructurada que podemos analizar y almacenar.

Sobre la implementación

La implementación se encuentra totalmente en python 3. Pensamos que es una implementación legible y fácil de entender donde no hace falta tener conocimientos profundos de este lenguaje de programación. Nos apoyamos fundamentalmente en la librería beautifulsoup4 para la implementación. La clase Scrapper recibe la url en forma de string y un entero que representa el nivel de profundidad a realizar el web scrapping. Los resultados se muestran en la carpeta downloads.

Para la instalación de la misma ejecutamos el siguiente comando:

pip install -r requirements.txt

Sobre la ejecución

En el archivo makefile proveemos una manera fácil, sencilla y rápida para correr nuestra implementación.

Para la ejecución, escriba las siguientes líneas en una terminal abierta en este directorio:

cd src/
make run

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
doc		doc
img		img
src		src
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Web Scrapping

Sobre los autores

Sobre el Scrapper

Sobre la implementación

Sobre la ejecución

About

Releases

Packages

Languages

License

ArielXL/web-scrapping

Folders and files

Latest commit

History

Repository files navigation

Web Scrapping

Sobre los autores

Sobre el Scrapper

Sobre la implementación

Sobre la ejecución

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages