Skip to content

Este proyecto utiliza Scrapy y MongoDB Atlas para realizar el proceso de ETL para el proyecto de Business Intelliegence and Big Data (I/2024) sobre los anuncios de inmuebles en Clasificados de Los Tiempos.

License

Notifications You must be signed in to change notification settings

dotM87/los-tiempos-bi-bd-i-2024

Repository files navigation

Clasificados: Inmuebles

Este proyecto utiliza Scrapy y MongoDB Atlas para realizar el proceso de ETL para el proyecto de Business Intelliegence sobre los anuncios de inmuebles en Clasificados de Los Tiempos.

Requisitos

  • Python 3.x
  • Scrapy
  • pymongo
  • MongoDB Atlas

Instalación

  1. Clona este repositorio:

    git clone https://github.com/dotM87/los-tiempos-bi-bd-i-2024.git
  2. Instala las dependencias:

    pip install -r requirements.txt

Uso

  1. Ejecuta el spider de Scrapy para realizar el web scraping:

    scrapy crawl -s MONGODB_URI="mongodb+srv://<usuario>:<contraseña>@cluster0.ztxjdbr.mongodb.net/" -s MONGODB_DATABASE="att" clasificados_spider
  2. Los datos extraídos se almacenarán en la base de datos de MongoDB.

Licencia

Este proyecto está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.

About

Este proyecto utiliza Scrapy y MongoDB Atlas para realizar el proceso de ETL para el proyecto de Business Intelliegence and Big Data (I/2024) sobre los anuncios de inmuebles en Clasificados de Los Tiempos.

Topics

Resources

License

Stars

Watchers

Forks

Languages