Mi Biblioteca: Scraper de Libros de Goodreads con Django

Este proyecto Django se enfoca en desarrollar un scraper web que extrae información de libros de mi lista de lectura en Goodreads y la almacena en una base de datos SQLite3. La aplicación también maneja la descarga y almacenamiento de las portadas de los libros.

Características

Extrae información de libros como título, autor, enlace de la portada, calificación personal, calificación pública, fecha de lectura y enlace del libro.
Descarga y almacena las portadas de los libros en la carpeta static/Img/Covers.
Utiliza la biblioteca BeautifulSoup para analizar el HTML de Goodreads.
Emplea la librería requests para realizar solicitudes HTTP y descargar las portadas.
Implementa una función para modificar los enlaces de las portadas y obtener una resolución más alta.
Utiliza SQLite3 como base de datos y crea una tabla books para almacenar la información de los libros.
Verifica si el número de libros en Goodreads ha cambiado antes de actualizar la base de datos.
Evita la duplicación de libros al verificar si el enlace del libro ya existe en la base de datos.

Instalación

Clona el repositorio:

git clone https://github.com/tu-usuario/tu-repositorio.git

Crea un entorno virtual e instala las dependencias:

python -m venv env
source env/bin/activate  # En Windows, usa `env\Scripts\activate`
pip install -r requirements.txt

Aplica las migraciones de Django:

python manage.py migrate

Ejecuta el scraper:

python manage.py scrap_books

Explicación del Código

El código principal se encuentra en el archivo paste.txt. A continuación, se explica cada sección:

Importación de módulos: Se importan los módulos necesarios, como models de Django, BeautifulSoup, requests, os, re, sqlite3 y datetime.
Función modify_cover_url: Esta función modifica el enlace de la portada del libro para obtener una resolución más alta (700 píxeles).
Función scrap_books: Esta es la función principal que realiza el scraping de los libros. Aquí se destacan las siguientes acciones:
- Crea la carpeta static/Img/Covers si no existe.
- Establece una conexión a la base de datos SQLite3 y crea la tabla books si no existe.
- Obtiene el número total de páginas en la lista de libros de Goodreads.
- Itera sobre cada página y extrae la información de cada libro.
- Descarga y almacena las portadas de los libros en la carpeta correspondiente.
- Inserta los datos de los libros en la base de datos, evitando duplicados.
Modelo Book: Esta es la clase que define el modelo de datos Book en Django. Contiene campos como title, author, cover_link, my_rating, public_rating, date_read y book_link.

Uso

Asegúrate de tener un entorno virtual activado y las dependencias instaladas.
Aplica las migraciones de Django: python manage.py migrate.
Ejecuta el scraper: python manage.py scrap_books.
El scraper comenzará a extraer la información de los libros de Goodreads y a descargar las portadas correspondientes.
Los datos de los libros se almacenarán en la base de datos SQLite3 database.db.
Las portadas de los libros se guardarán en la carpeta static/Img/Covers.

Siéntete libre de personalizar y adaptar este proyecto según tus necesidades. Si tienes alguna pregunta o sugerencia, no dudes en abrir un issue en el repositorio.

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
Bookshelf		Bookshelf
home_page		home_page
static		static
templates		templates
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
database.db		database.db
manage.py		manage.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mi Biblioteca: Scraper de Libros de Goodreads con Django

Características

Instalación

Explicación del Código

Uso

About

Releases

Packages

Languages

License

Johanfer12/My_Bookshelf

Folders and files

Latest commit

History

Repository files navigation

Mi Biblioteca: Scraper de Libros de Goodreads con Django

Características

Instalación

Explicación del Código

Uso

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages