Skip to content

Diversos proyectos de web Scraping - Python - SQL - Pysql

Notifications You must be signed in to change notification settings

jrguignan/Web_Scraping

Repository files navigation

Python Beautifulsoup MySQL Pandas Numpy

Proyectos de Web Scraping

Índice

El proyecto consta de guardar la información del top de 100 libros de la página https://cuspide.com/, en un archivo csv, agregando tres columnas extras, con el precio en dólares norteamericanos y euros, y la fecha en que se guarda la información.

Versión 1

  • Se tomó la información de https://cuspide.com/100-mas-vendidos/ con beautifulsoup.
  • Se llevó la información a listas.
  • Se pasaron las listas a un dataframe de pandas.
  • Se tomo la información del tipo de cambio de siguiente link USD y link EUR
  • Se crearon las columnas Precios_USD , Precios_euro y la columna con la fecha.
  • Se guardó el dataframe en un archivo csv.

Versión 2

Es similar a la versión anterior con la siguiente variación.

  • A partir de las direcciones url, se entró a cada una y allí se tomo el valor en pesos argentinos y dólares norteamericanos.
  • Se tomó la información de https://cuspide.com/100-mas-vendidos/ con beautifulsoup.
  • Se llevó la información a listas.
  • Se tomo la informacion del tipo de cambio de siguiente link USD y link EUR
  • Se crearon las columnas Precios_dolar , Precios_euro y la columna con la fecha.
  • Se creó una base de datos top_libros en el servidor local, a traves de pysql.
  • Se creó una tabla top.
  • Se procedió a cargar la información de las listas a la tabla top, usando la función executemany.
  • Se tomó la información de un archivo .csv directo del siguiente link a traves de beautifulsoup, de la página https://buenosaires.gob.ar/inicio/
  • Se limpió la información, se crearon las listas con los valores del archivo.
  • Se creó la base de datos oferta_gastronomica de manera local.
  • Se creó la tabla oferta.
  • Se cargaron las listas a la base de datos.

Archivo.csv de donde se saco la información en su momento (20/10/23).

Archivo .sql donde se hizo una pequeña limpieza a la base de datos con Mysql.

Nota

Con el paso del tiempo se modifica el código funte de las páginas web y se modifica la información mostrada en las mismas, por lo que es muy probable que los códigos anteriores no funcionen en su totalidad.

Requerimientos


Volver al Índice

Autor

About

Diversos proyectos de web Scraping - Python - SQL - Pysql

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published