Medium Web Scrapper

To run this, user has to install scrapy library using pip install scrapy

There are two scrappers

medium_scrapper_post.py This scrapper searches Medium for articles based on a user inputted search string.

To run the scrapper, use

scrapy runspider -a searchString=searchTerm medium_scrapper_post.py

medium_scrapper_tag_archive.py This scraper get all Articles for a particular tag slug in a given date range

Note : If tag is Data Science, then pass tag as 'data-science' in tagSlug Parameter To run the scrapper, use

scrapy runspider -a tagSlug='tagSlug' -a start_date=YYYYmmdd -a end_date=YYYYmmdd medium_scrapper_tag_archive.py

Medium Posts Data Extraction

The file DataExtraction.py extracts information from the json files scrapped by the scrapper medium_scrapper_post.py. To extract information from json files scrapped by medium_scrapper_tag_archive.py (scrapping from tags archive) then use Data_Extraction_Archive_Tags.py

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
A Facebook Analysis.ipynb		A Facebook Analysis.ipynb
DataExtraction.py		DataExtraction.py
Data_Extraction_Archive_Tags.py		Data_Extraction_Archive_Tags.py
IdentifyingPopularGroups.ipynb		IdentifyingPopularGroups.ipynb
README.md		README.md
medium_scrapper_post.py		medium_scrapper_post.py
medium_scrapper_tag_archive.py		medium_scrapper_tag_archive.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Medium Web Scrapper

Medium Posts Data Extraction

About

Releases

Packages

Languages

AiswaryaSrinivas/Scraping-Medium-and-Data-Analysis

Folders and files

Latest commit

History

Repository files navigation

Medium Web Scrapper

Medium Posts Data Extraction

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages