CORD-19 Data Explorer

Project Overview

This project explores the CORD-19 dataset, which contains metadata of COVID-19 research papers. The goal is to perform a complete data science workflow, including data loading, cleaning, analysis, visualization, and building an interactive application using Streamlit.

By completing this project, I gained hands-on experience with real-world data, learning how to handle missing values, extract insights, visualize trends, and create interactive dashboards.

Dataset

File used: metadata.csv from the CORD-19 dataset
Source: CORD-19 Dataset
Key columns:
- title: Title of the research paper
- abstract: Abstract text of the paper
- publish_time: Publication date
- journal: Journal name
- source_x: Dataset source

Project Steps

Part 1: Data Loading and Basic Exploration

Download the dataset and place metadata.csv in your project folder.
Load the dataset using pandas:

import pandas as pd

df = pd.read_csv('metadata.csv', low_memory=False)

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
README.md		README.md
data-analysis.py		data-analysis.py
streamlit_app.py		streamlit_app.py
visualization.py		visualization.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

CORD-19 Data Explorer

Project Overview

Dataset

Project Steps

Part 1: Data Loading and Basic Exploration

About

Uh oh!

Releases

Packages

Languages

kidanen/Python-Framework-Assignment

Folders and files

Latest commit

History

Repository files navigation

CORD-19 Data Explorer

Project Overview

Dataset

Project Steps

Part 1: Data Loading and Basic Exploration

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages