📰 fake news detection

automate news authenticity prediction with machine learning model

initialization

chmod +x run.sh

./run.sh init

each of the following steps uses a YAML configuration file stored in config folder

processed version of dataset is saved to data directory with prep suffix by default

./run.sh clean

all visualizations are saved to visualization/outputs directory by default

./run.sh viz

requires 8 GB of memory by default which is configurable at driver_memory in config/modeling.yaml file

./run.sh model

best output model is saved to modeling/outputs directory by default
hyper parameter performance summary is also stored to modeling/outputs directory as a CSV file
tuning part requires 8 GB of memory which is configurable at driver_memory in config/modeling.yaml file

./run.sh tune

./run.sh api

Name		Name	Last commit message	Last commit date
Latest commit History 241 Commits
app		app
config		config
data		data
images		images
inference		inference
modeling		modeling
outputs		outputs
preprocessing		preprocessing
runners		runners
visualization		visualization
.gitignore		.gitignore
README.md		README.md
reference.txt		reference.txt
requirements.txt		requirements.txt
run.sh		run.sh
test-data.txt		test-data.txt