SHB-project-group-4

for Studies on Human Behavior course project

Informal resources processing

Structure for processing informal resources.

Project Structure

project_root/
│
├── data/
│   ├── raw/
│   │   └── # Raw data files
│   ├── processed/
│   │   └── # Processed data files
│   └── interim/
│       └── # Intermediate data files
├── plots/
├── pre-processing/
│   ├── config.py
│   ├── s1_time_diary.py
│   ├── s2_demographic.py 
│   ├── s3_matching.py
│   ├── s4_get_app_names.py
│   ├── s5_features.py
│   ├── s6_join_features.py
│   ├── s7_mood_normalization.py
│   └── utils.py
├── analyzie_viz.py
├── main.py
├── requirements.txt # Project libraries
│

Getting Started

Follow these steps to set up and run the project:

install project libraries:

pip install -r requirements.txt

Data processing pipeline

Download required datasets in /data/raw/ directory.

Execute the preprocessing scripts in the following order:

Step 1: Timediary dataset processing

python pre_processing/s1_timediary.py -l pre_processing/log_s1.log -i data/raw/td_ita.dta -o data/interim/

Step 2: Demographic dataset processing

python pre_processing/s2_demographic.py -l pre_processing/log_s2.log -i data/raw/data4diarynew_ITA.dta -o data/interim/

Step 3: Matching

Matches outputs of step 1 and 2.

python pre_processing/s3_matching.py -l pre_processing/log_s3.log -i data/interim/demographic.csv -i2 data/interim/timediary.csv -o data/interim/

Step 4: Get app names

Scrapes Google Play Store to get application group names.

python pre_processing/s4_get_app_names.py -l pre_processing/log_s3.log -i data/raw/applicationevent.csv -o data/interim/

Step 5: Process features

Process features include notification sensor and application sensor.

python pre_processing/s5_features.py -l pre_processing/log_s5.log -i data/raw/notificationevent.csv -o data/interim/

python pre_processing/s5_features.py -l pre_processing/log_s5.log -i data/raw/applicationevent.csv -o data/interim/

Step 6: Join features from /raw/interim folder, it reads files '*_feature.csv'

python pre_processing/s6_join_features.py -l pre_processing/log_s6.log -i data/interim/  -o data/processed/

Step 7: mood normalization

python pre_processing/s7_mood_normalization.py -l pre_processing/log_s7.log -i data/processed/final_data_encoded.csv -o data/processed/

You can customize the script parameters according to your data and file paths.

Data Analysis

One file contains multiple functions; each analyses, and export visualization

python analyze_viz.py -l log_viz.log -i data/processed/final_data.csv -ii data/processed/final_data_encoded.csv -o plots

Machine learning experiment

Results are out in log file

python main.py -l log_main.log -i data/processed/final_data_encoded_normalized.csv -o

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SHB-project-group-4

Informal resources processing

Project Structure

Getting Started

install project libraries:

Data processing pipeline

Data Analysis

Machine learning experiment

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
data		data
plots		plots
pre_processing		pre_processing
README.md		README.md
analyze_viz.py		analyze_viz.py
log_main.log		log_main.log
log_viz.log		log_viz.log
main.py		main.py
question_desc		question_desc
requirements.txt		requirements.txt

Munkh99/SHB-project-group-4

Folders and files

Latest commit

History

Repository files navigation

SHB-project-group-4

Informal resources processing

Project Structure

Getting Started

install project libraries:

Data processing pipeline

Data Analysis

Machine learning experiment

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages