Event Data Analysis Guide

Data Security and Privacy Considerations

Data Storage

Store all data files locally and DO NOT upload raw data to GitHub or any public repository
If version control is needed, use .gitignore to exclude data files
Consider using sample data or anonymized subsets for documentation purposes

Privacy Requirements

Remove entries for participants who did not consent to data usage
Document the process of consent verification
Keep a separate record of excluded entries for audit purposes
Maintain a log of when and why data was excluded

Data Cleaning Protocol

Standardizing Manual Entries

Review and standardize educational fields:
- Create a mapping table for similar entries (e.g., "Computer Science" = "CS" = "CS Vanderbilt")
- Document all equivalences in a separate reference file
- Include original and standardized values in the cleaning log
Create a data cleaning log with:
- Original value
- Standardized value
- Reason for change
- Date of modification
- Person responsible for the change

Statistical Analysis Framework

Demographic Analysis

Calculate basic statistics:
- Age distribution
- Gender representation
- Geographic distribution
- Educational background
- Professional experience
Documentation of any assumptions made during analysis

Reporting Guidelines

Data Visualization

Include clear labels and legends
Note excluded categories or filtered data
Provide context for interpretations

Reproducibility Checklist

Data exclusions documented
Manual entry standardizations logged
Privacy requirements met
Analysis code version controlled
Data cleaning steps documented
Statistical assumptions stated
Results independently verified

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
README.md		README.md
data_analysis.ipynb		data_analysis.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Event Data Analysis Guide

Data Security and Privacy Considerations

Data Storage

Privacy Requirements

Data Cleaning Protocol

Standardizing Manual Entries

Statistical Analysis Framework

Demographic Analysis

Reporting Guidelines

Data Visualization

Reproducibility Checklist

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

brainhack-vandy/data_analysis

Folders and files

Latest commit

History

Repository files navigation

Event Data Analysis Guide

Data Security and Privacy Considerations

Data Storage

Privacy Requirements

Data Cleaning Protocol

Standardizing Manual Entries

Statistical Analysis Framework

Demographic Analysis

Reporting Guidelines

Data Visualization

Reproducibility Checklist

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages