HackML: Fraud Detection with Data Validation

A machine learning project for detecting fraudulent transactions using advanced data validation and model training pipelines.

Project Overview

This project implements a comprehensive fraud detection system that includes:

Data Validation Layer: Automated validation, cleaning, and quality checks for financial transaction data
Model Training: Baseline machine learning models for fraud classification
Reporting: Detailed validation reports and model performance metrics
Testing: Comprehensive test suite for data validation components

Prerequisites

Python 3.8+
Required packages listed in requirements.txt

Installation

Clone the repository:

git clone https://github.com/dshak1/hackML.git
cd hackML

Install dependencies:

pip install -r requirements.txt

Quick Start

1. Prepare Data

Place your fraud detection datasets in the fraud/ directory:

fraud/train.csv - Training data with target column
fraud/test.csv - Test data without target column

2. Validate Data

Run data validation to check data quality and generate reports:

python scripts/validate_data.py \
  --train fraud/train.csv \
  --test fraud/test.csv \
  --out_dir runs \
  --mode warn

3. Train Model

Train a baseline fraud detection model:

python scripts/train_model.py \
  --train fraud/train.csv \
  --test fraud/test.csv \
  --out_dir runs

Contributing

Fork the repository
Create a feature branch
Make your changes
Add tests for new functionality
Run the full test suite
Submit a pull request

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
scripts		scripts
src		src
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_DATA_VALIDATION.md		README_DATA_VALIDATION.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

HackML: Fraud Detection with Data Validation

Project Overview

Prerequisites

Installation

Quick Start

1. Prepare Data

2. Validate Data

3. Train Model

Contributing

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

HackML: Fraud Detection with Data Validation

Project Overview

Prerequisites

Installation

Quick Start

1. Prepare Data

2. Validate Data

3. Train Model

Contributing

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages