preprocessing

This is a fraudulent user detecting Kaggle competition. We developed a classification model based on Random Forest to predict when a user downloads a specific app through advertised apps. This data set contained 200 million observations which can be considered as big data. We implemented many feature engineering and data preprocessing techniques…

data-science machine-learning random-forest data-visualization preprocessing data-cleaning

Updated May 8, 2018
R

HaidYi / DASC

Star

Detecting hidden batch factors through data adaptive adjustment for biological effects

quality-control rna-seq clustering statistical-methods gene-expression preprocessing normalization batch-effects

Updated Jun 1, 2018
R

AVJdataminer / Squeaky

Star

R package for data cleaning and pre-processing for data science

automation r organization preprocessing data-cleansing

Updated Aug 24, 2018
R

metamaden / methyPre

Star

Methylation array preprocessing.

bioconductor preprocessing combat normalization qc hg19 sva cpg hm450k illumina-bead-chip methylation-arrays minfi batch-correction swan-normalize illumina-normalize

Updated Sep 6, 2018
R

biharicoder / Engineering-Data-Analysis

Star

This repo has the project codes and documentation for the project related to Semiconductor manufacturing dataset in coursework of Engineering Data Analysis

preprocessing classification-algorithm datacleaning imputation-methods semiconductor-manufacturing-dataset

Updated Oct 4, 2018
R

sauravgore / Predictive-Statistics-of-Imbalanced-Rainfall-Data

Star

Preprocessing imbalanced rainfall data using Apache Hadoop framework and give predictive statistics of rainfall data using R

analysis estimation forecast rainfall india preprocessing predictive-analytics agricultural rainfall-data apache-hadoop-framework rstudio-analysis apache-hadoop-preprocessing

Updated Oct 16, 2018
R

nyubachi / pharmaprepro

Star

This R package is for medical staff such as pharmacists to use for preprocessing clinical data.

package r medical preprocessing pharmacists

Updated Jan 15, 2019
R

nyrrrr / data-thesis

Star

Thesis data, see README.md

data-science machine-learning r thesis preprocessing motion-data

Updated Feb 23, 2019
R

smaakage85 / customsteps

Star

Customizable Higher-Order Recipe Step Functions

recipes machine-learning statistics preprocessing predictive-modeling tidymodeling

Updated Apr 8, 2019
R

PeerChristensen / preprocessML

Star

A package with a simple function for fast preprocessing of data for machine learning

machine-learning r preprocessing

Updated Jun 8, 2019
R

anilsilwal98 / AppliedPredictiveModeling

Star

Exercises From Book "Applied Predictive Modeling" by "Kuhn and Johnson (2013)"

r neural-network linear-regression nn data-transformation prediction model-selection naive-bayes-classifier caret preprocessing predictive-modeling data-cleaning svm-classifier r-programming mass applied-predictive-modeling r-programming-projects

Updated Aug 28, 2019
R

imabelaus / Market-Value-Prediction

Star

In this project I make machine learning models to predict market value of professional football player from the "Complete FIFA 19 dataset" from Kaggle. It contains a pdf with the results, a youtube video of me explaining it, the codes and a read me file. Enjoy :)

visualization r big-data time-series machine-learning-algorithms coursework preprocessing exploratory-analysis