GitHub - chalimbu/rdds-blog: PENDING BLOG

para practica operaciones con rdd en spark

dataset de prueba sacado de https://www.kaggle.com/datasets/isabbaggin/transaction-fraudulent-financial-syntheticdata/ transaction data for fraud analysis la estructura del dataset es

quiero practicar respondiendo algunas preguntas.

total de valores de transaciones por cada cliente
valor promedio de las operaciones fraudulentas
promedio valor de operaciones por cada cliente
generar grupos de edades 0-20, 21 a 40, 41 a 60 etc, y contar el numero de operaciones fraudulentas por edad, ordenar por los grupos que tienen mas operaciones fraudulentas

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.bsp		.bsp
data/archive		data/archive
project		project
src/main/scala/co/com/sebastian		src/main/scala/co/com/sebastian
.gitignore		.gitignore
build.sbt		build.sbt
readme.md		readme.md

Provide feedback