Skip to content

thiagosequeira/pyspark-bigdata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 

Repository files navigation

PySpark for Big Data

Este repositorio contiene ejemplos y soluciones de data cleaning utilizando la biblioteca de PySpark. Estas soluciones están diseñadas para ayudarte a resolver problemas comunes en el preprocesamiento de datos.

Este repositorio es material de estudio de un curso completo para aprender Databricks, incluido Spark Dataframes, Machine Learning, analítica avanzada y Streaming.

image

Contenido

En este repositorio encontrarás:

  • Lección 1: Fundamentos básicos de PySpark y Python que muestran ejemplos prácticos de cómo utilizar PySpark para limpiar y procesar datos.
  • Lección 2: Fundamentos avanzados.
  • Lección 3: Databricks dbutils.

About

Data cleaning utilizando la biblioteca PySpark.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published