Skip to content

Diegoramirez1999/Quickdata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 

Repository files navigation

Quickdata Librery


Optimiza tu tiempo como Data Scientist

Por Diego Alejandro Ramírez Araujo - Github

Librería que te permitirá automatizar y simplificar tus labores cotidianas como científico/analista de datos.

Actualmente, su función principal se enfoca en optimizar el análisis univariado de variables categóricas/cualitativas, mediante la visualización automatizada de manera ponderada y sin ponderar de la variable en cuestión.

Para utilizarlo simplemente necesitas incluir como primer argumento el data frame y como segundo argumento una lista con la/las variables a graficar (los argumentos de personalización son opcionales). La función devolverá una gráfica sin ponderar y ponderada por cada variable.

📝 Note: Actualmente se están desarrollando otras funciones de automatización de gráficos combinados y detección/tratamiento/manejo de outliers.


Prerequisitos 🎬

  1. Python


Funcionalidades del proyecto 🛠️

pip install Quickdata

from Quickdata import complot
  • Funcionalidad simple: Obten una gráfica sin poderar y ponderada de una variable de tu DataFrame, sin necesidad de invertir tiempo y líneas de código (configuración de axes, figure, títulos, labels y efectos visuales automatizados).
complot(example,["sexo"])

  • Funcionalidad avanzada: Introduce múltiples variables de tu DataFrame dentro de la función. Cada variable obtendrá dos gráficos (sin ponderar y ponderado). La función múltiple coloca de manera individual cada variable en el eje x o en y (para múltiples categorías se recomienda utilizar el eje y), agrupa de forma predeterminada las categorías con poca frecuencia para introcucirlas en el gráfico de pie como una sola (mejor visualización) y ordena de forma automática cada variable dependiendo del tipo de su tipo de dato correspondiente: nominales (ordenados de mayor a menor según su frecuencia) y ordinales (ordenados de menor a mayor según su etiqueta).
complot(ejemplo,['Rango de edad', 'Familiares vinculados', 'Motivo de estancia'], 
        chart_type="donut", count_labels=False)

📝 Note:
1. Gráficos ordenados de manera independiente según el tipo de dato.
2. El gráfico ponderado de "Familiares vinculados" se encuentra agrupado (a partir de 5) por default.

  • Otras funcionalidades: Exportar, guardar y personalizar la configuración interna de los gráficos (paleta de colores, tamaño de figuras, establecer o no segmentación automática, limite de variables a introducir en el eje x, entre otros).
complot(ejemplo,['Rango de edad', 'Familiares vinculados', 'Motivo de estancia'], 
        chart_type="donut", count_labels=False, count_x_limit=5, palette="inferno", 
        figsize=(15,15), save=True)

📝 Note: Entre las nuevas funcionalidades que se están desarrollando, se incluye un argumento que otorgue libertar absoluta al usuario para configurar cada gráfico de manera individual bajo los mismos atributos que se emplearían en las librerías originales (seaborn y matplotlib).


Parámetros ❔

data: pd.DataFrame
     Dataset a graficar.

var: list
     Lista con una o múltiples variables a graficar.

figsize: tuple (optional)
     Ancho y alto de la figura en la cual se graficará.

Palette: palette name or list (optional)
     Colores a utilizar en los gráficos.

Chart_type: 'donut' o 'pie' (optional)
     Tipo de gráfico ponderado.

Segmentation: Bool (optional)
     Agrupación de categorías con poca representación en las variables al momento de crear el pie/donut chart.

Segmentation_minimum: float (optional)
     En caso de incluir segmentación, ponderación mínima por categoría antes de ser segmentada.

count_labels: Bool (optional)
     Activa o desactiva las etiquetas de datos del gráfico sin ponderar.

count_x_limit: int (optional)
     Número de variables máximas permitidas en el eje x del gráfico no ponderado (en caso de superarse se graficará en el eje y).

save: Bool (optional)
     Guarda automáticamente en formato .png los gráficos creados.


Autor 👽

About

Librería creada con el fin de automatizar labores presentes en el día a día de los Data Scientists.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors