
# Análisis de Datos de Ventas

## Descripción del Proyecto
American Things, un poli rubro dedicado a la venta de productos en general, que se ha visto en la necesidad de organizar la información 
alojada en sus bases de datos respecto a las ventas realizadas durante un determinado período de tiempo. El proyecto propone el análisis
y procesamiento de datos, relacionados a las ventas más actuales de la empresa, obtenidos en un período de tiempo, con el fin de desarrollar
y aplicar, tecnologías y métodos destinados a poner en conocimiento al establecimiento, de las categorías de productos, que han tenido un
alza o una baja en ventas, y a partir de ello, abordar las estrategias necesarias para mejorar los diferentes sectores y generar un mejor
rendimiento.

## Integrantes del Equipo
- **Lucas Ryser** - 44.346.194 - lucasryser4k@gmail.com - [GitHub](https://github.com/lucasryser6)
- **Emanuel Guaráz** - 38.276.061 - guarazjemanuel@gmail.com - [GitHub](https://github.com/JEmanuelG)
- **Nicolás Allende Olmedo** - 35.871.057 - nicoallende92@gmail.com - [GitHub](https://github.com/AllendeNicolas)
- **Bruno Lobo Souza** - 95.690.709 - lobosouza.it@gmail.com - [GitHub](https://github.com/lobosouza)
- **Carlos Direni** - 28.117.281 - direnicarlos@gmail.com - [GitHub](https://github.com/Cdireni1)

## ·        Importar los datos

## ·        Imprimir los primeros diez registros

In [None]:
import pandas as pd

# Importar los datos
df = pd.read_csv('American Things - Base de Datos.csv', encoding='latin-1')

# convierte los str formato numero y los errores en NaN
df['Costo'] = pd.to_numeric(df['Costo'], errors='coerce')
df['Ventas'] = pd.to_numeric(df['Ventas'], errors='coerce')
df['Resenia'] = pd.to_numeric(df['Resenia'], errors='coerce')

# Mostrar los primeros 10 registros
print(df.head(10))

## ·        Describir el dataset

In [None]:
print(df.describe(include='all'))

## ·        Análisis de columnas numéricas

In [None]:
numeric_cols = df.select_dtypes(include=['number']).columns

for col in numeric_cols:
    print(f"Análisis de la columna numérica: {col}")
    print(f"Valores válidos sobre el total: {df[col].count()} / {len(df)}")
    print(f"Media: {round(df[col].mean(), 2)}")
    print(f"Mediana: {df[col].median()}")
    print(f"Desviación estándar: {round(df[col].std(), 2)}")
    print(f"Valores ausentes: {df[col].isna().sum()}")
    print(f"Valores mal registrados o erróneos: {df[col].isna().sum() + df[col].isnull().sum()}")
    print("")

# ·        Análisis de columnas categóricas

In [None]:
categorical_cols = df.select_dtypes(include=['object']).columns

for col in categorical_cols:
    print(f"Análisis de la columna categórica: {col}")
    print(df[col].value_counts())
    print(f"Registros válidos sobre el total: {df[col].count()} / {len(df)}")
    print(f"Valores ausentes: {df[col].isna().sum()}")
    print(f"Valores mal registrados o erróneos: {df[col].isna().sum() + df[col].isnull().sum()}")
    print("")

# ·        Análisis de otras variables

In [None]:
other_cols = df.columns.difference(numeric_cols).difference(categorical_cols)

for col in other_cols:
    print(f"Análisis de la columna: {col}")
    print(f"Valores válidos sobre el total: {df[col].count()} / {len(df)}")
    print(f"Valores ausentes: {df[col].isna().sum()}")
    print(f"Valores mal registrados o erróneos: {df[col].isna().sum() + df[col].isnull().sum()}")
    print("")