Informe de Análisis Estadístico

# Informe de Análisis Estadístico

## 1. Cargar el archivo y mostrar las primeras filas de los datos

En este análisis se utiliza un conjunto de datos de ventas de productos, donde se registran los precios, categorías y métodos de pago.

```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

# Cargar el archivo CSV
try:
    df = pd.read_csv("negocio.csv", delimiter=';', encoding='utf-8')
except UnicodeDecodeError:
    df = pd.read_csv("negocio.csv", delimiter=';', encoding='latin1')

# Mostrar las primeras filas del DataFrame
print("Primeras filas del DataFrame:")
print(df.head())


2. Seleccionar una columna para agrupar los datos
Agrupamos los datos por categoría y sumamos los precios totales.

In [None]:
# Limpiar los nombres de las columnas
df.columns = df.columns.str.strip()  # Elimina espacios en los nombres de las columnas

# Agrupar los datos por CATEGORIA y sumar precios
ventas_por_categoria = df.groupby('CATEGORIA')['PRECIO'].sum().reset_index()
print("Ventas totales por categoría:")
print(ventas_por_categoria)


3. Presentar gráficos de las tendencias importantes

In [None]:
# Gráfico de barras de ventas por categoría
plt.figure(figsize=(10, 5))
plt.bar(ventas_por_categoria['CATEGORIA'], ventas_por_categoria['PRECIO'], color='skyblue')
plt.title('Ventas Totales por Categoría')
plt.xlabel('Categoría')
plt.ylabel('Total Ventas')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# Gráfico de líneas para mostrar la tendencia de precios
plt.figure(figsize=(10, 5))
plt.plot(df['REFERENCIA'], df['PRECIO'], marker='o', linestyle='-', color='orange')
plt.title('Tendencia de Precios por Referencia')
plt.xlabel('Referencia')
plt.ylabel('Precio')
plt.xticks(rotation=90)
plt.tight_layout()
plt.show()



4. Destacar información clave para el análisis

A continuación se presentan estadísticas descriptivas de la columna precio

In [None]:
# Convertir la columna PRECIO a tipo numérico
df['PRECIO'] = pd.to_numeric(df['PRECIO'], errors='coerce')

# Análisis estadístico de la columna PRECIO
media = np.mean(df['PRECIO'])
mediana = np.median(df['PRECIO'])
moda = stats.mode(df['PRECIO'])
varianza = np.var(df['PRECIO'])
desviacion_estandar = np.std(df['PRECIO'])

# Imprimir resultados
print('La media es:', media)
print('La mediana es:', mediana)
if isinstance(moda.mode, np.ndarray) and len(moda.mode) > 0:
    print('La moda es:', moda.mode[0], 'y se repite', moda.count[0], 'veces.')
else:
    print('No se encontró moda.')
print('La varianza es:', varianza)
print('La desviación estándar es:', desviacion_estandar)


5. Generar una nueva columna
Se crea una nueva columna que representa un 10% de descuento sobre el precio original.

In [None]:
# Crear una nueva columna que representa un 10% de descuento
df['PRECIO_CON_DESCUENTO'] = df['PRECIO'] * 0.9
print("DataFrame con la nueva columna de precios con descuento:")
print(df.head())


. Análisis final de los hallazgos
A continuación, se presentan las conclusiones basadas en el análisis realizado:

In [None]:
# Análisis final
print("Análisis final:")
print("1. La media de los precios es:", media)
print("2. La mediana de los precios es:", mediana)
if isinstance(moda.mode, np.ndarray) and len(moda.mode) > 0:
    print("3. La moda de los precios es:", moda.mode[0], "y se repite", moda.count[0], "veces.")
else:
    print("3. No se encontró moda.")
print("4. La varianza indica la dispersión de los precios, siendo:", varianza)
print("5. La desviación estándar de los precios es:", desviacion_estandar)
print("6. Se observan tendencias significativas en los precios a través de los gráficos generados.")


Conclusiones
El análisis realizado muestra que:

La media, mediana y moda de los precios ofrecen información clave sobre la distribución de los mismos.
Las gráficas revelan patrones de comportamiento en las ventas según categorías.
La nueva columna de precios con descuento permite evaluar el impacto de las ofertas.
Este informe se puede guardar y compartir en un repositorio de GitHub.


### Instrucciones para usar el informe

1. **Crea un nuevo Jupyter Notebook** en tu entorno de trabajo.
2. **Copia y pega el código** en las celdas del notebook, dividiendo el contenido en celdas de Markdown y celdas de código según corresponda.
3. **Ejecuta el código** para asegurarte de que funciona correctamente con tu archivo CSV.
4. **Realiza cualquier ajuste necesario** según el análisis o los datos que encuentres.
5. **Sube el notebook a tu repositorio de GitHub** y comparte el enlace como se indica en las instrucciones del proyecto.

Si necesitas más personalización o ajustes en el contenido, ¡házmelo saber!
