# Importar datos

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
frozen = pd.read_csv('frozen_data.csv')

# Exploración de datos

In [3]:
frozen.head()

Unnamed: 0,Fecha,Cliente,Producto,Especie,Temperatura,Peso,Precio al mercado,Cantidad
0,2023-01-01,Cliente A,Congelado,Salmón,-2.599423,0.931058,12.360951,43
1,2023-01-02,Cliente B,Congelado,Atún,-4.181985,0.939198,10.7187,15
2,2023-01-03,Cliente C,Congelado,Bacalao,-3.173686,1.615701,14.973585,20
3,2023-01-04,Cliente A,Congelado,Trucha,-2.140608,1.507491,13.841908,11
4,2023-01-05,Cliente C,Congelado,Pez espada,-3.197286,0.710501,13.28065,15


In [4]:
frozen.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 365 entries, 0 to 364
Data columns (total 8 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   Fecha              365 non-null    object 
 1   Cliente            365 non-null    object 
 2   Producto           365 non-null    object 
 3   Especie            365 non-null    object 
 4   Temperatura        365 non-null    float64
 5   Peso               365 non-null    float64
 6   Precio al mercado  365 non-null    float64
 7   Cantidad           365 non-null    int64  
dtypes: float64(3), int64(1), object(4)
memory usage: 22.9+ KB


# Limpieza y preparación de datos

In [17]:
# Asegurarse de que los tipos de datos sean adecuados
frozen_header = frozen.rename(columns= {'Fecha':'Date','Cliente':'Client','Producto':'Product','Especie':'Species','Temperatura':'Temperature','Peso':'Weight','Precio al mercado':'Market price','Cantidad':'Quantity'})
frozen_header

Unnamed: 0,Date,Client,Product,Species,Temperature,Weight,Market price,Quantity
0,2023-01-01,Cliente A,Congelado,Salmón,-2.599423,0.931058,12.360951,43
1,2023-01-02,Cliente B,Congelado,Atún,-4.181985,0.939198,10.718700,15
2,2023-01-03,Cliente C,Congelado,Bacalao,-3.173686,1.615701,14.973585,20
3,2023-01-04,Cliente A,Congelado,Trucha,-2.140608,1.507491,13.841908,11
4,2023-01-05,Cliente C,Congelado,Pez espada,-3.197286,0.710501,13.280650,15
...,...,...,...,...,...,...,...,...
360,2023-12-27,Cliente A,Congelado,Salmón,-4.500626,1.503434,13.317199,50
361,2023-12-28,Cliente B,Congelado,Atún,-2.634145,1.451413,8.399055,10
362,2023-12-29,Cliente C,Congelado,Bacalao,-4.290684,0.706006,13.725111,14
363,2023-12-30,Cliente A,Congelado,Trucha,-3.489221,0.926921,13.031791,23


In [6]:
# Detectar valores nulos o espacios en blanco
null = frozen.isnull()
null

Unnamed: 0,Fecha,Cliente,Producto,Especie,Temperatura,Peso,Precio al mercado,Cantidad
0,False,False,False,False,False,False,False,False
1,False,False,False,False,False,False,False,False
2,False,False,False,False,False,False,False,False
3,False,False,False,False,False,False,False,False
4,False,False,False,False,False,False,False,False
...,...,...,...,...,...,...,...,...
360,False,False,False,False,False,False,False,False
361,False,False,False,False,False,False,False,False
362,False,False,False,False,False,False,False,False
363,False,False,False,False,False,False,False,False


In [7]:
blank = frozen == ' '
blank

Unnamed: 0,Fecha,Cliente,Producto,Especie,Temperatura,Peso,Precio al mercado,Cantidad
0,False,False,False,False,False,False,False,False
1,False,False,False,False,False,False,False,False
2,False,False,False,False,False,False,False,False
3,False,False,False,False,False,False,False,False
4,False,False,False,False,False,False,False,False
...,...,...,...,...,...,...,...,...
360,False,False,False,False,False,False,False,False
361,False,False,False,False,False,False,False,False
362,False,False,False,False,False,False,False,False
363,False,False,False,False,False,False,False,False


In [8]:
# Obtener el recuento de valores nulos por columna
nulls = frozen.isnull().sum()
nulls

Fecha                0
Cliente              0
Producto             0
Especie              0
Temperatura          0
Peso                 0
Precio al mercado    0
Cantidad             0
dtype: int64

# Análisis estadístico

In [15]:
statistical = frozen_header.describe()
statistical

Unnamed: 0,Temperature,Weight,Market price,Quantity
count,365.0,365.0,365.0,365.0
mean,-3.438092,1.241284,11.373875,30.120548
std,0.843895,0.427496,1.984682,12.381382
min,-4.998515,0.504772,8.023002,10.0
25%,-4.12203,0.896121,9.745122,19.0
50%,-3.45074,1.256811,11.18573,30.0
75%,-2.735402,1.602082,13.123674,41.0
max,-2.000264,1.996268,14.973585,50.0


# Análisis de la demanda de productos en función de la fecha y el cliente

reset_index() se utiliza para eliminar los índices actuales y reemplazarlos por un nuevo índice numérico predeterminado. Esto puede ser útil para restablecer el índice a una secuencia simple de números enteros consecutivos.

In [24]:
# Agrupar por fecha y cliente y calcular la suma de la cantidad
demand_products = frozen_header.groupby(['Date', 'Client'])['Quantity'].sum().reset_index()
demand_products

Unnamed: 0,Date,Client,Quantity
0,2023-01-01,Cliente A,43
1,2023-01-02,Cliente B,15
2,2023-01-03,Cliente C,20
3,2023-01-04,Cliente A,11
4,2023-01-05,Cliente C,15
...,...,...,...
360,2023-12-27,Cliente A,50
361,2023-12-28,Cliente B,10
362,2023-12-29,Cliente C,14
363,2023-12-30,Cliente A,23


Cuando se especifica hue en una gráfica, seaborn utilizará los valores únicos de la columna especificada como hue para asignar colores diferentes a las diferentes categorías en la visualización. Esto es útil cuando se desea resaltar o distinguir las categorías en la trama.

In [31]:
# Visualizar la demanda de productos utilizando seaborn
sns.lineplot(date = demand_products , x = 'Date' )
plt.show()


ValueError: Could not interpret value `Date` for parameter `x`

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=3d8a3cf7-bb98-4fa3-989b-a10c6393cda1' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>