In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

In [2]:
motores_unicos = pd.read_excel('/content/Motores_Unicos.xlsx')

In [None]:
print(motores_unicos)

In [None]:
# prompt: extraer los valores unicos de la columna FRAME
unique_frames = motores_unicos['FRAME'].unique()
unique_frames

In [None]:
len(unique_frames)

# Analisis Descriptivos

In [None]:
# Calcular los estadísticos importantes
potencia_hp = motores_unicos['POTENCIA (HP)']
median_hp = potencia_hp.median()
mean_hp = potencia_hp.mean()
q1_hp = potencia_hp.quantile(0.25)
q3_hp = potencia_hp.quantile(0.75)

# Crear el diagrama de caja
plt.figure(figsize=(10, 6))
sns.boxplot(x='POTENCIA (HP)', data=motores_unicos)

# Título y etiquetas
plt.title('Diagrama de Caja de Potencia (HP) de Motores Únicos', fontsize=14, fontweight='bold')
plt.xlabel('Potencia (HP)', fontsize=12, fontweight='bold')

# Anotar la media, mediana y cuartiles en el gráfico
plt.text(mean_hp, 0.1, f'Media: {mean_hp:.2f}', ha='center', va='center', color='black', fontsize=10)
plt.text(median_hp, 0.15, f'Mediana: {median_hp:.2f}', ha='center', va='center', color='blue', fontsize=10)
plt.text(q1_hp, 0.15, f'Q1: {q1_hp:.2f}', ha='center', va='center', color='purple', fontsize=10)
plt.text(q3_hp, 0.15, f'Q3: {q3_hp:.2f}', ha='center', va='center', color='purple', fontsize=10)

# Mostrar el gráfico
plt.tight_layout()
plt.show()


In [None]:
# Calcular los estadísticos importantes
rpm = motores_unicos['R.P.M']
median_rpm = rpm.median()
mean_rpm = rpm.mean()
q1_rpm = rpm.quantile(0.25)
q3_rpm = rpm.quantile(0.75)

# Crear el diagrama de caja
plt.figure(figsize=(10, 6))
sns.boxplot(x='R.P.M', data=motores_unicos)

# Título y etiquetas
plt.title('Diagrama de Caja de R.P.M de Motores Únicos', fontsize=14, fontweight='bold')
plt.xlabel('R.P.M', fontsize=12, fontweight='bold')

# Anotar la media, mediana y cuartiles en el gráfico
plt.text(mean_rpm, 0.1, f'Media: {mean_rpm:.2f}', ha='center', va='center', color='black', fontsize=10)
plt.text(median_rpm, 0.15, f'Mediana: {median_rpm:.2f}', ha='center', va='center', color='blue', fontsize=10)

# Mostrar el gráfico
plt.tight_layout()
plt.show()

# Distribuciones Numericas

In [None]:

# Crear el histograma de la columna 'POTENCIA (HP)' para los motores únicos
plt.figure(figsize=(10, 6))  # Ajustar el tamaño de la figura
sns.histplot(motores_unicos['POTENCIA (HP)'], kde=True, bins=10)
plt.title('Distribución de Potencia (HP) de Motores Únicos')
plt.xlabel('Potencia (HP)')
plt.ylabel('Frecuencia')
# Agregar etiquetas con la cantidad en cada barra
for p in plt.gca().patches:
    plt.gca().text(p.get_x() + p.get_width() / 2., p.get_height(), '%d' % int(p.get_height()),
                ha='center', va='bottom', fontsize=10)
plt.show()


In [None]:
# Crear el histograma de la columna 'R.P.M' para los motores únicos
plt.figure(figsize=(10, 6))
sns.histplot(motores_unicos['R.P.M'], kde=True, bins=10)
plt.title('Distribución de RPM de Motores Únicos')
plt.xlabel('RPM')
plt.ylabel('Frecuencia')
# Agregar etiquetas con la cantidad en cada barra
for p in plt.gca().patches:
    plt.gca().text(p.get_x() + p.get_width() / 2., p.get_height(), '%d' % int(p.get_height()),
                ha='center', va='bottom', fontsize=10)
plt.show()



# Graficos con Categorias

In [None]:
# Contar la cantidad de motores por marca
marca_counts = motores_unicos['MARCA '].value_counts()

# Configuración general del gráfico
plt.figure(figsize=(12, 6))
sns.set_style("whitegrid")  # Estilo de fondo más elegante

# Crear gráfico de barras con colores gradientes
bars = sns.barplot(x=marca_counts.index, y=marca_counts.values, palette="viridis")

# Agregar etiquetas de valor en cada barra
for bar in bars.patches:
    yval = bar.get_height()
    bars.text(bar.get_x() + bar.get_width()/2, yval, int(yval), ha='center', va='bottom', fontsize=10, fontweight='bold')

# Etiquetas y título
plt.xlabel('Marca', fontsize=12, fontweight='bold')
plt.ylabel('Cantidad de Motores', fontsize=12, fontweight='bold')
plt.title('Cantidad de Motores por Marca', fontsize=14, fontweight='bold')

# Rotación de las etiquetas del eje x para mejor legibilidad
plt.xticks(rotation=45, ha='right', fontsize=10)

# Ajuste de los márgenes y presentación final
plt.tight_layout()
plt.show()

In [None]:
#Crear un histograma de la distribución de FRAME para motores con más de un motor
plt.figure(figsize=(12, 6))
sns.histplot(motores_unicos[motores_unicos['CANTIDAD'] > 1]['FRAME'], kde=False, bins=20)
plt.title('Distribución de FRAME para Motores con más de 1 motor')
plt.xlabel('FRAME')
plt.ylabel('Frecuencia')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

# Gráficos de dispersión 2D Y 3D

In [None]:
# Gráfico de dispersión de Potencia vs RPM con colores por FRAME
plt.figure(figsize=(10, 6))

# Crear una lista de colores únicos para cada FRAME
frames = motores_unicos['FRAME'].unique()
num_frames = len(frames)
colors = plt.cm.get_cmap('viridis', num_frames)

# Iterar sobre los FRAME y graficar los puntos con colores diferentes
for i, frame in enumerate(frames):
  subset = motores_unicos[motores_unicos['FRAME'] == frame]
  plt.scatter(subset['POTENCIA (HP)'], subset['R.P.M'], label=frame, color=colors(i))

plt.title('Relación entre Potencia y RPM de Motores Únicos (Colores por FRAME)')
plt.xlabel('Potencia (HP)')
plt.ylabel('RPM')
plt.legend(title='FRAME', bbox_to_anchor=(1.05, 1), loc='upper left', ncol=3)
plt.show()

GRAFICO EN 3D

In [14]:
from sklearn.preprocessing import LabelEncoder

# Crear un LabelEncoder
le = LabelEncoder()
# Ajustar y transformar la columna 'FRAME' a una representación numérica
motores_unicos['FRAME_codificado'] = le.fit_transform(motores_unicos['FRAME'])

In [None]:
fig = plt.figure(figsize=(10, 8))
ax = fig.add_subplot(111, projection='3d')

# Create a list of unique frame values
unique_frames = motores_unicos['FRAME'].unique()

# Define a list of markers for each frame
markers = ['o', '^', 's', 'D', 'v', '*', 'p', 'h']

# Create a dictionary to map frame values to colors
color_map = {frame: plt.cm.nipy_spectral(i / len(unique_frames)) for i, frame in enumerate(unique_frames)}

for frame in unique_frames:
    frame_data = motores_unicos[motores_unicos['FRAME'] == frame]

    # Select a marker for the frame (looping through markers)
    marker_index = unique_frames.tolist().index(frame) % len(markers)
    marker = markers[marker_index]


    # Scatter plot with color-encoding based on 'frame'
    scatter = ax.scatter(frame_data['POTENCIA (HP)'],
                         frame_data['R.P.M'],
                         frame_data['FRAME_codificado'],
                         c=[color_map[frame]] * len(frame_data),
                         marker=marker,
                         label=frame)


ax.set_xlabel('Potencia (HP)')
ax.set_ylabel('RPM')
ax.set_zlabel('FRAME Codificado')

# Add a legend to show the mapping of colors and markers to 'frame' values
plt.legend(loc='center left', bbox_to_anchor=(1.1, 0.5), fontsize='small', ncol=2) # Ajusta la posición y el número de columnas

plt.title('Gráfico de Dispersión 3D: Potencia, RPM y FRAME')

plt.show()

# Tabla para conocer la relacion de FRAME_codificado y el FRAME real

In [16]:
# Crear una tabla de frames con frame codificado, frame y cantidad de registros
tabla_frames = motores_unicos.groupby(['FRAME_codificado', 'FRAME'])['ID_Motor'].count().reset_index(name='Cantidad_Registros')

print(tabla_frames)

    FRAME_codificado      FRAME  Cantidad_Registros
0                  0      100-L                   1
1                  1      112-M                   2
2                  2      132-M                   2
3                  3      132-S                   3
4                  4      145-T                   1
..               ...        ...                 ...
60                60      IP-55                   3
61                61      M2Q-A                   1
62                62     S/DATO                  50
63                63     T5-B14                   1
64                64  XU-180-TZ                   1

[65 rows x 3 columns]


In [18]:
# Print unique values of 'Cantidad_Registros'
unique_cantidad_registros = tabla_frames['Cantidad_Registros'].unique()
unique_cantidad_registros

array([ 1,  2,  3,  4,  7,  6, 11, 12, 19,  5, 18,  8, 21, 14, 50])

In [19]:
#para conocer los frame
lista_n = unique_cantidad_registros.tolist()

for i in lista_n:
  frames = tabla_frames[tabla_frames['Cantidad_Registros'] == i]
  print(f"frames con {i} registros")
  print(frames)


frames con 1 registros
    FRAME_codificado      FRAME  Cantidad_Registros
0                  0      100-L                   1
4                  4      145-T                   1
5                  5     145-TC                   1
15                15      200-M                   1
16                16    200-M/L                   1
18                18     213-TC                   1
23                23    225-S/M                   1
24                24      234-T                   1
25                25      245-T                   1
29                29      280-M                   1
32                32     284-TC                   1
36                36      300-M                   1
37                37    315-S/M                   1
45                45     365-TC                   1
50                50    444-5TC                   1
53                53      445-T                   1
54                54       90-L                   1
55                55     E-1140          