In [1]:
!pip install python-docx



In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly.express as px
from docx import Document
from docx.shared import Inches


In [None]:
df=pd.read_excel('C:\\Users\\user\\Downloads\\T17.xlsx')

In [None]:
df['created_at'] = pd.to_datetime(df['created_at'])
df['date2'] = df['created_at'].dt.date

In [None]:
from docx.shared import RGBColor
doc = Document()
title = doc.add_heading('Rapport de défauts', level=1)
doc.add_heading('USE CASE : Equipement X', level=4)
title_run = title.runs[0]
title_run.font.color.rgb = RGBColor(178, 111, 210)

In [None]:
types=df['point_name'].unique()
plt.figure(figsize=(10, 6))
df['date2'] = pd.to_datetime(df['date2'], errors='coerce')
date_reference = pd.Timestamp('2024-01-01')
df_filtered = df[df['date2'] >= date_reference]
df_filtered = df_filtered.sort_values(by='date2')
for k in types:
    plt.plot(df_filtered[(df_filtered['point_name'] == k)]['date2'], df_filtered[(df_filtered['point_name'] == k)]['NGV'])


plt.ylabel('NGV')
plt.legend(df['point_name'])
chemin_image = 'graphique.png'
plt.savefig(chemin_image)
plt.show()
para="Notre attention se porte sur la surveillance des performances du Equipement X, un élément vital de notre système. À travers le graphique des tendances des points de capteurs, nous explorons une vue globale des variations observées dans les différentes parties de l'équipement . Cette visualisation offre une vue d'ensemble claire, permettant d identifier les conditions de fonctionnement normales ainsi que les éventuelles anomalies. "
doc.add_paragraph(para)
description = doc.add_paragraph("Valeurs de NGV")
description_run = description.runs[0]
description_run.font.color.rgb = RGBColor(0, 0, 255)
doc.add_picture(chemin_image, width=Inches(7.5))
doc.add_page_break()
chemin_fichier = 'rapport_avec_graphique.docx'
doc.save(chemin_fichier)

In [None]:
def pietype(motor_type):
    y=df[df['family'] == motor_type]['point_name'].unique()
    n=[]
    for k in y:
      n.append(df[(df['family'] == motor_type) & (df['point_name'] == k) ]['point_name'].count())

    plt.pie(n, labels = y)
    plt.legend(title = motor_type)

    plt.tight_layout()

    chemin_image = 'graphique.png'
    plt.savefig(chemin_image)

    plt.show()

In [None]:
description = doc.add_paragraph('les points de chaque moteur')
description_run = description.runs[0]
description_run.font.color.rgb = RGBColor(0, 0, 255)
table = doc.add_table(rows=1, cols=3)
row_cells = table.rows[0].cells
p = doc.paragraphs[-1]  
p.alignment = 1
m=df['family'].unique()
for k in range (len(m)):
  pietype(m[k])
  row_cells[k].add_paragraph().add_run().add_picture(chemin_image, width=Inches(2.25))

In [None]:
N=[]
for i in df['date2'].dt.year.unique():

  n=[df[(df['date2'].dt.year == i) & (df[18] == 1) ][18].count(),df[(df['date2'].dt.year == i) & (df[18] == 0) ][18].count()]
  N.append(n)
for i in df['date2'].dt.year.unique():
  N.append(i)
doc.add_heading("Arrêt Général", level=1)
description = doc.add_paragraph('Pourcentage des arrêts')
description_run = description.runs[0]
description_run.font.color.rgb = RGBColor(0, 0, 255)
p = doc.paragraphs[-1] 
p.alignment = 1
table = doc.add_table(rows=1, cols=3)
row_cells = table.rows[0].cells

def arret(n,i):
  labels = ['en arrêt','en marche']
  fig, ax = plt.subplots()
  a=N[len(df['date2'].dt.year.unique())+i]
  ax.pie(n, labels=labels, autopct='%1.1f%%', startangle=90)
  plt.title(f'Pourcentage des arrêts pour lannée {a}')
  ax.axis('equal')
  chemin_image = 'graphique.png'
  plt.savefig(chemin_image)
  plt.show()

for i in range (0,len(df['date2'].dt.year.unique())):
  arret(N[i],i)
  row_cells[i].add_paragraph().add_run().add_picture(chemin_image, width=Inches(2.25))

para="L'analyse de ces périodes est essentielle pour évaluer la performance opérationnelle de l’Equipement X, pour identifier les tendances potentielles dans les causes des arrêts, et pour mettre en œuvre des améliorations ciblées visant à réduire les temps d'arrêt à l'avenir. Cette documentation exhaustive permet d aligner les pratiques de maintenance avec les objectifs de productivité et de fiabilité à long terme."
doc.add_paragraph(para)

chemin_fichier = 'rapport_avec_graphique.docx'
doc.save(chemin_fichier)

In [None]:
L=[]
for k in df.family.unique():
  for l in df.point_name.unique():
    count1=df[(df['family'] == k) & (df['point_name'] == l)].shape[0]
    count2=df[(df['family'] == k) & (df['point_name'] == l) & (df[20] == 1)].shape[0]
    count3=df[(df['family'] == k) & (df['point_name'] == l) & (df[18] == 1)].shape[0]
    count4=df[(df['family'] == k) & (df['point_name'] == l) & (df[14] == 1)].shape[0]
    count5=df[(df['family'] == k) & (df['point_name'] == l) & (df[16] == 1)].shape[0]
    count6=df[(df['family'] == k) & (df['point_name'] == l) & (df[17] == 1)].shape[0]

    if count1!=0:
      L.append([k,l,count1,count2,count3,count4,count5,count6])
L

In [None]:
df1 = pd.DataFrame(L, columns=[' ',' Points','mesures totales','Outliers' , 'Arrêt' ,'Ski Slope','Défaut de Capteur' , 'Saturation de Capteur'])
fig, ax = plt.subplots(figsize=(12, 8))  
ax.axis('tight')
ax.axis('off')
table = ax.table(cellText=df1.values, colLabels=df1.columns, cellLoc='center', loc='center')
for (i, j), cell in table._cells.items():
    cell.set_edgecolor('black') 
    cell.set_linewidth(1)  
    cell.set_fontsize(18)  


for i in range(len(df1.index)):
    for cell in table._cells.values():
        if cell.get_text().get_text() in df1.index:
            cell.set_height(6)  
table.scale(2, 6)


chemin_image = 'graphique.png'
plt.savefig(chemin_image, bbox_inches='tight', dpi=300)  
plt.show()
doc.add_heading('Vision Générale', level=1)
doc.add_picture(chemin_image, width=Inches(7.0))
doc.add_page_break()
chemin_fichier = 'rapport_avec_graphique.docx'
doc.save(chemin_fichier)

In [None]:
df['NGV2']=df[(df[14] != 1) & (df[16] != 1) & (df[20] != 1) ]['NGV']
df['NGV2'] = df.apply(lambda row: 0 if ( row[18] == 1 ) else row['NGV'], axis=1)

In [None]:
doc.add_heading("Tendances de l'ensemble des points de l'équipement", level=1)
para="Initialement, les tendances de l'ensemble des points de l'équipement Equipement X étaient affectées par des interruptions fréquentes, des variations soudaines et des fluctuations anormales, résultant en une représentation instable et imprécise de la performance opérationnelle. Les arrêts non planifiés, les variations de type Ski Slope et les défauts de capteurs étaient présents de manière significative, perturbant la continuité des données et entravant la capacité à identifier les schémas sous-jacents."
doc.add_paragraph(para)
types=df['point_name'].unique()
plt.figure(figsize=(10, 6))
df['date2'] = pd.to_datetime(df['date2'], errors='coerce')
date_reference = pd.Timestamp('2024-01-01')
df_filtered = df[df['date2'] >= date_reference]
df_filtered = df_filtered.sort_values(by='date2')
for k in types:
    plt.plot(df_filtered[(df_filtered['point_name'] == k)]['date2'], df_filtered[(df_filtered['point_name'] == k)]['NGV'])


plt.ylabel('NGV')
plt.legend(df['point_name'])
plt.title('NGV Trend (Including Shutdown, Ski Slope, Sensor Saturation, Sensor fault and Outliers)')
chemin_image = 'graphique.png'
plt.savefig(chemin_image)
plt.show()
doc.add_picture(chemin_image, width=Inches(6.0))

chemin_fichier = 'rapport_avec_graphique.docx'
doc.save(chemin_fichier)

In [None]:
para="Suite à l'application du preprocessing, les tendances du Equipement X ont été considérablement améliorées. La détection et la correction des arrêts non planifiés, des variations de type Ski Slope et des défauts de capteurs ont permis d'atténuer les perturbations. En éliminant ces anomalies, les données ont été rendues plus cohérentes et plus fiables, offrant ainsi une vue plus claire de la performance opérationnelle de l'équipement. En conséquence, les tendances post-preprocessing sont plus stables, plus précises et fournissent une base solide pour une analyse approfondie et une prise de décision éclairée"
doc.add_paragraph(para)
types=df['point_name'].unique()
plt.figure(figsize=(10, 6))
df['date2'] = pd.to_datetime(df['date2'], errors='coerce')
date_reference = pd.Timestamp('2024-01-01')
df_filtered = df[df['date2'] >= date_reference]
df_filtered = df_filtered.sort_values(by='date2')
for k in types:
    plt.plot(df_filtered[(df_filtered['point_name'] == k)]['date2'], df_filtered[(df_filtered['point_name'] == k)]['NGV2'])


plt.ylabel('NGV2')
plt.legend(df['point_name'])
plt.title('NGV Trend (Excluding Ski Slope, Sensor fault and Outliers)')
chemin_image = 'graphique.png'
plt.savefig(chemin_image)
doc.add_picture(chemin_image, width=Inches(6.0))
chemin_fichier = 'rapport_avec_graphique.docx'
doc.save(chemin_fichier)