In [539]:
## Import necessary modules
import os,sys
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.dates import date2num, AutoDateFormatter, AutoDateLocator, WeekdayLocator, MonthLocator, DayLocator, DateLocator, DateFormatter
from matplotlib.dates import MO, TU, WE, TH, FR, SA, SU
from matplotlib.ticker import AutoMinorLocator, AutoLocator, FormatStrFormatter, ScalarFormatter
import numpy as np
import datetime, calendar
from datetime import timedelta
import matplotlib.patches as mpatches
from itertools import tee

%matplotlib tk

In [540]:
######## GET A LIST OF MATCHING .xls FILES FROM THE GIVEN DIRECTORY
arcpath='/home/keuch/gits/keuch/code_box/pyt/spreadsheetparsing/test_stats/archiv/'
def collectxlfiles(arcpath):
    xlfilelist=list()

    for xlfile in os.listdir(arcpath):
        if xlfile.startswith('1458_daily'):
            xlfileabs=os.path.join(arcpath,xlfile)
            xlfilelist.append(xlfileabs)
    return sorted(xlfilelist)

xlfilelist=collectxlfiles(arcpath)

In [541]:
def turn_xls_to_df(file):
    needecols=[0,1,2,3,4,5,12,21] # Liste der Spalten, die aus dem Excelfile gelesen werden sollen
    nucolnames=['tstp','clls','ange','verb','ht','tt','acw','lost'] # Namen, die spaeter auf die Spalten kommen
    
    excel_df=pd.read_excel(file,skiprows=3,skip_footer=1,usecols=needecols)  # die ersten 3 werden nicht benötigt, letzte auch nicht
    excel_df['Timestamp'] = pd.to_datetime(excel_df['Timestamp'], format=' %d.%m.%Y %H:%M ') # statt string soll das ein datetime werden
    excel_df.columns=nucolnames
    excel_df2=excel_df.set_index('tstp').copy() # die timestamps sollen der index sein
        
    return excel_df2

In [542]:
greatframe=pd.DataFrame() # leeren df initialisieren
for i in xlfilelist:
    i_frame=turn_xls_to_df(i)
    greatframe=greatframe.append(i_frame) 
# alle files werden ordentlich in df konvertiert und an den ausserhalb der funktion kreierten df angehangen
# greatframe # hier sind alle daten vollständig enthalten, die gebraucht werden, der Ur-Frame

In [543]:
uhrzeit=greatframe.index.time # nur die Uhrzeit der Timestamps im Index
wday=greatframe.index.weekday

# Nebenzeiten von 00:00-07:29 und wieder von 20:00-23:59
nulluhr=datetime.time(0, 0)
halbacht_am=datetime.time(7, 29)
siebzehn30=datetime.time(17, 30)
zwanzig=datetime.time(20, 0)
vierundzwanzig=datetime.time(23, 59)
dreizehn=datetime.time(13, 0)

WeekNZ = (wday.isin([0,1,2,3,4]) & ((uhrzeit >= nulluhr) & (uhrzeit <= halbacht) | ((uhrzeit >= siebzehn30) & (uhrzeit < vierundzwanzig))))
SamsNZ = (wday.isin([5]) & ((uhrzeit >= nulluhr) & (uhrzeit <= halbacht) | ((uhrzeit >= dreizehn) & (uhrzeit < vierundzwanzig))))
SonnNZ = (wday.isin([6]))

In [544]:
Nebenzeit_CE = greatframe.loc[(WeekNZ|SamsNZ|SonnNZ)].copy() # Nebenzeit viertelstündlich

NZ_CE_DAY=Nebenzeit_CE.groupby(pd.TimeGrouper(freq='D')).sum().copy() # Nebenzeit nach Tagen gruppiert
NZ_CE_DAY['wd'] = NZ_CE_DAY.index.weekday

In [545]:
index_month=NZ_CE_DAY.index.month # nur der Monat der Timestamps im Index
index_year=NZ_CE_DAY.index.year

q1 = ((index_month >= 1) & (index_month <= 3))
q2 = ((index_month >= 4) & (index_month <= 6))
q3 = ((index_month >= 7) & (index_month <= 9))
q4 = ((index_month >= 10) & (index_month <= 12))

In [579]:
def plotzi(frame,quartal):
    fig=plt.figure(figsize=(9,4))
    von=Quart.index.date.min().strftime('%d.%m.%Y')
    bis=Quart.index.date.max().strftime('%d.%m.%Y')
    #fig.suptitle('Quartal '+str(quartal)+' '+str(jahr))
    fig.suptitle(von+' - '+bis)
    callsoverall=int(frame.clls.sum())
    weekcalls=int(frame.loc[frame['wd'].isin([0,1,2,3,4])]['clls'].sum())
    suncalls=int(frame.loc[frame['wd'] == 6]['clls'].sum())
    satcalls=int(frame.loc[frame['wd'] == 5]['clls'].sum())
    
    aht="#003873"
    aacw="#EE0042"
    att="#899EB2"
    nzb="#C7798F"

    ax=fig.add_subplot(111)
    ax.margins(0,0)
    ax.set_xlabel('Nebenzeit CE-Dispo')
    ax.set_ylabel('Calls')

    coor={0:aht, 1:aht, 2:aht, 3:aht, 4:aht, 5: att, 6: nzb}
    calls=ax.bar(frame.index,frame['clls'], label='calls', color=frame.wd.map(coor))

    calls_leg = mpatches.Patch(color='000000', label='Calls Nebenzeit gesamt('+str(callsoverall)+')')
    #calls_leg = mpatches.Patch(color=aht, label='Calls Nebenzeit Quartal '+str(quartal)+' '+str(jahr)+' gesamt('+str(callsoverall)+')')
    wee_leg = mpatches.Patch(color=aht, label='werktags 0:00-7:30 und 17:30-24('+str(weekcalls)+')')
    sat_leg = mpatches.Patch(color=att, label='samstags 0:00-7:30 und 13-24('+str(satcalls)+')')
    sun_leg = mpatches.Patch(color=nzb, label='sonntags('+str(suncalls)+')')

    ax.legend(handles=[calls_leg,wee_leg,sat_leg,sun_leg],fontsize=8,ncol=2,loc='upper right',borderaxespad=-2)

In [582]:
jahr = 2018
Start_2017=datetime.date(2017,1,1)
EndQ1_2018=datetime.date(2018,3,31)
Quart=NZ_CE_DAY.loc[(index_year == jahr) & q1].copy()
#Quart=NZ_CE_DAY.loc[(NZ_CE_DAY.index.date >= Start_2017) & (NZ_CE_DAY.index.date <= EndQ1_2018)].copy()

plotzi(Quart,1)

'31.03.2017'