In [None]:
import pandas as pd
from pandas.plotting import table
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import datetime as dt
import seaborn as sns
import six

# Estatisticas para furtos em 2018

In [None]:
df_furtos = pd.read_csv('D:\\EPS\\TCC\\data_cleaned\\SSP\\furtos2018.csv', sep=",", decimal=".")

In [None]:
df_furtos.columns

In [None]:
df_furtos.head()

## Processo para boxplot e histograma da quantidade de furtos de carros por dia da semana em 2018

In [None]:
# Agrupamos por dia da semana e data da ocorrencia e contamos quantas datas tiveram
furtos_2018_grp = df_furtos.groupby(['DIASEMANA', 'DATAOCORRENCIA'])['DATAOCORRENCIA'].count().rename('TOTAL').reset_index()

In [None]:
# Substituimos cada numero pelo dia da semana correspondente
furtos_2018_grp['DIASEMANA'] = furtos_2018_grp['DIASEMANA'].map({0: 'Segunda', 1: 'Terca', 2: 'Quarta', 3: 'Quinta', 4: 'Sexta', 5: 'Sabado', 6: 'Domingo'})

In [None]:
furtos_2018_grp

In [None]:
for index, item in furtos_2018_grp.iterrows():
    df_day = furtos_2018_grp.loc[furtos_2018_grp['DIASEMANA'] == item['DIASEMANA']]
    if((item['DIASEMANA'] == ('Domingo')) | (item['DIASEMANA'] == ('Sabado'))):
        ax = df_day.plot(kind='bar', x='DATAOCORRENCIA', y='TOTAL', figsize=(20,5), title='Histograma da quantidade de ocorrências de furtos nos '+item['DIASEMANA']+'s de 2018')
    else:
        ax = df_day.plot(kind='bar', x='DATAOCORRENCIA', y='TOTAL', figsize=(20,5), title='Histograma da quantidade de ocorrências de furtos nas '+item['DIASEMANA']+'s de 2018')        
    ax.set_xlabel("DATA DA OCORRENCIA ("+item['DIASEMANA']+"s)")
    ax.set_ylabel("QTD DE OCORRENCIAS")
    plt.tight_layout()
    plt.savefig('hist_'+item['DIASEMANA']+'.png')

In [None]:
sns.set_style("whitegrid")
ax = sns.boxplot(x="DIASEMANA", y="TOTAL", data=furtos_2018_grp, palette="Set3").set_title('Boxplot da quantidade de furtos de carros por dia da semana em 2018')

In [None]:
ax.get_figure().savefig('bloxplot_dia_da_semana_furtos_2018.png')

## Describe dos furtos em 2018 por dia da semana

In [None]:
# Agrupamos por dia da semana e data da ocorrencia e contamos quantas datas tiveram
furtos_2018_grp = df_furtos.groupby(['DIASEMANA', 'DATAOCORRENCIA'])['DATAOCORRENCIA'].count().rename('TOTAL').reset_index()

In [None]:
furtos_2018_grp.head()

In [None]:
df = furtos_2018_grp.groupby('DIASEMANA')['TOTAL'].describe().reset_index()

In [None]:
df

In [None]:
df['DIASEMANA'] = df['DIASEMANA'].map({0: 'Segunda', 1: 'Terca', 2: 'Quarta', 3: 'Quinta', 4: 'Sexta', 5: 'Sabado', 6: 'Domingo'})

In [None]:
df.reset_index(drop=True, inplace=True)

In [None]:
df

In [None]:
def render_mpl_table(data, col_width=3.0, row_height=0.625, font_size=14,
                     header_color='#40466e', row_colors=['#f1f1f2', 'w'], edge_color='w',
                     bbox=[0, 0, 1, 1], header_columns=0,
                     ax=None, **kwargs):
    if ax is None:
        size = (np.array(data.shape[::-1]) + np.array([0, 1])) * np.array([col_width, row_height])
        fig, ax = plt.subplots(figsize=size)
        ax.axis('off')

    mpl_table = ax.table(cellText=data.values, bbox=bbox, colLabels=data.columns, **kwargs)

    mpl_table.auto_set_font_size(False)
    mpl_table.set_fontsize(font_size)

    for k, cell in  six.iteritems(mpl_table._cells):
        cell.set_edgecolor(edge_color)
        if k[0] == 0 or k[1] < header_columns:
            cell.set_text_props(weight='bold', color='w')
            cell.set_facecolor(header_color)
        else:
            cell.set_facecolor(row_colors[k[0]%len(row_colors) ])
    fig.savefig('describe_furtos_dia_da_semana.png')
    
    return ax

render_mpl_table(df, header_columns=0, col_width=3.0)

## Processo para boxplot da quantidade de furtos de carros para perídos do dia em 2018

In [None]:
df_furtos['PERIDOOCORRENCIA'].unique()

In [None]:
df_furtos.info()

In [None]:
df_furtos['PERIDOOCORRENCIA'].value_counts()

In [None]:
df_furtos.drop(df_furtos[(df_furtos.PERIDOOCORRENCIA == 'EM HORA INCERTA')].index, inplace=True)

In [None]:
df_furtos.rename({'PERIDOOCORRENCIA': 'PERIODO_OCORRENCIA'}, axis=1, inplace=True)

In [None]:
furtos_2018_grp = df_furtos.groupby(['PERIODO_OCORRENCIA', 'DATAOCORRENCIA'])['PERIODO_OCORRENCIA'].count().rename('TOTAL').reset_index()

In [None]:
furtos_2018_grp

In [None]:
sns.set_style("whitegrid")
ax = sns.boxplot(x="PERIODO_OCORRENCIA", y="TOTAL", data=furtos_2018_grp, palette="Set3").set_title('Boxplot da quantidade de furtos de carros por período do dia em 2018')
ax.get_figure().savefig('boxplot_periodo_do_dia_furtos_2018.png')

## Describe dos furtos em 2018 por período do dia

In [None]:
df = furtos_2018_grp.groupby('PERIODO_OCORRENCIA')['TOTAL'].describe().reset_index()

In [None]:
df

In [None]:
def render_mpl_table(data, col_width=3.0, row_height=0.625, font_size=14,
                     header_color='#40466e', row_colors=['#f1f1f2', 'w'], edge_color='w',
                     bbox=[0, 0, 1, 1], header_columns=0,
                     ax=None, **kwargs):
    if ax is None:
        size = (np.array(data.shape[::-1]) + np.array([0, 1])) * np.array([col_width, row_height])
        fig, ax = plt.subplots(figsize=size)
        ax.axis('off')

    mpl_table = ax.table(cellText=data.values, bbox=bbox, colLabels=data.columns, **kwargs)

    mpl_table.auto_set_font_size(False)
    mpl_table.set_fontsize(font_size)

    for k, cell in  six.iteritems(mpl_table._cells):
        cell.set_edgecolor(edge_color)
        if k[0] == 0 or k[1] < header_columns:
            cell.set_text_props(weight='bold', color='w')
            cell.set_facecolor(header_color)
        else:
            cell.set_facecolor(row_colors[k[0]%len(row_colors) ])
    fig.savefig('describe_furtos_periodo_ocorrencia.png')
    
    return ax

render_mpl_table(df, header_columns=0, col_width=3.0)