## Importação das Bibliotecas 

In [None]:
import pandas as pd
import numpy as np
from datetime import date, datetime
import seaborn as sns
import matplotlib.pyplot as plt 
import plotly.express as px

## Leitura da Planilha de Assinaturas

In [None]:
assinaturas = pd.read_csv('assinaturas.csv', sep=';')

assinaturas

In [None]:
## Verificando as colunas de assinaturas
assinaturas.columns

## 1 - Total de Gasto 

In [None]:
total = assinaturas['TotalGasto'].sum() 

total_formatado = "R$ {:,.2f}".format(total)
print(total_formatado)

## 1.1 - Média de Gasto

In [None]:
média = assinaturas['TotalGasto'].mean() 

média_formatado = "R$ {:,.2f}".format(média)
print(média_formatado)

## 2 - Total Gasto e Média de Assinaturas por Sexo 

In [None]:
total_gasto_assinatura_sexo = assinaturas.groupby(["Sexo"])["TotalGasto"].sum().rename("Total de Assinaturas por Sexo") 
media_gasto_assinatura_sexo = assinaturas.groupby(["Sexo"])["TotalGasto"].mean().rename("Média de Assinaturas por Sexo")

analise_geral = pd.DataFrame({"Total de Assinaturas por Sexo" : total_gasto_assinatura_sexo, 
                              "Média de Assinaturas por Sexo" : media_gasto_assinatura_sexo})

analise_geral['Total de Assinaturas por Sexo'] = analise_geral['Total de Assinaturas por Sexo'].map(lambda x : "R$ {:,.2f}".format(x)) 

analise_geral['Média de Assinaturas por Sexo'] = analise_geral['Média de Assinaturas por Sexo'].map(lambda x : "R$ {:,.2f}".format(x)) 

analise_geral

## 3 - Total Gasto de Assinaturas por Ocupação 

In [None]:
total_gasto_assinatura = assinaturas.groupby(["Ocupação"])["TotalGasto"].sum()

total_gasto_assinatura_formatado = "\n".join(
    "Ocupação: {}, Total Gasto: R$ {:,.2f}".format(ocupacao, total_gasto)
    for ocupacao, total_gasto in total_gasto_assinatura.items()
)

print(total_gasto_assinatura_formatado)

In [None]:
data = pd.DataFrame({
    'Ocupação': total_gasto_assinatura.index,
    'TotalGasto': total_gasto_assinatura.values
})

In [None]:
# Gráfico de Barras
plt.figure(figsize=(10, 7)) 
sns.barplot(
    x='TotalGasto', 
    y='Ocupação',
    data=data,
    estimator=sum, 
    ci=None,
    color='#69b3a2'
)
plt.xlabel("Total Gasto")
plt.ylabel("Ocupação")
plt.title("Total Gasto por Ocupação")
plt.show()

## 3.1 - Média Gasto de Assinaturas por Ocupação 

In [None]:
media_gasto_assinatura = assinaturas.groupby(["Ocupação"])["TotalGasto"].sum()

media_gasto_assinatura_formatado = "\n".join(
    "Ocupação: {}, Total Gasto: R$ {:,.2f}".format(ocupacao, media_gasto)
    for ocupacao, media_gasto in media_gasto_assinatura.items()
)

print(media_gasto_assinatura_formatado)

In [None]:
data_media = pd.DataFrame({
    'Ocupação': media_gasto_assinatura.index,
    'MediaGasto': media_gasto_assinatura.values
})

In [None]:
# Gráfico de Barras
plt.figure(figsize=(10, 7)) 
sns.barplot(
    x='MediaGasto', 
    y='Ocupação',
    data=data_media,
    estimator=np.mean, 
    ci=None,
    color='#69b3a2'
)
plt.xlabel("Média Gasto")
plt.ylabel("Ocupação")
plt.title("Média Gasto por Ocupação")
plt.show()

## 4 - Total Gasto de Assinaturas por Nome 

In [None]:
grupo_nome = assinaturas.groupby('Nome')

resultado_assinatura_total_nome = grupo_nome.agg({
    'TotalGasto': 'sum',
}).reset_index()

resultado_assinatura_total_nome['TotalGasto'] = resultado_assinatura_total_nome['TotalGasto'].map(lambda x: "R$ {:,.2f}".format(x))
resultado_assinatura_total_nome

In [None]:
trace = go.Bar(x = resultado_assinatura_total_nome['Nome'], 
               y = resultado_assinatura_total_nome['TotalGasto']) 

data = [trace] 

py.iplot(data)

## 5 - Total Gasto e Média de Assinaturas por Ano, Dia e Mês 

In [None]:
## Conversão da Coluna em formato Ano 
assinaturas['Assinatura'] = pd.to_datetime(assinaturas['Assinatura'])
assinaturas['Ano_Assinatura'] = assinaturas['Assinatura'].dt.year
assinaturas['Mês_Assinatura'] = assinaturas['Assinatura'].dt.month
assinaturas['Dia_Assinatura'] = assinaturas['Assinatura'].dt.day

In [None]:
display(assinaturas)

* Total e Média de Assinaturas por Ano

In [None]:
ano_total_assinatura = assinaturas.groupby(["Ano_Assinatura"])["TotalGasto"].sum().rename("Total Gasto por Ano")
ano_media_assinatura = assinaturas.groupby(["Ano_Assinatura"])["TotalGasto"].mean().rename("Média Gasta por Ano") 

analise_ano = pd.DataFrame({"Total Gasto por Ano" : ano_total_assinatura, 
                            "Média Gasta por Ano" : ano_media_assinatura}) 

analise_ano['Total Gasto por Ano'] = analise_ano['Total Gasto por Ano'].map(lambda x: "R$ {:,.2f}".format(x))
analise_ano['Média Gasta por Ano'] = analise_ano['Média Gasta por Ano'].map(lambda x: "R$ {:,.2f}".format(x))

analise_ano

* Total e Média de Assinaturas por Mês

In [None]:
mes_total_assinatura = assinaturas.groupby(["Mês_Assinatura"])["TotalGasto"].sum().rename("Total Gasto por Mês")
mes_media_assinatura = assinaturas.groupby(["Mês_Assinatura"])["TotalGasto"].mean().rename("Média Gasta por Mês") 

analise_mes = pd.DataFrame({"Total Gasto por Mês" : mes_total_assinatura, 
                            "Média Gasta por Mês" : mes_media_assinatura}) 

analise_mes['Total Gasto por Mês'] = analise_mes['Total Gasto por Mês'].map(lambda x: "R$ {:,.2f}".format(x))
analise_mes['Média Gasta por Mês'] = analise_mes['Média Gasta por Mês'].map(lambda x: "R$ {:,.2f}".format(x))

analise_mes

* Total e Média de Assinaturas por Dia

In [None]:
dia_total_assinatura = assinaturas.groupby(["Dia_Assinatura"])["TotalGasto"].sum().rename("Total Gasto por Dia")
dia_media_assinatura = assinaturas.groupby(["Dia_Assinatura"])["TotalGasto"].mean().rename("Média Gasta por Dia") 

analise_dia = pd.DataFrame({"Total Gasto por Dia" : dia_total_assinatura, 
                            "Média Gasta por Dia" : dia_media_assinatura}) 

analise_dia['Total Gasto por Dia'] = analise_dia['Total Gasto por Dia'].map(lambda x: "R$ {:,.2f}".format(x))
analise_dia['Média Gasta por Dia'] = analise_dia['Média Gasta por Dia'].map(lambda x: "R$ {:,.2f}".format(x))

analise_dia

## 6 - Média de Assinatura por Assinatura 

* Lista de Assinaturas ** 

In [None]:
datas_assinaturas = assinaturas['Assinatura']

datas_assinaturas

** Cálculo da Média de Assinaturas ** 

In [None]:
diferencas = datas_assinaturas.diff().mean()

** Conversão da média para o formato de dias ** 

In [171]:
media_ass_dias = diferencas.days

In [173]:
print(f'A Média de dias entre assinaturas é de aproximadamente {media_ass_dias} dias')

A Média de dias entre assinaturas é de aproximadamente -5 dias


## 7 - Média de Assinatura por Nascimento 

** Listas de Assinaturas por Nascimento 

In [174]:
datas_assinaturas_nascimento = assinaturas['Data_Nascimento']

datas_assinaturas_nascimento

0     02/02/1970
1     05/07/1985
2     03/06/1964
3     04/09/1974
4     01/07/1983
5     03/01/1971
6     06/09/1951
7     09/03/1991
8     01/12/1979
9     04/08/1960
10    28/06/1949
11    07/01/1995
12    04/04/1987
13    04/03/1967
14    10/05/1956
15    04/06/1978
16    11/06/1994
17    30/08/1950
18    12/08/1967
19    28/09/1966
20    11/06/1980
21    03/03/1971
22    11/06/1973
23    29/04/1958
24    30/09/1955
25    05/01/1953
26    27/04/1954
27    27/05/1961
28    29/07/1960
29    01/06/1977
Name: Data_Nascimento, dtype: object

In [178]:
datas_assinaturas_nascimento = pd.to_datetime(datas_assinaturas_nascimento, format='%d/%m/%Y')
datas_assinaturas_nascimento

0    1970-02-02
1    1985-07-05
2    1964-06-03
3    1974-09-04
4    1983-07-01
5    1971-01-03
6    1951-09-06
7    1991-03-09
8    1979-12-01
9    1960-08-04
10   1949-06-28
11   1995-01-07
12   1987-04-04
13   1967-03-04
14   1956-05-10
15   1978-06-04
16   1994-06-11
17   1950-08-30
18   1967-08-12
19   1966-09-28
20   1980-06-11
21   1971-03-03
22   1973-06-11
23   1958-04-29
24   1955-09-30
25   1953-01-05
26   1954-04-27
27   1961-05-27
28   1960-07-29
29   1977-06-01
Name: Data_Nascimento, dtype: datetime64[ns]

** Cálculo da Média de Assinaturas ** 

In [179]:
diferencas_nascimento = datas_assinaturas_nascimento.diff().mean()

** Conversão da média de nascimento para o formato de dias ** 

In [180]:
media_ass_nasc_dias = diferencas_nascimento.days

In [181]:
print(f'A Média de dias entre assinaturas por nascimento é de aproximadamente {media_ass_nasc_dias} dias')

A Média de dias entre assinaturas por nascimento é de aproximadamente 92 dias
