Análise de dados
================

📘 O que é um arquivo .ipynb ?
------------------------------

.ipynb é um tipo de arquivo usado pelo Jupyter 
Notebook (incluindo o Google Colab), ou seja,
significa Interactive Python Notebook.

É um arquivo JSON estruturado, mas você o manipula 
através de uma interface visual (como Jupyter ou Colab).

Contém códigos Python + textos + gráficos + tabelas 
em um mesmo documento.

Usado para análise de dados, ensino, experimentação, 
ciência de dados e machine learning.



⚙️ O que pode ter dentro de um .ipynb?
---------------------------------------
Células de código (com Python ou outro kernel)

Células de texto (em Markdown, com títulos, listas, links etc)

Saídas de código (prints, gráficos, tabelas, etc)

Comentários explicativos

Histórico de execução



Importando dados - 23/10/2025

In [None]:
import pandas as pd

#pip install babel
from babel.numbers import format_currency #R$(valor monetário)

def converter_reais(valor):
    return format_currency(valor, 'BRL', locale='pt_BR')

In [None]:
local_arquivo = r'C:\Rafaélla Sena - Python\Python 2\Python 2 - Clarify\Aluno\Aula_01\bases\01_base_exe_novo.xlsx'
dados = pd.read_excel(local_arquivo)
display(dados)

In [None]:
#vamos exibir o total da coluna Desconto

faturamento_total = dados['Desconto'].sum()
display(f'{faturamento_total:,.2f}')

biblioteca Babel
================
importar a função format_currency da biblioteca babel, que é
usada para formatar números como valores monetários(moeda)
de forma correta


Você encontra informações completas da biblioteca Babel em fontes oficiais, cada uma com um nível diferente de detalhe:

O que você encontra no	Link:
=============================
Guia de uso, exemplos de código, referência de todas as 
                                    funções (dates, numbers, traduções etc.).	https://babel.pocoo.org/

Descrição do pacote, comando de instalação, histórico de versões. https://pypi.org/project/Babel/

In [None]:

#obrigatoriamente todas as funções ficam no inicio do código 
def converter_reais(valor):

    #simbolo R$
    return format_currency(valor, 'BRL', locale='pt_BR')

#item 1- Agrupar e somar os descontos por cidade
faturamento_por_loja = dados[['Cidade','Desconto']].groupby('Cidade').sum()

#item 2- comoa coluna 'Cidade' está como indice, para formatar 'Desconto' fazemos desta forma:
faturamento_por_loja['Desconto Formatado'] = faturamento_por_loja['Desconto'].apply(converter_reais)

#item 3- exibir os dados
display(faturamento_por_loja)

In [None]:
# Faturamento por plano 
def converter_reais(valor):
    return format_currency(valor, 'BRL', locale='pt_BR')

#agrupar e somar os descontos por plano
faturamento_por_plano = dados[['Plano Vendido','Desconto']].groupby('Plano Vendido').sum().reset_index()

faturamento_por_plano['Desconto Formatado'] = faturamento_por_plano['Desconto'].apply(converter_reais)
display(faturamento_por_plano)

In [None]:
# faturamento por plano e cidade

# Plano Vendido, Cidade, Desconto
faturamento_por_plano_cidade = dados[['Plano Vendido','Cidade','Desconto']].groupby(['Plano Vendido','Cidade']).sum().reset_index()

display(faturamento_por_plano_cidade)



In [None]:
#  Cidade, Plano Vendido, Desconto
faturamento_por_cidade = dados[['Cidade','Plano Vendido','Desconto']].groupby(['Cidade','Plano Vendido']).sum().reset_index()

faturamento_por_cidade['Desconto Formatado'] = faturamento_por_cidade['Desconto'].apply(converter_reais)

faturamento_por_cidade #o resultado da variavel será exibido na tela 

In [None]:
# faturamento médio mensal
# a função .mean() retorna um tipo de dado chamado  Numpy float64
# é uma (biblioteca Numpy, número de ponto flutuante "monetário")
maior_valor = dados['Desconto'].max() #maior valor da coluna
menor_valor = dados['Desconto'].min() #menor valor
media_valor = dados['Desconto'].mean() #media valor
qtde_registros = dados ['Desconto'].count() #contagem

display(f'Maior valor: {maior_valor:,.2f}')
display(f'Menor valor: {menor_valor:,.2f}')
display(f'Media: {media_valor:,.2f}')
display(f'Quantidade de registros: {qtde_registros}')

In [None]:
# faturamento por cliente

# 1) agrupa o DataFrame dados pelo campo 'Cliente'
# 2) para cada grupo(cliente), somar os valores da coluna Desconto
# 3) ordena os valores do maior para o menor [Z-A]
faturamento_por_cliente = dados.groupby('Cliente')['Desconto'].sum().sort_values(ascending=False) #[Z-A]
faturamento_por_cliente

In [None]:
# qtde de vendas cidade

#.size() = conta quantas linhas existem em cada grupo, ou seja, quantas vendas daquele plano forma feitas em cada cidade

#.reset_index (name = contagem) = transformar o resultado em um dataframe normal, com as colunas cidade, plano vendido e uma nova coluna Contagem que mostra a quantidade de vendas para aquela combinação
qtde_vendas_cidade = dados.groupby(['Cidade','Plano Vendido'])['Desconto'].size().reset_index(name ='Contagem')
qtde_vendas_cidade


In [None]:
# distribuição qtde de planos vendidos
# contar quantas vezes cada valor único aparece na coluna
qtde_planos_vendidos_distr = dados['Plano Vendido'].value_counts()

qtde_planos_vendidos_distr


In [None]:
# agrupa por Plano Vendido

resultado = dados.groupby('Plano Vendido').agg(
    qtde_venda = ('Plano Vendido', 'size'),
    soma_desconto = ('Desconto','sum'),
    media_desconto = ('Desconto', 'mean'),
    maior_desconto = ('Desconto', 'max'),
    menor_desconto = ('Desconto','min')
).reset_index()

#formatar os valores monetários
resultado['Total Desc'] = resultado['soma_desconto'].apply(converter_reais)
resultado['Media Desc'] = resultado['media_desconto'].apply(converter_reais)
resultado['Maior Desc'] = resultado['maior_desconto'].apply(converter_reais)
resultado['Menor Desc'] = resultado['menor_desconto'].apply(converter_reais)

#remove as colunas numéricas originais para ficar só com as formatadas
resultado = resultado.drop(
    columns=['soma_desconto','media_desconto','maior_desconto','menor_desconto']
)

#renomear a coluna qtde_venda para qtde vendida
resultado = resultado.rename(columns={'qtde_venda':'Qtde Vendas'})

resultado

In [None]:
# melhor plano
# 1) seleciona a coluna [Plano Vendido]
# 2) .value_counts() = contar quantas vezes cada plano aparece
#    ,ou seja, a quantidade de vendas de cada plano
# 3) .idxmax() = retorna o índice, ou seja, o plano com mais vendas.
plano_mais_vendido = dados['Plano Vendido'].value_counts().idxmax()
plano_mais_vendido



'Basic'