### Precisamos antes de tudo, importar a biblioteca. É um padrão abreviar o nome da biblioteca para 'pd' por meio de um alias.

In [1]:
import pandas as pd

# Séries - Análise Unidimensional

### Uma série em pandas representa uma estrutura unidimensional, junto a um índice.

Vamos criar uma série números múltiplos de 10.

In [None]:
serie = pd.Series([10, 20, 30, 40, 50, 60, 70, 80, 90])

Podemos usar os métodos Head e Tail para ler os primeiros e últimos elementos em uma série

In [None]:
serie.head()

In [None]:
serie.tail()

In [None]:
print(serie)

Em arquivos do tipo ipynb (notebooks), é possível utilizar também o método display para exibir os dados.

In [None]:
display(serie)

Podemos acessar elementos da série através dos seus índices, assim como é feito nas listas.

In [None]:
print(serie[3])

In [None]:
display(serie[4:7])

Podemos obter informações estatísticas básicas a partir da série.

In [None]:
serie.describe()

Média Aritimética (Soma de todos elementos dividido pela quantidade de elementos)

In [None]:
tamanho = serie.size
print(f'Total de Elementos: {tamanho}')

In [None]:
media = serie.mean()
print(f'Média: {media}')

Maior Valor

In [None]:
maximo = serie.max()
print(f'Maior Valor: {maximo}')

Menor Valor

In [None]:
minimo = serie.min()
print(f'Menor Valor: {minimo}')

A Mediana, o elemento localizado no centro ao considerar a série ordenada em ordem crescente.

In [None]:
mediana = serie.median()
print(f'Mediana: {mediana}')

Vamos adicionar mais um elemento no próximo índice da série

In [None]:
serie[9] = 100
print(serie)

Se a mediana é o elemento central, como calculá-la em um cojunto de elementos com número de itens par?

In [None]:
mediana = serie.median()
print(f'Mediana: {mediana}')

É possível realizar ações de filtragem na série

In [None]:
display(serie[serie > 30])

In [None]:
display(serie[serie % 3 == 0])

In [None]:
display(serie[serie > serie.mean()])

Podemos também, aplicar cálculos para todos os elementos das séries

In [None]:
serie_metade = serie/2

display(serie_metade)

E também fazer operações entre duas séries. Nesse caso, o índice é utilizado como referência para correlacionar os registros

In [None]:
display(serie + serie_metade)

Se o número de elementos for par, a mediana é a média aritmética dos dois valores centrais.

### Além dos índices numéricos autoincrementais, é possível fornecer um conjunto de índices customizado, que pode ser utilizado para acrescentar informações à análise.

Vamos criar uma série com as temperaturas médias por mês do ano em Petrópolis.

Fonte: https://www.climatempo.com.br/previsao-do-tempo/15-dias/cidade/317/petropolis-rj

In [None]:
temperatura_minima = {'13/05': 13,
                     '14/05': 12,
                     '15/05': 15,
                     '16/05': 14,
                     '17/05': 14,
                     '18/05': 15,
                     '19/05': 14,
                     '20/05': 15,
                     '21/05': 16,
                     '22/05': 16}

In [None]:
temperatura_min = pd.Series(temperatura_minima)

In [None]:
temperatura_min.head()

In [None]:
temperatura_min.describe()

Ou até mesmo, acessar diretamente pelos índices

In [None]:
temperatura_min[['14/05','18/05','20/05','22/05']]

Ainda é possível buscar por posição, através do método iLoc

In [None]:
temperatura_min.iloc[0:3]

Podemos também usar o método Plot para gerar visualizacoes sobre os dados

In [None]:
temperatura_min.plot()

In [None]:
temperatura_min.plot(kind='bar')

## **Prática**

A partir do conjunto de dados de temperaturas mínimas do exemplo, junto ao conjunto de dados a seguir de temperaturas máximas, mais as regras de negócios fornecidas resolva a seguinte questão. Utilize Series Pandas e demais conhecimentos de python aprendidos.

Seu objetivo é ajudar um turista a planejar quais roupas deverá usar ou levar ao sair de casa para passar um dia inteiro de outono em Petrópolis, as regras são as seguintes:


*   **Casaco**: se a temperatura mínima do dia for menor que 16ºc
*   **Gorro**: se a temperatura mínima do dia for menor que a média de temperaturas mínimas
*   **Mochila**: quando a amplitude térmica for maior ou igual a 5ºc, será necessário levar uma mochila para guardar as roupas de frio
*   **Bermuda**: Se a temperatura máxima for pelo menos 22ºc e a mínima for acima das médias de temperaturas mínimas
*   **Luvas**: Se a temperatura mínima for a menor do período analisado


####*Amplitude Térmica*: Diferença entre a maior a menor temperatura em um período analisado. Nesse caso, estamos analisando por dia. (Máxima Dia - Mínima Dia)
####*Efeito Chuva*: Se chover, a sensação térmica ficará menor, com isso, todas as temperaturas serão consideradas 2ºc menores, tanto para máximas quanto para mínimas.


**Crie scripts para responder as seguintes questões**

1.   Se as temperaturas mínimas e máximas oscilarem 1ºc para cima em todos os dias, quantos dias o turista será recomendado a usar bermuda?
2.   Em quais dias será necessário levar mochila?
3.   Em algum dos dias o Turista será indicado a usar tanto bermuda quanto luvas?
4.   Quais serão os itens indicados para o dia 17/05?
5.   Em quais dias, que normalmente não necessitariam o uso de casaco, o item passaria a ser necessário em caso de chuva?
6.   Gere um gráfico com a evolução da amplitude térmica.
7.   Gere um gráfico que retorne quantas vezes cada item será utilizado.

In [None]:
temperatura_maxima = {'13/05': 21,
                     '14/05': 20,
                     '15/05': 21,
                     '16/05': 22,
                     '17/05': 23,
                     '18/05': 22,
                     '19/05': 23,
                     '20/05': 23,
                     '21/05': 25,
                     '22/05': 25}

# DataFrames

### Assim como nas seríes é possível usar as estruturas comuns da linguagem para a criação dos DataFrames. Também é possível importar de arquivos (txt, csv, excel, etc) ou da Web.

In [None]:
#Campos: ID da Transação, Codigo Cliente, Modelo, Data do Aluguel, Data de Devolução, Valor Locacao, Taxa Administrativa

alugueis = [
    (1, 1023, "Onix", "2025-01-05", "2025-01-10", 1250.00, "R$ 150,00"),
    (2, 1045, "HB20", "2025-01-07", "2025-01-12", 1400.00, "R$ 150,00"),
    (3, 1102, "Tracker", "2025-01-10", "2025-01-15", 1750.50, "R$ 200,00"),
    (4, 1150, "T-Cross", "2025-01-12", "2025-01-16", 1120.75, "R$ 200,00"),
    (5, 1201, "Civic", "2025-01-15", "2025-01-17", 800.00, "R$ 250,00"),
    (6, 1254, "Civic", "2025-01-18", "2025-01-31", 4525.25, "R$ 250,00"),
    (7, 1300, "L200", "2025-01-20", "2025-01-29", 4875.00, "R$ 300,00"),
    (8, 1356, "Compass", "2025-01-22", "2025-01-28", 3400.60, "R$ 400,00"),
    (9, 1025, "Onix", "2025-02-01", "2025-02-05", 1000.00, "R$ 150,00"),
    (10, 1023, "HB20", "2025-02-03", "2025-02-07", 1120.00, "R$ 150,00"),
    (11, 1122, "Tracker", "2025-02-05", "2025-02-07", 425.75, "R$ 200,00"),
    (12, 1177, "T-Cross", "2025-02-08", "2025-02-12", 1240.50, "R$ 200,00"),
    (13, 1225, "Civic", "2025-02-10", "2025-02-15", 1750.00, "R$ 250,00"),
    (14, 1270, "Civic", "2025-02-12", "2025-02-17", 2000.00, "R$ 250,00"),
    (15, 1300, "L200", "2025-02-14", "2025-02-15", 500.00, "R$ 300,00"),
    (16, 1375, "Compass", "2025-02-16", "2025-02-21", 3600.00, "R$ 400,00"),
    (17, 1005, "Onix", "2025-02-18", "2025-02-19", 400.00, "R$ 150,00"),
    (18, 1150, "Tracker", "2025-02-20", "2025-02-25", 1925.00, "R$ 250,00"),
    (19, 1105, "T-Cross", "2025-02-22", "2025-02-26", 1300.00, "R$ 200,00"),
    (20, 1023, "Civic", "2025-02-20", "2025-02-28", 3850.00, "R$ 250,00")
]

### Com isso, conseguimos instanciar a classe Dataframe, a partir da leitura do CSV. A partir de agora, os dados estão disponíveis para serem trabalhados em memória.

In [None]:
df = pd.DataFrame(alugueis)

In [None]:
df.to_csv('alugueis_carros.csv', index= False, header = False)

In [None]:
df.tail()

In [None]:
df = pd.read_csv('alugueis_carros.csv',header=None)

In [None]:
display(df)

Podemos incluir o nome das colunas, já na criação do DataFrame

In [None]:
df = pd.DataFrame(alugueis, columns=[
    "id_transacao", "cod_cliente", "modelo", "data_aluguel", "data_devolucao", "valor_locacao", "taxa_administrativa"
])

In [None]:
df.head(10)

### Podemos utilizar alguns métodos para explorar e entender melhor o conjunto de dados.

In [None]:
df.info()

In [None]:
df.describe()

In [None]:
df[['modelo','valor_locacao']].head(15)

### Mesmo em conjuntos de dados simples, podemos descobrir informações valiosas manipulando os dados.

In [None]:
df.groupby('modelo')['valor_locacao'].mean()

Um tratamento comum de ser feito é a alteração de tipagens de dados

In [None]:
df['data_aluguel'] = pd.to_datetime(df['data_aluguel'], format='%Y-%m-%d')
df['data_devolucao'] = pd.to_datetime(df['data_devolucao'], format='%Y-%m-%d')

Podemos incluir a informação de duração prevista do aluguel

In [None]:
df['duracao_dias'] = (df['data_devolucao'] - df['data_aluguel']).dt.days

In [None]:
df.head(20)

In [None]:
df['valor_dia'] = (df['valor_locacao'] / df['duracao_dias']).round(2)

In [None]:
df.head()

In [None]:
df.groupby('modelo')['valor_dia'].mean()

## **Prática**

A partir do conteúdo apresentado sobre DataFrames, Séries e demais conhecimentos em Python. Utilize o conjunto de dados sobre locação veiculas abordado até aqui e responda as seguintes perguntas. Se necessário, faça tratamentos de manipulações no DataFrame.

### **Regras:**

**Classificação da duração do aluguel:**

*   **Curta** - Até 3 dias
*   **Média** - 4-7
*   **Longa** - Acima de 7 dias


**Valor Total:**

*   Soma do Total do Aluguel com a Taxa Administrativa

*Repare que o campo da Taxa Administrativa precisa ser tratado para poder ser utilizado como um campo numérico*

**Definição do Impacto das Taxas Administrativas na Composição do Preço:**

*   **Baixa** - Menos de 8% do Valor Total
*   **Média** - Entre 8% e 15% do Valor Total
*   **Alta** - Acima de 15% do Valor Total

**Desconto:**

*   Os descontos são aplicados após o cálculo do valor total. Existem 2 tipos de desconto, e eles são acumulativos.

1.   Desconto de Taxa: Caso a Classificação de Impacto das Taxas seja **Alta**, será ofertado um desconto que subtraído do valor da taxa, a deixe no patamar de 15%.
2.   Desconto de Duração: Será ofertado um desconto de **8%** para locações de duração **Média** e **12%** para locações de duração **Longa**.
3.   Desconto Total: Desconto de Duração + Desconto de Taxa.

*Formate com 2 casas decimais*

**Valor Final:**

*   Total - Desconto de Taxa - Desconto de Duração

**Percentual de Desconto:**

*   1 - (valor_final/valor_inicial)

*Formate com 1 casa decimal*

**Crie scripts para responder as seguintes questões**



1.    Qual é a proporção (%) de contratos curtos, médios e longos no período analisado?
2.   Quem são os três clientes (Código Cliente) que mais geraram receita total no período? Quanto (R$) cada um gastou?
3.   Calcule o total de desconto concedido pode modelo de carro.
4.   Ordene os aluguéis por % de desconto
5.   Calcule o Total de Diárias e o valor médio de diária por mês de aluguel (data_aluguel)
6.   Bônus: Exporte um Excel com todos os campos originais, além das informações enriquecidas: Classificador de Duração, Desconto Total, Valor Final e Percentual de Desconto.




