In [1]:
# Importando a biblioteca
import pandas as pd

# 🎯 Trabalhando com datas

Trabalhar com DateTime pode ser uma coisa complicada. Este guia visa simplificar o complicado, concentrando-se no que você precisa saber para começar e saber o suficiente para descobrir mais por conta própria. Datas e horas são formas críticas de dados em muitos domínios, incluindo finanças, economia, ciência e muito mais.

## 👾 O que é datetime?

A biblioteca pandas possui um tipo de dado específico para trabalhar com datas e horários chamado "datetime". Esse tipo é baseado na classe "datetime" do Python padrão, mas possui algumas funcionalidades adicionais para trabalhar com Series e DataFrames.

Com o tipo datetime, é possível criar objetos que representam uma data e hora específica, e também realizar operações aritméticas (como adição e subtração) entre objetos datetime. Além disso, é possível extrair informações como ano, mês, dia, hora, minuto e segundo de um objeto datetime.

Na prática, o tipo datetime é muito útil para trabalhar com Series e DataFrames de dados temporais, como séries de preços de ações ou séries de dados climáticos. Ele permite agrupar os dados por períodos de tempo (como dias, meses ou anos), calcular diferenças entre datas, e realizar outras operações comuns em dados temporais.

## 👾 pd.to_datetime

A função `pd.to_datetime()` é utilizada para converter uma série ou coluna de um dataframe no tipo datetime do pandas. Ela pode ser utilizada para converter strings com datas e horas em objetos datetime, ou para converter outros tipos de dados (como inteiros ou floats) que representam datas e horas. A documentação da função está [aqui](https://pandas.pydata.org/docs/reference/api/pandas.to_datetime.html). Os principais parâmetros da função `pd.to_datetime()` são:


### <font color=purple>pd.to_datetime (<font> 

**arg**<br>
**format** = None <br>
**erros** = 'raise' <br>
**utc** = None <br>
**dayfirst** = False <br>
**yearfirst** = False <br>

### <font color=purple>) <font> <br>

### 🐥 arg

_arg_ é o argumento a ser convertido. Pode ser uma série, coluna de dataframe, lista, array ou qualquer outra estrutura de dados que contenha as informações de data e hora.

In [12]:
# Criando um data frame com datas no formato string
df = pd.DataFrame(['2022-01-01', '2022-01-02', '2022-01-03'], columns=['Data'])
print(df)
print()
print(df.dtypes)

         Data
0  2022-01-01
1  2022-01-02
2  2022-01-03

Data    object
dtype: object


In [22]:
# Convertendo as data para o formato datetime
df['Data'] = pd.to_datetime(arg=df['Data'])
print(df)
print()
print(df.dtypes)

        Data
0 2022-01-01
1 2022-01-02
2 2022-01-03

Data    datetime64[ns]
dtype: object


### 🐥 formart

O parâmetro `format` é utilizado para especificar o formato da string de data e hora que está sendo convertida. Ele é opcional, mas é necessário quando as strings de data e hora não estão no formato padrão `YYYY-MM-DD HH:MM:SS`. Por exemplo, você pode se deparar com datas assim, 1-11-2022 ou 1-11-22 ou 1-22-11 e muitos outros tipos loucos. Para que, na hora da conversão, a função `pd.to_datetime` entenda quem é o ano, mês e dia, você precisa especificar ao parâmetro `format` quem é o ano, o mês, o dia, se eles possuem zeros ou não e outras caracteristicas da data que será convertida. 

Para isso, você usa os `caracteres de formatação`, como essa por exemplo, `%m-%d-%y`. Onde signifca que o mês é o primeiro numero da data, o dia é o segundo numero, o ano é o terceiro numero e que o ano possui somente 2 numeros para representa-lo. Existem diversos tipos de `caracteres de formatação` que podemos utilizar, aqui está um [link](https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior) onde você pode encontra-los.

In [55]:
# Criando um data frame com datas no formato string
# O formato da data é dia-ano-mes
df = pd.DataFrame(['05-22-01', '06-22-01', '07-22-01'], columns=['Data'])
print(df)

       Data
0  05-22-01
1  06-22-01
2  07-22-01


In [56]:
# Convertendo as datas para o formato datetime
pd.to_datetime(arg=df['Data'], format='%d-%y-%m')  

# Estou utilizando os caracteres de formatação para informar quem é o ano, o mes e o dia e outras caracteristicas
# Dessa forma a função pd.to_datetime consegue converter as datas sem problemas

0   2022-01-05
1   2022-01-06
2   2022-01-07
Name: Data, dtype: datetime64[ns]

### 🐥 formart

In [19]:
df = pd.DataFrame(['2018-10-26 12:15', '2018-10-26 12:30'], columns=['Data'])

In [20]:
df['Data'] = pd.to_datetime(arg=df['Data'])

In [25]:
type(df['Data'][0])

pandas._libs.tslibs.timestamps.Timestamp

# 

**Atributos**:
- columns e name
- shape
- dtypes e dtype
- index
- values


<br>

**Métodos**:
- max
- min
- mean
- median
- std
- var 
- corr
- describe
- count
- unique e nunique
- value_counts
- sample
- astype
- set_index
- sort_values
- sort_index
- remane
- rename_index
- groupby
- apply
- merge
- map
- T
- pivot
- pd.cut
- pd.crosstab
- pd.concat
- drop