In [1]:
# Importando a biblioteca
import pandas as pd

# üéØ Trabalhando com datas

Trabalhar com DateTime pode ser uma coisa complicada. Este guia visa simplificar o complicado, concentrando-se no que voc√™ precisa saber para come√ßar e saber o suficiente para descobrir mais por conta pr√≥pria. Datas e horas s√£o formas cr√≠ticas de dados em muitos dom√≠nios, incluindo finan√ßas, economia, ci√™ncia e muito mais.

## üëæ O que √© datetime?

A biblioteca pandas possui um tipo de dado espec√≠fico para trabalhar com datas e hor√°rios chamado "datetime". Esse tipo √© baseado na classe "datetime" do Python padr√£o, mas possui algumas funcionalidades adicionais para trabalhar com Series e DataFrames.

Com o tipo datetime, √© poss√≠vel criar objetos que representam uma data e hora espec√≠fica, e tamb√©m realizar opera√ß√µes aritm√©ticas (como adi√ß√£o e subtra√ß√£o) entre objetos datetime. Al√©m disso, √© poss√≠vel extrair informa√ß√µes como ano, m√™s, dia, hora, minuto e segundo de um objeto datetime.

Na pr√°tica, o tipo datetime √© muito √∫til para trabalhar com Series e DataFrames de dados temporais, como s√©ries de pre√ßos de a√ß√µes ou s√©ries de dados clim√°ticos. Ele permite agrupar os dados por per√≠odos de tempo (como dias, meses ou anos), calcular diferen√ßas entre datas, e realizar outras opera√ß√µes comuns em dados temporais.

## üëæ pd.to_datetime

A fun√ß√£o `pd.to_datetime()` √© utilizada para converter uma s√©rie ou coluna de um dataframe no tipo datetime do pandas. Ela pode ser utilizada para converter strings com datas e horas em objetos datetime, ou para converter outros tipos de dados (como inteiros ou floats) que representam datas e horas. A documenta√ß√£o da fun√ß√£o est√° [aqui](https://pandas.pydata.org/docs/reference/api/pandas.to_datetime.html). Os principais par√¢metros da fun√ß√£o `pd.to_datetime()` s√£o:


### <font color=purple>pd.to_datetime (<font> 

**arg**<br>
**format** = None <br>
**erros** = 'raise' <br>
**utc** = None <br>
**dayfirst** = False <br>
**yearfirst** = False <br>

### <font color=purple>) <font> <br>

### üê• arg

_arg_ √© o argumento a ser convertido. Pode ser uma s√©rie, coluna de dataframe, lista, array ou qualquer outra estrutura de dados que contenha as informa√ß√µes de data e hora.

In [12]:
# Criando um data frame com datas no formato string
df = pd.DataFrame(['2022-01-01', '2022-01-02', '2022-01-03'], columns=['Data'])
print(df)
print()
print(df.dtypes)

         Data
0  2022-01-01
1  2022-01-02
2  2022-01-03

Data    object
dtype: object


In [22]:
# Convertendo as data para o formato datetime
df['Data'] = pd.to_datetime(arg=df['Data'])
print(df)
print()
print(df.dtypes)

        Data
0 2022-01-01
1 2022-01-02
2 2022-01-03

Data    datetime64[ns]
dtype: object


### üê• formart

O par√¢metro `format` √© utilizado para especificar o formato da string de data e hora que est√° sendo convertida. Ele √© opcional, mas √© necess√°rio quando as strings de data e hora n√£o est√£o no formato padr√£o `YYYY-MM-DD HH:MM:SS`. Por exemplo, voc√™ pode se deparar com datas assim, 1-11-2022 ou 1-11-22 ou 1-22-11 e muitos outros tipos loucos. Para que, na hora da convers√£o, a fun√ß√£o `pd.to_datetime` entenda quem √© o ano, m√™s e dia, voc√™ precisa especificar ao par√¢metro `format` quem √© o ano, o m√™s, o dia, se eles possuem zeros ou n√£o e outras caracteristicas da data que ser√° convertida. 

Para isso, voc√™ usa os `caracteres de formata√ß√£o`, como essa por exemplo, `%m-%d-%y`. Onde signifca que o m√™s √© o primeiro numero da data, o dia √© o segundo numero, o ano √© o terceiro numero e que o ano possui somente 2 numeros para representa-lo. Existem diversos tipos de `caracteres de formata√ß√£o` que podemos utilizar, aqui est√° um [link](https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior) onde voc√™ pode encontra-los.

In [55]:
# Criando um data frame com datas no formato string
# O formato da data √© dia-ano-mes
df = pd.DataFrame(['05-22-01', '06-22-01', '07-22-01'], columns=['Data'])
print(df)

       Data
0  05-22-01
1  06-22-01
2  07-22-01


In [56]:
# Convertendo as datas para o formato datetime
pd.to_datetime(arg=df['Data'], format='%d-%y-%m')  

# Estou utilizando os caracteres de formata√ß√£o para informar quem √© o ano, o mes e o dia e outras caracteristicas
# Dessa forma a fun√ß√£o pd.to_datetime consegue converter as datas sem problemas

0   2022-01-05
1   2022-01-06
2   2022-01-07
Name: Data, dtype: datetime64[ns]

### üê• formart

In [19]:
df = pd.DataFrame(['2018-10-26 12:15', '2018-10-26 12:30'], columns=['Data'])

In [20]:
df['Data'] = pd.to_datetime(arg=df['Data'])

In [25]:
type(df['Data'][0])

pandas._libs.tslibs.timestamps.Timestamp

# 

**Atributos**:
- columns e name
- shape
- dtypes e dtype
- index
- values


<br>

**M√©todos**:
- max
- min
- mean
- median
- std
- var 
- corr
- describe
- count
- unique e nunique
- value_counts
- sample
- astype
- set_index
- sort_values
- sort_index
- remane
- rename_index
- groupby
- apply
- merge
- map
- T
- pivot
- pd.cut
- pd.crosstab
- pd.concat
- drop