#pd.to_datetime()
A função pd.to_datetime() é usada para converter argumentos para datetime. Isso é
crucial quando você lê dados e as colunas de data são importadas como strings ou
objetos.

In [None]:
import pandas as pd
# Criando um DataFrame com datas em formato string
df_datas = pd.DataFrame({
'Data_String': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
'Evento': ['Feriado', 'Reunião', 'Lançamento', 'Manutenção']
})
print('--- DataFrame Original (tipos de dados) ---\n', df_datas.dtypes)

In [None]:
# Convertendo a coluna 'Data_String' para datetime
df_datas['Data'] = pd.to_datetime(df_datas['Data_String'])
print('\n--- DataFrame após pd.to_datetime() (tipos de dados) ---\n', df_datas.dtypes)
print('\n--- DataFrame após pd.to_datetime() ---\n', df_datas)

In [None]:
# Lidando com formatos diferentes
df_datas_formatos = pd.DataFrame({
'Data_Custom': ['01/01/2023', '02-Jan-2023', '20230103'], 'Valor': [10, 20, 30] })
df_datas_formatos['Data_Custom_Convertida'] =
pd.to_datetime(df_datas_formatos['Data_Custom'], format='mixed')
print('\n--- DataFrame com formatos mistos ---\n', df_datas_formatos)

Uma vez que uma coluna é do tipo datetime, você pode facilmente extrair
componentes como ano, mês, dia, dia da semana, hora, etc., usando o acessor .dt .

In [None]:
#Extração de datas
df_partes_data = pd.DataFrame({
'Timestamp': pd.to_datetime(['2023-01-15 10:30:00', '2023-02-20 14:00:00',
'2023-03-25 08:45:00'])
})
print('--- DataFrame Original ---\n', df_partes_data)
df_partes_data['Ano'] = df_partes_data['Timestamp'].dt.year
df_partes_data['Mes'] = df_partes_data['Timestamp'].dt.month
df_partes_data['Dia'] = df_partes_data['Timestamp'].dt.day
df_partes_data['Hora'] = df_partes_data['Timestamp'].dt.hour
df_partes_data['Dia_da_Semana'] = df_partes_data['Timestamp'].dt.dayofweek #
Segunda=0, Domingo=6
df_partes_data['Nome_Dia_Semana'] = df_partes_data['Timestamp'].dt.day_name()
print('\n--- DataFrame com partes da data extraídas ---\n', df_partes_data)

##**Filtragem por data e intervalo de tempo**
Filtrar dados por datas ou intervalos de tempo é uma operação comum e eficiente no Pandas.


In [None]:
#Criação do segundo DataFrame
df2 = pd.DataFrame({
'Data': pd.to_datetime(['2023-01-01', '2023-01-15', '2023-02-01', '2023-02-10', '2023-03-05', '2023-03-20']),
'Valor': [100, 120, 150, 130, 180, 160]
})
print('--- DataFrame Original ---\n', df2)

In [None]:
# Filtrar por uma data específica
filtro_data_especifica = df2[df2['Data'] == '2023-01-15']
print('\n--- Dados de 2023-01-15 ---\n', filtro_data_especifica)

In [None]:
# Filtrar por um mês específico
filtro_mes = df2[df2['Data'].dt.month == 2]
print('\n--- Dados de Fevereiro ---\n', filtro_mes)

In [None]:
# Filtrar por um intervalo de tempo
filtro_intervalo = df2[(df2['Data'] >= '2023-01-01') & (df2['Data'] <= '2023-02-15')]
print('\n--- Dados entre 01/Jan e 15/Fev ---\n', filtro_intervalo)

In [None]:
# Usando .between() para intervalos
filtro_between = df2[df2['Data'].between('2023-01-01', '2023-02-15')]
print('\n--- Dados entre 01/Jan e 15/Fev (usando between) ---\n', filtro_between)