In [2]:
import pandas as pd

**Analisando Dados**

Analisar dados é o processo de inspecionar, limpar, transformar e modelar dados com o objetivo de descobrir informações úteis, informar decisões e apoiar conclusões. Um dos passos iniciais em uma análise é explorar o conjunto de dados, buscando entender a estrutura, distribuições e possíveis padrões.

Exportando arquivo .csv, e dando uma olhada nas 5 primeiras linhas

In [3]:
tesouroDireto = pd.read_csv('csv/EstoqueTesouroDireto.csv', delimiter=';')

tesouroDireto.head()

Unnamed: 0,Tipo Titulo,Vencimento do Titulo,Mes Estoque,PU,Quantidade,Valor Estoque
0,Tesouro IPCA+ com Juros Semestrais,15/05/2045,12/2006,1177096763,1168080,1374943186
1,Tesouro IGPM+ com Juros Semestrais,01/07/2017,12/2006,1631064966,1101960,1797368350
2,Tesouro IPCA+ com Juros Semestrais,15/05/2015,12/2006,1364426939,1040860,1420177424
3,Tesouro IGPM+ com Juros Semestrais,01/01/2031,12/2006,2565474340,1595120,4092239429
4,Tesouro IGPM+ com Juros Semestrais,01/04/2021,12/2006,1532573046,1101700,1688435724


**Definição de uma Hipótese**

Uma hipótese é uma suposição ou previsão que você deseja testar usando os dados. Para o Tesouro Direto, uma hipótese pode ser:

Hipótese: *"A maioria dos investidores prefere títulos com vencimento de longo prazo (mais de 5 anos) em vez de títulos de curto prazo."*

In [5]:
# Convertendo a coluna de data de vencimento para datetime, se necessário
tesouroDireto['Vencimento do Titulo'] = pd.to_datetime(tesouroDireto['Vencimento do Titulo'], errors='coerce')

# Calculando o tempo restante para o vencimento
tesouroDireto['Tempo para Vencimento'] = (tesouroDireto['Vencimento do Titulo'] - pd.Timestamp.now()).dt.days

# Classificando entre curto prazo (<= 5 anos) e longo prazo (> 5 anos)
tesouroDireto['Prazo'] = tesouroDireto['Tempo para Vencimento'].apply(lambda x: 'Curto Prazo' if x <= 5*365 else 'Longo Prazo')

# Agrupando por 'Prazo' e contando a quantidade de títulos em cada categoria
vencimento_contagem = tesouroDireto.groupby('Prazo').size()

# Exibindo a contagem de títulos por prazo
print(vencimento_contagem)

Prazo
Curto Prazo    5901
Longo Prazo    1738
dtype: int64


A distribuição de títulos por prazo mostra que há uma quantidade significativamente maior de títulos de curto prazo em comparação aos de longo prazo. Isso refuta a hipótese inicial de que "a maioria dos investidores prefere títulos com vencimento de longo prazo (mais de 5 anos)".