# Desafio de Código DIO

# Neste desafio devemos fazer um processo de ETL (Extract, Transform and Load)

# Descrição do Projeto:

imaginemos que estamos trabalhando como cientistas/analistas de dados em uma empresa do ramo financeiro. Esta empresa cuida das carteiras de investimentos de seus clientes e como o mercado financeiro é bastante volátil é necessário estar sempre atento aos movimentos da economia. Um agente de negócios está com dúvidas se deve ou não recomendar a compra de Ações do Itaú para seus clientes e veio até pedindo para que fosse disponilizada uma planilha com os registro semanais dos indicadores de preços das ações.


# passo a passo

- Buscar dados das ações através uma API (Alpha Advantage API)

- Tratar os dados e construir a planilha que nos foi pedida.

- Carregar essa planilha em formato xlsx em uma pasta.

In [40]:
# Vamos importar as bibliotecas que serão necessárias para o ETL

import requests
import pandas as pd
from io import StringIO
import datetime as dt

In [41]:
# Vamos utilizar a API da Alpha advantage, que possui uma versão gratuita https://www.alphavantage.co/

Api_key = "BKF6KQP5IGY1H824" #Com esta chave vamos nos autenticar na API. É possível requisitar uma Api key no site da Aplha Advantage

url = f'https://www.alphavantage.co/query?function=TIME_SERIES_WEEKLY_ADJUSTED&symbol=ITSA3.SAO&apikey={Api_key}&datatype=csv' #Este é o End Point para requisitar informações semanais das ações do Itaú

r = requests.get(url) #Fazemos uma requisição para a Api que nos retorna as informações em CSV

In [42]:
# Vamos transformar as informações para CSV

acoes = pd.read_csv(StringIO(r.text)) #Usamos o StringIO para salvar as informações

# Vamos conferir o resultado
acoes.head()

Unnamed: 0,timestamp,open,high,low,close,adjusted close,volume,dividend amount
0,2023-09-19,9.43,9.55,9.38,9.41,9.41,104500,0.0
1,2023-09-15,9.5,9.67,9.08,9.42,9.42,1686500,0.0
2,2023-08-25,9.42,9.65,9.31,9.46,9.46,554600,0.0
3,2023-08-18,9.618,9.7076,9.38,9.42,9.42,1817402,0.0235
4,2023-08-11,9.83,10.01,9.57,9.67,9.6464,911500,0.0


In [43]:
# Vamos conferir os tipos dos dados da ações
acoes.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 996 entries, 0 to 995
Data columns (total 8 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   timestamp        996 non-null    object 
 1   open             996 non-null    float64
 2   high             996 non-null    float64
 3   low              996 non-null    float64
 4   close            996 non-null    float64
 5   adjusted close   996 non-null    float64
 6   volume           996 non-null    int64  
 7   dividend amount  996 non-null    float64
dtypes: float64(6), int64(1), object(1)
memory usage: 62.4+ KB


In [44]:
# Uma vez que precisamos retornar apenas os dados referentes à 2023 precisamos tratar a coluna que nos dá essa informação

acoes['timestamp'] = pd.to_datetime(acoes['timestamp']) # Transformamos o tipo de dado da coluna timestamp para filtrar o ano de 2023

# Filtrando o ano de 2023

acoes = acoes.loc[acoes['timestamp'].dt.year == 2023]

#Visualizando a tabela

display(acoes)

Unnamed: 0,timestamp,open,high,low,close,adjusted close,volume,dividend amount
0,2023-09-19,9.43,9.55,9.38,9.41,9.41,104500,0.0
1,2023-09-15,9.5,9.67,9.08,9.42,9.42,1686500,0.0
2,2023-08-25,9.42,9.65,9.31,9.46,9.46,554600,0.0
3,2023-08-18,9.618,9.7076,9.38,9.42,9.42,1817402,0.0235
4,2023-08-11,9.83,10.01,9.57,9.67,9.6464,911500,0.0
5,2023-08-04,9.97,10.12,9.8,9.84,9.816,971500,0.0
6,2023-07-28,9.99,10.18,9.82,9.97,9.9457,635600,0.0515
7,2023-07-21,9.75,10.08,9.69,9.98,9.904,835400,0.0
8,2023-07-14,9.88,9.98,9.66,9.75,9.6757,750900,0.0
9,2023-07-07,9.76,9.98,9.74,9.87,9.7948,652400,0.0


- O agente de negócios pediu para fazer uma última correção: Exportar para a planilha apenas as ações com valor de entrada acima de R$ 9,50.

In [45]:
# Buscando as ações com valor de entrada acima de R$9,50


acoes = acoes.loc[acoes['open'] > 9.5]

In [46]:
# Visualizando a correção

display(acoes)

Unnamed: 0,timestamp,open,high,low,close,adjusted close,volume,dividend amount
3,2023-08-18,9.618,9.7076,9.38,9.42,9.42,1817402,0.0235
4,2023-08-11,9.83,10.01,9.57,9.67,9.6464,911500,0.0
5,2023-08-04,9.97,10.12,9.8,9.84,9.816,971500,0.0
6,2023-07-28,9.99,10.18,9.82,9.97,9.9457,635600,0.0515
7,2023-07-21,9.75,10.08,9.69,9.98,9.904,835400,0.0
8,2023-07-14,9.88,9.98,9.66,9.75,9.6757,750900,0.0
9,2023-07-07,9.76,9.98,9.74,9.87,9.7948,652400,0.0
10,2023-06-30,9.76,9.83,9.55,9.74,9.6658,454600,0.0
11,2023-06-23,9.72,10.05,9.65,9.77,9.6956,917600,0.1144


In [50]:
# Vamos salvar estas informações para o agente de negócios

Itau3 = 'acoes_semanais_2023.xlsx'

acoes.to_excel(Itau3, index=False) #Por padrão o arquivo ficará salvo no mesmo diretório do código, mas poderíamos passar o caminho de uma pasta compartilhada


In [None]:
# Arquivo gerado pode ser acesso no link https://docs.google.com/spreadsheets/d/1J-6Z6hHJK6fj5F21poYCnp1-w2ErUMerxVx7Cupq9GQ/edit#gid=1530441486