# Getting data from APIs

Voc√™ n√£o pode construir um modelo sem dados, certo? Em projetos anteriores, trabalhamos com dados armazenados em arquivos (como um CSV) ou bancos de dados (como SQL). Neste projeto, vamos obter nossos dados de um servidor web usando uma API.

Ent√£o, nesta li√ß√£o, vamos aprender o que √© uma API e como extrair dados de uma. Tamb√©m vamos trabalhar na transforma√ß√£o de nossos dados em um formato gerenci√°vel. Vamos l√°!

In [None]:
import pandas as pd
import requests

# Acessando APIs atrav√©s de uma URL

Nesta li√ß√£o, vamos extrair informa√ß√µes do mercado de a√ß√µes da API [AlphaVantage](https://alphavantage.co/). Para entender como uma API funciona, considere a URL abaixo.

Tire um momento para ler o texto do link em si, depois clique nele e examine os dados que aparecem no seu navegador. Qual √© o formato dos dados? Quais dados est√£o inclu√≠dos? Como eles est√£o organizados?

https://www.alphavantage.co/query?function=TIME_SERIES_DAILY&symbol=IBM&apikey=demo

Observe que esta URL possui v√°rios componentes. Vamos analis√°-los um por um.

| URL | Componente |
|:--- | :-------- |
| `https://www.alphavantage.co` | Este √© o **hostname** ou **URL base**. √â o endere√ßo web do servidor onde podemos obter nossos dados de a√ß√µes. |
| `/query` | Este √© o **caminho**. A maioria das APIs tem v√°rias opera√ß√µes diferentes que podem ser feitas. O caminho √© o nome da opera√ß√£o espec√≠fica que queremos acessar. |
| `?` | Este ponto de interroga√ß√£o indica que tudo o que segue na URL √© um **par√¢metro**. Cada par√¢metro √© separado por um caractere `&`. Esses par√¢metros fornecem informa√ß√µes adicionais que ir√£o modificar o comportamento da opera√ß√£o. Isso √© semelhante √† forma como passamos **argumentos** para fun√ß√µes em Python. |
| `function=TIME_SERIES_DAILY` | Nosso primeiro par√¢metro usa a palavra-chave `function`. O valor √© `TIME_SERIES_DAILY`. Neste caso, estamos pedindo dados de a√ß√µes **di√°rios**. |
| `symbol=IBM` | Nosso segundo par√¢metro usa a palavra-chave `symbol`. Portanto, estamos pedindo dados de uma a√ß√£o cujo [**ticker symbol**](https://en.wikipedia.org/wiki/Ticker_symbol) √© `IBM`. |
| `apikey=demo` | Da mesma forma que voc√™ precisa de uma senha para acessar alguns sites, uma **chave de API** ou **token de API** √© a senha que voc√™ usar√° para acessar a API. |

Agora que temos uma no√ß√£o dos componentes da URL que obt√©m informa√ß√µes do AlphaVantage, vamos criar a nossa pr√≥pria para uma a√ß√£o diferente.

### Exerc√≠cio:
Usando a URL acima como modelo, crie uma nova URL para obter os dados da [Ambuja Cement](https://www.ambujacement.com/). com o ticker sendo `"AMBUJACEM.BSE"`.


In [None]:
url = ...

print("url type:", type(url))
url

Oh n√£o! Um problema. Parece que precisamos da nossa pr√≥pria chave de API para acessar os dados.

Como voc√™ pode imaginar, uma chave de API √© uma informa√ß√£o que deve ser mantida em sigilo, ent√£o √© uma m√° ideia inclu√≠-la no c√≥digo da nossa aplica√ß√£o. Quando se trata de informa√ß√µes sens√≠veis como esta, desenvolvedores e cientistas de dados as armazenam como uma [vari√°vel de ambiente](https://en.wikipedia.org/wiki/Environment_variable) que √© mantida em um arquivo `.env`.

### Exerc√≠cio:
Obtenha sua chave de API e a salve em seu arquivo `.env`.

Agora que armazenamos nossa chave de API, precisamos import√°-la para o nosso c√≥digo. Isso √© comumente feito criando um m√≥dulo `config`.

### Exerc√≠cio:
Importe a vari√°vel `settings` do m√≥dulo `config`. Em seguida, use o comando `dir` para ver quais atributos ela possui.

In [None]:
# Import settings


# Use `dir` to list attributes


### Exerc√≠cio:
Crie uma nova URL para `"AMBUJACEM.BSE"`:


In [None]:
url = ...

print("url type:", type(url))
url

Est√° funcionando! Acontece que h√° muitos mais par√¢metros. Vamos construir nossa URL para inclu√≠-los.

### Exerc√≠cio:
V√° at√© a documenta√ß√£o da [API AlphaVantage Time Series Daily](https://www.alphavantage.co/documentation/#daily). Amplie sua URL para incorporar todos os par√¢metros listados na documenta√ß√£o. Al√©m disso, para tornar sua URL mais din√¢mica, crie nomes de vari√°veis para todos os par√¢metros que podem ser adicionados √† URL.

In [None]:
ticker = ...
output_size = ...
data_type = ...

url = ...

print("url type:", type(url))
url

# Acessando APIs Atrav√©s de uma Solicita√ß√£o

Vimos como acessar a API AlphaVantage clicando em uma URL, mas isso n√£o funcionar√° para a aplica√ß√£o que estamos construindo neste projeto, pois apenas humanos clicam em URLs. Programas de computador acessam APIs fazendo **solicita√ß√µes**. Vamos construir nossa primeira solicita√ß√£o usando a URL que criamos na tarefa anterior.

### Exerc√≠cio:
Use a biblioteca `requests` para fazer uma solicita√ß√£o `get` √† URL que voc√™ criou na tarefa anterior. Atribua a resposta √† vari√°vel `response`.

In [None]:
response = ...

print("response type:", type(response))

Isso nos informa que tipo de resposta recebemos, mas n√£o nos diz nada sobre o que isso significa. Se quisermos descobrir quais tipos de dados est√£o realmente *na* resposta, precisaremos usar o comando `dir`.

### Exerc√≠cio:
Use o comando `dir` para ver quais atributos e m√©todos a vari√°vel `response` possui.

In [None]:
# Use `dir` on your `response`


O comando `dir` retorna uma lista e, como voc√™ pode ver, h√° muitas possibilidades aqui! Por enquanto, vamos nos concentrar em dois atributos: `status_code` e `text`.

Come√ßaremos com `status_code`. Sempre que voc√™ faz uma chamada para uma URL, a resposta inclui um [c√≥digo de status HTTP](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes) que pode ser acessado com o atributo `status_code`. Vamos ver qual √© o nosso.

### Exerc√≠cio:
Atribua o c√≥digo de status da sua `response` √† vari√°vel `response_code`.

In [None]:
response_code = ...

print("code type:", type(response_code))
response_code

Traduzido para o ingl√™s, `200` significa "OK". √â a resposta padr√£o para uma solicita√ß√£o HTTP bem-sucedida. Em outras palavras, funcionou! Recebemos com sucesso os dados da API AlphaVantage.

Agora vamos dar uma olhada no `text`.

### Exerc√≠cio:
Atribua o texto da sua `response` √† vari√°vel `response_text`.

In [None]:
response_text = ...

print("response_text type:", type(response_text))
print(response_text[:200])

Essa string parece com os dados que vimos anteriormente em nosso navegador quando clicamos na URL no exerc√≠cio 5. Mas n√£o podemos trabalhar com dados estruturados como JSON quando est√£o como uma string. Em vez disso, precisamos que eles estejam em um dicion√°rio.

### Exerc√≠cio:
Use o m√©todo `json` para acessar uma vers√£o em dicion√°rio dos dados. Atribua-a √† vari√°vel chamada `response_data`.

In [None]:
response_data = ...

print("response_data type:", type(response_data))

Vamos verificar se os dados est√£o estruturados da mesma forma que vimos em nosso navegador.

### Exerc√≠cio:
Imprima as chaves de `response_data`. Elas s√£o o que voc√™ esperava?

In [None]:
# Print `response_data` keys


Agora vamos olhar os dados que est√£o atribu√≠dos √† chave `"Time Series (Daily)"`.

### Exerc√≠cio:
Atribua o valor da chave `"Time Series (Daily)"` √† vari√°vel `stock_data`. Em seguida, examine os dados de um dos dias em `stock_data`.

In [None]:
# Extract `"Time Series (Daily)"` value from `response_data`
stock_data = ...

print("stock_data type:", type(stock_data))

# Extract data for one of the days in `stock_data`



Agora que sabemos como os dados est√£o organizados quando os extra√≠mos da API, vamos transform√°-los em um DataFrame para torn√°-los mais gerenci√°veis.

### Exerc√≠cio:
Leia os dados de `stock_data` em um DataFrame chamado `df_ambuja`. Certifique-se de que todos os seus tipos de dados est√£o corretos!

In [None]:
df_ambuja = ...

print("df_ambuja shape:", df_ambuja.shape)
print()
print(df_ambuja.info())
df_ambuja.head(10)

Voc√™ notou que o √≠ndice para `df_ambuja` n√£o tem uma entrada para todos os dias? Considerando que se trata de dados do mercado de a√ß√µes, por que voc√™ acha que isso acontece?

No geral, isso parece muito bom, mas h√° alguns problemas: o tipo de dados das datas e o formato dos cabe√ßalhos. Vamos corrigir as datas primeiro. No momento, as datas s√£o strings; para que o restante do nosso c√≥digo funcione, precisaremos criar um `DatetimeIndex` adequado.

### Exerc√≠cio:
Transforme o √≠ndice de `df_ambuja` em um `DatetimeIndex` com o nome `"date"`.

In [None]:
# Convert `df_ambuja` index to `DatetimeIndex`


# Name index "date"


print(df_ambuja.info())
df_ambuja.head()

__Nota:__ as linhas em `df_ambuja` est√£o ordenadas de forma <b>decrescente</b>, com a data mais recente no topo. Isso ser√° vantajoso quando armazenarmos e recuperarmos os dados do nosso banco de dados da aplica√ß√£o, mas precisaremos orden√°-los de forma <b>crescente</b> antes de podermos us√°-los para treinar um modelo.

Ok! Agora que as datas est√£o corrigidas, vamos lidar com os cabe√ßalhos. N√£o h√° nada realmente *errado* com eles, mas aqueles n√∫meros os fazem parecer um pouco inacabados. Vamos nos livrar deles.

### Exerc√≠cio:
Remova a numera√ß√£o dos nomes das colunas de `df_ambuja`.

In [None]:
# Remove numbering from `df_ambuja` column names
df_ambuja.columns = ...

print(df_ambuja.info())
df_ambuja.head()

# Programa√ß√£o Defensiva

Programa√ß√£o defensiva √© a pr√°tica de escrever c√≥digo que continuar√° a funcionar, mesmo que algo d√™ errado. Nunca conseguiremos prever todos os problemas que as pessoas podem encontrar com nosso c√≥digo, mas podemos tomar medidas para garantir que as coisas n√£o desmoronem sempre que um desses problemas acontecer.

At√© agora, fizemos solicita√ß√µes de API onde tudo funciona. Mas erros de codifica√ß√£o e problemas com servidores s√£o comuns, e podem causar grandes problemas em um projeto de ci√™ncia de dados. Vamos ver como nossa `response` muda quando introduzimos erros comuns em nosso c√≥digo.

### Exerc√≠cio:
Volte ao exerc√≠cio 5 e mude a primeira parte da sua URL. Em vez de `"query"`, use `"search"` (um caminho que n√£o existe). Em seguida, execute novamente seu c√≥digo para todas as tarefas que se seguem. O que muda? O que permanece o mesmo?

Sabemos o que acontece quando tentamos acessar um endere√ßo inv√°lido. Mas e quando acessamos o *caminho correto* com um s√≠mbolo de a√ß√£o *inv√°lido*?

### Exerc√≠cio:
Volte ao exerc√≠cio 5 e mude o s√≠mbolo da a√ß√£o de `"AMBUJACEM.BSE"` para `"RAMBUJACEM.BSE"` (uma empresa que n√£o existe). Em seguida, execute novamente seu c√≥digo para todas as tarefas que se seguem. Novamente, observe o que muda e o que permanece o mesmo.

Vamos formalizar nosso processo de extra√ß√£o e transforma√ß√£o para a API AlphaVantage em uma fun√ß√£o reproduz√≠vel.

### Exerc√≠cio:
Construa uma fun√ß√£o `get_daily` que obtenha dados da API AlphaVantage e retorne um DataFrame limpo. Use a docstring como guia. Quando estiver satisfeito com o resultado, envie seu trabalho para o avaliador.

In [None]:
def get_daily():

    """Get daily time series of an equity from AlphaVantage API.

    Parameters
    ----------
    ticker : str
        The ticker symbol of the equity.
    output_size : str, optional
        Number of observations to retrieve. "compact" returns the
        latest 100 observations. "full" returns all observations for
        equity. By default "full".

    Returns
    -------
    pd.DataFrame
        Columns are 'open', 'high', 'low', 'close', and 'volume'.
        All are numeric.
    """
    # Create URL (8.1.5)


    # Send request to API (8.1.6)


    # Extract JSON data from response (8.1.10)


    # Read data into DataFrame (8.1.12 & 8.1.13)


    # Convert index to `DatetimeIndex` named "date" (8.1.14)


    # Remove numbering from columns (8.1.15)


    # Return DataFrame
    return df

In [None]:
# Test your function
df_ambuja = get_daily(ticker="AMBUJACEM.BSE")

print(df_ambuja.info())
df_ambuja.head()

Como essa fun√ß√£o lida com os dois erros que exploramos nesta se√ß√£o? Nosso primeiro erro, uma URL inv√°lida, √© algo com o qual n√£o precisamos nos preocupar. N√£o importa o que o usu√°rio insira nesta fun√ß√£o, a URL sempre estar√° correta. Mas veja o que acontece quando o usu√°rio insere um s√≠mbolo de a√ß√£o inv√°lido. Qual √© a mensagem de erro? Isso ajudaria o usu√°rio a localizar seu erro?

### Exerc√≠cio:
Adicione uma cl√°usula `if` √† sua fun√ß√£o `get_daily` para que ela lance uma `Exception` quando um usu√°rio fornecer um s√≠mbolo de a√ß√£o inv√°lido. Certifique-se de que a mensagem de erro seja informativa.

In [None]:
# Test your Exception
df_test = get_daily(ticker="ABUJACEM.BSE")

Certo! Agora temos todas as ferramentas necess√°rias para obter os dados para o nosso projeto. Na pr√≥xima li√ß√£o, tornaremos nosso c√≥digo AlphaVantage mais reutiliz√°vel, criando um m√≥dulo `data` com defini√ß√µes de classe. Tamb√©m criaremos o c√≥digo necess√°rio para armazenar e ler esses dados do nosso banco de dados de aplica√ß√£o.

# Desenvolvimento Orientado a Testes (TDD)

Na li√ß√£o anterior, aprendemos como obter dados de uma API. Nesta li√ß√£o, temos dois objetivos. Primeiro, vamos pegar o c√≥digo que usamos para acessar a API e construir uma classe `AlphaVantageAPI`. Isso nos permitir√° reutilizar nosso c√≥digo. Segundo, criaremos uma classe `SQLRepository` que nos ajudar√° a carregar nossos dados de a√ß√µes em um banco de dados SQLite e depois extra√≠-los para uso posterior. Al√©m disso, construiremos esse c√≥digo usando uma t√©cnica chamada **desenvolvimento orientado a testes**, onde usaremos instru√ß√µes `assert` para garantir que tudo esteja funcionando corretamente. Assim, evitaremos problemas mais tarde ao construir nossa aplica√ß√£o.

In [None]:
%load_ext autoreload
%load_ext sql
%autoreload 2

import sqlite3
import matplotlib.pyplot as plt
import pandas as pd
from config import settings

# Construindo Nosso M√≥dulo de Dados

Para nossa aplica√ß√£o, vamos manter todas as classes que usamos para extrair, transformar e carregar dados em um √∫nico m√≥dulo que chamaremos de `data`.

## Classe AlphaVantage API

Vamos come√ßar pegando o c√≥digo que criamos na √∫ltima li√ß√£o e incorpor√°-lo em uma classe que ser√° respons√°vel por obter dados da API AlphaVantage.

### Exerc√≠cio:
No m√≥dulo `data`, crie uma defini√ß√£o de classe para `AlphaVantageAPI`. Por enquanto, certifique-se de que ela tenha um m√©todo `__init__` que anexe sua chave de API como o atributo `__api_key`. Depois de terminar, importe a classe abaixo e crie uma inst√¢ncia dela chamada `av`.

In [None]:
# Import `AlphaVantageAPI`


# Create instance of `AlphaVantageAPI` class
av = ...

print("av type:", type(av))

Lembre-se da fun√ß√£o `get_daily` que fizemos na √∫ltima li√ß√£o? Agora vamos transform√°-la em um m√©todo de classe.

### Exerc√≠cio:
Crie um m√©todo `get_daily` para sua classe `AlphaVantageAPI`. Assim que terminar, use a c√©lula abaixo para buscar os dados das a√ß√µes da empresa de energia renov√°vel [Suzlon](https://www.suzlon.com/) e atribua-os ao DataFrame `df_suzlon`.

In [None]:
# Define Suzlon ticker symbol
ticker = "SUZLON.BSE"

# Use your `av` object to get daily data
df_suzlon = ...

print("df_suzlon type:", type(df_suzlon))
print("df_suzlon shape:", df_suzlon.shape)
df_suzlon.head()

Certo! A pr√≥xima coisa que precisamos fazer √© testar nosso novo m√©todo para garantir que ele funcione da maneira que desejamos. Normalmente, esses tipos de testes s√£o escritos *antes* de escrever o m√©todo, mas, neste primeiro caso, faremos o contr√°rio para entender melhor como as instru√ß√µes de assert funcionam.

### Exerc√≠cio:
Crie quatro instru√ß√µes `assert` para testar a sa√≠da do seu m√©todo `get_daily`. Use os coment√°rios abaixo como guia.

In [None]:
# Does `get_daily` return a DataFrame?


# Does DataFrame have 5 columns?


# Does DataFrame have a DatetimeIndex?


# Is the index name "date"?


### Exerc√≠cio:
Crie mais dois testes para a sa√≠da do seu m√©todo `get_daily`. Use os coment√°rios abaixo como guia.

In [None]:
# Does DataFrame have correct column names?


# Are columns correct data type?


Ok! Agora que nossa classe `AlphaVantageAPI` est√° pronta para obter dados, vamos focar na classe que precisaremos para armazenar nossos dados em nosso banco de dados SQLite.

## Classe Reposit√≥rio SQL

N√£o seria eficiente se nosso aplicativo precisasse obter dados da API AlphaVantage toda vez que quis√©ssemos explorar nossos dados ou construir um modelo, ent√£o precisaremos armazenar nossos dados em um banco de dados. Como nossos dados s√£o altamente estruturados (cada DataFrame que extra√≠mos da AlphaVantage sempre ter√° as mesmas cinco colunas), faz sentido usar um banco de dados SQL.

Usaremos o SQLite para nosso banco de dados. Para consist√™ncia, esse banco de dados sempre ter√° o mesmo nome, que armazenamos em nosso arquivo `.env`.

### Exerc√≠cio:
Conecte-se ao banco de dados cujo nome est√° armazenado no arquivo `.env` deste projeto. Certifique-se de definir o argumento `check_same_thread` como `False`. Atribua a conex√£o √† vari√°vel `connection`.

In [None]:
connection = ...

print("connection type:", type(connection))

Temos uma conex√£o, e agora precisamos come√ßar a construir a classe que ir√° gerenciar todas as nossas transa√ß√µes com o banco de dados. Com esta classe, no entanto, vamos criar nossos testes *antes* de escrever a defini√ß√£o da classe.

### Exerc√≠cio:
Escreva dois testes para a classe `SQLRepository`, usando os coment√°rios abaixo como guia.

In [None]:
# Import class definition


# Create instance of class
repo = ...

# Does `repo` have a "connection" attribute?


# Is the "connection" attribute a SQLite `Connection`?


__Dica:__ Voc√™ n√£o poder√° executar este bloco de c√≥digo ‚òùÔ∏è at√© completar a tarefa abaixo. üëá

### Exerc√≠cio:
Crie uma defini√ß√£o para sua classe `SQLRepository`. Por enquanto, complete apenas o m√©todo `__init__`. Assim que terminar, use o c√≥digo que voc√™ escreveu na tarefa anterior para test√°-la.

O pr√≥ximo m√©todo que precisamos para a classe `SQLRepository` √© um que nos permita armazenar informa√ß√µes. No jarg√£o SQL, isso √© geralmente referido como **inserir** tabelas no banco de dados.

### Exerc√≠cio:
Adicione um m√©todo `insert_table` √† sua classe `SQLRepository`. Como guia, use as instru√ß√µes `assert` abaixo e o docstring no m√≥dulo `data`. Quando terminar, execute a c√©lula abaixo para verificar seu trabalho.

In [None]:
response = repo.insert_table(table_name=ticker, records=df_suzlon, if_exists="replace")

# Does your method return a dictionary?
assert isinstance(response, dict)

# Are the keys of that dictionary correct?
assert sorted(list(response.keys())) == ["records_inserted", "transaction_successful"]

Se nosso m√©todo estiver passando as instru√ß√µes `assert`, sabemos que ele est√° retornando um registro da transa√ß√£o no banco de dados, mas ainda precisamos verificar se os dados foram realmente adicionados ao banco de dados.

### Exerc√≠cio:
Escreva uma consulta SQL para obter as **cinco primeiras linhas** da tabela de dados da Suzlon que voc√™ acabou de inserir no banco de dados.

In [None]:

%sql sqlite:///

In [None]:
%%sql



Podemos inserir dados no nosso banco de dados, mas n√£o devemos esquecer que tamb√©m precisamos ler dados dele. A leitura ser√° um pouco mais complexa do que a inser√ß√£o, ent√£o vamos come√ßar escrevendo o c√≥digo neste notebook antes de incorpor√°-lo √† nossa classe `SQLRepository`.

### Exerc√≠cio:
Primeiro, escreva uma consulta SQL para obter **todos** os dados da Suzlon. Em seguida, use o pandas para extrair os dados do banco de dados e ler em um DataFrame, chamado `df_suzlon_test`.

In [None]:
sql = ...
df_suzlon_test = ...

print("df_suzlon_test type:", type(df_suzlon_test))
print()
print(df_suzlon_test.info())
df_suzlon_test.head()

Agora que sabemos como ler uma tabela do nosso banco de dados, vamos transformar nosso c√≥digo em uma fun√ß√£o adequada. Mas, como estamos fazendo design reverso, precisamos come√ßar com nossos testes.

### Exerc√≠cio:
Complete as declara√ß√µes `assert` abaixo para testar sua fun√ß√£o `read_table`. Use os coment√°rios como guia.

In [None]:
# Assign `read_table` output to `df_suzlon`
df_suzlon = read_table(table_name="SUZLON.BSE", limit=2500)  # noQA F821

# Is `df_suzlon` a DataFrame?


# Does it have a `DatetimeIndex`?


# Is the index named "date"?


# Does it have 2,500 rows and 5 columns?


# Are the column names correct?


# Are the column data types correct?


# Print `df_suzlon` info
print("df_suzlon shape:", df_suzlon.shape)
print()
print(df_suzlon.info())
df_suzlon.head()

__Dica:__ Voc√™ n√£o poder√° executar este bloco de c√≥digo ‚òùÔ∏è at√© completar a tarefa abaixo. üëá

### Exerc√≠cio:
Expanda o c√≥digo que voc√™ escreveu acima para completar a fun√ß√£o `read_table` abaixo. Use a docstring como um guia.

__Dica:__ Lembre-se de que armazenamos nossos dados ordenados de forma <b>decrescente</b> pela data. Isso definitivamente facilitar√° a implementa√ß√£o do <code>read_table</code>!

In [None]:
def read_table():

    """Read table from database.

    Parameters
    ----------
    table_name : str
        Name of table in SQLite database.
    limit : int, None, optional
        Number of most recent records to retrieve. If `None`, all
        records are retrieved. By default, `None`.

    Returns
    -------
    pd.DataFrame
        Index is DatetimeIndex "date". Columns are 'open', 'high',
        'low', 'close', and 'volume'. All columns are numeric.
    """
    # Create SQL query (with optional limit)
    sql = ...


    # Retrieve data, read into DataFrame
    df = ...

    # Return DataFrame
    return df

### Exerc√≠cio:
Transforme a fun√ß√£o `read_table` em um m√©todo da sua classe `SQLRepository`.

### Exerc√≠cio:
Volte √† tarefa 11 e altere o c√≥digo para que voc√™ teste o m√©todo da sua classe em vez da fun√ß√£o do notebook.

Excelente! Temos tudo o que precisamos para obter dados do AlphaVantage, salvar esses dados em nosso banco de dados e acess√°-los mais tarde. Agora √© hora de fazer uma pequena an√°lise explorat√≥ria para comparar as a√ß√µes das duas empresas para as quais temos dados.

# Comparar Retorno de A√ß√µes

J√° temos os dados da Suzlon Energy em nosso banco de dados, mas precisamos adicionar os dados da Ambuja Cement antes de podermos comparar as duas a√ß√µes.

### Exerc√≠cio:
Use as inst√¢ncias das classes `AlphaVantageAPI` e `SQLRepository` que voc√™ criou nesta li√ß√£o (`av` e `repo`, respectivamente) para obter os dados de a√ß√µes da Ambuja Cement e armazen√°-los no banco de dados.

In [None]:
ticker = "AMBUJACEM.BSE"

# Get Ambuja data using `av`
ambuja_records = ...

# Insert `ambuja_records` database using `repo`
response = ...

response

Vamos dar uma olhada nos dados para garantir que estamos obtendo o que precisamos.

### Exerc√≠cio:
Usando o m√©todo `read_table` que voc√™ adicionou ao seu `SQLRepository`, extraia as 2.500 linhas mais recentes de dados da Ambuja Cement do banco de dados e atribua o resultado a `df_ambuja`.

In [None]:
ticker = "AMBUJACEM.BSE"
df_ambuja = ...

print("df_ambuja type:", type(df_ambuja))
print("df_ambuja shape:", df_ambuja.shape)
df_ambuja.head()

J√° passamos bastante tempo observando esses dados, mas o que eles realmente representam? Acontece que o mercado de a√ß√µes √© muito parecido com qualquer outro mercado: as pessoas compram e vendem bens. Os pre√ßos desses bens podem subir ou descer dependendo de fatores como oferta e demanda. No caso de um mercado de a√ß√µes, os bens sendo vendidos s√£o a√ß√µes (tamb√©m chamadas de "equities" ou "securities"), que representam uma participa√ß√£o na propriedade de uma corpora√ß√£o.

Durante cada dia de negocia√ß√£o, o pre√ßo de uma a√ß√£o muda, ent√£o, quando estamos avaliando se uma a√ß√£o pode ser um bom investimento, observamos quatro tipos de n√∫meros: abertura (open), m√°ximo (high), m√≠nimo (low), fechamento (close) e volume (volume). **Abertura (Open)** √© exatamente o que parece: o pre√ßo de venda de uma a√ß√£o quando o mercado abre para o dia. Da mesma forma, **fechamento (Close)** √© o pre√ßo de venda de uma a√ß√£o quando o mercado fecha no final do dia, e **m√°ximo (High)** e **m√≠nimo (Low)** s√£o os pre√ßos m√°ximo e m√≠nimo de uma a√ß√£o ao longo do dia. **Volume** √© o n√∫mero de a√ß√µes de uma determinada empresa que foram compradas e vendidas naquele dia. De modo geral, uma empresa cujas a√ß√µes tiveram um grande volume de negocia√ß√£o ver√° mais varia√ß√£o de pre√ßo ao longo do dia do que uma empresa cujas a√ß√µes foram negociadas de forma mais leve.

Vamos visualizar como o pre√ßo da Ambuja Cement mudou na √∫ltima d√©cada.

### Exerc√≠cio:
Plote o pre√ßo de fechamento de `df_ambuja`. Certifique-se de rotular seus eixos e incluir uma legenda.

In [None]:
fig, ax = plt.subplots(figsize=(15, 6))
# Plot `df_ambuja` closing price


# Label axes



# Add legend


Vamos adicionar o pre√ßo de fechamento da Suzlon ao nosso gr√°fico para que possamos comparar os dois.

### Exerc√≠cio:
Crie um gr√°fico que mostre os pre√ßos de fechamento de `df_suzlon` e `df_ambuja`. Novamente, rotule seus eixos e inclua uma legenda.

In [None]:
fig, ax = plt.subplots(figsize=(15, 6))
# Plot `df_suzlon` and `df_ambuja`



# Label axes



# Add legend


Olhando para este gr√°fico, podemos concluir que a Ambuja Cement √© uma a√ß√£o "melhor" do que a Suzlon Energy, pois seu pre√ßo √© mais alto. Mas o pre√ßo √© apenas um fator que um investidor deve considerar ao criar uma estrat√©gia de investimento. O que √© definitivamente verdade √© que √© dif√≠cil fazer uma compara√ß√£o direta entre essas duas a√ß√µes, pois h√° uma diferen√ßa de pre√ßo t√£o grande.

Uma maneira de os investidores compararem a√ß√µes √© observando seus **retornos**. Um retorno √© a mudan√ßa de valor em um investimento, representada como uma porcentagem. Ent√£o, vamos analisar os retornos di√°rios de nossas duas a√ß√µes.

### Exerc√≠cio:
Adicione uma coluna `"return"` ao `df_ambuja` que mostre a mudan√ßa percentual na coluna `"close"` de um dia para o outro.

__Dica:__ Nossos dois DataFrames est√£o ordenados de forma <b>decrescente</b> por data, mas voc√™ precisar√° garantir que estejam ordenados de forma <b>crescente</b> para calcular seus retornos.

In [None]:
# Sort DataFrame ascending by date


# Create "return" column


print("df_ambuja shape:", df_ambuja.shape)
print(df_ambuja.info())
df_ambuja.head()

### Exerc√≠cio:
Adicione uma coluna `"return"` ao `df_suzlon` que mostre a varia√ß√£o percentual na coluna `"close"` de um dia para o outro.

In [None]:
# Sort DataFrame ascending by date


# Create "return" column


print("df_suzlon shape:", df_suzlon.shape)
print(df_suzlon.info())
df_suzlon.head()

Agora vamos plotar os retornos das nossas duas empresas e ver como as duas se comparam.

### Exerc√≠cio:
Plote os retornos de `df_suzlon` e `df_ambuja`. Certifique-se de rotular seus eixos e usar uma legenda.

In [None]:
fig, ax = plt.subplots(figsize=(15, 6))
# Plot returns for `df_suzlon` and `df_ambuja`



# Label axes



# Add legend


Sucesso! Ao representar os retornos como uma porcentagem, conseguimos comparar duas a√ß√µes que t√™m pre√ßos muito diferentes. Mas o que essa visualiza√ß√£o est√° nos dizendo? Podemos ver que os retornos da Suzlon t√™m uma varia√ß√£o maior. Observamos grandes ganhos e grandes perdas. Em contraste, a varia√ß√£o da Ambuja √© mais estreita, o que significa que o pre√ßo n√£o flutua tanto.

Outro nome para essa flutua√ß√£o di√°ria nos retornos √© chamado de [**volatilidade**](https://en.wikipedia.org/wiki/Volatility_(finance)), que √© outro fator importante para os investidores. Portanto, na pr√≥xima li√ß√£o, aprenderemos mais sobre volatilidade e, em seguida, construiremos um modelo de s√©ries temporais para prever isso.