# Dados, bancos de dados e APIs

Vimos como podemos obter nossos dados a partir de arquivos de texto e planilhas, mas a maior parte dos dados existentes está armazenada em bancos de dados. Esses dados são obtidos através de uma conexão com o banco de dados e a realização de consultas ou queries. Existem linguagens específicas para realizar essas consultas, como SQL, a Structured Query Language, que lida com bancos de dados relacionais.

## Acessando bancos de dados pelo Python com ORMs

Vamos ver como podemos fazer essas consultas utilizando ORM, ou Object Relational Mappers, bibliotecas que permitem a realização dessas consultas através de funções Python.

## Obtendo dados da internet através de APIs

Outra forma de obter dados dos bancos de dados é através de APIs, Application Programming Interfaces, que são vias de acesso a dados através da internet. A maior parte dessas APIs é acessada através de simples pedidos (requests) e respostas (responses).

### Pandas Data Reader

Essa é uma biblioteca interessante que nos dá acesso a uma API chamada Yahoo Finance. Essa API é capaz de obter valores sobre ações de empresas de capital aberto, ou seja, empresas cujas ações estão no mercado público de ações. 

Para obter a informação, precisamos utilizar seu símbolo no mercado, que podemos obter através desse link da NASDAQ: https://api.nasdaq.com/api/screener/stocks?tableonly=true&limit=25&offset=0&download=true

Para obter os dados, vamos utilizar a biblioteca pandas_datareader, por onde acessaremos a API.

In [None]:
import pandas_datareader.data as web
import pandas as pd
import datetime   # Vamos utilizar para lidar com datas
import numpy as np # Vamos utilizar para representar vetores
import matplotlib.pyplot as plt # Essa é uma biblioteca de visualização
from sklearn.linear_model import LinearRegression # Vamos utilizar para fazer regressões lineares

In [None]:
nomes = web.get_nasdaq_symbols()
nomes

In [None]:
empresas = pd.read_csv('symbols.csv')
empresas

In [None]:
def obter_stock(empresa,start,end):
    df = web.DataReader(empresa, 'yahoo', start, end)
    return df['Adj Close']

In [None]:
start = datetime.datetime(2020, 9, 7)
end = datetime.datetime(2022, 9, 8)
empresa = 'ABEV'
dados = pd.DataFrame()
dados[empresa] = pd.DataFrame(obter_stock(empresa,start,end))
dados

In [None]:
# Salvando em arquivos
# Excel
# CSV
# JSON

In [None]:
# Visualização
## Séries históricas

In [None]:
## Correlação

In [None]:
# Como podemos prever um próximo resultado?

In [None]:
# Encontre duas empresas com correlação absoluta maior que 0.5

In [None]:
# Vamos obter as regressões para duas empresas com correlação maior que 0.5
# Como podemos prever um próximo resultado?


In [None]:
# E correlação maior que 0.9?

In [None]:
# Vamos obter as regressões para duas empresas com correlação maior que 0.9
# Como podemos prever um próximo resultado?