# DEV_TEST - Modulos do código. 

In [1]:
import os
import time
import pandas as pd
import investpy as inv
import yfinance as yf
from google.cloud import bigquery
from google.api_core.exceptions import NotFound

In [2]:
# Configuração da autenticação do GCP
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "C:/Neoway/Neoway_Capital_Market_Analytics_Engineering_DEV_FullStack_Python_v1.0.0/docs/gbq.json"

# Define os caminhos para salvar os arquivos CSV
wallet_br_path = os.path.join(os.getcwd(), 'wallet_br.csv')
historical_stock_price_path = os.path.join(os.getcwd(), 'historical_stock_price.csv')


In [3]:
def persist_to_bigquery(df, table_id):
    """Persiste o DataFrame no BigQuery."""
    client = bigquery.Client()
    try:
        job = client.load_table_from_dataframe(df, table_id)
        job.result()  # Aguarde o término do job
        print(f"Dados persistidos na tabela {table_id}")
    except NotFound as e:
        print(f"Tabela não encontrada: {e}")
    except Exception as e:
        print(f"Erro ao persistir dados no BigQuery: {e}")

In [4]:
def get_brazil_stocks():
    """Obtém a lista de ações do Brasil e seleciona as colunas desejadas."""
    print("Obtendo lista de ações do Brasil...")
    start_time = time.time()
    br_stocks = inv.get_stocks(country='brazil')
    selected_columns_br = br_stocks[['country', 'name', 'full_name', 'symbol']]
    end_time = time.time()
    print(f"Tempo de execução: {end_time - start_time:.2f} segundos")
    return selected_columns_br

In [5]:
def format_tickers(df):
    """Formata os tickers das ações para o padrão utilizado pelo Yahoo Finance."""
    return [ticker + '.SA' for ticker in df['symbol'].tolist()]

In [6]:

def create_wallet_df(df, tickers):
    """Cria o DataFrame wallet_br com colunas adicionais."""
    wallet_br = df.copy()
    wallet_br['ticker_br'] = tickers
    wallet_br['snome'] = wallet_br['symbol'] + '-' + wallet_br['name']
    return wallet_br

In [7]:
def get_stock_info(tickers):
    """Obtém informações de setor e indústria com tratamento de exceções."""
    print("Obtendo informações de setor e indústria das ações...")
    data = []
    start_time = time.time()
    for i, ticker in enumerate(tickers, 1):
        try:
            stock = yf.Ticker(ticker)
            info = stock.info
            data.append({
                'ticker': ticker,
                'sector': info.get('sector', 'N/A'),
                'industry': info.get('industry', 'N/A')
            })
        except Exception as e:
            print(f"Erro ao obter informações para {ticker}: {e}")
            data.append({
                'ticker': ticker,
                'sector': 'N/A',
                'industry': 'N/A'
            })
        print(f"Processo {i}/{len(tickers)} concluído. Tempo estimado restante: {(len(tickers)-i)*0.5:.2f} segundos")
        if i % 5 == 0:  # Reduz a frequência de espera para ser mais rápido
            time.sleep(0.5)
    end_time = time.time()
    print(f"Tempo total de execução: {end_time - start_time:.2f} segundos")
    return pd.DataFrame(data)

In [8]:
def merge_stock_info(wallet_df, stock_info_df):
    """Junta as informações de setor e indústria ao DataFrame original."""
    print("Juntando informações de setor e indústria ao DataFrame...")
    start_time = time.time()
    merged_df = wallet_df.merge(stock_info_df, left_on='ticker_br', right_on='ticker', how='left')
    merged_df.drop(columns=['ticker'], inplace=True)
    merged_df['research_cnpj'] = merged_df['full_name'] + ' - CNPJ'
    final_columns = ['country', 'name', 'full_name', 'symbol', 'ticker_br', 'snome', 'sector', 'industry', 'research_cnpj']
    end_time = time.time()
    print(f"Tempo de execução: {end_time - start_time:.2f} segundos")
    return merged_df[final_columns]

In [9]:
def get_historical_data(ticker):
    """Obtém as cotações históricas dos últimos 6 meses."""
    print(f"Obtendo cotações históricas para {ticker}...")
    try:
        stock = yf.Ticker(ticker)
        hist = stock.history(period='6mo')
        if hist.empty:
            print(f"{ticker}: No data found, symbol may be delisted")
            return pd.DataFrame()
        hist['ticker'] = ticker
        return hist
    except Exception as e:
        print(f"Erro ao obter cotações para {ticker}: {e}")
        return pd.DataFrame()

In [10]:
def get_all_historical_data(tickers):
    """Obtém as cotações históricas para todos os tickers e as combina em um único DataFrame."""
    print("Obtendo cotações históricas para todas as ações...")
    start_time = time.time()
    all_stocks_hist = pd.concat([get_historical_data(ticker) for ticker in tickers], axis=0)
    all_stocks_hist.reset_index(inplace=True)
    end_time = time.time()
    print(f"Tempo total de execução: {end_time - start_time:.2f} segundos")
    return all_stocks_hist[['Date', 'ticker', 'Open', 'High', 'Low', 'Close', 'Volume']]

In [11]:
def main():
    if os.path.exists(wallet_br_path) and os.path.exists(historical_stock_price_path):
        print("Arquivos CSV já existem. Carregando os dados...")
        wallet_br = pd.read_csv(wallet_br_path)
        historical_stock_price = pd.read_csv(historical_stock_price_path)
    else:
        # Passo 1: Extração
        start_time = time.time()
        br_stocks = get_brazil_stocks()
        ticker_br = format_tickers(br_stocks)
        wallet_br = create_wallet_df(br_stocks, ticker_br)
        stock_info = get_stock_info(wallet_br['ticker_br'])
        wallet_br = merge_stock_info(wallet_br, stock_info)
        historical_stock_price = get_all_historical_data(wallet_br['ticker_br'])
        end_time = time.time()
        print(f"Tempo total de extração: {end_time - start_time:.2f} segundos")

        # Passo 3: Salvamento dos arquivos CSV
        start_time = time.time()
        wallet_br.to_csv(wallet_br_path, index=False)
        historical_stock_price.to_csv(historical_stock_price_path, index=False)
        end_time = time.time()
        print(f"Tempo total de salvamento: {end_time - start_time:.2f} segundos")

    # Passo 2: Persistência na camada raw (bronze)
    start_time = time.time()
    persist_to_bigquery(wallet_br, 'neoway-capitalmarketanalytics.raw.wallet_br')
    persist_to_bigquery(historical_stock_price, 'neoway-capitalmarketanalytics.raw.historical_stock_price')
    end_time = time.time()
    print(f"Tempo total de persistência: {end_time - start_time:.2f} segundos")

    # Mensagens de confirmação
    print(f"wallet_br saved to {wallet_br_path}")
    print(f"historical_stock_price saved to {historical_stock_price_path}")

    print("Processo concluído!")

if __name__ == "__main__":
    main()

Arquivos CSV já existem. Carregando os dados...


DefaultCredentialsError: File C:/Neoway/Neoway_Capital_Market_Analytics_Engineering_DEV_FullStack_Python_v1.0.0/docs/gbq.json was not found.

# DEV TEST 2 

* Mandando tabelas para o Google BigQuery com REPLACE

### Como criar seu arquivo de conexão json no BigQuery
Menu de navegação -> IAM e administrador -> Contas de serviço ->
Escolher uma conta já existente ou criar uma nova -> Em ações, clicar nos três pontos ->
Criar chave -> json -> Baixar

Renomear -> GBQO.json


### TEST_v1

In [20]:
key_path = './docs/private_key_gbq/GBQ.json'
credentials = service_account.Credentials.from_service_account_file(
key_path, scopes=["https://www.googleapis.com/auth/cloud-platform"])

FileNotFoundError: [Errno 2] No such file or directory: './docs/private_key_gbq/GBQ.json'

In [14]:
wallet_br.to_gbq(credentials=credentials,
                  destination_table='neoway-capitalmarketanalytics.wallet_br',
                  if exists='replace')


SyntaxError: invalid syntax (4218744104.py, line 3)

In [None]:
historical_stock_price_br.to_gbq(credentials=credentials,
                destination_table='neoway-capitalmarketanalytics.historical_stock_price_br',
                if exists='replace')

### TEST_v2 - Conect - GCP

In [18]:
import pandas_gbq #Conexão com BigQuery pelo Pandas
from google.oauth2 import service_account # Conexão com Google Cloud

In [21]:
# Conexao com Google Cloud

SCOPES = [
    'https://www.googleapis.com/auth/cloud-platform'
] 

credentials = service_account.Credentials.from_service_account_info(

{
  "type": "service_account",
  "project_id": "coastal-haven-424622-a5",
  "private_key_id": "1a7afebee98c4e4f12ff032d74115852ad79d0c3",
  "private_key": "-----BEGIN PRIVATE KEY-----\nMIIEvAIBADANBgkqhkiG9w0BAQEFAASCBKYwggSiAgEAAoIBAQCFcC81OGxB7D/t\nyc3rDQJNPhl8gRMcPgLvfnXigt+QQUNT6cRFy00kZKyi+jqzUtPYTec845/woxOx\nDRvkl3GrJt2Kxr7l7/0C7PAAgD59kP9Ohq9Pafki8ZzsenMnVLe99jVFgApz7zih\njQRc4h70Eh3bKYLei3tgfQ9m9cqYpaozBUAqWv0QA7eT0p7bmnvhmJLO3HYHxuV0\nxq1FKV77kq+ua75Ahi0k2x7hqjej/DFog7kuE04vQSirxQWVSO6Q1lSvfJ6ezVdj\nHa+9q4HF30/UHjvEN1Mpn5gEdgXtGD+EyGsO5p6Y8EQf+vMAlRZd0wUoUIpCehYB\nK/2hlaK9AgMBAAECggEAEAxgARyaGIubXLPqqhxUbInNcuXrMHhczgT9lJJ85NKU\nkGELFAHRc1EQWkGSEcMia19jMjWGJODYG3EiK6nzJ8xy1J/2kZz9Zv6sFsNVwLBR\npFYae4iZSBSa9O39L3vG5XfZDFTL7QmWXAejwLAJXP1YzeT+MlnAKuifk5h4F0eY\n7Ea1JWmwZXH68YXrabBxXPxO71bqnWvsMuEOxM+fLMEXRCauYrieQaCI6U+Yoyai\nDcYcY+1Qhs0gwdAScb2x7GT5gF7sYDP1JxkyZAUUqeD1RQ1/gAqZwSTIeM8iAzAv\n7LebYQGOk//sXjJdM5Ue0M1DRq8Cbcv8Pag9hVI/mQKBgQC7k24OK2DDCn91apgu\n1qXcWuXvhJ3FY+gwxyyS1RXfhkfL8MY+OL7EIWVSz9xz9xwTg62gNyhDa+kbb3se\n4cmoi/iF8wGzkAL0g8AQLIGc5Qc1vmhDEZc4bc6h1l17zVR3jQoBocNWLD5BKrSN\nDN+7LkkApXdX8fUGLWh51z8dtwKBgQC2HSqrRNhjwLa34Z3LCdUE8cJs3dWneFSd\n+1DoKhqDic+IkG/1ChW3zL1dD6THB2LF/gjjspd9vDW0BHZ0QEHE4Rw8V4V7bFHH\npzsEaFJ4fzlv1EXmluKQL68hhTexWS5n/sZExSAtrR4XBrmWrB02GN2/AfZTnKMi\n3x2jcHGDKwKBgBTQ+rC13aonexejubnQ9l0q9UOMexnRyY3IPMkavq+srkESul1j\nXMBVWHJFQRjZfpMn1Nfn5x78VcVGrOozcnay+eSboD+2Jq3OBT2GQugPfqpXNCjl\nRdvsS7coG/3GPq55x3eA5TWl+U6wF5Njr1yNeWqJ8mGfJ2sFFQgYfBenAoGAEB9g\n6ay8o4gqJPlaaOFD9J4aoly5T4w9oYbgUM15b2/B6csvvjfYWF9N3HFIGz6yJekp\njE8BTmZdMsS6X+xYZj+vqj/tV1Hto4lQlkFOG9DXmujmD1YIVM+D56nNlmvYyegq\nUWhKQwDyiwNTZt1x8Joe94wK7LgPUUUDcLbBteUCgYBvtLr9Gz7IwvxnHZoLBFvd\ndLvpuZdTK1oH0mLIl2nBP2MV6tDpxAMKn/ItPhxaNgqZEVWTsPzkCBWunBckmwyb\nkFhjyhblRrDbvWq3eNyf5YeoPjuHgTKx0Yhtbq0Oj5snE/zU8f6GSAfZvlhI/Jdx\nYnpGnBJIcGY3FuPb6E56gg==\n-----END PRIVATE KEY-----\n",
  "client_email": "app-neoway-capital-market@coastal-haven-424622-a5.iam.gserviceaccount.com",
  "client_id": "108516196615590885599",
  "auth_uri": "https://accounts.google.com/o/oauth2/auth",
  "token_uri": "https://oauth2.googleapis.com/token",
  "auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs",
  "client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/app-neoway-capital-market%40coastal-haven-424622-a5.iam.gserviceaccount.com",
  "universe_domain": "googleapis.com"
}
    
)

pandas_gbq.context.credentials=credentials
pandas_gbq.context.project='coastal-haven-424622-a5'


In [None]:
from pandas import util

df=util.testing.makeMixedDatarrame()

df.hesd()

In [None]:
pandas gba. to gba(df, 'teste.df pandas”, project id='G6ENOASO', if exists='replake')