# Planejamento do projeto

## Resultado final
    - Uma classe em linguagem python em que o usuário digita o símbolo da ação (stock ticker) e recebe uma série 
    de gráficos e análises da empresa selecionada.
    - Quais análises serão entregues?
        . Gráfico interativo com o comportamento das ações no tempo;
        . Relatório com os principais indicadores;
        . Avaliação de investimento, favorável ou desvaforável?
        . Previsão de comportamento?

## Ferramental
    - Utilizar o Jupyter Notebook para a escrita e interpretação do código;
    - Utilizar a biblioteca Selenium ou urllib.request para analisar conteudos de páginas;
    - Utilizar a biblioteca Beautiful Soup (ou lXml e Scrapy) que torna possível ler o conteúdo das páginas HTML;
    - Utilizar a biblioteca Pandas para armazenar o conteúdo das páginas em DataFrames;
    - Utilizar a biblioteca Numpy para realização de operações;
    - Utilizar a biblioteca Plotly para desenhar gráficos interativos;
    - Utilizar a biblioetca pyplot da matplotlib para criação de gráficos e dashboards;
    - Utilizar a biblioteca sklearn para a adaptação de um modelo de previsão de preço de ação.
    
## Processo de desenvolvimento
    - Coletar os dados das páginas que contêm informações sobre ações: https://finance.yahoo.com/ 
        - Dados históricos dos preços das ações
        - Indicadores fundamentalistas das ações 
        - Dados históricos dos fundos 
        - Indicadores dos fundos
    - Organizar os dados em DataFrames
    - Tratar os dados, isto é, retirar dados duplicados, tratar dados faltantes, ajustar indices e headers
    - Gerar as análises dos dados

# Utilizando o URLLIB

In [2]:
# Imports para o desenvolvimento do projeto
import pandas as pd
import numpy as np
from bs4 import BeautifulSoup
import urllib.request as ur
import requests
import csv

In [None]:
# Endereço de uma das páginas a qual fornecerá informações para a análise
url = "https://br.financas.yahoo.com/quote/{}/history?period1={}&period2={}&interval=1d&filter=history&frequency=1d&includeAdjustedClose=true"

# Tratar condições de erro

## Como tratar possíveis condições de erro? 
    - Colocando try except 
    - Colocando assert
    

In [None]:
# Inserir o nome empresa
ticker = input()

# Selecionado a data do horizonte de busca de 5 anos 
date2 = np.timedelta64(np.datetime64('today') - np.datetime64('1969-12-31'), 's').astype(int)
date1 = date2 - 86400 * 365 * 5

# Formatando o url 
url = url.format(ticker, date1, date2)
print(url)

In [None]:
# Adicionar cabeçalho para passar informações adicionais. Deve-se identificar o erro retornado pelo navegador (401 por exemplo
# é um exemplo de permissão negada) e adicionar o cabeçalho correspondente, no caso o site necessitava de alguma identificação 
# para concretizar a requisição, essa informação pode ser o tipo de aplicação o sistema operacional, fornecedores, a versão 
# de agente de usuário requisitante e outros. "Mozilla/5.0" é o token geral que diz que o navegador é compatível com Mozilla.
# Por razões históricas, quase todo navegador envia isso hoje. 
# Fonte: https://developer.mozilla.org/pt-BR/docs/Web/HTTP/Headers/User-Agent
     
response = requests.get(url, headers=headers) #baixa o conteúdo de uma página na web
status = response.raise_for_status()

# Retorna um objeto BeautifulSoup que permite manipular o data structure com mais facilidade
soup = BeautifulSoup(response.text, 'html.parser')

# O título da página HTML
print(soup.title.string)

linhas = [] #lista para armazenar os dados retirados do HTML
for element in soup.find_all(['th', 'td', 'strong']):
    linhas.append(element.string) #retira os strings que acompanham as classes selecionadas
    
# Tratando os strings para obter o dado desejado
linhas = [e for e in linhas if e not in ('Operating Expenses','Non-recurring Events')]
new_lista = list(filter(None,linhas)) #retira os Nones

dado = list(zip(*[iter(new_lista)]*7))
df_dado = pd.DataFrame(dado)

# Raspagem da tabela de preços de ações utilizando o Selenium

In [2]:
# Imports
import time
import requests
import pandas as pd 
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
import numpy as np

In [3]:
# Ajuste do url
# inserir o nome empresa
ticker = "XPLG11.SA"

# selecionado a data do horizonte de busca de 5 anos 
date2 = np.timedelta64(np.datetime64('today') - np.datetime64('1969-12-31'), 's').astype(int)
date1 = date2 - 86400 * 365 * 5

url = "https://br.financas.yahoo.com/quote/{}/history?period1={}&period2={}&interval=1d&filter=history&frequency=1d&includeAdjustedClose=true"

# formatando o url da página que será acessada
url = url.format(ticker, date1, date2)

# Instância do navegador
opt = webdriver.ChromeOptions()
opt.headless = True #não mostrar a ação em andamento 
ser = Service(r'C:\Program Files (x86)\Google\Chrome\Application\97.0.4692.99\chromedriver.exe')
driver = webdriver.Chrome(service=ser, options=opt)

driver.get(url)

time.sleep(5)

html = driver.find_element(By.TAG_NAME, 'html')

# posição do inicial do scroll
last_height = driver.execute_script("return document.body.scrollHeight")
print("last_height: {}".format(last_height))

while (True):
    # posiciona o scroll no final da página
    html.send_keys(Keys.END)
    
    # pausa para carregar a página
    time.sleep(1)

    # atualiza a posição do scroll 
    new_height = driver.execute_script("return document.documentElement.scrollHeight")
    print("new_height: {}".format(new_height))
    
    # verifica se houve movimento da página 
    if (new_height == last_height):
        # termina o loop
        break
    else:
        # atualiza o último valor 
        last_height = new_height         

element = driver.find_element(By.TAG_NAME, 'table')
html_content = element.get_attribute('outerHTML')

driver.quit()

# Código HTML da tabela
soup = BeautifulSoup(html_content, 'html.parser')

# Tratando o HTML para gerar a tabela de hostórico do preço da ação
# lista para armazenar o dados que não sejam relacionados com o preço da ação (dividendo e desdobramento)
list_not_related = [] #lista com conteúdo não relacionado com o preço das ações
tuplas_eventos = [] #tuplas data, valor, ocorrencia (dividendo e desdobramento)
for element in soup.find_all('td',"Ta(start) Py(10px)"):
    list_not_related.append(element)
    tuplas_eventos.append((element.previous_element, element.find('strong').string, element.find('span').string))

linhas_tab = [] #lista para armazenar os dados das linhas da tebela
# retira os strings que acompanham as classes selecionadas e filtra os casos não queridos
for element in soup.find_all(['td', 'th']):
    if element in list_not_related:
        del(linhas_tab[-1]) #deleta o elemento anterior
    else:
        linhas_tab.append(element.string)
        
new_lista = list(filter(None, linhas_tab)) #retira os Nones se existirem
stock_data = list(zip(*[iter(new_lista)]*7)) #empacota em listas de 7 elementos 

df_data_stocks = pd.DataFrame(stock_data[1:], columns=stock_data[0][0:7]) 
df_not_related = pd.DataFrame(tuplas_eventos, columns=['Data', 'Valor', 'Tipo'])


# Tratando o DataFrame
# converte a última coluna para inteiro substituindo o ponto
df_data_stocks["Volume"] = df_data_stocks['Volume'].apply(lambda x: int(x.replace(".","")) if x != "-" else x)

# laço para substituir os pontos por vírgulas 
for coluna in df_data_stocks.columns[1:6]:
    df_data_stocks[coluna] = df_data_stocks[coluna].apply(lambda x: float(x.replace(",",".")) if x != '-' else x)

# dicionário para auxiliar na correção das datas
dicio = {"jan.": "01",
         "fev.": "02",
         "mar.": "03",
         "abr.": "04",
         "mai.": "05",
         "jun.": "06",
         "jul.": "07",
         "ago.": "08",
         "set.": "09",
         "out.": "10",
         "nov.": "11",
         "dez.": "12"}

# ordenando cada data por Ano-mês-dia, substituindo o nome do mês pelo número correspondente e convertendo para datetime64
df_data_stocks["Data_Time"] = pd.to_datetime(df_data_stocks["Data"].apply(lambda x: x.split(' ')[0:6:2][::-1]).\
                                             apply(lambda x: "".join([x[0], dicio[x[1]], x[2]])), 
                                             format='%Y-%m-%d')

# Rearanjando as colunas do dataframe
cols = df_data_stocks.columns.tolist()
cols = cols[-1:] + cols[:-1]
df_data_stocks = df_data_stocks[cols]
df_data_stocks.index = df_data_stocks['Data_Time'] #faz o índice virar a coluna data_time
df_data_stocks.drop(labels='Data_Time', axis=1, inplace=True)

df_data_stocks

last_height: 583
new_height: 8316
new_height: 12105
new_height: 15894
new_height: 16284
new_height: 16284


Unnamed: 0_level_0,Data,Abrir,Alto,Baixo,Fechamento*,Fechamento ajustado**,Volume
Data_Time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2022-01-31,31 de jan. de 2022,98.51,99.50,98.01,98.59,98.59,38886
2022-01-28,28 de jan. de 2022,99.60,99.95,98.00,98.36,98.36,42635
2022-01-27,27 de jan. de 2022,100.08,100.64,99.00,99.60,99.60,48723
2022-01-26,26 de jan. de 2022,99.80,100.50,97.80,100.15,100.15,55275
2022-01-25,25 de jan. de 2022,101.00,101.00,99.69,99.96,99.96,44672
...,...,...,...,...,...,...,...
2020-06-10,10 de jun. de 2020,119.06,121.95,118.97,120.81,120.81,65441
2020-06-09,09 de jun. de 2020,118.49,118.97,117.00,118.97,118.97,93157
2020-06-08,08 de jun. de 2020,117.36,119.00,117.21,118.50,118.50,125987
2020-06-05,05 de jun. de 2020,115.75,117.87,115.75,117.36,117.36,75750


# Gráfico interativos

In [6]:
import plotly.express as px
import ipywidgets as widgets
from ipywidgets import fixed
import plotly.graph_objects as go
import plotly.express as px

# O filtro SelectionRangeSlider precisa de uma lista de valores para exibir para o usuário
# options = [e.strftime(' %d/%m/%Y ') for e in df_data_stocks.Data_Time.to_list()[::-1]]
options = [e.strftime(' %d/%m/%Y ') for e in df_data_stocks.index.to_list()[::-1]]

date_filter = widgets.SelectionRangeSlider(
    options = options,
    index = (0, len(options)-1), #fornecer os índices da lista
    description = 've ai',
    disabled = False,
    layout={'width': '500px'},
    continuous_update=False
)

options = df_data_stocks.columns.to_list()[1::]

column_filter = widgets.Combobox(
    value = 'Fechamento*',
    placeholder = 'Clique para escolher',
    options = options,
    description = 'Parâmetro de análise:',
    ensure_option = True,
    style={'description_width':'initial'}, #mostrar a "description" completa
    layout={'width': '350px'},
    disabled = False
)

def update_graph(df, filter_date, filter_column):
    # Datas selecionadas, convertidas de string (%d/%m/%Y) para datetime64 (%Y-%m-%d)
    date_init = np.datetime64("-".join(filter_date[0].replace('/','-').strip().split('-')[::-1])) 
    date_fin = np.datetime64("-".join(filter_date[1].replace('/','-').strip().split('-')[::-1]))
    
    # Fatiando o dataframe conforme filtro de data
    df_test = df[(df.index >= date_init) &
                 (df.index <= date_fin)].copy()
    
    # Plotando o gráfico conforme data selecionada e coluna
    fig = go.Figure([go.Scatter(x=df_test.index, y=df_test[filter_column])])
    fig.update_xaxes(dtick="M1", tickformat="%b\n%Y")
    fig.show()
    
    print(filter_column)
    
    return None
    
    
widgets.interactive(update_graph, df=fixed(df_data_stocks), filter_date=date_filter, filter_column=column_filter)

interactive(children=(SelectionRangeSlider(continuous_update=False, description='ve ai', index=(0, 410), layou…

# Tabela de indicadores de FII

In [5]:
url = 'https://www.fundsexplorer.com.br/ranking'
header ={'user-agent':'Mozilla/5.0'}
lendo_url = requests.get(url, headers = header)

lendo_url2 = lendo_url.text
# lendo_url2
soup = BeautifulSoup(lendo_url.content,'html.parser')
listona = []

for i in soup.find_all('td'):
    listona.append(i.string)
indice = 0
listona_separado_linhas = []
while indice < len(listona):
    lista_provisoria=[]
    for z in range(indice,indice+25):
        lista_provisoria.append(listona[z])
    listona_separado_linhas.append(lista_provisoria)
    indice += 26
# listona_separado_linhas
df_fundos = pd.DataFrame(listona_separado_linhas, columns =['Código do fundo', 'Setor', 'Preço atual','Liquidez','Dividendo','Dividend Yield','DY 3M','DY 6M','DY 12M','DY 3M media','DY 6M media','DY 12M media','DY ANO','Variação Preço','Rentab. Período','Retab. Acum.','Patrimônio Líq.','VPA','P/VPA','DY PATR.','Varia. Patri.','Rentab. Patr.', 'Vacância Física','Vacância Financeira','Quantidade de ativos'])
df_fundos.index = df_fundos["Código do fundo"]
df_fundos.drop(labels='Código do fundo', axis=1, inplace=True)

df_fundos.to_excel("Lista_indicadores_fundo.xlsx")

In [6]:
df_fundos

Unnamed: 0,Código do fundo,Setor,Preço atual,Liquidez,Dividendo,Dividend Yield,DY 3M,DY 6M,DY 12M,DY 3M media,...,Retab. Acum.,Patrimônio Líq.,VPA,P/VPA,DY PATR.,Varia. Patri.,Rentab. Patr.,Vacância Física,Vacância Financeira,Quantidade de ativos
0,FIVN11,Shoppings,"R$ 2,43",3013.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"0,00%","R$ 65.805.766,28","R$ 6,99",035,,,,,"56,00%",
1,BZLI11,Títulos e Val. Mob.,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"1,14%","R$ 432.739.853,66","R$ 10,89",135,,,,,,
2,XTED11,Lajes Corporativas,"R$ 6,28",578.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-37,83%","R$ 27.341.371,70","R$ 14,12",044,,,,,"0,00%","100,00%"
3,ALMI11,Lajes Corporativas,"R$ 989,00",28.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-28,29%","R$ 250.264.016,46","R$ 2.251,04",044,,,,,"68,15%",
4,PABY11,Híbrido,"R$ 9,19",1511.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-31,62%","R$ -8.246.025,21","R$ -10,87",-085,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
268,SPTW11,Lajes Corporativas,"R$ 45,47",4870.0,"R$ 0,40","0,86%","4,22%","6,85%","22,07%","1,41%",...,"-33,61%","R$ 93.875.642,24","R$ 52,21",087,,,,,"0,00%",
269,VTLT11,Logística,"R$ 91,38",4669.0,"R$ 0,75","0,78%","2,35%","4,62%","8,69%","0,78%",...,"-10,00%","R$ 218.154.340,14","R$ 103,15",089,,,,,"0,00%","0,00%"
270,RFOF11,Títulos e Val. Mob.,"R$ 70,96",4232.0,"R$ 0,64","0,85%","2,59%","4,96%","9,38%","0,86%",...,"-8,57%","R$ 93.232.405,03","R$ 86,47",082,,,,,,
271,GALG11,Híbrido,"R$ 98,57",5077.0,"R$ 0,84","0,82%","2,48%","4,86%","9,38%","0,83%",...,"1,80%","R$ 558.924.528,85","R$ 99,58",099,,,,,"0,00%","0,00%"


In [243]:
df_fundos.replace('N/A',"0")

Unnamed: 0_level_0,Setor,Preço atual,Liquidez,Dividendo,Dividend Yield,DY 3M,DY 6M,DY 12M,DY 3M media,DY 6M media,...,Retab. Acum.,Patrimônio Líq.,VPA,P/VPA,DY PATR.,Varia. Patri.,Rentab. Patr.,Vacância Física,Vacância Financeira,Quantidade de ativos
Código do fundo,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
APTO11,Híbrido,"R$ 10,44",20.0,"R$ 0,03","0,30%",0,0,0,0,0,...,0,"R$ 39.476.292,41","R$ 9,84",106,0,0,0,0,0,0
FIVN11,Shoppings,"R$ 2,70",43981.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"0,00%","R$ 65.805.766,28","R$ 6,99",039,0,0,0,0,"56,00%",0
BZLI11,Títulos e Val. Mob.,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"1,14%","R$ 432.739.853,66","R$ 10,89",135,0,0,0,0,0,0
XTED11,Lajes Corporativas,"R$ 6,20",210.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-37,83%","R$ 27.341.371,70","R$ 14,12",044,0,0,0,0,"0,00%","100,00%"
ALMI11,Lajes Corporativas,"R$ 1.012,11",27.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-28,29%","R$ 250.264.016,46","R$ 2.251,04",045,0,0,0,0,"68,15%",0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
CXCE11B,Outros,"R$ 45,69",645.0,"R$ 0,37","0,82%","2,31%","6,60%","12,74%","0,77%","1,10%",...,"-49,63%","R$ 110.977.715,16","R$ 64,79",071,0,0,0,0,"0,00%",0
MFAI11,Híbrido,"R$ 75,90",537.0,"R$ 1,06","1,44%","3,14%","5,41%","10,04%","1,05%","0,90%",...,"-30,62%","R$ 24.864.912,55","R$ 82,02",093,0,0,0,0,0,0
RBVO11,Outros,"R$ 12,35",176.0,"R$ 0,05","0,42%","0,91%","2,03%","3,46%","0,30%","0,34%",...,"-14,64%","R$ 11.981.470,71","R$ 23,23",053,0,0,0,0,0,0
CXTL11,Logística,"R$ 298,99",7.0,"R$ 0,75","0,25%","0,66%","1,28%","0,00%","0,22%","0,21%",...,"3,06%","R$ 37.044.254,22","R$ 691,16",043,0,0,0,0,"61,00%",0


In [190]:
# Processamento no df para selecionar mais fácil 
df_fundos["P/VPA"] = df_fundos["P/VPA"].apply(lambda x: float(x.replace(',','.')) if x != "N/A" else 0) 

ticker = df_fundos["P/VPA"][ticker]

list(df_fundos[df_fundos["Código do fundo"] == "CXCE11B"].reset_index().iloc[0,1:])

# Tabela de indicadores fundamentalistas

In [7]:
import pandas as pd
import ssl

ssl._create_default_https_context = ssl._create_unverified_context 

url_link = "http://br.financas.yahoo.com/quote/SULA4.SA/key-statistics?p=SULA4.SA" 

r = requests.get(url_link, headers ={'User-Agent':'Mozilla/5.0'})
read_html_pandas_data = pd.read_html(r.text)


# Indicadores fundamentalistas para ações

In [27]:
import pandas as pd 
import requests
from bs4 import BeautifulSoup

In [360]:
Input_ticker = 'ASAI3'

# Aquisição do HTML
url_indicadores = 'https://statusinvest.com.br/acoes/{}'
url_indicadores2 = url_indicadores.format(Input_ticker)

headers = {'User-Agent':'Mozilla/5.0'}
url_requests = requests.get(url_indicadores2,headers = headers)
soup = BeautifulSoup(url_requests.text,'html.parser')

# Localização dos dados alvo
lista_recebe_alvos = []
for i in soup.find_all('div','info special w-100 w-md-33 w-lg-20'):
    lista_recebe_alvos.append((i.find('h3').string, i.find('strong').string))
        
for i in soup.find_all('div',{'title':'Valorização no preço do ativo com base nos últimos 12 meses'}):
    lista_recebe_alvos.append((i.find('h3').string, i.find('strong').string))
    
lista_recebe_alvos

for i in soup.find_all('div',["w-50 w-sm-33 w-md-25 w-lg-50 mb-2 mt-2 item",'w-50 w-sm-33 w-md-25 w-lg-16_6 mb-2 mt-2 item']):
    lista_recebe_alvos.append((i.find('h3').string,i.find('strong').string))
lista_recebe_alvos

df_indices_statusinvest = pd.DataFrame(lista_recebe_alvos, columns = ['Indicador','Valor'])

In [362]:
# Separando os indicadores desejados 
indices_acoes = {'Acao': Input_ticker}
indices_acoes['ROE'] = df_indices_statusinvest.loc[df_indices_statusinvest['Indicador'].isin(['ROE']), "Valor"].item()
indices_acoes['ROIC'] = df_indices_statusinvest.loc[df_indices_statusinvest['Indicador'].isin(['ROIC']), "Valor"].item()
indices_acoes['Liq. corrente'] = df_indices_statusinvest.loc[df_indices_statusinvest['Indicador'].isin(['Liq. corrente']), "Valor"].item()
indices_acoes['M. Líquida'] = df_indices_statusinvest.loc[df_indices_statusinvest['Indicador'].isin(['M. Líquida']), "Valor"].item()
indices_acoes['CAGR Receitas 5 anos'] = df_indices_statusinvest.loc[df_indices_statusinvest['Indicador'].isin(['CAGR Receitas 5 anos']), "Valor"].item()
indices_acoes['P/L'] = df_indices_statusinvest.loc[df_indices_statusinvest['Indicador'].isin(['P/L']), "Valor"].item()

indices_acoes

{'Acao': 'ASAI3',
 'ROE': '73,65%',
 'ROIC': '16,14%',
 'Liq. corrente': '0,97',
 'M. Líquida': '5,80%',
 'CAGR Receitas 5 anos': '-%',
 'P/L': '9,82'}

# Indicadores para fundos

In [71]:
url_FII = 'https://www.fundsexplorer.com.br/ranking'
header ={'user-agent':'Mozilla/5.0'}
lendo_url = requests.get(url_FII, headers = header)

soup = BeautifulSoup(lendo_url.content,'html.parser')

listona = []
for i in soup.find_all('td'):
    listona.append(i.string)

indice = 0
listona_separado_linhas = []
while indice < len(listona):
    lista_provisoria=[]
    for z in range(indice,indice+25):
        lista_provisoria.append(listona[z])
    listona_separado_linhas.append(lista_provisoria)
    indice += 26

df_fundos = pd.DataFrame(listona_separado_linhas, columns =['Código do fundo', 'Setor', 'Preço atual','Liquidez','Dividendo','Dividend Yield','DY 3M','DY 6M','DY 12M','DY 3M media','DY 6M media','DY 12M media','DY ANO','Variação Preço','Rentab. Período','Retab. Acum.','Patrimônio Líq.','VPA','P/VPA','DY PATR.','Varia. Patri.','Rentab. Patr.', 'Vacância Física','Vacância Financeira','Quantidade de ativos'])
df_fundos.index = df_fundos["Código do fundo"]
df_fundos.drop(labels='Código do fundo', axis=1, inplace=True)

df_fundos.style

Unnamed: 0_level_0,Setor,Preço atual,Liquidez,Dividendo,Dividend Yield,DY 3M,DY 6M,DY 12M,DY 3M media,DY 6M media,DY 12M media,DY ANO,Variação Preço,Rentab. Período,Retab. Acum.,Patrimônio Líq.,VPA,P/VPA,DY PATR.,Varia. Patri.,Rentab. Patr.,Vacância Física,Vacância Financeira,Quantidade de ativos
Código do fundo,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1
FIVN11,Shoppings,"R$ 2,10",27114.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","0,00%","0,00%","R$ 65.805.766,28","R$ 6,99",30.0,,,,,"56,00%",
BZLI11,Títulos e Val. Mob.,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,68%","0,68%","1,14%","R$ 432.739.853,66","R$ 10,89",135.0,,,,,,
XTED11,Lajes Corporativas,"R$ 6,21",489.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","1,10%","1,10%","-37,83%","R$ 27.341.371,70","R$ 14,12",44.0,,,,,"0,00%","100,00%"
ALMI11,Lajes Corporativas,"R$ 965,00",21.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","2,27%","2,27%","-28,29%","R$ 250.264.016,46","R$ 2.251,04",43.0,,,,,"68,15%",
PABY11,Híbrido,"R$ 9,01",51.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","-19,84%","-19,84%","-31,62%","R$ -7.949.662,93","R$ -10,48",-86.0,,,,,,
ORPD11,Títulos e Val. Mob.,"R$ 128,79",1.0,"R$ 1,38",,,,,,,,,,,,"R$ 44.218.407,47","R$ 152,48",84.0,,,,,,
FATN11,Híbrido,"R$ 101,99",64.0,"R$ 0,79","0,80%","2,22%","4,28%","8,19%","0,74%","0,71%","0,68%","8,19%","-4,41%","-3,64%","6,71%","R$ 82.067.157,50","R$ 101,18",101.0,,,,,"0,00%",
BIME11,,"R$ 9,55",6424.0,"R$ 0,10","1,05%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","1,05%","0,00%","1,05%","1,05%","R$ 55.918.188,04","R$ 9,57",100.0,,,,,,
SCPF11,Shoppings,"R$ 7,59",259.0,"R$ 0,03","0,39%","0,74%","1,45%","3,03%","0,25%","0,24%","0,25%","2,19%","0,00%","0,39%","-17,29%","R$ 52.548.899,51","R$ 12,51",61.0,,,,,"27,90%",
FISC11,Lajes Corporativas,"R$ 165,00",200.0,"R$ 0,22","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","0,00%","0,00%","R$ 251.458.437,24","R$ 153,06",108.0,,,,,,


In [125]:
fundo_teste = 'XPLG11'
indices_fundos = {'FII': fundo_teste}
indices_fundos['Preço'] = df_fundos['Preço atual'][fundo_teste]
indices_fundos['DY 12 M'] = df_fundos['DY 12M'][fundo_teste]
indices_fundos['Vacância Financeira'] = df_fundos['Vacância Financeira'][fundo_teste]
indices_fundos['P/VPA'] = df_fundos['P/VPA'][fundo_teste] 
indices_fundos['Dividendo'] = df_fundos['Dividendo'][fundo_teste]
indices_fundos['Magic Number'] = str(round(float(df_fundos['Preço atual'][fundo_teste].replace('R$ ','').replace(',','.')) / 
                                     float(df_fundos['Dividendo'][fundo_teste].replace('R$ ','').replace(',','.')), 2)).replace('.',',')


In [132]:
indices_fundos

{'FII': 'XPLG11',
 'Preço': 'R$ 97,09',
 'DY 12 M': '7,01%',
 'Vacância Financeira': '9,00%',
 'P/VPA': '0,89',
 'Dividendo': 'R$ 0,64',
 'Magic Number': '151,7'}

# Obtendo a lista de empresas listadas na bolsa

In [346]:
url = "https://www.infomoney.com.br/cotacoes/empresas-b3/"
headers = {'user-agent':'Mozilla/5.0'}
url_content = requests.get(url, headers)
soup = BeautifulSoup(url_content.content, 'html.parser')

firms = []
for each_tr in soup.find_all("tr"):
    # Extrai o nome da empresa
    aux = [each_tr.find('td', 'higher').string.strip() if each_tr.find('td', 'higher') != None else None]
    
    # Extrai as variações de ticker
    for each_a in each_tr.find_all('a'):
        aux.append(each_a.string)
        
    firms.append(aux)
    
firms = list(filter(lambda x: True if None not in x else False, firms)) #retira os Nones
firms.sort()

In [349]:
url = "https://www.infomoney.com.br/cotacoes/empresas-b3/"
headers = {'user-agent':'Mozilla/5.0'}
url_content = requests.get(url, headers)
soup = BeautifulSoup(url_content.content, 'html.parser')

firms = []
# Varre o código html para extrair informações desejadas
for each_tr in soup.find_all("tr"):
    # Extrai o nome da empresa
    firm_name = each_tr.find('td', 'higher').string.strip() if each_tr.find('td', 'higher') != None else None
    
    tckrs_list = []
    # Extrai as variações de ticker
    for each_a in each_tr.find_all('a'):
        tckrs_list.append(each_a.string)
    
    # Relacionando cada ticker a sua empresa
    for tckr in tckrs_list:
        firms.append([firm_name, tckr])

firms = list(filter(lambda x: True if None not in x else False, firms)) #retira os Nones
firms.sort()

In [351]:
# Escrevendo a lista de saída em um arquivo csv
file_name = 'empresas_listadas.csv'

with open(file_name, mode='w') as csv_file:
    # Cria o ponteiro para a escrita do arquivo csv
    writer = csv.writer(csv_file)
    
    # Escreve todas a linhas de uma só vez sem necessidade de loop
    writer.writerows(firms)

In [355]:
# Ler o arquivo csv e transformar fazer a lista de opções para o filtro
def read_csv_file(file_path):
    output_list = []
    
    with open(file_path, mode='r', newline='\n') as csv_file:
        # Cria o ponteiro para a escrita do arquivo
        reader = csv.reader(csv_file)
        
        # Transfere as linhas para a lista
        for line in reader:
            output_list.append(line)
    
    return output_list

options = tuple([element[1] + " (" + element[0] + ")" for element in read_csv_file("empresas_listadas.csv")])

In [296]:
# Exemplo de retirada de Nones utilização do filter
def check_None(teste):
    for e in teste:
        if e != None:
            for a in e:
                if a != None:
                    return True
            else:
                return True
        return False

new_lista = list(filter(check_None, teste)) #retira os Nones