### 1. Configuraçoes Iniciais

#### Imports

In [103]:
import requests
import pandas as pd
import numpy as np
import os

#### Importando dados do funds explorer

In [104]:
url = 'https://www.fundsexplorer.com.br/ranking'

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36'' (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36'}

response = requests.get(url, headers=headers)

if response.status_code == 200:
    df = pd.read_html(response.content, encoding='utf-8')[0]

#### Exibindo os dados

In [105]:
# df.sort_values('Código do fundo', inplace=True) #classifica os dados utilizando o código do fundo

# display(df) #imprime o DF
# df.info() # exibe o tipo de dados de cada coluna
# df.describe(include='all')
# df['Setor'].unique() #dados univos da coluna de setor
# df.columns


### 2. Limpeza e Formatação de Dados

In [106]:
#df.isna().sum() #mostra os dados NA

#### Dados categóricos

In [107]:
categorical_columns = ['Código do fundo','Setor'] #cria uma variavel para as colunas categoricas
idx = df[df['Setor'].isna()].index #mostra quais linhas possuem dados NA
#print(df[categorical_columns].isna().sum()) #mostra a soma de todas as linhas com NA
df.drop(idx, inplace=True) #apaga estas linhas
#df[categorical_columns].isna().sum() #mostra a soma de todas as linhas com NA
df[categorical_columns] = df[categorical_columns].astype('category') # define as colunas ocmo categoricas
#df.info()

#### Dados Numéricos

In [108]:
col_floats = list(df.iloc[:,2:-1].columns) #Seleciona da terceira até a penultima linha 
#print(col_floats)
df[col_floats] = df[col_floats].fillna(value=0) #substitui os dados NA por zero
df[col_floats] #valida se existe ainda dados nulos
df[col_floats] = df[col_floats].applymap(lambda x: str(x).replace('R$', '').replace('.0','').replace('.','').replace('%','').replace(',','.')) #limpa os dados removendo caracteres inuteis
df[col_floats] = df[col_floats].astype('float') #define as colunas como float
#df.info()
#df.describe()

##### Dados de P/VPA tem atributos infinitos e está em uma escala diferente

In [109]:
df = df.replace([np.inf, -np.inf], np.nan)  # Converter infinitos para NaN
df = df.dropna() #apaga os dados NA
df['P/VPA'] = df['P/VPA']/100 #convertendo P/VPA para
#df.describe()
#df

### 3. Analises (DF)

In [176]:
indicadores = ['Código do fundo','Setor', 'Preço Atual','DY (12M) Acumulado', 'Vacância Física', 'Vacância Financeira', 'P/VPA', 'Quantidade Ativos', 'Liquidez Diária']
indicadoresf = ['DY (12M) Acumulado', 'Vacância Física', 'Vacância Financeira', 'P/VPA', 'Quantidade Ativos', 'Liquidez Diária']

#### Média por Setor

In [111]:
#df.columns #exibe o nome de cabeçalho de todas as colunas do data set DF
df_aux = df[indicadores] #filtra o df pelos  cabeçalhos
media_setor = df_aux.groupby('Setor')[indicadoresf].agg(['mean']) #calcula a media dos indicadores agrupado por setor
media_setoru = media_setor.loc['Hotel', ('P/VPA', 'mean')]

#### Criando uma função com uma estratégia para oportunidades do mercado

In [124]:
def oportunidade_media_setor(df, setor, label_setor='Setor'):
    
    media_setor = df.groupby('Setor')[indicadoresf].agg(['mean']) #calcula a média dos indicadores do setor escolhido
    
    df_setor = df[df[label_setor].isin([setor])]
    
    filter_ = \
            (df_setor['Quantidade Ativos'] > 1) &\
            (df_setor['Liquidez Diária'] > 1) &\
            (df_setor['P/VPA'] < 2.0) &\
            (df_setor['DY (12M) Acumulado'] > media_setor.loc[setor, ('DY (12M) Acumulado','mean')]) 
            
    print('média do setor Yield: {}'.format(media_setor.loc[setor, ('DY (12M) Acumulado','mean')]))
    print('média do setor p/VPA: {}'.format(media_setor.loc[setor, ('P/VPA','mean')]))
    print('média do setor Ativos: {}'.format(media_setor.loc[setor, ('Quantidade Ativos','mean')]))
    
    return df_setor[filter_]

In [119]:
#list(df['Setor'].unique()) #mostra os setores do filtro selecionado

In [None]:
dataframe = df_aux
setorF = 'Híbrido'
oportunidade = oportunidade_media_setor(dataframe, setorF)
oportunidade.sort_values('DY (12M) Acumulado', ascending=False, inplace=True)
oportunidade

### 4. Analises (FIIs Pessoais)

#### 4.1 Importacao de Tickets via CSV

In [None]:
os.chdir("C:/Users/luis-/projetos/Python/analise-acoes/") #selecionando o diretorio do arquivo CSV a ser lido
tickets = pd.read_csv("./tickets.csv", sep = ',') #importando dados de um csv utilizando o pandas
tickets = tickets['Ativo'].tolist() #convertendo o data frame para lista
filtro = df.iloc[:, 0].isin(tickets) #filtando os dados utilizando as acoes do arquivo csv
df_filtro = df.loc[filtro]
display(df_filtro)

In [179]:
df_auxp = df_filtro[indicadores] #filtra o df pelos  cabeçalhos
filter_ = (df_aux['P/VPA'] < 1.01) & (df_aux['P/VPA'] > 0.85)
df_auxp = df_auxp[(filter_)].sort_values(['P/VPA'])
display(df_auxp)

  df_auxp = df_auxp[(filter_)].sort_values(['P/VPA'])


Unnamed: 0,Código do fundo,Setor,Preço Atual,DY (12M) Acumulado,Vacância Física,Vacância Financeira,P/VPA,Quantidade Ativos,Liquidez Diária
308,BRCO11,Logística,108.5,7.85,0.0,0.0,0.89,10,29879.0
165,XPLG11,Logística,105.19,8.86,8.8,1.2,0.92,13,25809.0
86,PVBI11,Lajes Corporativas,96.21,7.55,0.1,0.0,0.94,4,25668.0
70,KNRI11,Híbrido,153.49,7.8,2.0,6.72,0.96,20,23916.0
323,BTLG11,Logística,97.99,9.1,0.0,2.0,0.99,16,37684.0
107,HGRU11,Híbrido,124.17,9.77,0.0,0.0,1.0,17,25568.0


In [161]:
list(df_auxp['Setor'].unique()) #mostra os setores do filtro selecionado

['Logística', 'Híbrido', 'Lajes Corporativas', 'Títulos e Val. Mob.', 'Outros']

In [None]:
oportunidade = oportunidade_media_setor(df_auxp, setor='Lajes Corporativas')
oportunidade.sort_values('DY (12M) Acumulado', ascending=False, inplace=True)
oportunidade