<a href="https://colab.research.google.com/github/borgesf/Fomula_Magica_Greenblatt/blob/main/Magic_Formula_Greenblatt.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Fórmula Mágica - Joel Greenblat

### Autor: Filipe Borges (f3l5p7@yahoo.com.br)
### [Fonte](https://www.youtube.com/watch?v=e_ZRDG4F4ZA&list=PLCAhGm8nJ9CBn51o0x3j1p1LuMRqpeqCy&index=8)
### Data da Versão: 23/04/2021


\\

Notebook para gerar um *ranking* de ações da Bovespa, seguinte critérios de liquidez diária, ROIC e P/L. Fonte dos dados: [Fundamentus](https://www.fundamentus.com.br)

## 1 - Importando Bibliotecas e Carregando Dados

In [2]:
import pandas as pd
import requests
# import string

# import warnings
# warnings.filterwarnings('ignore')

url = 'http://www.fundamentus.com.br/resultado.php'
header = {
  "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36"  
 }

r = requests.get(url, headers=header)
df = pd.read_html(r.text,  decimal=',', thousands='.')[0]

# Pre-processamento dos dados: troca ',' por '.' em alguns decimais, e converte strings para float

for coluna in ['Div.Yield', 'Mrg Ebit', 'Mrg. Líq.', 'ROIC', 'ROE', 'Cresc. Rec.5a']:
  df[coluna] = df[coluna].str.replace('.', '')
  df[coluna] = df[coluna].str.replace(',', '.')
  df[coluna] = df[coluna].str.rstrip('%').astype(float) / 100

## Filtros de liquidez e "qualidade" - P/L e ROE

In [10]:
# Filtro de Liquidez: > 1 Milhão/2 meses
df = df[df['Liq.2meses'] > 1000000]

# Rankeamento - P/L (>0) e ROE
ranking = pd.DataFrame()
ranking['position'] = range(1,151)
ranking['P/L'] = df[df['P/L'] > 0].sort_values(by=['P/L'])['Papel'][:150].values
ranking['ROE'] = df.sort_values(by=['ROE'], ascending=False)['Papel'][:150].values

# Variaveis auxiliares para gerar ranking final - Imprime os 15 primeiros
aux_a = ranking.pivot_table(columns='P/L', values='position')
aux_b = ranking.pivot_table(columns='ROE', values='position')
aux_full=pd.concat([aux_a,aux_b])
Final_Rank = aux_full.dropna(axis=1).sum()
Final_Rank.sort_values()[:15]

MRFG3     11
TAEE3     39
TAEE11    39
TASA4     39
TASA3     39
TAEE4     39
ETER3     40
CYRE3     44
WIZS3     45
BEEF3     47
SULA11    48
GPCP3     49
CESP6     50
TRPL4     50
BRDT3     51
dtype: int64

## Filtros de liquidez e "qualidade" alternativo - EV/EBIT e ROIC (NÃO VALE PARA FINANCEIRAS E BANCOS!!!)

In [11]:
# Filtro de Liquidez: > 1 Milhão/2 meses
df = df[df['Liq.2meses'] > 1000000]

# Rankeamento - P/L (>0) e ROE
ranking = pd.DataFrame()
ranking['position'] = range(1,151)
ranking['EV/EBIT'] = df[df['EV/EBIT'] > 0].sort_values(by=['EV/EBIT'])['Papel'][:150].values
ranking['ROIC'] = df.sort_values(by=['ROIC'], ascending=False)['Papel'][:150].values

# Variaveis auxiliares para gerar ranking final - Imprime os 15 primeiros
aux_a = ranking.pivot_table(columns='EV/EBIT', values='position')
aux_b = ranking.pivot_table(columns='ROIC', values='position')
aux_full=pd.concat([aux_a,aux_b])
Final_Rank = aux_full.dropna(axis=1).sum()
Final_Rank.sort_values()[:15]

PSSA3      5
WIZS3      6
MRFG3     15
PLPL3     20
VALE3     26
TIET11    35
TASA4     40
BEEF3     42
TASA3     43
TRPL4     45
CMIN3     45
ALUP11    48
AURA33    51
USIM5     58
SAPR11    61
dtype: int64