# Objetivo deste projeto

- Ajudar pessoas através das vakinhas do site (vakinha.com.br)


# Valor mínimo da doação

- R$ 25,00


# Como?

Escolher uma vakinha é dificil, pois julgar quem pode ser beneficiado primeiro entre **a saúde de um animal**, **a saúde de um ser humano** ou **o sonho de vida de alguém** tem muitas variáveis envolvidas. Pensando nisso, resolvi fazer a seguite análise.

- Pegar todas as vakinhas cadastradas que ainda não atingiram o seu objetivo
- Calcular o indicadores de **PA e PN**

---

- PA é a porcentagem do objetivo já foi alcançado
- PN é o número de pessoas que ainda são necessárias para alcançar o objetivo

A ideia dos indicadores é **encontra a vakinha que está prestes a ser finalizada**, ou seja, **está chegando no seu objetivo** independente do que ela se trata.

Na lista final você ordenar por

- PA, então verá vakinhas que estão chegando ao seu objeto, seu PA está perto de 100%, mas que para chegar em 100% pode ser precisar de muitas pessoas doando. (admitindo o valor mínimo de doação).
- PN, você verá vakinhas que estão chegando ao seu objetivo, seu PN está próximo de 1, e seu PA não tem relevancia.

Sendo assim, na minha visão, é melhor ordenar por PN, ao invés de PA.

Segue um exemplo para ficar claro.

**Vakinha 1**: PA = 96.25 e PN = 6

**Vakinha 2**: PA = 85 e PN = 3

Se 3 pessoas ajudar com a **Vakinha 2**, ela será concluida, mesmo seu PA sendo **85%** (85% já concluida), já para a **Vakinha 1** é preciso 6 pessoas, mas seu PA é **96.25** (96.25% já concluida).


## Então, ordene por PN (number_of_people) e ajude muitas pessoas, animais e quem precisar :)

In [1]:
import glob
import math
import pandas as pd
import world_bank_data as wb

%matplotlib inline
MINIMUM_DONATE = 25

file_list = glob.glob('src/vakinha*.json')
file_list.sort(reverse = True)

df = pd.read_json(file_list[0])

# Número de vakinhas antes da limpesa de dados

In [2]:
len(df)

484

In [3]:
def clean_price_data(value):
    value = value.replace(',00', '')
    value = value.replace('R$', '')
    value = value.replace('.', '')
    value = value.replace(',', '.')
    return float(value)

df['collected'] = df['collected'].apply(lambda value: clean_price_data(value))
df['goal'] = df['goal'].apply(lambda value: clean_price_data(value))
df['different'] = df.apply(lambda row: row.goal - row.collected, axis=1)
df['percentage_goal'] = df.apply(lambda row: ((row.collected * 100) / row.goal), axis=1)
df['number_of_people'] = df.apply(lambda row: math.ceil(row.different / MINIMUM_DONATE), axis=1)

# Filtar apenas colunas importantes

In [4]:
df = df.filter(items=['title', 'link', 'percentage_goal', 'number_of_people'])

# Remove da lista vakinhas que já alcançaram seu objetivo

In [5]:
df = df[df.percentage_goal < 100]
len(df)

461

# Lista de vakinhas

Agora é possível ordenar por `percentage goal` ou `number_of_people`.

O principal objetivo é escolher uma vakinha que não precise de muitas pessoas para chegar no objetivo da mesma.

In [6]:
df

Unnamed: 0,title,link,percentage_goal,number_of_people
0,Vaquinha Para O Tratamen...,http://vaka.me/674387,2.800000,389
1,Ajuda Para Moradia (Viol...,http://vaka.me/673926,21.500000,63
2,Ajude Na Cirurgia Do Gat...,http://vaka.me/673951,13.846154,45
3,Casa Da Sra. Loiva De Ol...,http://vaka.me/673897,1.400000,986
4,Campanha Gean Em Madrid,http://vaka.me/673829,4.352941,326
5,Cadeira Do Ismael,http://vaka.me/673847,23.828279,155
6,Ajude Dr Fábio,http://vaka.me/673848,28.000000,144
7,Salvem Meu Bichinho,http://vaka.me/673838,30.000000,14
8,Ajuda A Igreja Icer Jard...,http://vaka.me/673961,6.825000,746
9,Vamos Ajudar O Denis,http://vaka.me/673904,0.875000,2379
