## Desafio 

Considerando um capital para investimento de R\$1.000.000 e as seguintes op√ß√µes de investimento:

| Op√ß√£o  | Descri√ß√£o                                         | Custo do investimento (R\$) | Retorno esperado (R\$) |
|:-------:|---------------------------------------------------|:---------------------------:|:----------------------:|
| 1     | Amplia√ß√£o da capacidade do armaz√©m ZDP em 5%      |           470.000           |         410.000        |
| 2     | Amplia√ß√£o da capacidade do armaz√©m MGL em 7%      |           400.000           |         330.000        |
| 3     | Compra de empilhadeira                            |           170.000           |         140.000        |
| 4     | Projeto de P&D I                                  |           270.000           |         250.000        |
| 5     | Projeto de P&D II                                 |           340.000           |         320.000        |
| 6     | Aquisi√ß√£o de novos equipamentos                   |           230.000           |         320.000        |
| 7     | Capacita√ß√£o de funcion√°rios  |            50.000           |         90.000         |
| 8     | Amplia√ß√£o da estrutura de carga rodovi√°ria        |           440.000           |         190.000        |

Desenvolva um algoritmo de otimiza√ß√£o para selecionar os projetos que maximizam o retorno total esperado, considerando que:

* Se o investimento 1 for selecionado, ent√£o o investimento 5 n√£o deve ser;
* Se o investimento 2 for selecionado, ent√£o o investimento 4 tamb√©m deve ser.


Prepare uma apresenta√ß√£o demonstrando os resultados da atividade. Sua apresenta√ß√£o deve ser no formato de **pitch**, deve durar **at√© 15 minutos**, e deve conter as seguintes se√ß√µes:
  * "Quem sou eu?": uma breve apresenta√ß√£o sobre voc√™ e sua forma√ß√£o;
  * "Qual o problema estou resolvendo?";
  * "Como eu resolvi o problema?";
  * Resultados e An√°lises.

# 1) Quem sou eu?
Ol√°, me chamo Gabriel Costa e tenho 20 anos, sou natural de Guarulhos, S√£o Paulo. Curso F√≠sica - Bacharel na Universidade Federal de Ouro Preto (UFOP) desde o primeiro semestre de 2019, com formatura prevista para o primeiro semestre de 2024.

Venho estudando desenvolvimento de software nos √∫ltimos tr√™s anos, atualmente me aperfei√ßoando em Python, uma linguagem vers√°til e muito simples para o desdobramento de problemas complexos.

Alguns trabalhos recentes: Estudo de s√©ries temporais, minera√ß√£o de dados, machine learning e pr√©-processamento de datasets em Python.

A Universidade e o curso me trouxeram a bagagem crucial sobre investiga√ß√£o da realidade e desenvolvimento do m√©todo cient√≠fico, sendo este parte fundamental do processo de an√°lise e produ√ß√£o do conhecimento. Al√©m disso trago v√°rias experi√™ncias amalgamadas em meu curr√≠culo, desde trabalhos informais at√© gerenciamento de pessoas, ferramentas (como PhotoShop e Git) e linguagens (como Latex, JavaScript, C e C++, entre outros).

**Link do meu curr√≠culo:** [Curr√≠culo - Gabriel Costa](https://drive.google.com/file/d/17_jHba1gGsnb3wF1uUFjTLrEEgOGNMQg/view?usp=sharing) üòã

**Link do meu GitHub:** [Perfil - GitHub](https://github.com/gabrielxcosta) üíª

**Link do meu LinkedIn:** [Perfil - LinkedIn](https://www.linkedin.com/in/gabxcostaxf/) üí•

![Perfil](https://media-exp1.licdn.com/dms/image/C4E03AQGyxCtU74dUgg/profile-displayphoto-shrink_200_200/0/1613416376199?e=1665619200&v=beta&t=rHIUorEn9fpMmQ2rgemTtswxnq4P-tCn3UwXvfELFiE)

# 2) Qual problema estou resolvendo?

![Ilustra√ß√£o do problema](https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Knapsack.svg/500px-Knapsack.svg.png)

Um exemplo de **problema da mochila 0-1** ou **mochila bin√°ria** √© a sele√ß√£o de projetos. 

Dados $n$ projetos e um capital $b$ para investimento. O projeto $j$ tem um custo $a_{j}$ e um retorno esperado $p_{j}$. O problema consiste em selecionar os projetos que maximizam o retorno total esperado sem ultrapassar o limite de capital.

Sendo $x_{j} = 1$ se o projeto $j$ foi escolhido ou $x_{j} = 0$ caso contr√°rio. 

$$max \sum_{j=1}^{n} p_{j}x_{j}$$

**Sujeito as restri√ß√µes:**

$$\sum_{j=1}^{n} a_{j}x_{j} ‚â§ b$$


$$x_{j} \in [{0, 1}]$$
$$j = 1, 2, ..., 7, 8$$

*Se o investimento 1 √© selecionado ent√£o o investimento 5 n√£o deve ser:*

<center>$x_{1} = 1 \to x_{5} = 0$ </center>

*Se o investimento 2 for selecionado, ent√£o o investimento 4 tamb√©m deve ser:*

<center>$x_{2} = 1 \to x_{4} = 1$ </center>

# 3) Como eu resolvi o problema?

### 3.1) Importando os m√≥dulos de interesse:

In [1]:
!pip install science_optimization
from science_optimization.builder import (
    BuilderOptimizationProblem,
    Variable,
    Constraint,
    Objective,
    OptimizationProblem
)
from science_optimization.function import (
    FunctionsComposite, 
    LinearFunction,
)
from science_optimization.solvers import Optimizer
from science_optimization.algorithms.linear_programming import Glop
from dataclasses import dataclass
from typing import List
import pandas as pd
import numpy as np

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting science_optimization
  Downloading science_optimization-0.8.0.tar.gz (239 kB)
[K     |‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 239 kB 19.6 MB/s 
Collecting decorator~=5.1
  Downloading decorator-5.1.1-py3-none-any.whl (9.1 kB)
Collecting matplotlib~=3.4
  Downloading matplotlib-3.5.3-cp37-cp37m-manylinux_2_5_x86_64.manylinux1_x86_64.whl (11.2 MB)
[K     |‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 11.2 MB 49.4 MB/s 
Collecting ortools~=9.1
  Downloading ortools-9.3.10497-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (15.5 MB)
[K     |‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 15.5 MB 38.1 MB/s 
Collecting Pillow~=8.4
  Downloading Pillow-8.4.0-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

### 3.2) Definindo listas com as ***descri√ß√µes, custos e retornos*** dos investimentos:

In [24]:
capital_limit = 10 ** 6

descriptions = ['Amplia√ß√£o da capacidade do armaz√©m ZDP em 5%', 'Amplia√ß√£o da capacidade do armaz√©m MGL em 7%',
                'Compra de empilhadeira', 'Projeto de P&D I', 'Projeto de P&D II', 'Aquisi√ß√£o de novos equipamentos',
                'Capacita√ß√£o de funcion√°rios', 'Amplia√ß√£o da estrutura de carga rodovi√°ria']

indexs = [int(n) for n in range(1, len(descriptions) + 1)]

profits = [
    410 * 1000, 330 * 1000, 140 * 1000, 250 * 1000, 320 * 1000, 320 * 1000, 90 * 1000, 190 * 1000
]

costs = [
    470 * 1000, 400 * 1000, 170 * 1000, 270 * 1000, 340 * 1000, 230 * 1000, 50 * 1000, 440 * 1000 	
]

### 3.3) Definindo a classe ***investimento***, al√©m de fun√ß√µes auxiliares:

In [25]:
@dataclass
class Investment:
    def __init__(self, index, description, profit, cost):
      self._index = index
      self._description = description
      self._profit = profit
      self._cost = cost      

    @property
    def index(self):
      return self._index

    @property
    def description(self):
        return self._description

    @property
    def profit(self):
        return self._profit

    @property
    def cost(self):
        return self._cost

    @property
    def ROI(self) -> float:
        return (self._profit - self._cost) / self._cost

# Fun√ß√£o para tabular os dados de cada investimento
def investments_to_table(investments: List[Investment]) -> pd.DataFrame: 
  records = [{
            'Investment': i.description,
            'Profit (R$)': i.profit,
            'Cost (-R$)': i.cost
        } for i in investments]
  records.append({
        'Investment': 'Total',
        'Profit (R$)': sum(i.profit for i in investments),
        'Cost (-R$)': sum(i.cost for i in investments)
    })
  df = pd.DataFrame.from_records(records)
  df.index = np.arange(1, len(df) + 1)
  return df

### 3.4) ***ROI*** como propriedade da classe ***investimento***?
Em finan√ßas, retorno sobre o investimento (em ingl√™s, **return on investment ou ROI**), tamb√©m chamado **taxa de retorno** (em ingl√™s, **rate of return ou ROR**), **taxa de lucro** ou simplesmente **retorno**, √© a rela√ß√£o entre a quantidade de dinheiro ganho (ou perdido) como resultado de um investimento e a quantidade de dinheiro investido. 

Em 1920 a Harvard Business Review referia-se ao ROI como a medida de an√°lise essencial para conhecer o valor do resultado de investimento de capital.

O seu conhecimento antecipado tem um impacto importante n√£o s√≥ no seio da organiza√ß√£o que gere o processo de investimento, como tamb√©m junto de potenciais investidores. Para al√©m da ‚Äúvenda‚Äù interna e externa do projecto, √© fundamental para o seu acompanhamento dando de uma forma clara o impacto no neg√≥cio face √†s metas pr√©-definidas.

$$ROI = \frac{(Profit ‚Äì Cost)}{Cost}$$

***Exemplo)*** Digamos que uma empresa investiu $R\$1.000,00$ em campanhas de marketing para a conquista de novos clientes. Depois de um tempo, o ganho total com novos neg√≥cios foi de $R\$ 10.000,00$. Assim, teremos:


$$ROI = \frac{(R\$10.000,00 ‚Äì R\$ 1.000,00)}{R\$1.000,00}$$


$$ROI = 9$$


$$ROI (\%) = 9 . 100 = 900\%$$

Como podemos ver, no caso do exemplo, o investimento na campanha de marketing foi muito bem-sucedido! O retorno foi de 9x o valor investido, ou 900%, tornando o neg√≥cio mais lucrativo!

Usaremos ent√£o o ROI como m√©trica para sortear nossos investimentos e escolhe-los do mais lucrativo para o menos lucrativo, sem ultrapassar nosso limite de capital.

### 3.5) Definindo a nossa ***heur√≠stica gulosa***:

In [67]:
def Greedy_Knapsack(
    capital_limit: float, 
    available_investments: List[Investment]
) -> List[Investment]:
    chosen_investments = list()

    # Os investimentos ser√£o ordenados de forma decrescente com base no nosso ROI
    sorted_investments = sorted(
        available_investments, 
        key=lambda i: i.ROI,
        reverse=True)

    is_chosen = set()

    # Para cada investimento nos investimentos ordenados:
    for investment in sorted_investments:
      # Se o indice dos investimentos for 1 ou 2:
      if investment.index == 1 or investment.index == 2: 
        is_chosen.add(investment.index) # Inclua-os no conjunto de escolhidos
      if investment.cost <= capital_limit: # Se o investimento atual da itera√ß√£o tiver um valor menor ou igual ao capital limite:
        if 1 in is_chosen and investment.index == 5: # Se o √≠ndice 1 est√° no nosso conjunto e o investimento da itera√ß√£o for o 5:
          continue # Pule para a pr√≥xima itera√ß√£o/N√£o o escolha
        if 2 in is_chosen and investment.index == 4: # Se o √≠ndice 2 est√° no nosso conjunto e o investimento da itera√ß√£o for o 4:
          chosen_investments.append(investment) # Inclua-o nos escolhidos
          capital_limit -= investment.cost  # Subtraia o custo do investimento do capital limite
        else: # Caso n√£o seja o investimento 1 ou o 2:
          chosen_investments.append(investment)
          capital_limit -= investment.cost
    return chosen_investments

### 3.6) Tabulando nossos ***investimentos*** e seus respectivos atributos:

In [68]:
# Zipando os √≠ndices, descri√ß√µes, retornos e custos dos investimentos e fazendo cast para tupla 
vars_comp = tuple(zip(indexs, descriptions, profits, costs))


# Com list comprehension crio uma lista de investimentos com respectivas descri√ß√µes,
# retornos e custos
available_investments = [Investment(i, d, p, c) for (i, d, p, c) in vars_comp]
investments_to_table(available_investments)

Unnamed: 0,Investment,Profit (R$),Cost (-R$)
1,Amplia√ß√£o da capacidade do armaz√©m ZDP em 5%,410000,470000
2,Amplia√ß√£o da capacidade do armaz√©m MGL em 7%,330000,400000
3,Compra de empilhadeira,140000,170000
4,Projeto de P&D I,250000,270000
5,Projeto de P&D II,320000,340000
6,Aquisi√ß√£o de novos equipamentos,320000,230000
7,Capacita√ß√£o de funcion√°rios,90000,50000
8,Amplia√ß√£o da estrutura de carga rodovi√°ria,190000,440000
9,Total,2050000,2370000


### 3.7) Testando nossa ***heur√≠stica gulosa***:

In [69]:
chosen_investments = Greedy_Knapsack(capital_limit, available_investments)
investments_to_table(chosen_investments)

Unnamed: 0,Investment,Profit (R$),Cost (-R$)
1,Capacita√ß√£o de funcion√°rios,90000,50000
2,Aquisi√ß√£o de novos equipamentos,320000,230000
3,Projeto de P&D II,320000,340000
4,Projeto de P&D I,250000,270000
5,Total,980000,890000


Nossa heur√≠stica gulosa obteve $R\$980000,00$ de retorno sobre os investimentos feitos. Nosso custo total foi de $R\$890000,00$. Vamos agora tentar maximizar nosso retorno olhando para o limite de capital que podemos investir.

### 3.8) Definindo a classe ***mochila*** e fun√ß√µes auxiliares para moldar e inicializar nosso problema de otimiza√ß√£o:

In [91]:
class Knapsack(BuilderOptimizationProblem):
    def __init__(
        self,
        capacity: float, 
        available_items: List[Investment]):

        self.__capacity = capacity
        self.__items = available_items
    
    @property
    def __num_vars(self) -> int:
        return len(self.__items)

    @property
    def __weights(self) -> np.array:
        return np.array([
            item.cost for item in self.__items
        ]).reshape(-1, 1)
    
    @property
    def __values(self) -> np.array:
        return np.array([
            item.profit for item in self.__items
        ]).reshape(-1, 1)


    def build_variables(self):
        x_min = np.zeros((self.__num_vars, 1))
        x_max = np.ones((self.__num_vars, 1))
        x_type=['d']*self.__num_vars # Discrete variable
        variables = Variable(x_min, x_max, x_type)

        return variables

    def build_constraints(self) -> Constraint:
        """Weights cannot exceed capacity"""
        # w * x - c <= 0
        constraint = LinearFunction(c=self.__weights, d=-self.__capacity)
        ineq_cons = FunctionsComposite()
        ineq_cons.add(constraint)
        constraints = Constraint(ineq_cons=ineq_cons)

        return constraints
    
    def build_objectives(self) -> Objective:
        # minimize -v*x
        obj_fun = LinearFunction(c=-self.__values)
        
        obj_funs = FunctionsComposite()
        obj_funs.add(obj_fun)
        objective = Objective(objective=obj_funs)

        return objective

def Optimization_Problem(
    capacity: float,
    available_items: List[Investment],
    verbose: bool = False
) -> OptimizationProblem:
    knapsack = Knapsack(capacity, available_items)
    problem = OptimizationProblem(builder=knapsack)
    if verbose:
        print(problem.info())
    return problem

def Run_Optimization(
    problem: OptimizationProblem,
    verbose: bool = False
) -> np.array:
    optimizer = Optimizer(
        opt_problem=problem,
        algorithm=Glop()
    )
    results = optimizer.optimize()
    decision_variables = results.x.ravel()
    if verbose:
        print(f"Decision variable:\n{decision_variables}")
    return decision_variables

def Knapsack_MILP(
    capacity: float, 
    items: List[Investment],
    verbose:bool = False) -> List[Investment]:
    
    problem = Optimization_Problem(capacity, 
                                   items, 
                                   verbose)
    
    decision_variables = Run_Optimization(problem, verbose)
    
    chosen_items = list()

    for item, item_was_chosen in zip(items, decision_variables):
        if item_was_chosen:
            chosen_items.append(item)
    return chosen_items

### 3.9) Testando nossa ***heur√≠stica MILP***:

In [92]:
chosen_investments = Knapsack_MILP(capital_limit, available_investments, verbose=True)
investments_to_table(chosen_investments)



Numbers of objectives: 1
Linear objective coefficients (c'x):
c =
[[-410000 -330000 -140000 -250000 -320000 -320000  -90000 -190000]]
Numbers of variables: 8
	 [0.] <= x_0 <= [1.]
	 [0.] <= x_1 <= [1.]
	 [0.] <= x_2 <= [1.]
	 [0.] <= x_3 <= [1.]
	 [0.] <= x_4 <= [1.]
	 [0.] <= x_5 <= [1.]
	 [0.] <= x_6 <= [1.]
	 [0.] <= x_7 <= [1.]
Inequality Linear Constraints (A*x <= b):
A =
[[470000 400000 170000 270000 340000 230000  50000 440000]]
b =
[[1000000]]
None
Decision variable:
[0. 1. 0. 1. 0. 1. 1. 0.]


Unnamed: 0,Investment,Profit (R$),Cost (-R$)
1,Amplia√ß√£o da capacidade do armaz√©m MGL em 7%,330000,400000
2,Projeto de P&D I,250000,270000
3,Aquisi√ß√£o de novos equipamentos,320000,230000
4,Capacita√ß√£o de funcion√°rios,90000,50000
5,Total,990000,950000


Nossa heur√≠stica MILP obteve $R\$990000,00$ de retorno sobre os investimentos feitos. Nosso custo total foi de $R\$950000,00$.

### 3.10) Fazendo testes de unidade na nossa ***heur√≠stica gulosa***:

In [84]:
import unittest

class TestGreedyKnapsack(unittest.TestCase):
    def test_if_no_available_investments_knapsack_is_empty(self):
        available_investments = list()
        capital_limit = 10 ** 6
        chosen_items = Greedy_Knapsack(capital_limit, available_investments)
        self.assertEqual(chosen_items, list())

    def test_single_item_is_chosen(self):
        available_investments = [Investment('ItemX', description='test', cost=1000, profit=10000)]
        capital_limit = 10 ** 6
        chosen_investments = Greedy_Knapsack(capital_limit, available_investments)
        self.assertEqual(chosen_investments, available_investments)
    
    def test_item_that_does_not_fit_in_backpack_is_not_chosen(self):
        light_item = Investment('ItemX', description='test', cost=150000, profit=200000)
        heavy_item = Investment('ItemY', description='test2', cost=1500000, profit=2000000)
        available_investments = [light_item, heavy_item]
        capital_limit = 10 ** 6
        chosen_investments = Greedy_Knapsack(capital_limit, available_investments)
        self.assertEqual(chosen_investments, [light_item])

unittest.main(argv=[''], verbosity=2, exit=False)

test_if_no_available_investments_knapsack_is_empty (__main__.TestGreedyKnapsack) ... ok
test_item_that_does_not_fit_in_backpack_is_not_chosen (__main__.TestGreedyKnapsack) ... ok
test_single_item_is_chosen (__main__.TestGreedyKnapsack) ... ok

----------------------------------------------------------------------
Ran 3 tests in 0.009s

OK


<unittest.main.TestProgram at 0x7f05c8e3dfd0>

### 4) Resultados e an√°lises:

**Antes da otimiza√ß√£o:**

Nossa heur√≠stica gulosa obteve $R\$980000,00$ de retorno e gastou $R\$890000,00$ para tais investimentos. 

**Depois da otimiza√ß√£o:**

Nossa heur√≠stica MILP obteve $R\$990000,00$ de retorno e gastou $R\$950000,00$ do nosso capital limite. Podemos ver claramente que atr√°ves da heur√≠stica do problema da mochila e algoritmos de otimiza√ß√£o conseguimos encher a mochila com os itens (investimentos) que trouxeram o maior valor agregado (retorno) sem estourar a nossa capacidade (capital limite) e obedecendo as restri√ß√µes.

Nos resultados p√≥s-otimiza√ß√£o percebemos que o investimento 2 foi selecionado e posteriormente o 4 tamb√©m, como foi requisitado em uma das restri√ß√µes do problema.

Por fim, sanamos o desafio maximizando o retorno esperado. üòÑü§ëüí∞