# Modelagem Linear

Segundo o Bazaraa, para ser um problema de programação linear, as seguintes hipóteses
devem ser satisfeitas:

  - **Proporcionalidade:** Dada uma variável $x_i$, sua contribuição na função objetivo
e nas restrições são é linearmente proporcional a seu valor. Portanto, se seu valor for
dobrado, então sua contribuição é dobrada. _e.g. se a venda de 15 produtos me rende R\$ 33,
então a venda de 30 produtos me rende R\$ 66, e a venda de 5 produtos me rende R\$ 11._
  - **Aditividade:** A contribuição de cada variável é somada para obter a contribuição total.
_e.g. Se a demanda de um produto P é de 6 kg, e o produto pode ser construído por duas
pessoas, elas podem satisfazer a demanda com qualquer combinação $p_1$ e $p_2$ tal que
$p_1 + p_2 = 6$.
  - **Divisibilidade:** A variável pode ser dividida fracionalmente, isto é, com valores não
inteiros.

Essencialmente, todo problema de programação linear pode ser escrito como

$$
    min \sum_{i=1}^n c_ix_i + \beta \\
    \mbox{suj. a } Ax = b \\
    Cx \leq d \\
    \ell \leq x \leq u
$$

Onde $c, x, \ell, u \in \mathbb{R}^n$, $b \in \mathbb{R}^{m_E}$, $d \in \mathbb{R}^{m_I}$,
$A \in \mathbb{R}^{m_E \times n}$, $C \in \mathbb{R}^{m_I \times n}$ e $\beta \in \mathbb{R}$.
Note que na prática $\beta$ é irrelevante para a solução do problema. Ademais, podemos introduzir
variáveis específicas para reescrever o problema acima como

$$
    min \sum_{i=1}^n c_ix_i \\
    \mbox{suj. a } Ax = b \\
    x \geq 0
$$

no que é chamado de formulação padrão, de modo que $(A,b,c)$ definem unicamente o problema.

Para os algoritmos que resolvem problemas de programação linear, essa formulação é importante,
principalmente na teoria. No entanto, para o modelador, ter que escrever o problema dessa maneira
não é interessante. Veremos que, na prática, vamos escrever o problema de uma maneira
geral, e deixar o trabalho de converter para a formulação padrão para o **software de modelagem**.

## Variáveis inteiras

Apesar do PL considerar que as variáveis são inteiras, muitas vezes isso não é possível pela natureza do problema.
Em muitos casos, no entanto, é possível deixar as variáveis como contínuas, e a solução do problema será inteira
ainda assim.
Existem teoremas que garantem que se a formulação tiver uma formato específico então isso acontece. Essencialmente
serão os problemas de **fluxos em redes**.

No entanto, em muitos casos isso também não é possível, e o problema precisa de um tratamento diferenciado.
Quando isso acontece, o problema passa a ser muito mais complicado de resolver. É importante ter essa noção
clara, pois para o modelador, a mudança é muito simples: Basta adicionar uma linha dizendo que a variável
é inteira.

Voltaremos em breve em variáveis inteiras.

## Unidades

- Produção: Kg, metros, milhares de unidade
- Recusos: Horas, minutos, pessoas

## Quantidades

Existem três tipos de quantidades essenciais:

- **Variáveis de decisão**: As variáveis do problema, $x$, representam incógnitas a serem
descobertas. _e.g., quais produtos produzir, qual alocação de funcionários, quando contratar
alguém, para onde mandar o produto, que caminho tomar, etc._
- **Objetivo**: Todo problema de PL tem um objetivo, que é minimizar ou maximizar algum valor.
Essa quantidade deve ser linearmente proporcional aos valores das variáveis de decisão.
_e.g., minimizar o custo de produção, os gastos, o tempo de entrega, ou maximizar o lucro,
a "felicidade", a quantidade de produtos entregues, etc._
- **Restrições**: Todo problema de PL também precisa de restrições. Essas restrições são
consequências lógicas que tornam o problema "real". Se o nosso objetivo fosse minimizar os
custos de produção e não tivessemos restrições (além de não-negatividade), bastaria não
vender nada.
As restrições usuais são:
    - **Demandas**: Em geral temos um objetivo na quantidade de produção. _e.g., uma quantidade
    mínima de produtos a ser entregue, uma quantidade mínima de qualidade numa liga de metais, etc._
    - **Recursos**: Muitas vezes os recursos que temos são limitados, e devemos estabelecer um
    máximo. _e.g., um funcionário trabalho por 40 horas semanais, temos apenas uma certa quantidade
    de matéria prima disponível, uma máquina só produz uma coisa por vez, etc.
    - **Restrições físicas**: Aspectos físicas das substâncias. _e.g., a maior parte das quantidades
    envolvidas não pode ser negativas, não se pode trabalhar por uma quantidade de tempo negativa,
    não é possível obter mais que 100% de alguma coisa, etc._
    - **Relações**: Principalmente quando se tem materiais com características. _e.g., pra fazer
    uma ração, podemos usar milho ou soja, cada um com seus valores nutricionais, mas a ração tem
    valores máximos e mínimos para os valores protéicos._

## Exemplo 1 - Ração de Galinha

Exemplo "Feed Mix Problem" do Bazaraa

Uma empresa manufatura ração de galinha. Isso é feito através da mistura  de
vários ingredientes, como milho, cálcario, alfafa. Essa mistura é feita
de maneira que a ração satisfaça certos níveis de nutrientes, como proteína,
cálcio, carboidrato e vitaminas.

Suponha que $n$ ingredientes ($j = 1,2,\dots,n$) são usados e $m$ nutrientes
($i = 1,2,\dots,m$) são considerados. O custo do ingrediente $j$ é $c_j$
(em R\$/Kg) e a quantidade do ingrediente a ser usado é $x_j$ (em Kg).
O custo de montar a ração então será
$$ \sum_{j=1}^n c_jx_j = c^Tx. $$

Agora vamos considerar que a quantidade do nutriente $i$ no ingrediente $j$ é $a_{ij}$,
e que as porcentagens máximas e mínimas desses nutrientes no produto final são $u_i$ e $\ell_i$
respectivamente. Por exemplo, o 1 kg de milho tem 94 mg de proteína e 15280 calorias, e 1 kg de
soja tem 130 mg de proteína e 6150 calorias.
Podemos limitar as quantidades máximas e mínimas de protéina num kg de ração a ficar entre 100 e
120 mg, e também que 1 kg de ração tenha entre 8000 e 12000 calorias.

> Fonte: https://en.wikipedia.org/wiki/Staple_food

A quantidade total do nutriente $i$ na ração é a soma de cada contribuição individual, isto é
$ \sum_{j=1}^n a_{ij} x_j $. Como a limitação é por kilo, precisamos dividir pela quantidade total
de ração para comparar a $\ell_i$ e $u_i$. A quantidade total de ração é $\sum_{j=1}^n x_j$.
Para manter a linearidade, vamos fixar a quantidade total de ração à um número positivo qualquer $b$.
Isso acrescenta a restrição $\sum_{j=1}^n x_j = b$ e as restrições
$\ell_i \leq \frac{1}{b}\sum_{j=1}^n a_{ij}x_j \leq u_i$ para $i = 1,\dots,m$.

Finalmente, a quantidade do ingrediente não pode
ser negativa, acrescentando $x_j \geq 0$, para $j = 1,\dots,n$.

O modelo final fica
$$ \min \sum_{j=1}^n c_jx_j \\
\mbox{suj. a } \sum_{j=1}^n x_j = b \\
\begin{array}{rcl}
b\ell_1 & \leq \sum_{j=1}^n a_{1j} x_j \leq & bu_1 \\
\vdots & \vdots & \vdots \\
b\ell_m & \leq \sum_{j=1}^n a_{mj} x_j \leq & bu_m \\
\end{array} \\
x_1 \geq 0, \dots, x_n \geq 0
$$

Podemos escolher $b = 1$ para simplificar ainda mais, e generalizar as inequações

$$ \min \sum_{j=1}^n c_jx_j \\
\mbox{suj. a } \sum_{j=1}^n x_j = 1 \\
\ell_i \leq \sum_{j=1}^n a_{ij} x_j \leq u_i, \quad i = 1,\dots,m \\
x_j \geq 0, j = 1,\dots,n
$$

## Modelando com o JuMP

In [1]:
using JuMP, DataFrames, Cbc

In [2]:
dados = readtable("staples.csv")

Unnamed: 0,Nutriente,IDR,Milho,Arroz_branco,Arroz_integral,Trigo,Batata,Mandioca,Soja,Batata_doce,Sorgo,Inhame,Banana_da_terra
1,Water (g),3000.0,10.0,12.0,10.0,13.0,79.0,60.0,68.0,77.0,9,70.0,65
2,Energy (kJ),,1528.0,1528.0,1549.0,1369.0,322.0,670.0,615.0,360.0,1419,494.0,511
3,Protein (g),50.0,9.4,7.1,7.9,12.6,2.0,1.4,13.0,1.6,11.3,1.5,1.3
4,Fat (g),,4.74,0.66,2.92,1.54,0.09,0.28,6.8,0.05,3.3,0.17,0.37
5,Carbohydrates (g),130.0,74.0,80.0,77.0,71.0,17.0,38.0,11.0,20.0,75,28.0,32
6,Fiber (g),30.0,7.3,1.3,3.5,12.2,2.2,1.8,4.2,3.0,6.3,4.1,2.3
7,Sugar (g),,0.64,0.12,0.85,0.41,0.78,1.7,0.0,4.18,0,0.5,15
8,Calcium (mg),1000.0,7.0,28.0,23.0,29.0,12.0,16.0,197.0,30.0,28,17.0,3
9,Iron (mg),8.0,2.71,0.8,1.47,3.19,0.78,0.27,3.55,0.61,4.4,0.54,0.6
10,Magnesium (mg),400.0,127.0,25.0,143.0,126.0,23.0,21.0,65.0,25.0,0,21.0,37


In [3]:
dados[:Milho]

32-element DataArrays.DataArray{Float64,1}:
   10.0 
 1528.0 
    9.4 
    4.74
   74.0 
    7.3 
    0.64
    7.0 
    2.71
  127.0 
  210.0 
  287.0 
   35.0 
    ⋮   
    3.63
    0.42
    0.62
   19.0 
  214.0 
    0.49
    0.3 
   97.0 
 1355.0 
    0.67
    1.25
    2.16

In [4]:
ingredientes = readtable("ingredientes.csv")

Unnamed: 0,Ingrediente,Custo
1,Milho,0.77
2,Arroz_branco,1.16
3,Trigo,0.8
4,Soja,1.26
5,Inhame,2.53
6,Batata,1.8


In [5]:
nutrientes = readtable("nutrientes.csv")

Unnamed: 0,Nutriente,Minimo,Maximo
1,Carbohydrates (g),24.0,51.0
2,Fiber (g),2.7,8.8
3,Iron (mg),1.8,3.3
4,Sugar (g),0.0,2.1
5,Fat (g),1.6,2.7
6,Calcium (mg),20.0,50.0
7,Magnesium (mg),21.0,89.0
8,Protein (g),6.3,8.1


In [6]:
dados_red = join(nutrientes, dados, on=:Nutriente)

Unnamed: 0,Nutriente,Minimo,Maximo,IDR,Milho,Arroz_branco,Arroz_integral,Trigo,Batata,Mandioca,Soja,Batata_doce,Sorgo,Inhame,Banana_da_terra
1,Calcium (mg),20.0,50.0,1000.0,7.0,28.0,23.0,29.0,12.0,16.0,197.0,30.0,28.0,17.0,3.0
2,Carbohydrates (g),24.0,51.0,130.0,74.0,80.0,77.0,71.0,17.0,38.0,11.0,20.0,75.0,28.0,32.0
3,Fat (g),1.6,2.7,,4.74,0.66,2.92,1.54,0.09,0.28,6.8,0.05,3.3,0.17,0.37
4,Fiber (g),2.7,8.8,30.0,7.3,1.3,3.5,12.2,2.2,1.8,4.2,3.0,6.3,4.1,2.3
5,Iron (mg),1.8,3.3,8.0,2.71,0.8,1.47,3.19,0.78,0.27,3.55,0.61,4.4,0.54,0.6
6,Magnesium (mg),21.0,89.0,400.0,127.0,25.0,143.0,126.0,23.0,21.0,65.0,25.0,0.0,21.0,37.0
7,Protein (g),6.3,8.1,50.0,9.4,7.1,7.9,12.6,2.0,1.4,13.0,1.6,11.3,1.5,1.3
8,Sugar (g),0.0,2.1,,0.64,0.12,0.85,0.41,0.78,1.7,0.0,4.18,0.0,0.5,15.0


In [7]:
ingrs = Array{Symbol}(ingredientes[1])

6-element Array{Symbol,1}:
 :Milho       
 :Arroz_branco
 :Trigo       
 :Soja        
 :Inhame      
 :Batata      

In [8]:
A = Matrix(dados_red[ingrs])

8x6 Array{Float64,2}:
   7.0   28.0    29.0   197.0   17.0   12.0 
  74.0   80.0    71.0    11.0   28.0   17.0 
   4.74   0.66    1.54    6.8    0.17   0.09
   7.3    1.3    12.2     4.2    4.1    2.2 
   2.71   0.8     3.19    3.55   0.54   0.78
 127.0   25.0   126.0    65.0   21.0   23.0 
   9.4    7.1    12.6    13.0    1.5    2.0 
   0.64   0.12    0.41    0.0    0.5    0.78

In [9]:
c = Vector(ingredientes[2])
l, u = Vector(dados_red[:Minimo]), Vector(dados_red[:Maximo])

([20.0,24.0,1.6,2.7,1.8,21.0,6.3,0.0],[50.0,51.0,2.7,8.8,3.3,89.0,8.1,2.1])

In [10]:
num_nuts, num_ingr = size(A)

(8,6)

In [11]:
m = Model()

Feasibility problem with:
 * 0 linear constraints
 * 0 variables
Solver is default solver

In [12]:
@variable(m, x[1:num_ingr] >= 0)

6-element Array{JuMP.Variable,1}:
 x[1]
 x[2]
 x[3]
 x[4]
 x[5]
 x[6]

In [13]:
m

Feasibility problem with:
 * 0 linear constraints
 * 6 variables
Solver is default solver

In [14]:
@objective(m, Min, sum{x[j] * c[j], j=1:num_ingr})

0.77 x[1] + 1.16 x[2] + 0.8 x[3] + 1.26 x[4] + 2.53 x[5] + 1.8 x[6]

In [15]:
m

Minimization problem with:
 * 0 linear constraints
 * 6 variables
Solver is default solver

In [16]:
@constraint(m, sum{x[j], j=1:num_ingr} == 1.0)

x[1] + x[2] + x[3] + x[4] + x[5] + x[6] = 1

In [18]:
m

Minimization problem with:
 * 1 linear constraint
 * 6 variables
Solver is default solver

In [19]:
for i = 1:num_nuts
    @constraint(m, l[i] <= sum{A[i,j] * x[j], j=1:num_ingr}
        <= u[i])
end

In [20]:
m

Minimization problem with:
 * 9 linear constraints
 * 6 variables
Solver is default solver

In [21]:
solve(m)

:Optimal

In [22]:
vx = getvalue(x)

6-element Array{Float64,1}:
 0.378873  
 0.00977443
 0.226812  
 0.0765708 
 0.0       
 0.307969  

In [24]:
getobjectivevalue(m)

1.1353444530393673

In [23]:
for i = 1:num_ingr
    println("$(ingrs[i]): \t$(round(vx[i]*100,2))%")
end
println("Custo do kg: R\$ $(round(getobjectivevalue(m),2))/Kg")

Milho: 	37.89%
Arroz_branco: 	0.98%
Trigo: 	22.68%
Soja: 	7.66%
Inhame: 	0.0%
Batata: 	30.8%
Custo do kg: R$ 1.14/Kg


In [26]:
m = Model()

Feasibility problem with:
 * 0 linear constraints
 * 0 variables
Solver is default solver

In [27]:
# Pessoas: Alice e Bob
# Produtos: ProdA e ProdB
@variable(m, x[p=[:Alice,:Bob]] >= 0)

x[p] ≥ 0 ∀ p ∈ {Alice,Bob}

In [30]:
"a"

"a"