# Lineaarinen optimointi Pythonia hyödyntäen

__Matemaattista optimointia__ on sovelletaan usealla eri alalla. Perusidea on _maksimoida_ tai _minimoida_ jonkin yhtälön arvo. Tällaisessa tilanteessa läsnä on yleensä joitain _rajoitteita_, joiden puitteissa arvoja tarkastellaan. __Lineaarisessa optimoinnissa__ kaikki yllä mainitut, maksimoitava tai minimoitava funktio sekä rajoitefunktiot ovat lineaarisia. Optimoitavasta funktiosta usein käytettyjä sovelluksia ovat mm. kustannus- ja kysyntäfuntiot.

Lisätietoa perusasioista löytyy mm.Wikipediasta:
*  [Linear function](https://en.wikipedia.org/wiki/Linear_function)
* [System of linear equations](https://en.wikipedia.org/wiki/System_of_linear_equations)

Katsotaan seuraavaksi esimerkkiä lineaarisesta optimoinnista.

Tehtävänä on __maksimoida__ funktion $$z=x+2y$$ arvo. Rajoitteina tässä tilanteessa toimivat funktiot
$$2x+y\leq 20$$
$$-4x+5y\leq 10$$
$$-x + 2y\geq -2$$
$$x\geq 0$$
$$y \geq 0$$

Tavoitteena on löytää sellaiset muuttujien $x$ ja $y$ arvot, että kaikki rajoitefunktioden epäyhtälöt toteutuvat ja samalla muuttujan $z$ arvo on suurin mahdollinen.

Riippumattomia muuttujia, edellä $x$ ja $y$, kutsutaan __päätösmuuttujiksi__ ja maksimoitavaa tai minimoitava muuttujaa, edellä $z$, __kohdefunktioksi__, __kustannusfunktioksi__ tai yksinkertaisesti __tavoitteeksi__.

Graafisesti rajoitteiden rajaama tilanne näyttää seuraavalta.

![Optimointiongelma graafisesti](https://realpython.com/cdn-cgi/image/width=828,format=auto/https://files.realpython.com/media/lp-py-fig-1.00f609c97aec.png "Optimointiongelma")

Punainen viiva kuvaa funktiota $2x+y=20$ ja punainen alue sen yläpuolella aluetta, jossa epäyhtälö ei ole tosi. Vastaavasti sininen viiva kuvaa suoraa $-4x+5y=10$ ja yllä esitetty epäyhtälö ei voimassa sinisellä alueella. Samoin keltainen suora on $-x+2y=-2$ ja yllä kuvattu epäyhtälö ei ole tosi keltaisella alueella.

Kun jätetään laskuista alueet, joissa ainakin yksi epäyhtälöistä ei ole tosi, jäljelle jää harmaa alue. Jokainen harmaan alueen piste toteuttaa jokaisen rajoitefunktion ehdon (epäyhtälön) ja jokainen piste on siis mahdollinen ratkaisu optimointiongelmaan. Tällaista aluetta kutsutaan __mahdolliseksi__ (__feasible region__) ja sen pisteet ovat __mahdollisia ratkaisuja__ (__feasible solutions__). Yllä olevassa esimerkissä mahdollisia ratkaisuja on rajoittamaton määrä.

Seuraavaksi tullaan muuttujan $z$ arvon maksimointiin. Se mahdollisista ratkaisuista, jolla muuttujan $z$ arvo  on maksimaalinen, on __optimaalinen ratkaisu__ (__optimal solution__). Samoin tietysti, jos tarkoitus olisi minimoida tavoitefunktion arvo, optimaalisin ratkaisu olisi mahdollisista ratkaisuista pienin.

Nyt on hyvä kiinnittää huomiota siihen, että $z$ on lineaarinen. Sen voi ajatella olevan taso kolmiulotteisessa avaruudessa. Tästä syystä optimaalisen ratkaisun on oltava mahdollisten ratkaisujen __kärkipiste__ tai __kulmapiste__. Osaatko jo tässä vaiheessa sanoa, kumpi esimerkin kahdesta kärkipisteestä on optimiratkaisu?

Voi olla myös niin, että mahdollisen alueen jonkun reunan kaikki pisteet tai jopa kaikki mahdollisen alueen pisteet ovat antavat tavoitefunktiolle saman arvon. Silloin optimiratkaisuja on siis  useita.

Tutustuaksemme aiheeseen tarkemmin, lisätään edellisten lisäksi vielä yksi rajoite, yhtälö
$$-x+5y=15$$

Tämä rajoite näkyy kuvassa vihreänä suorana.

![Optimaalinen ratkaisu, osa 2](https://realpython.com/cdn-cgi/image/width=828,format=auto/https://files.realpython.com/media/lp-py-fig-2.3d21c2b24205.png)

Ratkaisun pitää nyt toteuttaa myös yo. yhtälö, joten mahdolliset ratkaisut eivät löydykään enää koko harmaalta alueelta. Se löytyy harmaan alueen vihreän suoran osasta, joka leikkaa sinisen suoran ja punaisen suoran. Optimiratkaisu on itse asiassa jälkimmäinen.

Jos ongelmaan lisätään vielä rajoite, että kaikkien $x$-muuttujan arvojen tulee olla kokonaislukuja, ongelma muuttuu vielä lisää. Mahdollisten ratkaisujen joukko onkin kokoelma harmaalla alueella olevia pisteitä, joissa $x$ on kokonaisluku. Optimaalisin näistä on nyt se, joka on lähinnä punaista viivaa.

![Optimaalinen kokonaislukuratkaisujen joukko](https://realpython.com/cdn-cgi/image/width=828,format=auto/https://files.realpython.com/media/lp-py-fig-3.c13d0660ce57.png)

Edellä olevat kolme esimerkkiä kuvaavat __mahdollisia lineaarisia ratkaisuja__, koska mahdollisten ratkaisujen joukot ovat rajoitettuja ja ratkaisujen määrä on rajoitettu.

## Mahdoton lineaarinen optimointiongelma

Optimointiongelma on __mahdoton__, jos sillä ei ole ratkaisua. Tällaisessa tilanteessa yleensä yksikään ratkaisu ei voi toteuttaa kaikkia annettuja rajoitteita samaan aikaan.

Mitä tapahtuisi, jos vaikkapa edellisessä esimerkissä lisättäisiin vielä rajoite $x+y\leq -1$. Silloin ainakin toisen päätösmuuttujan ($x$ tai $y$) olisi oltava negatiivinen. Tämä puolestaan on ristiriidassa rajoitteiden $x\geq 0$ ja$y\geq 0$ kanssa. Sellaisella systeemillä ei ole mahdollista ratkaisua ja se on siis mahdoton.

Toinen esimerkki mahdottomasta ratkaisusta (yhtälösysteemistä) olisi, jos edellä rajoitteisiin lisättäisiin vihreän suoran lisäksi toinen, sen kanssa rinnakkainen suora. Kahdella rinnakkaisella suoralla ei voi olla yhteistä pistettä, joten tällaisessa tapauksessa ei voida löytää ratkaisua, joka täyttäisi molemmat rajoitteet.

## Rajoittamaton optimointiongelma

Optimointiongelma on __rajoittamaton__, jos sen mahdollinen ratkaisualue ei ole rajoitettu eikä ratkaisu näin ollen ole rajoitettu. Tällaöin ainakin yksi muuttuja ei ole rajoitettu ja se voi saada mielivaltaisen suuria positiivia tai mielivaltaisen pieniä negatiivisia arvoja. Tällöin tavoitteesta tulee myös rajoittamaton.

Jos vaikka edellä olevassa esimerkissä jätettäisiinkin punaisen ja keltaisen suoran rajoitteet pois, muuttujien $x$ ja $y$ arvot olisivat rajoitettu alhaalta mutta eivät positiiviselta puolelta. Ne voisivat silloin saada vaikka kuinka suuria positiivisia arvoja ja samalla tavoitefunktion $z$ arvoksi tulisi mielivaltaisen suuria arvoja.

## Resurssien kohdentamisen ongelma

Edellä tutustuttiin abstraktiin lineaariseen optimointiongelmaan, jota ei oltu suoranaisesti kytketty mihinkään käytännön ongelmaan. Seuraavaksi tutustutaan konkreettiseen ja käytännölliseen optimointiongelmaan, joka liittyy tuotannon resurssien kohdentamiseen.

Oletetaan, että tehdas tuottaa neljää erilaista tuotetta, ensimmäistä tuotetta päivittäin $x_1$ kappaletta, toista $x_2$ kappaletta jne. Tavoitteena on määrittää maksimimäärät tuotteita päivittäin seuraavat rajoitteet huomioiden:

1. Kate tuotteille on 20 €/kpl ensimmäiselle tuotteelle, 12 €/kpl toiselle tuotteelle, 40 €/kpl kolmannelle ja 25 €/kpl neljännelle tuotteelle.

2. Työvoimaan liittyvän rajoitteen mukaan jokaisena päivänä pystytään tuottamaan korkeintaan 50 tuotetta yhteensä.

3. Ensimmäisen tuotteen osalta kuluu kolme yksikköä raakamateriaalia A kappaleelta. Toisen tuotteen osalta kuluu kaksi yksikköä raakamateriaalia A ja yksi yksikkö raakamateriaalia B kappaleelta. Kolmannen tuotteen osalta kuluu yksi yksikkö raakamateriaalia A ja kaksi yksikköä raakamateriaalia B kappaleelta. Vastaavasti neljännen tuotteen osalta kuluu kolme yksikköä raakamateriaalia B kappaleelta.

4. Kuljetus- ja varastointirajoitteen mukaan tehdas pystyy käyttämään korkeintaan sata yksikköä raakamateriaalia A ja 90 yksikköä raakamateriaalia B päivittäin.


Ehtoja vastaava matemaattinen malli on:

maksimoidaan

$$20 x_1 + 12 x_2 + 40 x_3 + 25 x_4 \textrm{ (tuotto)}$$

olettaen, että

$$x_1 + x_2 + x_3 + x_4 \leq 50 \textrm{ (työvoima)}$$

$$3 x_1 + 2 x_2 + x_3 \leq 100 \textrm{ (materiaali A)}$$

$$x_2 + 2 x_3 + 3 x_4 \leq 90 \textrm{ (materiaali B)}$$

$$x_1, x_2, x_3, x_4 \geq 0$$


Tavoitefunktio määritellään yllä ehdossa yksi. Tyävoimarajoite tulee ehdosta kaksi. Materiaalien A ja B rajoitteet tulevat ehdosta kolme. Tuotteiden lukumäärät eivät voi olla negatiivisia, mistä saadaan viimeinen rajoite.

Tässä päätösmuuttujia onkin jo neljä eikä asian visualisointi enää käy yhtä näppärästi kuin edellä. Samat periaatteet pätevät kuitenkin vieläkin.

## Optimointiongelman Python-toteutus

Tässä artikkelissa sovelletaan kahta lähestymistapaa Pythonin hyödyntämiseksi yllä olevassa lineaarisessa optimointiongelmassa.

1. Käytetään Pythonin tieteellisen laskennan kirjastoa __scipy__.

2. Käytetään Pythonin lineaarisen ohjelmoinnin rajapintaa __PuLP__ ongelman määrittämiseen ja ratkaisemiseen.

Scipy:n alikirjasto __scipy.optimize__ soveltuu sekä lineaariseen että epälineaariseen optimointiin. PuLP antaa mahdollisuuden valita ratkaisualgoritmin ja muotoilla ongelmat luonnollisella tavalla. PuLP:in oletusalgoritmi on [COIN-OR Branch and Cut Solver (CBC)](https://github.com/coin-or/Cbc).

In [1]:
# Asennetaan linprog

from scipy.optimize import linprog

### Esimerkki 1

Ratkaistaan ensin alussa esitelty lineaarinen optimointiongelma:

Maksimoidaan:
$$z=x+2y$$

Rajoitteina:

$$2x+y\leq 20$$
$$-4x+5y\leq 10$$
$$-x + 2y\geq -2$$
$$-x + 5y = 15$$
$$x\geq 0$$
$$y \geq 0$$


_linprog()_ ratkaisee ainoastaa minimointiogelmia eikä se salli rajoitteita, joissa on suurempi tai yhtäsuuri kuin merkki $\geq$. Tästä syystä yllä olevaa matemaattista mallia on muutettava seuraavasti:

* Sen sijaan, että maksimoitaisiin yhtälön $z = x + 2 y$ arvo, tuleekin nyt minimoida sen negaatio $-z = -x -2 y$.

* Jos rajoitteessa on ehtona suurempi tai yhtäsuuri $\geq$, kerrotaan se luvulla $-1$ ja saadaan rajoitteelle käänteinen ehto, jossa tarkastellaan tapausta pienempi tai yhtäsuuri $\leq$.  

Näiden muutosten jälkeen optimointiongelma onkin seuraava:

Minimoidaan:
$$-z = -x - 2y$$

Rajoitteina:

$$2x + y \leq 20$$
$$-4x + 5y \leq 10$$
$$x - 2y \geq 2$$
$$-x + 5y = 15$$
$$x\geq 0$$
$$y \geq 0$$

Tämä yhtälösysteemi on alkuperäistä vastaava niillä on sama ratkaisu. Ainut syy näihin muutoksiin on SciPy:n rajoitukset ongelman muotoilussa.

Seuraavaksi määritellään syötteiden arvot.

In [2]:
obj = [-1, -2]
#      ─┬  ─┬
#       │   └┤ y:n kerroin
#       └────┤ x:n kerroin

lhs_ineq = [[ 2,  1],  # Ensimmäisen rajoitteen vasen puoli
            [-4,  5],  # Toisen rajoitteen vasen puoli
            [ 1, -2]]  # Kolmannen rajoitteen vasen puoli

rhs_ineq = [20,  # Ensimmäisen rajoitteen oikea puoli
            10,  # Toisen rajoitteen oikea puoli
             2]  # Kolmannen rajoitteen oikea puoli

lhs_eq = [[-1, 5]]  # Neljännen rajoitteen vasen puoli
rhs_eq = [15]       # Neljännen rajoitteen oikea puoli

Yhtälösysteemin arvot sijoitetaan soveltuviin Pythonin listoihin, monikoihin ja Numpyn taulukoihin.

* muuttujassa __obj__ ovat tavoitefunktiot kertoimet

* muuttujassa __lhs_ineq__ ovat epäyhtälöissä olevien rajoitteiden vasempien puolien kertoimet

* muuttujassa __rhs_ineq__ ovat epäyhtälöissä olevien rajoitteiden oikeiden puolien kertoimet

* muuttujassa __lhs_eq__ ovat yhtälössä olevien rajoitteiden vasempien puolien kertoimet

* muuttujassa __rhs_eq__ on yhtälössä olevan rajoitteen oikean puolen kerroin

__Huom__. On syytä olla tarkkana rivien ja sarakkeiden järjestyksien kanssa!

Rajoitteiden vasemman ja oikean puolien järjestyksen on oltava samat. Kukin rivi edustaa aina yhtä rajoitetta.

Tavoitefunktion kertoimien järjestyksen ja rajoitteiden vasempien puolien tulee vastata toisiaan. Kukin sarake edustaa yhtä päätösmuuttujaa.

Seuraavaksi määritellään muuttujien rajat samassa järjestyksessä kuin kertoimet. Tässä esimerkissä muuttujat voivat saada arvon nolla ja kaikki arvoja siitä ylöspäin.

In [3]:
bnd = [(0, float("inf")), # Muuttujan x rajat
       (0, float("inf"))] # Muuttujan y rajat


Tämä määritelmä tosin on turha, sillä ne ovat funktion linprog() oletusarvot eli $[0,\infty]$.

__Huom__. Edellä olevan <code>float("inf")</code> sijasta voi käyttää myös <code>math.inf</code>, <code>numpy.inf</code> tai <code>scipy.inf</code>.

Lopulta voidaan optimoida ja ratkaista käsillä oleva ongelma käyttäen funktiota _linprog()_.

In [4]:
opt = linprog(c=obj, A_ub=lhs_ineq, b_ub=rhs_ineq,
              A_eq=lhs_eq, b_eq=rhs_eq, bounds=bnd,
              method="highs")
opt

        message: Optimization terminated successfully. (HiGHS Status 7: Optimal)
        success: True
         status: 0
            fun: -16.818181818181817
              x: [ 7.727e+00  4.545e+00]
            nit: 0
          lower:  residual: [ 7.727e+00  4.545e+00]
                 marginals: [ 0.000e+00  0.000e+00]
          upper:  residual: [       inf        inf]
                 marginals: [ 0.000e+00  0.000e+00]
          eqlin:  residual: [ 0.000e+00]
                 marginals: [-2.727e-01]
        ineqlin:  residual: [ 0.000e+00  1.818e+01  3.364e+00]
                 marginals: [-6.364e-01 -0.000e+00 -0.000e+00]
 mip_node_count: 0
 mip_dual_bound: 0.0
        mip_gap: 0.0

Yllä koodisolussa c viittaa tavoitefunktion kertoimiin kun taas A_ub ja b_ub viittaavat epäyhtälörajoitteiden vasempiin ja oikeisiin puoliin. Vastaavasti A_eq ja b_eq viittaavat yhtälörajoitteisiin. Parametrilla bounds voi asettaa päätösmuuttujille ala- ja ylärajat.

linprog() palauttaa seuraavat attribuutit

* __.message__ on ratkaisun löytymisen tilannetieto

* __.success__ on Boolean-arvoinen muuttuja, joka kertoo, löytyikö optimiarvo

* __.status__ on kokonaisluku välillä 0 ja 4 ja se kertoo ratkaisun löytymisen tilanteen; nolla tarkoittaa, että optimiratkaisu on löytynyt

* __.fun__ on tavoitefunktion optimiarvo, jos sellainen löydetään

* __.x__ on NumPy:n taulukko, jossa on päätösmuuttujien optimiarvot

* __.nit__ laskennassa tarvittujen toistojen määrä

Lisätietoja löytyy [SciPy:n dokumentaatiosta](https://docs.scipy.org/doc/scipy/reference/optimize.linprog-highs.html).



Näihin voi viitata myös yksitellen.

In [5]:
opt.fun

-16.818181818181817

In [6]:
opt.success

True

In [7]:
opt.x

array([7.72727273, 4.54545455])

Näin saatiin siis vastaukset optimointiongelmaan. Niitä voi tarkastella myös graafisesti.

![Optimiratkaisu yhtäsuuruudella graafisesti](https://realpython.com/cdn-cgi/image/width=828,format=auto/https://files.realpython.com/media/lp-py-fig-5.11f20dcc5d6b.png)

Aiemmin jo totesimmekin, että optimiratkaisu löytyy mahdollisten ratkaisujen alueen pisteiden joukosta. Tässä tapauksessa mahdollisten ratkaisujen alue on vihreän viivan pisteet sinisen ja punaisen viivan välissä. Optimiratkaisu on kuvassa merkitty vihreällä neliöllä ja se on vihreän ja punaisen viivan leikkauspiste.

Jos halutaan jättää huomiotta yhtäsuuruusrajoite (kuvassa vihreä), jätetään koodista pois parametrit A_eq ja b_eq.

In [8]:
opt = linprog(c=obj, A_ub=lhs_ineq, b_ub=rhs_ineq, bounds=bnd,
              method="highs")

opt

        message: Optimization terminated successfully. (HiGHS Status 7: Optimal)
        success: True
         status: 0
            fun: -20.714285714285715
              x: [ 6.429e+00  7.143e+00]
            nit: 2
          lower:  residual: [ 6.429e+00  7.143e+00]
                 marginals: [ 0.000e+00  0.000e+00]
          upper:  residual: [       inf        inf]
                 marginals: [ 0.000e+00  0.000e+00]
          eqlin:  residual: []
                 marginals: []
        ineqlin:  residual: [ 0.000e+00  0.000e+00  9.857e+00]
                 marginals: [-9.286e-01 -2.143e-01 -0.000e+00]
 mip_node_count: 0
 mip_dual_bound: 0.0
        mip_gap: 0.0

Tämä ratkaisu eroaa edellisestä, ks. seuraava kuva.

![Optimiratkaisu ilman yhtäsuuruutta graafisesti](https://realpython.com/cdn-cgi/image/width=828,format=auto/https://files.realpython.com/media/lp-py-fig-4.8a846634edca.png)

Tässä esimerkissä optimiratkaisu on mahdollisten arvojen alueella (kuvassa harmaa) merkitty violetti piste, jossa sininen ja punainen rajoite leikkaavat. Muissa pisteissä, kuten kuvan keltaisessa neliössä, tavoitefunktiolla on suurempia arvoja.

## Esimerkki 2

Sovelletaan SciPy-kirjastoa myös toiseen esimerkkiin, johon aiemmin tutustuttiin.

$$\textrm{max } 20 x_1 + 12 x_2 + 40 x_3 + 25 x_4 \textrm{ (tuotto)}$$

olettaen, että

$$x_1 + x_2 + x_3 + x_4 \leq 50 \textrm{ (työvoima)}$$

$$3 x_1 + 2 x_2 + x_3 \leq 100 \textrm{ (materiaali A)}$$

$$x_2 + 2 x_3 + 3 x_4 \leq 90 \textrm{ (materiaali B)}$$

$$x_1, x_2, x_3, x_4 \geq 0$$

Edellistä esimerkkiä mukaillen, otetaan näistä ehdoista tarvittavat vektorit ja matriisit ja syötetään ne linprog():n argumenteiksi.

In [9]:
obj = [-20, -12, -40, -25]

lhs_ineq = [[1, 1, 1, 1],  # Työvoima
            [3, 2, 1, 0],  # Materiaali A
            [0, 1, 2, 3]]  # Materiaali B

rhs_ineq = [ 50,  # Työvoima
             100,  # Materiaali A
             90]  # Materiaali B

opt = linprog(c=obj, A_ub=lhs_ineq, b_ub=rhs_ineq,
              method="highs")
opt

        message: Optimization terminated successfully. (HiGHS Status 7: Optimal)
        success: True
         status: 0
            fun: -1900.0
              x: [ 5.000e+00  0.000e+00  4.500e+01  0.000e+00]
            nit: 4
          lower:  residual: [ 5.000e+00  0.000e+00  4.500e+01  0.000e+00]
                 marginals: [ 0.000e+00  1.800e+01  0.000e+00  2.500e+01]
          upper:  residual: [       inf        inf        inf        inf]
                 marginals: [ 0.000e+00  0.000e+00  0.000e+00  0.000e+00]
          eqlin:  residual: []
                 marginals: []
        ineqlin:  residual: [ 0.000e+00  4.000e+01  0.000e+00]
                 marginals: [-2.000e+01 -0.000e+00 -1.000e+01]
 mip_node_count: 0
 mip_dual_bound: 0.0
        mip_gap: 0.0

Ratkaisun mukaan maksimituotto on 1900 ja se saavutetaan, kun $x_1=5$ ja $x_3=45$. Ei ole tuottoisaa valmistaa toista ja neljättä tuotetta annetuilla ehdoilla. Tästä voidaan tehdä seuraavia huomioita.

1. Kolmas tuote tuo suurimman katteen tuotetta kohden, joten tehdas valmistaa sitä eniten.

2. Ensimmäinen _ineqlin_ jäännösarvo on nolla, mikä tarkoittaa, että työvoima-rajoitteen (ensimmäinen rajoite) epäyhtälössä vasen ja oikea puoli ovat yhtä suuret. Tehdas siis tuottaa 50 yksikköä tuotteita päivittäin eli täyden kapasiteetin verran.

3. Toinen _ineqlin_ jäännösarvo on 40, koska tehdas käyttää 60 yksikköä raakamateriaalia A (15 yksikköä ensimmäiseen ja 45 yksikköä kolmanteen tuotteeseen) mahdollisista sadasta yksiköstä.

4. Kolmas _ineqlin_ jäännösarvo on nolla, mikä tarkoittaa, että tehdas käyttää kaikki käytettävissä olevat 90 yksikköä raakamateriaalia B. Tuo kaikki menee kolmanteen tuotteeseen. Tästä syystä tehdas ei pysty tuottamaan toista eikä neljättä tuotetta lainkaan eikä myöskään enempää kuin 45 yksikköä kolmatta tuotetta. Materiaalia B ei ole käytettävissä enempää.

Koska opt.status on nolla ja opt.success on tosi, optimointiongelma ratkaistiin onnistuneesti ja optimiratkaisu löydettiin.

SciPy:n voimavarat lineaarisessa optimoinnissa ovat rajalliset ja se sovltuu siksi lähinnä pieniin ongelmiin. Isoihin, monimutkaisiin ongelmiin on syytä käyttää muita kirjastoja. Tähän on seuraavia syitä.

* SciPy:n kautta ei voi hyödyntää ulkopuolisia ratkaisualgoritmeja.

* SciPy ei toimi kokonaislukuarvoisilla päätösmuuttujilla.

* SciPy ei tarjoa luokkia tai funktioita mallien rakentamiseen. Käyttäjän on määriteltävä taulukot ja matriisit itse. Se voi olla väsyttävää ja virhealtista työtä erityisesti isojen ja mutkikkaiden ongelmien tapauksessa.

* SciPy ei tarjoa mahdollisuutta ratkaista maksimointiongelmia suoraan. Ongelmat on käännettävä minimointiongelmiksi.

* SciPy ei tarjoa mahdollisuutta ratkaista suurempi tai yhtäsuuri kuin -rajoitteita suoraan. Ne on ensin muutettava pienempi tai yhtäsuuri -rajoitteiksi.

Pythonin ekosysteemissä on kuitenkin vaihtoehtoisia ratkaisuja lineaarisiin optimointiongelmiin, jotka soveltuvat myös isojen ja mutkikkaiden ongelmien tapauksissa. Ykjsi niistä on seuraavaksi esiteltävä _PuLP_.

## PuLP

PuLP:issa on SciPy:ä miellyttävämpi ohjelmointirajapinta. Siinä ei tarvitse matemaattisesti muokata annettuja rajoitteita tai käyttää vektoreita tai matriiseja.

In [10]:
!pip install pulp

Collecting pulp
  Downloading PuLP-2.9.0-py3-none-any.whl.metadata (5.4 kB)
Downloading PuLP-2.9.0-py3-none-any.whl (17.7 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m17.7/17.7 MB[0m [31m25.0 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pulp
Successfully installed pulp-2.9.0


In [11]:
# Tuodaan kirjastot

from  pulp import LpMaximize, LpProblem, LpStatus, lpSum, LpVariable

Nyt ollaankin valmiita optimoimaan.

## Esimerkki 1

Ratkaistaan alussa esitelty lineaarinen optimointiongelma käyttäen PuLP:a:

Maksimoidaan:
$$z=x+2y$$

Rajoitteina:

$$2x+y\leq 20$$
$$-4x+5y\leq 10$$
$$-x + 2y\geq -2$$
$$-x + 5y = 15$$
$$x\geq 0$$
$$y \geq 0$$


Ensin on luotava ongelmaa vastaa [LpProblem](https://www.coin-or.org/PuLP/pulp.html#pulp.LpProblem)-malli ja annettava sille alkuarvot.

In [12]:
# Luodaan malli

model = LpProblem(name="small-problem", sense=LpMaximize)

Parametrilla _sense_ ilmoitetaan, onko kyseessä maksimointi- vai minimointiongelma. Oletusarvo on minimointi (LpMinimize tai 1), maksimoitaessa valitaan LpMaximize tai -1.

Kun malli on luotu, voidaan määritellä päätösmuuttujat luokan LpVariable tapauksina.

In [13]:
# Alustetaan päätösmuuttujat

x = LpVariable(name="x", lowBound=0)
y = LpVariable(name="y", lowBound=0)

Oletusarvona alarajalle on negatiivinen ääretön $-\infty$, joten tässä esimerkissä on annettava alaraja _lowBound_, koska muuttujien arvot eivät rajoitteiden mukaan ole negatiivisia. Parametrilla _upBound_ voi tarvittaessa määrittää ylärajan. Oletusarvo sille on $+\infty$.

Valinnaisella parametrilla _cat_ voi määrittää päätösmuuttujan kategorian. Oletusarvo on "_Continuous_", joka sopii jatkuvien muuttujien tapaukseen.

Muuttujia $x$ ja $y$ voidaan nyt käyttää muiden PuLP-objektien luomiseen. Näitä käytetään lineaaristen yhtälöiden ja rajoitteiden ilmaisemiseen.

In [14]:
expression = 2 * x + 4 * y
type(expression)

In [15]:
constraint = 2 * x + 4 * y >= 8
type(constraint)

Kun päätösmuuttuja kerrotaan jollain luvulla tai rakennetaan lineaarinen yhtälöryhmä useasta päätösmuuttujasta, tuloksena on [pulp.LpAffineExpression](https://coin-or.github.io/pulp/technical/pulp.html#pulp.LpAffineExpression)-instanssi.

__Huom__. Muuttujia tai lausekkeita voi lisätä tai vähentää toisistaan sekä niitä kertoa vakiolla, sillä PuLP:in luokat käyttävät Pythonin numeerisia menetelmiä jäljitteleviä menetelmiä. Näitä toimintoja käytetään perinteisillä symboleilla $+$, $-$ ja $*$.

Samalla tavalla lineaarisia lausekkeita, muuttujia ja skalaareja voi yhdistellä käyttäen loogisia operaattoreita $==$, $<=$ tai $>=$. Tuloksena on [pulp.LpConstraint](https://coin-or.github.io/pulp/technical/pulp.html#pulp.LpConstraint)-instansseja, jotka edustavat mallin rajoitteita.

Seuraavaksi malliin lisätäänkin rajoitteet ja tavoitefunktio. Tämä voidaan tehdä Pythonin lausekkeilla ja malliin lisääminen tapahtuu operaattorilla $+=$.

In [16]:
# Lisätään malliin rajoitteet

model += (2 * x + y <= 20, "punainen suora")
model += (4 * x - 5 * y >= -10, "sininen suora")
model += (-x + 2 * y >= -2, "keltainen suora")
model += (-x + 5 * y == 15, "vihreä suora")

Edellä määriteltiin monikko, joka sisältää rajoitteet ja niiden nimet. LpProblem antaa mahdollisuuden rajoitteiden lisäämisen malliin mahdollistamalla useamman parametrin. Ensimmäinen niistä on LpConstraint-instanssi, toinen on ihmisen luettava nimi rajoitteelle.

Tavoitefunktion lisääminen sujuu vastaavasti.

In [17]:
# Lisätään malliin tavoitefunktio

obj_func = x + 2 * y
model += obj_func

Tämän voi tehdä lyhyemminkin.

In [18]:
# Lisätään malliin tavoitefunktio

model += x + 2 * y



Näin on saatu rajoitteet ja tavoitefunktio lisättyä ja malli määriteltyä.

Isompiin optimointiongelmiin on usein sujuvampaa käyttää funktiota [_lpSum()_](https://www.coin-or.org/PuLP/pulp.html#pulp.lpSum) ja lisätä lista tai toinen jono sen sijaan, että toistaisi $+$-toimintoa. Esimerkiksi tavoitefunktion voisi lisätä myös seuraavasti.

In [19]:
# Lisätään malliin tavoitefunktio

model += lpSum([x, 2 * y])

Lopputulos on samakuin edellä olevassa koodissa.

Tutustutaan vielä määriteltyyn malliin ja katsotaan, että kaikki on kohdallaan. Tavoitefunktion, rajoitteet ja päätösmuuttujat ja näiden nimet voi tarkistaa seuraavasti.

In [20]:
model

small-problem:
MAXIMIZE
1*x + 2*y + 0
SUBJECT TO
punainen_suora: 2 x + y <= 20

sininen_suora: 4 x - 5 y >= -10

keltainen_suora: - x + 2 y >= -2

vihreä_suora: - x + 5 y = 15

VARIABLES
x Continuous
y Continuous

Lopulta päästään ratkaisemaan itse optimointiongelma. Tämä taphtuu funktiolla [_.solve()_](https://www.coin-or.org/PuLP/pulp.html#pulp.LpProblem.solve). Jos oletusalgoritmi CBC riittää, argumentteja ei tarvita.

In [21]:
# Ratkaistaan optimointiongelma

status = model.solve()

.solve() käyttää oletusalgoritmia, muokkaa model-objektia ja palauttaa ratkaisun tilanteen kokonaislukuna, joka on yksi, mikäli optimiratkaisu löytyy. Muita mahdollisia tilannekoodeja löytyy [LpStatus[]-dokumentaatiosta](https://www.coin-or.org/PuLP/constants.html#pulp.constants.LpStatus).

Malli sisältää nyt myös optimointiratkaisun tuloksen ja muutakin tietoa. Niiden lukemisessa auttanevat seuraavien rivien koodit.

In [27]:
# Optimointiratkaisun tilanne

print(f"status: {model.status}, {LpStatus[model.status]}")

status: 1, Optimal


In [28]:
# Optimointiongelman tavoiteratkaisu

print(f"objective: {model.objective.value()}")

objective: 16.8181817


In [29]:
# Päätösmuuttujien arvot

for var in model.variables():
    print(f"{var.name}: {var.value()}")

x: 7.7272727
y: 4.5454545


In [30]:
# Rajoitteet

for name, constraint in model.constraints.items():
    print(f"{name}: {constraint.value()}")


punainen_suora: -9.99999993922529e-08
sininen_suora: 18.181818300000003
keltainen_suora: 3.3636362999999996
vihreä_suora: -2.0000000233721948e-07


_malli.objective_ sisältää siis tavoitefunktion optimiarvon, _malli.constraints_ täytemuuttujien arvot, $x$:llä ja $y$:llä on kohdemuuttujien optimiarvot ja _malli.variables()_ palauttaa listan päätösmuuttujista.

In [32]:
model.variables()

[x, y]

In [33]:
model.variables()[0] is x

True

In [34]:
>>> model.variables()[1] is y

True

Lista sisältää siis kaikki ne muuttujat, jotka luotiin yllä käyttäen LpVariable:a hyödyntäen.

Edellä saadut tulokset ovat suurin piirtein samat kuin SciPy:llä lasketut.

__Huom__. Ole varovainen soveltaessa .solve()-toimintoa. Se muuttaa $x$:n ja $y$:n arvoja.

Tarkistetaan myös käytetty ratkaisualgoritmi .solver:lla.

In [35]:
# Ratkaisualgoritmi

model.solver

<pulp.apis.coin_api.PULP_CBC_CMD at 0x7985ab353a00>

Käytetty ratkaisualgoritmi oli siis oletusarvo CBC.

Oletusarvosta poikkeavaa ratkaisualgoritmia voi käyttää antamalla se _.solve()_:n argumenttina. Esimerkiksi, GLPK:n käyttäminen sujuu käyttäen koodia <code>solver = GLPK(msg=False)</code>, kunhan on GLPK:n ensin asentanut. On hyvä muistaa, että se ensin on myös tuotava.

In [36]:
from pulp import GLPK

Tuonnin jälkeen GLPK:n käyttö onnistuu siis .solve():lla.

In [37]:
# Luodaan malli

model = LpProblem(name="small-problem", sense=LpMaximize)

In [38]:
# Alustetaan päätösmuuttujat

x = LpVariable(name="x", lowBound=0)
y = LpVariable(name="y", lowBound=0)

In [39]:
# Lisätään malliin rajoitteet

model += (2 * x + y <= 20, "punainen_suora")
model += (4 * x - 5 * y >= -10, "sininen_suora")
model += (-x + 2 * y >= -2, "keltainen_suora")
model += (-x + 5 * y == 15, "vihrea_suora")

In [40]:
# Lisätään malliin tavoitefunktio

model += lpSum([x, 2 * y])

In [None]:
# Ratkaistaan optimointiongelma GLPK:lla
status = model.solve(solver=GLPK(msg=False))

In [43]:
print(f"status: {model.status}, {LpStatus[model.status]}")

status: 0, Not Solved


Parametrilla _msg_ voidaan säätää, halutaan ratkaisualgoritmin kertomaa informaatiota ratkaisusta lukea tässä yhteydessä.

Kun malli on määritelty ja ratkaistu, sitä voi tutkia samaan tapaan kuin edellä.

In [46]:
# Optimiratkaisun löytymisen tilannetieto

print(f"status: {model.status}, {LpStatus[model.status]}")

status: 0, Not Solved


In [47]:
# Tavoitefunktion arvo

print(f"objective: {model.objective.value()}")

objective: None


In [48]:
# Päätösmuuttujien arvot

for var in model.variables():
    print(f"{var.name}: {var.value()}")

x: None
y: None


In [49]:
# Rajoitteet

for name, constraint in model.constraints.items():
    print(f"{name}: {constraint.value()}")

punainen_suora: None
sininen_suora: None
keltainen_suora: None
vihrea_suora: None


Katsotaan vielä, mitä ratkaisualgoritmia käytettiin tällä kertaa.

In [51]:
# ratkaisin

model.solver

PuLP antaa mahdollisuuden tarkastella ratkaista myös osin kokonaislukuarvoisia ongelmia. Muuttujan voi määrittää olevan kokonaislukuarvoinen tai binääriarvoinen käyttämällä _LpVariablen_ parametrina <code>cat='Integer'</code> tai <code>cat='Binary'</code>. Muut kohdat toistetaan kuten yllä.


In [52]:
# Luodaan malli

model = LpProblem(name="small-problem", sense=LpMaximize)

# Alustetaan päätösmuuttujat: x on kokonaisluku, y on jatkuva muuttuja

x = LpVariable(name="x", lowBound=0, cat="Integer")
y = LpVariable(name="y", lowBound=0)

# Lisätään malliin rajoitteet

model += (2 * x + y <= 20, "punainen_suora")
model += (4 * x - 5 * y >= -10, "sininen_suora")
model += (-x + 2 * y >= -2, "keltainen_suora")
model += (-x + 5 * y == 15, "vihrea_suora")

# Lisätään malliin tavoitefunktio

model += lpSum([x, 2 * y])

# Ratkaistaan ongelma

status = model.solve()

Tässä esimerkissä yksi muuttujista onkin kokonaislukuarvoinen ja myös ratkaisu eroaa edellisestä.

In [53]:
# Optimointiratkaisun tilanne

print(f"status: {model.status}, {LpStatus[model.status]}")

status: 1, Optimal


In [55]:
# Tavoitefunktion arvo

print(f"objective: {model.objective.value()}")

objective: 15.8


In [56]:
# Päätösmuuttujien arvot

for var in model.variables():
    print(f"{var.name}: {var.value()}")

x: 7.0
y: 4.4


In [57]:
# Rajoitteet

for name, constraint in model.constraints.items():
    print(f"{name}: {constraint.value()}")

punainen_suora: -1.5999999999999996
sininen_suora: 16.0
keltainen_suora: 3.8000000000000007
vihrea_suora: 0.0


In [59]:
# Käytetty ratkaisualgoritmi

model.solver

<pulp.apis.coin_api.PULP_CBC_CMD at 0x7985ab353a00>

Tässä $x$ on kokonaislukuarvoinen muuttuja. (Teknisesti se on itse asiassa liukuluku, jossa desimaalipisteen jälkeiset desimaalit vain ovat kaikki nollia.) Tämä muuttaa koko ratkaisua. Visuaalisesti tätä voidaan kuvata seuraavasti.

![kokonaislukuarvoinen_optimiratkaisu](https://realpython.com/cdn-cgi/image/width=828,format=auto/https://files.realpython.com/media/lp-py-fig-6.a415a074213b.png)

Tästä näkyy, että optimiratkaisu on oikeanpuoleisin vihreä piste harmaalla alueella eli mahdollisten ratkaisujen alueella. Tämä piste on siis myös mahdollinen ratkaisu ja siinä muuttujien $x$ ja $y$ arvot suurimmat. Näin ollen saadaan myös maksimaalinen tavoitefunktion arvo.

Myös GLPK pystyy ratkaisemaan tällaisia ongelmia.

## Esimerkki 2

Käytetään seuraavaksi PuLP:a ratkaisemaan edellä esitelty resurssien kohdentamisen ongelma.

Maksimoidaan

$$20 x_1 + 12 x_2 + 40 x_3 + 25 x_4 \textrm{ (tuotto)}$$

olettaen, että

$$x_1 + x_2 + x_3 + x_4 \leq 50 \textrm{ (työvoima)}$$

$$3 x_1 + 2 x_2 + x_3 \leq 100 \textrm{ (materiaali A)}$$

$$x_2 + 2 x_3 + 3 x_4 \leq 90 \textrm{ (materiaali B)}$$

$$x_1, x_2, x_3, x_4 \geq 0$$


Ongelman määrittäminen ja ratkaiseminen sujuu kuten edellä.

In [61]:
# Määritellään malli

model = LpProblem(name="resource-allocation", sense=LpMaximize)

# Määritellään päätösmuuttujat sanakirjaan

x = {i: LpVariable(name=f"x{i}", lowBound=0) for i in range(1, 5)}

# Lisätään malliin rajoitteet

model += (lpSum(x.values()) <= 50, "tyovoima")
model += (3 * x[1] + 2 * x[2] + x[3] <= 100, "materiaali_A")
model += (x[2] + 2 * x[3] + 3 * x[4] <= 90, "materiaali_B")

# Asetetaan tavoitefunktio

model += 20 * x[1] + 12 * x[2] + 40 * x[3] + 25 * x[4]

# Ratkaistaan optimointiongelma

status = model.solve()

# Tutustutaan tuloksiin

print(f"ratkaisun tilanne: {model.status}, {LpStatus[model.status]}")
print(f"tavoitefunktion optimiarvo: {model.objective.value()}")

for var in x.values():
    print(f"{var.name}: {var.value()}")

for name, constraint in model.constraints.items():
    print(f"{name}: {constraint.value()}")

ratkaisun tilanne: 1, Optimal
tavoitefunktion optimiarvo: 1900.0
x1: 5.0
x2: 0.0
x3: 45.0
x4: 0.0
tyovoima: 0.0
materiaali_A: -40.0
materiaali_B: 0.0


Tässä on käytetty sanakirjaa x, johon päätösmuuttujat tallennetaan. Tämä onkin näppärä ja suositeltava tapa niiden käsittelyyn, sillä Pythonin sanakirja-tietotyyppi mahdollistaa päätösmuuttujien nimien tai indeksien tallentamisen lisäksi vastaavien _LpVariable_:n objektien tallentamisen arvoina. Pythonin listoja ja monikkoja kannattaa käyttää niitäkin.

Yllä oleva ratkaisu vastaa SciPy:llä tekemäämme. Maksimituotto saavutetaan, kun valmistetaan viisi yksikköä ensimmäistä tuotetta ja 45 yksikköä kolmatta tuotetta päivittäin.

Tehdäänpä ongelmasta mutkikkaampi ja samalla mielenkiintoisempi. Oletetaan, että tehdas ei laitteistoon liittyvistä syistä pysty ratkaisemaan ensimmäistä ja kolmatta tuotetta samanaikaisesti. Mikä on maksimituotto tässä tapauksessa?

Nyt asiaan liittyy looginen rajoite: jos $x_1$ on positiivinen, $x_3$:n on oltava nolla ja kääntäen. Tällaisissa tapauksissa binääriset päätösmuuttujat osoittautuvat hyödyllisiksi. Otetaan käyttöön kaksi binääristä päätösmuuttujaa $y_1$ ja $y_3$, jotka ilmaisevat, valmistetaanko ensimmäistä tai kolmatta tuotetta lainkaan.

In [62]:
# Luodaan malli

model = LpProblem(name="resource-allocation", sense=LpMaximize)

# Määritellään päätösmuuttujat

x = {i: LpVariable(name=f"x{i}", lowBound=0) for i in range(1, 5)}
y = {i: LpVariable(name=f"y{i}", cat="Binary") for i in (1, 3)}

# Lisätään rajoitteet

model += (lpSum(x.values()) <= 50, "tyovoima")
model += (3 * x[1] + 2 * x[2] + x[3] <= 100, "materiaali_A")
model += (x[2] + 2 * x[3] + 3 * x[4] <= 90, "materiaali_B")

M = 100

model += (x[1] <= y[1] * M, "x1_rajoite")
model += (x[3] <= y[3] * M, "x3_rajoite")
model += (y[1] + y[3] <= 1, "y_rajoite")

# Maäritetään tavoitefunktio

model += 20 * x[1] + 12 * x[2] + 40 * x[3] + 25 * x[4]

# Ratkaistaan optimointiongelma

status = model.solve()

print(f"ratkaisun tilanne: {model.status}, {LpStatus[model.status]}")
print(f"tavoitefunktion optimiarvo: {model.objective.value()}")

for var in model.variables():
    print(f"{var.name}: {var.value()}")

for name, constraint in model.constraints.items():
    print(f"{name}: {constraint.value()}")

ratkaisun tilanne: 1, Optimal
tavoitefunktion optimiarvo: 1800.0
x1: 0.0
x2: 0.0
x3: 45.0
x4: 0.0
y1: 0.0
y3: 1.0
tyovoima: -5.0
materiaali_A: -55.0
materiaali_B: 0.0
x1_rajoite: 0.0
x3_rajoite: -55.0
y_rajoite: 0.0


Koodi on monelta osin samanlainen yllä olevan kanssa, mutta oleellisiakin eroja löytyy.

* Sanakirjaan $y$ tallennetaan binääriset päätösmuuttujat $y[1]$ ja $y[3]$.

* Muuttujan $M$ on tarkoitus olla mielivaltaisen suuri arvo. Tässä arvo sata $M$:lle on riittävän suuri, sillä tehtaassa ei voida valmistaa yli sataa tuotetta päivässä.

* Kohdassa _$x_1$_rajoite_ määritellään, että jos $y[1]$ on nolla, $x[1]$:n on oltava nolla, muutoin se voi olla mikä tahansa ei-negatiivinen luku.

* Kohdassa _$x_3$_rajoite_ määritellään, että jos $y[3]$ on nolla, $x[3]$:n on oltava nolla, muutoin se voi olla mikä tahansa ei-negatiivinen luku.

* Kohdassa _$y$_rajoite_ sanotaan, että joko $y[1]$:n tai $y[3]$:n arvo on nolla, tai molempien arvo on nolla. Niinpä edellisten kohtien mukaan silloin myös joko $x[1]$:n tai $x[3]$:n arvo on myös nolla.

Osoittautuu siis, että optimaalinen ratkaisu on valmistaa vain tuotetta kolme ja jättää valmistamatta ensimmäistää tuotetta kokonaan.

Lähde ja lisämateriaalia:


*   [RealPython: Hands-On Linear Programming: Optimization With Python](https://realpython.com/linear-programming-python/)



In [23]:
import datetime
print(f'Last modified {datetime.datetime.now():%Y-%m-%d %H:%M} by Juha Nurmonen')

Last modified 2024-09-06 12:37 by Juha Nurmonen
