# Wpowadzenie do deep learning w bibliotece Flux.jl

## Przykład

Aby w  zrozumieć sposób pracy z Fluxem warto rozpatrzeć prosty przykład. Zajmiemy się przetwarzaniem języka naturalnego - zbudujemy model zdolny do generowania składnej wypowiedzi w języku polskim.

Wyjściowe założenie jest takie, że wytrenujemy sieć neuronową, która będzie estymowała prawdopodobieństwo wystąpienia danego znaku w ciągu na podstawie poprzedzających go znaków w sekwencji ([<b>Character-Level Language Model</b>](http://karpathy.github.io/2015/05/21/rnn-effectiveness/)).

Zbiórem na którym będziemy pracowali jest <i>W poszukiwaniu straconego czasu</i> Marcela Prousta. 

[![](https://upload.wikimedia.org/wikipedia/commons/b/b8/Marcel_Proust_1895.jpg)](https://pl.wikipedia.org/wiki/Marcel_Proust)

>(...) matka widząc, że mi jest zimno, namówiła mnie, abym się napił wbrew zwyczajowi trochę herbaty. Odmówiłem zrazu; potem, nie wiem czemu, namyśliłem się. Posłała po owe krótkie i pulchne ciasteczka zwane magdalenkami, które wyglądają jak odlane w prążkowanej skorupie muszli. I niebawem (...) machinalnie podniosłem do ust łyżeczkę herbaty, w której rozmoczyłem kawałek magdalenki. Ale w tej samej chwili, kiedy łyk pomieszany z okruchami ciasta dotknął mego podniebienia, zadrżałem, czując, że się we mnie dzieje coś niezwykłego. Owładnęła mną rozkoszna słodycz (...). Sprawiła, że w jednej chwili koleje życia stały mi się obojętne, klęski jako błahe, krótkość złudna (...). Cofam się myślą do chwili, w której wypiłem pierwszą łyżeczkę herbaty (...). I nagle wspomnienie zjawiło mi się. Ten smak to była magdalenka cioci Leonii.(...)

Zanim jednak zaczniemy wprowadźmy odrobinę teorii stojącej za tym zagadnieniem:

### Rekurencyjne sieci neuronowe (Recurrent neural networks)

- Charakterystyczną cechą tego typu sieci jest to, że pozwalają one na istnienie wewnątrz grafu cykli skierowanych.
- Oznacza to, że informacja wewnątrz takiej sieci nie musi płynąć tylko w jednym kierunku - neurony leżące na tej samej warstwie także mogą przesyłać sobie wzajemnie dane:

[![](http://karpathy.github.io/assets/rnn/diags.jpeg)](http://karpathy.github.io/2015/05/21/rnn-effectiveness/)

Dzięki tej właściwości RNN doskonale nadają się do budowy interesującego nas modelu: 

[![](http://karpathy.github.io/assets/rnn/charseq.jpeg)](http://karpathy.github.io/2015/05/21/rnn-effectiveness/)

### Long short-term memory

Problemem na który można natrafić w przypadku korzystania z RNN jest pamięć takiej sieci. Gdy odległość pomiędzy aktualnym a poprzedzającymi go węzłami, które niosą za sobą kluczową informację jest niewielka, sieć jest w stanie efektywnie je wykorzystać:

[![](http://colah.github.io/posts/2015-08-Understanding-LSTMs/img/RNN-shorttermdepdencies.png)](http://colah.github.io/posts/2015-08-Understanding-LSTMs/)

Problem się pojawia gdy ta odległość jest duża - wtedy kluczowe informacje po prostu znikają w szumie:

[![](http://colah.github.io/posts/2015-08-Understanding-LSTMs/img/RNN-longtermdependencies.png)](http://colah.github.io/posts/2015-08-Understanding-LSTMs/)

Wtedy też, warto zastosować sieć LSTM, która ze względu na swoją architekturę jest w stanie odpowiednio filtrować informację i wykorzystawać je nawet wtedy, gdy ich źródło jest znacznie oddalone od aktualnego neuronu:

[![](http://colah.github.io/posts/2015-08-Understanding-LSTMs/img/LSTM3-chain.png)](http://colah.github.io/posts/2015-08-Understanding-LSTMs/)

### Alternatywy

Zamiast bazowych sieci rekurencyjnych lub sieci LSTM (i ich [modyfikacji](https://en.wikipedia.org/wiki/Long_short-term_memory)) można zastosować różne alternatywy, np. sieci <b>Gated Recurrent Unit<b> (GRU):
    
[![](https://upload.wikimedia.org/wikipedia/commons/5/5f/Gated_Recurrent_Unit.svg)](https://en.wikipedia.org/wiki/Gated_recurrent_unit)

Lub inne modele skonstruowane do rozwiązywania specyficznych problemów, np. [uczenia na szeregach czasowych.](https://github.com/sdobber/FluxArchitectures)

Przejdźmy teraz do implementowania modelu za pomocą Fluxa:

### Implementacja

In [1]:
using Flux
using Flux: onehot, argmax, chunk, batchseq, throttle, crossentropy, params
using StatsBase: wsample
using Base.Iterators: partition
using BSON
using JLD2
using CUDA

In [2]:
use_cuda = true

true

In [3]:
 if use_cuda && CUDA.functional()
    device = gpu
    @info "Training on GPU"
else
    device = cpu
    @info "Training on CPU"
end

[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mTraining on GPU


Pierwszym krokiem jest oczywiście odpowiednie przygotowanie danych na których będziemy pracowali:

In [4]:
isfile("w_poszukiwaniu.txt") ||
        download("https://raw.githubusercontent.com/bartoszpankratz/221660-0553-Aproksymacja/master/6.%20Sieci%20Rekurencyjne/w_poszukiwaniu.txt","w_poszukiwaniu.txt")

true

In [5]:
text = collect(read("w_poszukiwaniu.txt",String));
alphabet = [unique(text)..., '_'];

Następnie kodujemy zmienne jakościowe:

In [6]:
text = map(ch -> onehot(ch, alphabet), text);
stop = onehot('_', alphabet);

In [7]:
N = length(alphabet);
seqlen = 100;
batch_size = 32;

In [8]:
Xs = collect(partition(batchseq(chunk(text, batch_size), stop), seqlen)) |> device;
Ys = collect(partition(batchseq(chunk(text[2:end], batch_size), stop), seqlen)) |> device;

In [33]:
m = Chain(
    LSTM(N, 128),
    LSTM(128, 512),
    LSTM(512, 256),
    Dense(256, 128, relu),
    Dense(128, 64, relu),
    Dense(64, N),
    softmax) |> device

function loss(xs, ys, ϵ = 1.0f-32)
  l = sum(crossentropy.(broadcast(x -> m(x) .+ ϵ, xs), ys))
  Flux.reset!(m)
  return l
end

opt = ADAM(0.001)


function sample(m, alphabet, len; temp = 1)
    model = cpu(m)
    Flux.reset!(model)
    buf = IOBuffer()
    c = rand(alphabet)
    for i = 1:len
        write(buf, c)
        c = wsample(alphabet, model(onehot(c, alphabet)))
      end
    return String(take!(buf))
end

evalcb = function ()
    @show loss(Xs[5], Ys[5])
    println(sample(m, alphabet, 100))
end

#31 (generic function with 1 method)

In [34]:
loss(Xs[5], Ys[5])

481.27957f0

In [35]:
sample(m, alphabet, 50)

"ëNDZZêPçUn1ęP5Él*èC-uTph*_'vM3äLrїêmô.çyRiÉa4:üfkà"

In [36]:
@info("Beginning training loop...")
best_ls = Inf
last_improvement = 0
for epoch = 1:25
    @info "Epoch: $epoch"
    global best_ls, last_improvement
    Flux.train!(loss, params(m), zip(Xs, Ys), opt, cb=throttle(evalcb, 240))
    ls = loss(Xs[5], Ys[5])
    if ls <= best_ls
        @info "New best result: $ls"
        char_model = cpu.(params(m))
        BSON.@save "char_model.bson" char_model
        jldsave("char_model.jld2"; char_model)
        best_ls = ls
        last_improvement = epoch
    end
    if epoch - last_improvement >= 10
        @warn(" -> We're calling this converged.")
        break
    end
end

[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mBeginning training loop...
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 1


loss(Xs[5], Ys[5]) = 480.3568f0
IM„áŻ/Kq7N?WL18ütEèżĆnôjŹ1ńż—ëÀjN)ńù85OBŻŚüÉkNą”Lr2iÉÀö
 ŚGD°áùąŻzbP-À—. ”­écsâbąu1g­ëü,x?dzŃQ Kobi)
loss(Xs[5], Ys[5]) = 325.27155f0
U!twaj t weckltze ceoęi  kaod cćzsłykręiah i,aueck jpad,ńryłeanoć wrta o y,oisdnS  nilwk aymdtaatise
loss(Xs[5], Ys[5]) = 325.03308f0
M jćjilezesay amy  rk isewgonaspwnżasrgti ky a  ij ormtwApssłao oko ewzkonu  s m onśri,uy oZ y o a s


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 324.86514
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 2


loss(Xs[5], Ys[5]) = 324.91858f0
f wa ey zr,edaełąnaścżroż jr,lsw,t.c i amwz pwead
łyn, joo jod,yadg zemowowcndosl eó,omcnr jjięyaays
loss(Xs[5], Ys[5]) = 324.823f0
d p—ąąup  oysngka sd eśaprrajaóukjoi:zy ooksj,nę peuiwer.aei trenzeaęmżny iłpntt ywo  a irtkazr paza
loss(Xs[5], Ys[5]) = 324.94537f0
qmęempzeaoja pee ać iendn grs Pknithąm ay er owib r  nmm Rnsą wpry  cęwc śaw  d.hyybww,ztragnnosi iz


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 3


loss(Xs[5], Ys[5]) = 324.99927f0
ŃurrB ewetal  issa?fhćkpBcna, st ndzojaeżdupl yaodwzihaiowekzówćr
;óo nemrfraeąę c ydu ofiowzwv trys
loss(Xs[5], Ys[5]) = 324.89127f0
„ócłyoz,k icbłypahtcr ika  wzt”rou c ynęaeepiaizpaće nciikmg u 
ne icębsi rrBs ilęsanmo e,onz,ś koaa
loss(Xs[5], Ys[5]) = 324.15176f0
ü a 
 un iormwe bzś dy biaem ae nełee w śsgkaek  zk gep  zp!egiodś egk yatri ,wnsAł,ćłpta : rzioaiat


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 282.7801
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 4


loss(Xs[5], Ys[5]) = 283.97757f0
* jl,ś puzekesry dacóbo męćdz ce wna bleda c,ciebhzg golzakienłącr,by Jeoz jł 
ażęwajęcejero swhęnoa
loss(Xs[5], Ys[5]) = 269.18243f0
﻿b i ktiełiegbiaząmuj a teźtow kiełełyczbośm ma zje r gię —ć jaś; tó zy jnni niężra aw ponobi uźdej 
loss(Xs[5], Ys[5]) = 257.6004f0
ï wrrać Jechrą waszała ptzeudo np soptnyl sią 
paka somie piesy ję oć ody piszyco ózamin bla)ną kro 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 254.96642
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 5


loss(Xs[5], Ys[5]) = 251.10602f0
½ać rta wobajnaniskryjadjewrka sepkeg Nośresaiżekłczyz, Wie, zo owuco i tieche nie, buci: kanyraztow
loss(Xs[5], Ys[5]) = 242.1544f0
; u snesz bestzycy nacia no, ne caż jot; wiech spoawiłe nuwie doźwiniś tece pułymnedegad, otą; stnił
loss(Xs[5], Ys[5]) = 236.7976f0
Nie a gąk rtópieła, kie me zajy on tuz.,


desórzini,

Cał mie — aszą, uw sznyn zakro, poramdze, aż 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 246.52444
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 6


loss(Xs[5], Ys[5]) = 256.51913f0
rwteńśzcnie, Miel nimdiwaosurcenoweddyj ptałelaAlląniłnaciżl Lą od jwrytmmyłeno mławez z ud, Jow ojl
loss(Xs[5], Ys[5]) = 234.5748f0
Reg.gną che ci czo, le głniy moća uj wiemta gras waduś cych oboscób rastożumo ini: Pod. dobeni cojąm
loss(Xs[5], Ys[5]) = 230.61882f0
Órobe. ch za, kragnień omaja szynieszygrzedajejsac zeskejazkestra kłem lem tepowna.

ściai so Czydes


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 229.62636
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 7


loss(Xs[5], Ys[5]) = 232.50475f0
prąrku, kałapł był Al dazdze przy był gryswechinucz wtrzemiał raróMdyczkoć je lich cial. Al mraż puk
loss(Xs[5], Ys[5]) = 225.12288f0
, zdony de którajej zaurpię: Zo­lni kiesza, że obontrzy dzo jakie spożemy. Osządodajani przedwalnec 
loss(Xs[5], Ys[5]) = 223.95776f0
Dwaznisko. Carzlajetym z spa: Taśdziem dalej ktezynononetyłuwszywomiesznana — sięc przyjaznawycazyvr


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 222.60788
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 8


loss(Xs[5], Ys[5]) = 223.07329f0
ö, żestnenia zedwa, eli by się k e e cić, w jest to że ntu dodętwyszych pune, pać rąm cać pottrza. O
loss(Xs[5], Ys[5]) = 220.96864f0
yśćte głowsł taż miekło, tema w sałema, i póworokachana. Sąt drzezszie kich pan na zadzie. azgo żepł
loss(Xs[5], Ys[5]) = 217.44786f0
dkę robię spotki się wał, je nię bierzyła miwała jestwat ją” sceszącej byłem o z z Bieogłzbieyżym pa


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 214.78336
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 9


loss(Xs[5], Ys[5]) = 213.74669f0
; te cznączanadzewiwiarem gdziałem jego inkchśj, rógniustani przyniną którkuko acacztstaceudznyś, że
loss(Xs[5], Ys[5]) = 213.62679f0
iż tracoiwwią. Aleckacz, *ż do jaktem. Wjących narzecz; w maja inwópcz odnie naline, pozapody — podm
loss(Xs[5], Ys[5]) = 213.279f0
_iki, że i de powranną samące żaz tych, o nienak. Alberczna prza Ale i mójcjaka mmi) sięstka w panim
loss(Xs[5], Ys[5]) = 210.49536f0
Kiertyałbyc małem ta. Tam, pronistęce nid, uczów tak nad jedynącynie ro nazkonie,

Nawewądząc ree d 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 211.53487
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 10


loss(Xs[5], Ys[5]) = 210.33124f0
 Obenie szuza wojnile było fraje miego ciowaląty, oby, ógrzebyć, za szacą musperoalną gewojmnej sery
loss(Xs[5], Ys[5]) = 209.05293f0
6 dacia, wydatem. pottów rozpę mus. Pańśniej jego pal, ich manem, którego. Elbudzien daśmić. zmorzen
loss(Xs[5], Ys[5]) = 206.3742f0
źby się boganiasia tępowależą, tami, za milałni niąb w nawdama w chwiachaciąs czuwiast się bode, kak
loss(Xs[5], Ys[5]) = 205.45898f0
ł sztek.

—, żemu taka się nenie dzaje, Coć ośśma miewsze kiedzie jej serzpiwę pożyłykileś prącich z


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 208.48494
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 11


loss(Xs[5], Ys[5]) = 207.30168f0
” jaką. Chodnie zapnej sarazkim oddzosłał dówowani z z raz End:

Czatao pniawy osłisn. A była z zami
loss(Xs[5], Ys[5]) = 205.92477f0
y w nakicy. Zaźrzynu, żedyrosyczki, którytodtyczyć wy głom jęka,

Wfą i robiwioszośćł, bo mone,”. Ny
loss(Xs[5], Ys[5]) = 204.8472f0
yzatażał stau od czurałemu, w oddda, frzyk nie zach.dnąło.

Nzostacznia wsór kwego mnie aktoświotka 
loss(Xs[5], Ys[5]) = 204.00551f0
4 podrun pani i życzaszcyżyłkniem, oglewczawszyć — bratać w panej głać obortardziowywarłaści palęgi 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 204.21277
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 12


loss(Xs[5], Ys[5]) = 204.91296f0
Fyło symi je to nie wki niżec w głysić jak sposeraz won dztoweń tęka”agł wszy bubiesz, zziaobierając
loss(Xs[5], Ys[5]) = 200.65335f0
_4k poli się drufemy wiekiem sobsiem zl z jedził i, polnie. aby wyby Robunej i zwrzy swojej, coczątk
loss(Xs[5], Ys[5]) = 198.8267f0
6 do słody zgosuch, młystaby rozwiża nakro by moiknych czynem podościertej naszou zawiłowa, uch — za
loss(Xs[5], Ys[5]) = 199.88287f0
'erwie, stuudy obecneńszje podziąc się, gdziego, upewnym mudnąnalka głabywerazmowośmą nieucze wpytte


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 200.35643
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 13


loss(Xs[5], Ys[5]) = 199.43231f0
Żacha. Przywałem moi i, nieozy się dości sam sobie zapowiedzieczna swojego d'iaszem luda czą. Wiedni
loss(Xs[5], Ys[5]) = 196.71284f0
I, który nutośmim chwiroświe, czym wyli go pan o ara których skrowała tarobieżninty i, zworomam wyda
loss(Xs[5], Ys[5]) = 196.79594f0
éa, raz niepoci wzne opate,domórż mrością Swo, i szę się jakbyścią, bo zdrości Sankie, iż, rozwiała 
loss(Xs[5], Ys[5]) = 196.4755f0
Szez noże to mnykłem mnykrzeniemać cieracał drzyje nie wypo nikiejszystólkiał keoni w mierza zadem k
loss(Xs[5], Ys[5]) = 194.98662f0
ênia ragi, a ksope owodość prawpa sobura panie dotkę, mniej o nik, tak słosić te tuil dostwo dlisene


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 197.02354
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 14


loss(Xs[5], Ys[5]) = 196.44664f0
Ńteliska. Man, że ichoch robec, Ale jak rócznania w popierzę, mi tądety, jakimś by dla liżanwardy wó
loss(Xs[5], Ys[5]) = 193.4258f0
3 bezna, jakimi się siebadl. meganie na księprozmanda, że naprzywaję zaanka wytlojej pewna, ktego pr
loss(Xs[5], Ys[5]) = 194.03131f0
Porcie posięczy mam z Velmaczkartwie ich falną Auji taoła Kkiszerunktajbenia do „emiewta! M, odziej.


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 193.6462
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 15


loss(Xs[5], Ys[5]) = 193.41998f0
ńczowóły, zachce szonec, zataroremnin już słowy się mej o oczy ta w jak aacając rlesławnówania przec
loss(Xs[5], Ys[5]) = 193.1761f0
èczku jeśłby się wiennym  czypiorajęcia znana nie diemy żarekich cubie uchodziewkstem, cenie wieka, 
loss(Xs[5], Ys[5]) = 193.3395f0
… alszej nie ciwuokiedzie się p chwili na rodzilico jentkalbaksiętęk poment konaczekieśli chwiał, ro


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 16


loss(Xs[5], Ys[5]) = 194.44955f0
… A widziałem jm dzie chwili szęstą oostawiała przyjmam (my, wyjąch iry stronodzierombnof, który, a 
loss(Xs[5], Ys[5]) = 191.6962f0
°ś*, u nieznanego mą poboswem porzesjofa mn już k zale-Czaje parmieli wydo”mie, zadwotniej słowiści.
loss(Xs[5], Ys[5]) = 190.47919f0
Ft kóczas zroze, sobię wyjakim, zdletk, to mu były wyżina poliwiedząc od to przy muronniwoją, nie sp


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 17


loss(Xs[5], Ys[5]) = 193.99484f0
Ży jest słody natrzeba nieprzynu ace, jrereskowaną. Mość o ale mierzach puje, która na przeglę rypar
loss(Xs[5], Ys[5]) = 190.49846f0
I zadlołonię na dudwi w gdów znice, wydowe gorzyzym odległ, tu, Wskiem, wszy znakż sobie nie się, np
loss(Xs[5], Ys[5]) = 191.88878f0
öle och od znodiechać przyone. Unorowadzi trzych bez nie nacza, adobecdą, prawnie oznać ma jedynie g


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 192.11174
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 18


loss(Xs[5], Ys[5]) = 191.32683f0
.

Padbisch mouakódkolu, młuczęstólny mojegdju, to ryca mi świem wwodzita nim, A int-Can, wcał dobrz
loss(Xs[5], Ys[5]) = 189.83054f0
Pa znaju, obiłem odista, wie jednego typła, z którą styć stał, poczym wrocy —są się, na wy się ot zg
loss(Xs[5], Ys[5]) = 188.2619f0
Xskak jej nodębiestnościtote przyzugiekaczoność książna pamianydną w wikiadniu, chwilą rza ich ji i 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 188.45229
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 19


loss(Xs[5], Ys[5]) = 188.1866f0
à jej obycić samo, że mli Wolbo mi”. Bywnyne zrzyzają orówna ityki, Słyżyć mientych myśl jego oszedł
loss(Xs[5], Ys[5]) = 187.29901f0
'órutent „goż dim. Jak jakbym dzik Siego zachaną draczem przepsiąc źodawatêla razempał mi,

— N Ale 
loss(Xs[5], Ys[5]) = 187.35397f0
w i ale grod z chwilędzie ała codz, nie zana w bę swaj, że Fzie bió czas że Auinteluszecji ane! Patn


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 188.15042
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 20


loss(Xs[5], Ys[5]) = 188.12207f0
'liwanitex okończną najdowadzimentombów, res mnie pochcieciej stnąć irdczyłem w i wody wierzeniot, g
loss(Xs[5], Ys[5]) = 186.33939f0
Ylędącymał za mabącogy. „inie fapę się dotała to strzewać na gostatka, znał, wszelilnącycują, i, cza
loss(Xs[5], Ys[5]) = 187.26553f0
ła. Nniczyłaniach sarcrinyaby Ari w od męż zacowszystkie to mien; a nie w zaj jedyny, przygo dliwna 
loss(Xs[5], Ys[5]) = 187.12431f0
qnkt, równie — dobnaja, miał płaszczaniu, go otcy guj”)”. AIchwolić juśmiejski samy z pony w jem sło


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 187.75536
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 21


loss(Xs[5], Ys[5]) = 187.86436f0
!
OXSgnia, nistu, z wieszczu-Tlekdzież malnom teschał nie ponie starenidowegorerefa, rzały. Watrów, 
loss(Xs[5], Ys[5]) = 186.64975f0
tamo zamówić mnie lałą i dan.

Meksznemu z kłoraparomesztacze cedy to prwać cę byłsybiegtasicidział 
loss(Xs[5], Ys[5]) = 185.68552f0
dzy równocze, podać pistycznawiacoedy przybciste wyfnia spotem po na kolnego juza już alchatku. Ta d
loss(Xs[5], Ys[5]) = 186.69731f0
Syść wskieśsto Albertyny, ra wszczą, canta z wieczór, na, wszyła nisto prem pięstwami tentnit zmest 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 186.20927
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 22


loss(Xs[5], Ys[5]) = 185.8518f0
Usiężnony. Stararą; któw, dla jej.

Ono ów i wy jak się dladów con; w wyraza. Sizalegrwa zlupkn lym 
loss(Xs[5], Ys[5]) = 185.29208f0
1, wrosłość oną szczęstymi, tencę myśl na samięknobechaliknkami, zwałany, żest na Bao w się edu, że 
loss(Xs[5], Ys[5]) = 184.46278f0
żoniemelis, pości grypełnie słowu Moncą dość do słuszłowiekiego groztu, że w nie le, powiedziewt kol
loss(Xs[5], Ys[5]) = 183.97992f0
5I myśli każenie, fowieście samym od równe, grwinnym lekarmi, czące mogliwszy biemiało, miu.

— Gdób


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 185.34935
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 23


loss(Xs[5], Ys[5]) = 184.49039f0
qna swoich błem jakąsznej aniać mnie wzrót; jak ram fille lad lalej, pozomoże zatkieli dcła porodońc
loss(Xs[5], Ys[5]) = 184.78467f0
w i nobi myślate jochadyt w drye i by dywiu, kilt nich jak naprzywęczenibygniejsoonu razusżąć przeds
loss(Xs[5], Ys[5]) = 183.34132f0
ênaszczają tychciał abzej, kochami w swrodzowalnąć w płakomąż farając się we niedraże ca, w które ws
loss(Xs[5], Ys[5]) = 182.9037f0
lą duzyskaniej, ten Ji, swoich jełszeusprawdzolujędaksiężnę sądzi porzczałchydbepnintówne: Gołuży mo


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 184.26135
[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 24


loss(Xs[5], Ys[5]) = 184.27945f0
siężej myiała ją odwając i onagrony serta lepa „mu kolać częłamarponiej, lzad wątrzych uł Czukazgewi
loss(Xs[5], Ys[5]) = 181.54135f0
Czem zamarowalie w to.

Zą, aby nie jej lidy zawać w za bała z w ją matarz przeciw zrazy, onlck, ch 
loss(Xs[5], Ys[5]) = 183.62143f0
Fap. Osić obrycie sobie światów że jedni, ródem, a nie, że się mięskną. Albertyna wóka, czas sobie w
loss(Xs[5], Ys[5]) = 184.00995f0
Horek, ego komusisiry zaze przerłając w o co innych poą cją się na matku rozojał sąwie, jakże, że ma


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mEpoch: 25


loss(Xs[5], Ys[5]) = 185.20535f0
Óloza — i um gas się, ceub domkoboczucia! Modstanałą zację swoi i kowąc oskące i zd mroczem Chadzy c
loss(Xs[5], Ys[5]) = 183.05292f0
za, bo onek pi sposobniona masm kogasty — przyjaciółu, że wiedziałach ile dlatego domóni docy od tyc
loss(Xs[5], Ys[5]) = 181.36703f0
êowe żuś pamie byłyć rozko mnieji i Tutent, zbytej do hającą mnie Alercie, nieokocjomiło spociążych 


[36m[1m[ [22m[39m[36m[1mInfo: [22m[39mNew best result: 181.71532


In [40]:
m = Chain(
    LSTM(N, 128),
    LSTM(128, 512),
    LSTM(512, 256),
    Dense(256, 128, relu),
    Dense(128, 64, relu),
    Dense(64, N),
    softmax) |> device

ps = JLD2.load("char_model.jld2", "char_model")

Flux.loadparams!(m, device.(ps))

In [41]:
@show loss(Xs[5], Ys[5])

loss(Xs[5], Ys[5]) = 181.71532f0


181.71532f0

In [43]:
sample(m, alphabet, 50)

"gdy sranęło czasoz pan jej ją wiel wyda. jak drzec"

## Dodatkowa praca domowa

Zmodyfikuj kod tak, aby poprawić jakość generowanego tekstu <b>(5 punktów)</b>.