# Inference Demo

In [1]:
import data_utils
import inference
import train_utils
import ithaca_like



In [2]:
params = inference.load_params("LatinTatoebaDebug/36/default/")
model_config = ithaca_like.IthacaTranslationConfig(**train_utils.parse_config("latin_tatoeba_model.yml"))

(
    train_dl,
    test_dl, 
    source_tokenizer, 
    target_tokenizer
) = data_utils.get_training_data(train_utils.TrainConfig(**train_utils.parse_config("latin_tatoeba_train.yml")), model_config.max_len)


model_config = model_config.replace(
    char_vocab_size=source_tokenizer.vocab_size(words=False),
    word_vocab_size=source_tokenizer.vocab_size(),
    out_char_vocab_size=target_tokenizer.vocab_size(words=False),
    out_word_vocab_size=target_tokenizer.vocab_size(),
    deterministic=True,
    decode=True,
)

In [3]:
model_config

IthacaTranslationConfig(char_vocab_size=31, word_char_emb_size=256, word_vocab_size=10000, out_char_vocab_size=31, out_word_vocab_size=10000, emb_size=256, max_len=256, dropout=0.1, dtype='float32', decode=True, layers=2, qkv_dim=256, mlp_dim=512, num_heads=8, attention_dropout=0.1, activation_fn='gelu', block_size=8, deterministic=True)

In [4]:
test_dl.array_only = False
it = iter(test_dl)

In [5]:
batch = next(it)
batch

{'source': ['feles super sellam sedebat',
  'puer lapidem iacit',
  'annus mmxvi simiae est',
  'abraham nonaginta novem erat annorum quando circumcisus est in carne praeputii sui et ismael filius eius tredecim annos impleverat tempore circumcisionis suae',
  'feles homo non est',
  'festinavit abraham in tabernaculum ad saram dixitque accelera tria sata similae commisce et fac subcinericios panes',
  'surrexit abraham et adoravit populum terrae filios videlicet heth dixitque ad eos si placet animae vestrae ut sepeliam mortuum meum audite me et intercedite pro me apud ephron filium seor ut det mihi speluncam machpela quam habet in extrema parte agri su',
  'da mihi cervisiam quaeso',
  'raeda celerior quam birota est',
  'liber e charta factus est',
  'felis domum a muribus purgat',
  'profectus inde abraham in terram nageb habitavit inter cades et sur et peregrinatus est in geraris',
  'traditum est homerum caecum fuisse',
  'abel quoque obtulit de primogenitis gregis sui et de adipib

In [6]:
s, t = inference.translate(
    batch["source"],
    params,
    source_tokenizer,
    target_tokenizer,
    len(batch["source"]),
    4,
    model_config.max_len,
    model_config
)

100%|██████████| 1/1 [00:11<00:00, 11.55s/it]


In [7]:
s

['feles super sellam sedebat',
 'puer lapidem iacit',
 'annus mmxvi simiae est',
 'abraham nonaginta novem erat annorum quando circumcisus est in carne praeputii sui et ismael filius eius tredecim annos impleverat tempore circumcisionis suae',
 'feles homo non est',
 'festinavit abraham in tabernaculum ad saram dixitque accelera tria sata similae commisce et fac subcinericios panes',
 '',
 'da mihi cervisiam quaeso',
 'raeda celerior quam birota est',
 'liber e charta factus est',
 'felis domum a muribus purgat',
 'profectus inde abraham in terram nageb habitavit inter cades et sur et peregrinatus est in geraris',
 'traditum est homerum caecum fuisse',
 'abel quoque obtulit de primogenitis gregis sui et de adipibus eorum et respexit dominus ad abel et ad munus eius',
 'abram habitavit in terra chanaan lot vero moratus est in oppidis quae erant circa iordanem et tabernacula movit usque ad sodomam',
 'machina computatoria praesentior est quam abacus']

In [8]:
t

['the',
 'you',
 'i',
 'and',
 'you',
 'and',
 'and',
 'i',
 'i',
 'you',
 'the',
 'and',
 'the',
 'and',
 'and',
 'the']