HLT

Human Language Technologies project for the a.y. 2020/2021.

Neural Machine Translation task

English-Italian

Europarl Corpus or the english-italian dataset from http://www.manythings.org/anki/

Sources used

Benchmark

https://github.com/facebookresearch/flores/blob/main/README.md

The baselines for confronting the results of our models were chosen from:

MarianMT, https://huggingface.co/Helsinki-NLP/opus-mt-en-it
DeltaLM, https://arxiv.org/pdf/2106.13736.pdf

Tokenizers and models

We used https://huggingface.co/dbmdz/bert-base-italian-cased as the italian tokenizer for each of our models, for the source language we used the correct tokenizer for each encoder.

Masked language encoders:

Neural machine translation encoders:

https://huggingface.co/google/t5-v1_1-small

Name		Name	Last commit message	Last commit date
Latest commit History 144 Commits
dataset		dataset
report		report
.gitignore		.gitignore
DallaNoce_Ristori_HLT.ipynb		DallaNoce_Ristori_HLT.ipynb
Pre_trained_encoder_neural_machine_translation_with_transformer.ipynb		Pre_trained_encoder_neural_machine_translation_with_transformer.ipynb
README.md		README.md
Report_DallaNoce_Ristori.pdf		Report_DallaNoce_Ristori.pdf
decoder.py		decoder.py
encoder.py		encoder.py
main.py		main.py
positional_embedding.py		positional_embedding.py
transformer.py		transformer.py
translator.py		translator.py
utilities.py		utilities.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

HLT

Neural Machine Translation task

Sources used

Benchmark

Tokenizers and models

Masked language encoders:

Neural machine translation encoders:

About

Releases

Packages

Contributors 2

Languages

nikodallanoce/NeuralMachineTranslation

Folders and files

Latest commit

History

Repository files navigation

HLT

Neural Machine Translation task

Sources used

Benchmark

Tokenizers and models

Masked language encoders:

Neural machine translation encoders:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages