![image](https://media.geeksforgeeks.org/wp-content/uploads/20231226141038/Machine-Translation-Model.png)

----
## Empat Tipe Utama Machine Translation
### 1. Rule-Based Machine Translation (RBMT)

Rule-based machine translation mengandalkan sumber daya linguistik seperti aturan tata bahasa, kamus bilingual, dan aturan transformasi. Sistem bekerja dengan cara:

1. Melakukan parsing pada teks sumber
2. Mengubah teks menjadi representasi perantara
3. Menghasilkan teks dalam bahasa target berdasarkan aturan tata bahasa dan kamus

Pendekatan ini memastikan terjemahan yang akurat untuk konteks tertentu, namun memerlukan banyak aturan manual.

In [None]:
# Kamus bilingual sederhana Indonesia -> Inggris
dictionary = {
    "saya": "I",
    "makan": "eat",
    "nasi": "rice",
    "setiap": "every",
    "pagi": "morning"
}

# Aturan grammar dasar (opsional, sangat sederhana)
def translate_rbmt(sentence):
    words = sentence.lower().split()
    translated = [dictionary.get(w, w) for w in words]
    return " ".join(translated).capitalize()

print(translate_rbmt("saya makan nasi setiap pagi"))

### 2. Statistical Machine Translation (SMT)

Berbeda dari RBMT yang berbasis aturan, SMT mengandalkan pembelajaran mesin berbasis statistik. Algoritma SMT mempelajari pola dari kumpulan besar terjemahan manusia (parallel corpus).

Ketika menerjemahkan teks baru, sistem:

  - Menggunakan probabilitas hasil pelatihan
  - "Menebak" pasangan kata atau frasa target yang paling mungkin
  - Memilih terjemahan berdasarkan kemungkinan statistik tertinggi

Pendekatan ini lebih fleksibel tetapi bergantung pada kualitas dan jumlah data.

In [None]:
# Probabilitas terjemahan sederhana (mock SMT)
probabilities = {
    "saya": {"I": 0.9, "me": 0.1},
    "makan": {"eat": 0.7, "consume": 0.3},
    "nasi": {"rice": 1.0}
}

def translate_smt(sentence):
    words = sentence.lower().split()
    translated = []
    for w in words:
        if w in probabilities:
            # Pilih terjemahan dengan probabilitas tertinggi
            best = max(probabilities[w], key=probabilities[w].get)
            translated.append(best)
        else:
            translated.append(w)
    return " ".join(translated).capitalize()

print(translate_smt("saya makan nasi"))


### 3. Neural Machine Translation (NMT)

Neural Machine Translation memanfaatkan arsitektur neural network, yaitu jaringan node yang terhubung satu sama lain menyerupai cara kerja otak manusia.

Prosesnya:

1. Teks masuk ke jaringan sebagai input
2. Setiap node memproses sebagian informasi
3. Transformasi dilakukan berlapis-lapis
4. Node terakhir menghasilkan terjemahan akhir

NMT mampu menghasilkan terjemahan yang lebih natural, kontekstual, dan mendekati manusia.

In [None]:
from transformers import MarianMTModel, MarianTokenizer

model_name = "Helsinki-NLP/opus-mt-id-en"
tokenizer = MarianTokenizer.from_pretrained(model_name)
model = MarianMTModel.from_pretrained(model_name)

def translate_nmt(sentence):
    inputs = tokenizer(sentence, return_tensors="pt")
    translated = model.generate(**inputs)
    return tokenizer.decode(translated[0], skip_special_tokens=True)

print(translate_nmt("saya belajar machine learning"))


### 4. Hybrid Machine Translation

Hybrid Machine Translation menggabungkan dua atau lebih pendekatan MT untuk meningkatkan kualitas terjemahan.

Biasanya melibatkan:

1. Rule-Based Machine Translation untuk struktur dan akurasi
2. Statistical Machine Translation untuk fleksibilitas dan variasi
3. Hasil akhir merupakan sintesis dari keluaran berbagai sub-sistem

Pendekatan hybrid mengatasi kelemahan masing-masing metode dan menghasilkan terjemahan yang lebih stabil serta akurat.

In [None]:
# RBMT sederhana
dictionary = {"saya": "I", "makan": "eat", "nasi": "rice"}

def rbmt(sentence):
    return " ".join([dictionary.get(w, w) for w in sentence.split()])

# NMT (menggunakan model sama seperti di atas)
def hybrid_translate(sentence):
    pre = rbmt(sentence)
    final = translate_nmt(pre)  # refinement oleh NMT
    return final

print(hybrid_translate("saya makan nasi"))
