In [None]:
!pip install jiwer
!pip install tqdm

Collecting jiwer
  Downloading jiwer-4.0.0-py3-none-any.whl.metadata (3.3 kB)
Collecting rapidfuzz>=3.9.7 (from jiwer)
  Downloading rapidfuzz-3.13.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (12 kB)
Downloading jiwer-4.0.0-py3-none-any.whl (23 kB)
Downloading rapidfuzz-3.13.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (3.1 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.1/3.1 MB[0m [31m98.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: rapidfuzz, jiwer
Successfully installed jiwer-4.0.0 rapidfuzz-3.13.0


In [None]:
import os
import torch
import torchaudio
import zipfile
import pandas as pd
from torch.utils.data import Dataset, DataLoader
from transformers import WhisperProcessor, WhisperForConditionalGeneration
from peft import get_peft_model, LoraConfig, TaskType, PeftModel
from tqdm import tqdm

# CUDA memory config
os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "expandable_segments:True"
device = "cuda" if torch.cuda.is_available() else "cpu"

In [None]:
# Unzip audio files if needed
zip_path = "final_segments.zip"
extract_path = "final_segments"

if not os.path.exists(extract_path):
    print("Extracting audio files...")
    with zipfile.ZipFile(zip_path, 'r') as zip_ref:
        zip_ref.extractall(extract_path)
    print("Extraction complete.")

Extracting audio files...
Extraction complete.


In [None]:
# Dataset
class WhisperDataset(Dataset):
    def __init__(self, csv_path, processor, audio_folder, max_length=128):
        self.df = pd.read_csv(csv_path)
        self.processor = processor
        self.audio_folder = audio_folder
        self.max_length = max_length

        # Only keep rows where audio file exists
        self.df["Audio File"] = self.df["Audio File"].apply(os.path.basename)
        self.df = self.df[self.df["Audio File"].apply(
            lambda x: os.path.exists(os.path.join(self.audio_folder, x))
        )].reset_index(drop=True)

    def __len__(self):
        return len(self.df)

    def __getitem__(self, idx):
        row = self.df.iloc[idx]
        audio_filename = row["Audio File"]
        audio_path = os.path.join(self.audio_folder, audio_filename)
        text = row["Text Chunk"]

        audio_tensor, sr = torchaudio.load(audio_path)
        if sr != 16000:
            audio_tensor = torchaudio.transforms.Resample(sr, 16000)(audio_tensor)
        audio_array = audio_tensor.mean(dim=0).numpy()

        inputs = self.processor(audio_array, sampling_rate=16000, return_tensors="pt")
        labels = self.processor.tokenizer(
            text,
            padding="max_length",
            truncation=True,
            max_length=self.max_length,
            return_tensors="pt"
        ).input_ids
        labels[labels == self.processor.tokenizer.pad_token_id] = -100

        return {
            "input_features": inputs.input_features.squeeze(0),
            "labels": labels.squeeze(0)
        }

In [None]:
# Load Whisper model and processor
model_name = "openai/whisper-small"
processor = WhisperProcessor.from_pretrained(model_name)
base_model = WhisperForConditionalGeneration.from_pretrained(
    model_name,
    torch_dtype=torch.float16,
    device_map="auto"
)

Error while fetching `HF_TOKEN` secret value from your vault: 'Requesting secret HF_TOKEN timed out. Secrets can only be fetched when running from the Colab UI.'.
You are not authenticated with the Hugging Face Hub in this notebook.
If the error persists, please let us know by opening an issue on GitHub (https://github.com/huggingface/huggingface_hub/issues/new).


preprocessor_config.json: 0.00B [00:00, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

normalizer.json: 0.00B [00:00, ?B/s]

added_tokens.json: 0.00B [00:00, ?B/s]

special_tokens_map.json: 0.00B [00:00, ?B/s]

config.json: 0.00B [00:00, ?B/s]

model.safetensors:   0%|          | 0.00/967M [00:00<?, ?B/s]

generation_config.json: 0.00B [00:00, ?B/s]

In [None]:
# LoRA config
lora_config = LoraConfig(
    task_type=TaskType.SEQ_2_SEQ_LM,
    inference_mode=False,
    r=8,
    lora_alpha=16,
    lora_dropout=0.1,
    target_modules=["q_proj", "v_proj"]
)

In [None]:
# Apply LoRA
model = get_peft_model(base_model, lora_config)

# Patch model for audio (input_features) instead of input_ids
class WhisperPeftWrapper(PeftModel):
    def forward(self, input_features=None, labels=None, **kwargs):
        return self.base_model(input_features=input_features, labels=labels, **kwargs)

    def generate(self, input_features=None, **kwargs):
        return self.base_model.generate(input_features=input_features, **kwargs)

# Use correct adapter config
adapter_config = model.peft_config["default"]
model = WhisperPeftWrapper(model.base_model, adapter_config).to(device)

# Dataset and DataLoader
dataset = WhisperDataset("aligned_final_segments.csv", processor, extract_path)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)



In [None]:
# Training
optimizer = torch.optim.AdamW(model.parameters(), lr=1e-4)
model.train()

print("Starting training...\n")
for epoch in range(20):
    total_loss = 0
    pbar = tqdm(dataloader, desc=f"Epoch {epoch+1}")
    for batch in pbar:
        input_features = batch["input_features"].to(device).half()
        labels = batch["labels"].to(device)

        outputs = model(input_features=input_features, labels=labels)
        loss = outputs.loss
        loss.backward()

        optimizer.step()
        optimizer.zero_grad()

        total_loss += loss.item()
        pbar.set_postfix(loss=loss.item())

    print(f"Epoch {epoch+1} complete - Avg Loss: {total_loss / len(dataloader):.4f}")

# Save Model
model.save_pretrained("whisper-small-peft-malay-e20")
processor.save_pretrained("whisper-small-peft-malay-e20")
print("Model saved to 'whisper-small-peft-malay-e20'")

Starting training...



Epoch 1:   0%|          | 0/1424 [00:00<?, ?it/s]Passing a tuple of `past_key_values` is deprecated and will be removed in Transformers v4.43.0. You should pass an instance of `EncoderDecoderCache` instead, e.g. `past_key_values=EncoderDecoderCache.from_legacy_cache(past_key_values)`.
Epoch 1: 100%|██████████| 1424/1424 [03:39<00:00,  6.49it/s, loss=0.314]


Epoch 1 complete - Avg Loss: 0.6002


Epoch 2: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.325]


Epoch 2 complete - Avg Loss: 0.3331


Epoch 3: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.26]


Epoch 3 complete - Avg Loss: 0.3017


Epoch 4: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.314]


Epoch 4 complete - Avg Loss: 0.2755


Epoch 5: 100%|██████████| 1424/1424 [03:37<00:00,  6.55it/s, loss=0.184]


Epoch 5 complete - Avg Loss: 0.2540


Epoch 6: 100%|██████████| 1424/1424 [03:38<00:00,  6.53it/s, loss=0.222]


Epoch 6 complete - Avg Loss: 0.2346


Epoch 7: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.0997]


Epoch 7 complete - Avg Loss: 0.2171


Epoch 8: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.155]


Epoch 8 complete - Avg Loss: 0.2019


Epoch 9: 100%|██████████| 1424/1424 [03:37<00:00,  6.53it/s, loss=0.247]


Epoch 9 complete - Avg Loss: 0.1868


Epoch 10: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.359]


Epoch 10 complete - Avg Loss: 0.1732


Epoch 11: 100%|██████████| 1424/1424 [03:37<00:00,  6.54it/s, loss=0.199]


Epoch 11 complete - Avg Loss: 0.1611


Epoch 12: 100%|██████████| 1424/1424 [03:38<00:00,  6.52it/s, loss=0.269]


Epoch 12 complete - Avg Loss: 0.1495


Epoch 13: 100%|██████████| 1424/1424 [03:39<00:00,  6.49it/s, loss=0.0944]


Epoch 13 complete - Avg Loss: 0.1386


Epoch 14: 100%|██████████| 1424/1424 [03:38<00:00,  6.52it/s, loss=0.16]


Epoch 14 complete - Avg Loss: 0.1286


Epoch 15: 100%|██████████| 1424/1424 [03:38<00:00,  6.53it/s, loss=0.125]


Epoch 15 complete - Avg Loss: 0.1192


Epoch 16: 100%|██████████| 1424/1424 [03:38<00:00,  6.52it/s, loss=0.0695]


Epoch 16 complete - Avg Loss: 0.1101


Epoch 17: 100%|██████████| 1424/1424 [03:38<00:00,  6.52it/s, loss=0.0578]


Epoch 17 complete - Avg Loss: 0.1042


Epoch 18: 100%|██████████| 1424/1424 [03:38<00:00,  6.51it/s, loss=0.109]


Epoch 18 complete - Avg Loss: 0.0975


Epoch 19: 100%|██████████| 1424/1424 [03:39<00:00,  6.49it/s, loss=0.155]


Epoch 19 complete - Avg Loss: 0.0932


Epoch 20: 100%|██████████| 1424/1424 [03:38<00:00,  6.52it/s, loss=0.0618]


Epoch 20 complete - Avg Loss: 0.0847
Model saved to 'whisper-small-peft-malay-e3'


In [None]:
from peft import PeftModel, PeftConfig

# Reload model and processor
processor = WhisperProcessor.from_pretrained("whisper-small-peft-malay-e3")
base_model = WhisperForConditionalGeneration.from_pretrained("openai/whisper-small", torch_dtype=torch.float16, device_map="auto")

# Load PEFT config
config = PeftConfig.from_pretrained("whisper-small-peft-malay-e3")
model = PeftModel.from_pretrained(base_model, "whisper-small-peft-malay-e3")
model = model.to(device)

# Wrap for input_features
class WhisperPeftWrapper(PeftModel):
    def forward(self, input_features=None, labels=None, **kwargs):
        return self.base_model(input_features=input_features, labels=labels, **kwargs)

    def generate(self, input_features=None, **kwargs):
        return self.base_model.generate(input_features=input_features, **kwargs)

model = WhisperPeftWrapper(model.base_model, config).to(device)



In [None]:
from jiwer import wer
import pandas as pd
from tqdm import tqdm
import torch

def evaluate_model(model, processor, dataset, save_path="evaluation_results_small_e20.csv", preview_limit=100):
    model.eval()
    predictions = []
    references = []
    audio_ids = []

    # Force decoder to transcribe in Malay
    forced_decoder_ids = processor.get_decoder_prompt_ids(language="malay", task="transcribe")
    total_samples = len(dataset)

    print(f"Evaluating on {total_samples} samples...\n")

    for i in tqdm(range(total_samples), desc="Evaluating"):
        sample = dataset[i]
        input_features = sample["input_features"].unsqueeze(0).to("cuda").half()

        with torch.no_grad():
            generated_ids = model.generate(
                input_features=input_features,
                forced_decoder_ids=forced_decoder_ids,
                max_new_tokens=128,
                no_repeat_ngram_size=3
            )
            transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]

        target = processor.tokenizer.decode(
            [t for t in sample["labels"].tolist() if t != -100],
            skip_special_tokens=True
        )

        predictions.append(transcription.strip().lower())
        references.append(target.strip().lower())
        audio_ids.append(i)

        if i < preview_limit:
            sample_wer = wer([target.strip().lower()], [transcription.strip().lower()])
            print(f"\nSample {i+1}")
            print(f"Reference:     {target}")
            print(f"Transcription: {transcription}")
            print(f"WER:           {sample_wer:.3f}\n")

    # Compute overall WER
    overall_wer = wer(references, predictions)
    print(f"\nOverall WER (Word Error Rate): {overall_wer:.3f}")

    # Save results
    df = pd.DataFrame({
        "ID": audio_ids,
        "Reference": references,
        "Prediction": predictions
    })
    df["WER"] = df.apply(lambda row: wer([row["Reference"]], [row["Prediction"]]), axis=1)
    df.to_csv(save_path, index=False)
    print(f"Results (with per-row WER) saved to: {save_path}")

    return overall_wer

In [None]:
# Evaluate on up to 100 samples from the training dataset
evaluate_model(model, processor, dataset, save_path="evaluation_results_small_e20.csv", preview_limit=100)

Evaluating on 2848 samples...



Evaluating:   0%|          | 1/2848 [00:01<1:18:46,  1.66s/it]


Sample 1
Reference:     Pendahuluan,  pendapat  awal  saya  mengenai  masalah  yang  sedang  dihadapi  oleh  orang  melayu  dibentangkan  untuk  pertama  kalinya  sewaktu  menjawab  cabaran  yang  dikemukakan  oleh  Profesor  Ungku  Aziz,  Professor  Ekonomi,  (sekarang  Professor  Diraja  dan  Naib
Transcription:  Pendahuluan, pendapat awal saya mengenai masalah yang sedang dihadapi oleh orang Melayu dibentangkan untuk pertama kalinya sewaktu menjawab cabaran yang dikemukakan oleh Prof. Unku Aziz, Prof. Ekonomi, sekarang Prof. Diraja dan naip
WER:           0.188



Evaluating:   0%|          | 2/2848 [00:02<1:09:13,  1.46s/it]


Sample 2
Reference:     Canselor  di  Universiti  Malaya.  Di  dalam  satu  seminar  yang  diadakan  di  Kuala  Lumpur  pada  tahun  1966,  ketika  membincangkan  sebab-sebab  lemahnya  pencapaian  pelajar-pelajar  melayu,  saya  telah  menyebut,  antara  lain,
Transcription:  Di dalam satu semina yang diadakan di Kuala Lumpur pada tahun 1966, ketika membincangkan sebab lemahnya pencapaian Praja-Praja Melayu, saya telah menyebut antara lain
WER:           0.321



Evaluating:   0%|          | 3/2848 [00:03<55:03,  1.16s/it]  


Sample 3
Reference:     tentang  pengaruh  ke  turunan  dan  alam  sekitar  sebagai  faktor -faktor  yang  menyebabkan  wujudnya  masalah  ini.
Transcription:  tentang pengaruh keturunan dan alam sekitar sebagai faktor-faktor yang menyebabkan wujudnya masalah ini.
WER:           0.267



Evaluating:   0%|          | 4/2848 [00:05<1:05:43,  1.39s/it]


Sample 4
Reference:     Memang  tidak  dapat  dinafikan  bahawa  lain-lain  faktor  seperti  dasar  pelajaran,  kemudahan  yang  tidak  mencukupi,  kekurangan  guru  serta  guru  yang  tidak  cukup  terlatih  turut  memainkan  peranan  dalam  meningkatkan  lagi  peratus  kegagalan  di  kalangan  pelajar
Transcription:  Memang tidak dapat dinafikan bahawa lain-lain faktor seperti dasar pelajaran, kemudahan yang tidak mencukupi, kekurangan guru seter guru yang tidak cukup terlatih turut memainkan peranan dalam meningkatkan lagi peratus kegagalan di kalangan pelajar
WER:           0.030



Evaluating:   0%|          | 5/2848 [00:06<1:00:15,  1.27s/it]


Sample 5
Reference:     melayu.  Namun,  pada  hemat  saya,  faktor -faktor  keturunan  dan  alam  sekitar  tidak  boleh  diketepikan  begitu  sahaja  tanpa  diberi  perhatian  yang  serius.
Transcription:  Namun, pada hemat saya, faktor-faktor keturunan dan alam sekitar tidak boleh diketebikan begitu sahaja tanpa diberi perhatian yang serius.
WER:           0.190



Evaluating:   0%|          | 6/2848 [00:08<1:07:10,  1.42s/it]


Sample 6
Reference:     Pandangan  yang  sedemikian  pada  umumnya  telah  tidak  dipersetujui  oleh  peserta -peserta  seminar  terutama sekali  oleh  Profesor  Ungku Aziz  sebab  pandangan  tersebut  dikatakan  memberi  takrif  bahawa  orang  melayu  memang  pada  lahiriahnya  adalah  bersifat
Transcription:  Pandangan yang sedemikian pada umumnya telah tidak dipesetujui oleh peserta-peserta semina, terutama sekali oleh Prof. Unku Aziz sebab pandangan tersebut dikatakan memberitah krif bahawa orang Melayu memang pada lahir yahnya adalah bersifat
WER:           0.312



Evaluating:   0%|          | 7/2848 [00:09<1:03:16,  1.34s/it]


Sample 7
Reference:     inferior  atau  rendandiri.  Oleh  kerana sifat  ini  dikatakan  terdapat  dalam  zuriat  orang  melayu,  maka  ini  bermakna  is  kekal  turun-temurun.
Transcription:  infiria atau rendan diri. Oleh kerana sifat ini dikatakan terdapat dalam zuriak orang Melayu, maka ini bermakna iskikal turun temulun.
WER:           0.368



Evaluating:   0%|          | 8/2848 [00:11<1:08:05,  1.44s/it]


Sample 8
Reference:     Ini  bukanlah  apa  yang  saya  maksudkan  atau  apa  yang  telah  saya  rumuskan.  Tujuan  saya  ialah  mahu  menumpukan  perhatian  kepada  beberapa  faktor  hakiki  yang  merencatkan  kemajuan  orang  melayu  terutama  faktor  yang  boleh  dibaiki.
Transcription:  Ini bukanlah apa yang saya maksudkan atau apa yang telah saya rumuskan. Tujuan saya ialah mahu menumpukan perhatian kepada beberapa faktor hakiki yang merencatkan kemajuan orang Melayu, terutama faktor-faktor yang boleh dibayar.
WER:           0.094



Evaluating:   0%|          | 9/2848 [00:12<1:11:39,  1.51s/it]


Sample 9
Reference:     Jika  amalan  yang  dianggap  kurang  baik  itu  diketahui  dan  diakui  oleh  umum,  maka  lebih  mudahlah  untuk  mengatasinya  pada  umumnya  orang-orang  Islam,  termasuk  orang -orang  melayu  memang  tidak  dapat  menerima  fikiran -fikiran  moden  mengenai  evolusi
Transcription:  Jika amalannya dianggap kurang baik itu diketahui dan diakui oleh umum, maka lebih mudahlah untuk mengatasinya, pada umumnya, orang-orang Islam, termasuk orang- orang Melayu memang tidak dapat menerima fikiran-fikiran modern mengenai evolusi
WER:           0.265



Evaluating:   0%|          | 10/2848 [00:13<1:06:31,  1.41s/it]


Sample 10
Reference:     manusia.  Meskipun  begitu  orang  melayu  sendiri  mengakui  bahawa  ciri-ciri  tentu  dalam  diri  seseorang  itu  diturunkan  dari  ibu  bapa  kepada  anak -anak  mereka.
Transcription:  Meskipun begini, orang Melayu sendiri mengakui bahawa ciri-ciri tertentu dalam diri seseorang itu diturunkan dari ibu bapa kepada anak-anak mereka.
WER:           0.227



Evaluating:   0%|          | 11/2848 [00:15<1:13:44,  1.56s/it]


Sample 11
Reference:     Ini  dapat  dilihat  dalam  peribahasa  melayu  yang  berbunyi  bapa  borek  anak  rintik.  Maksudnya  memang  nyata,  kalau  begitulah  keadaannya  bagi  seseorang  individu,  maka  tentunya  pengaruh  keturunan  juga  memainkan  perannanya  dalam  perkembangan kelompok  individu
Transcription:  ini dapat dilihat dalam peribahasa Melayu yang berbunyi Bapak Borik Anak Rintik. Maksudnya memang nyata, kalau bagitulah keadaannya bagi seseorang individu, maka tentunya pengaruh keturunan juga memainkan peranannya dalam perkembangan kelompok individu
WER:           0.125



Evaluating:   0%|          | 12/2848 [00:16<1:04:40,  1.37s/it]


Sample 12
Reference:     dalam  sesuatu  kaum.  Perkara  yang  umumnya  tidak  diketahui  oleh  orang -orang  melayu  adalah  kesan  pembiakan  seketurunan  atau  pembiakbakaan  dalam.
Transcription:  Percara yang umumnya tidak diketahui oleh orang-orang Melayu adalah kesan pembiarkan seketurunan atau pembiak bakaan dalam.
WER:           0.474



Evaluating:   0%|          | 13/2848 [00:18<1:06:15,  1.40s/it]


Sample 13
Reference:     Di  dalam  buku  ini  saya  cuba  menerangkan  bagaimana  hukum  genetik  yang  menentukan  penyaluran  ciri -ciri  keturunan  dipengaruhi  oleh  pembiakan  seketurunan  dan  lain -lain  amalan  perkahwinan.
Transcription:  Di dalam buku ini saya cuba menerangkan bagaimana hukum genetik yang menentukan penyaluran ciri-ciri keturunan, dipengaruhi oleh pembiarkan seketurunan dan lain-lain amalan perkahwinan.
WER:           0.240



Evaluating:   0%|          | 14/2848 [00:19<1:02:27,  1.32s/it]


Sample 14
Reference:     Pemikiran  yang  berdasarkan  kepada  prinsip -prinsip  sains  telah  banyak  didapati  mengenai  pembiakan  seketurunan  dan  kesannya  terhadap  masyarakat  manusia.
Transcription:  Pemikiran yang berdasarkan kepada prinsip-prinsip sains telah banyak didapati mengenai pembiakan seketurunan dan kesannya terhadap masyarakat manusia.
WER:           0.111



Evaluating:   1%|          | 15/2848 [00:20<1:01:58,  1.31s/it]


Sample 15
Reference:     Malahan  Ceril Dean  Darlington,  seorang  ahli  genetik  British,  di  dalam  bukunya,  the  evolution  of  men  and  society  memberi  pendapat  yang  ekstrem  bahawa  evolusi  masyarakat  manusia  ditentukan  oleh  bakar.
Transcription:  Malahan serial Dinda LinkedIn, seorang ahli genetik British di dalam bukunya, The Evolution of Man and Society, memberi pendapat yang ekstrem bahawa evolusi masyarakat manusia ditentukan oleh bakar.
WER:           0.214



Evaluating:   1%|          | 16/2848 [00:22<1:08:56,  1.46s/it]


Sample 16
Reference:     Menurut  beliau,  tamadun  akan  bekerja  bang  maju  atau  untuk  mengikol  penentuan  bakar.  Beliau  menyatakan  bahawa  apabila  sesuatu  golongan  pemerintah  berkuasa,  mereka  akan  cuba  mengekalkan  kuasa  mereka  melalui  pembiakan  seketurunan  tanpa  membenarkan
Transcription:  Menurut Beliau, Tamadon akan berkembang maju atau runtuh mengikut penentuan bakar. Beliau menyatakan bahawa apabila sesuatu golongan pemerintah berkuasa, mereka akan cuba mengekalkan kuasa mereka melalui pembiakan seketurunan tanpa membenarkan
WER:           0.161



Evaluating:   1%|          | 17/2848 [00:24<1:13:08,  1.55s/it]


Sample 17
Reference:     kemasukan  bakar  bakar  bang  ke  dalam  keturunan  mereka.  Amalan  begini,  menurut  darlington  telah  mempercepatkan  kejatuhan  pemerintahan  firau,  pelimi  dan  sezer,  hipotesis  yang  menarik  ini  umumnya  agak  ke  terlaluan  untuk  diteri -mengolis
Transcription:  kemasukan bakar-bakar bahan ke dalam keturunan mereka. Amalan begini, menurut Darlington, telah mempercepatkan kejatuhan pemerintahan firau, pelini dan siza, hipotesis yang menarik ini umumnya agak ketelaluan untuk diterima oleh
WER:           0.323



Evaluating:   1%|          | 18/2848 [00:25<1:12:21,  1.53s/it]


Sample 18
Reference:     semua  orang,  termasuklah  orang -orang  bukan  Islam.  Baga  mana  pun,  darlington  cuma  menyentuh  mengenai  soal  perkahwinan  di  antara  saudara  kandung,  satu  amalan  yang  tidak  terdapat  langsung  di  kalangan  orang -orang  melayu.
Transcription:  semua orang, termasuklah orang-orang bukan Islam. Bagaimanapun, Darlington cuma menyentuh mengenai soal perkawinan di antara saudara Kandong, satu amalan yang tidak terdapat langsung di kalangan orang- orang Melayu.
WER:           0.290



Evaluating:   1%|          | 19/2848 [00:26<1:06:31,  1.41s/it]


Sample 19
Reference:     Walaupun  bagaimana  pun,  takrif  moden  mengenai  pembiakan  seketurunan  telah  masuklah  amalan  perkahwinan  di  antara  sepupu  atau  kaum  keluarga  yang  dekat.
Transcription:  Walaubagaimanapun, takrif modern mengenai pembiakan seketurunan termasuklah amalan perkawinan di antara sepupu atau kaum keluarga yang dekat.
WER:           0.350



Evaluating:   1%|          | 20/2848 [00:28<1:10:00,  1.49s/it]


Sample 20
Reference:     Amalan  begini  agak  biasa  berlaku  di  kalangan  orang -orang  melayu.  Pengaruh  keturunan  boleh  juga  menimbulkan  kesan  yang  buruh  di  dalam  mah  syarakat  yang  menggalakkan  setiap  orang  perkahwin,  tidak  kira  sama  ada  orang  itu  sihat  atau  tidak.
Transcription:  Amalan begini agak biasa berlaku di kalangan orang-orang Melayu. Pengaruh keturunan boleh juga menimbulkan kesan yang buruk di dalam masyarakat yang menggalakkan setiap orang berkahwin tidak kira sama ada orang itu sihat atau tidak.
WER:           0.167



Evaluating:   1%|          | 21/2848 [00:29<59:10,  1.26s/it]  


Sample 21
Reference:     Oleh  itu,  orang -orang  yang  cacat  tubuh  badan  dan  otak  juga  dikahwinkan  dan  beranak  pina.
Transcription:  Oleh itu orang-orang yang cacak tubuh badan dan otak juga dikawinkan dan beranak pinah.
WER:           0.400



Evaluating:   1%|          | 22/2848 [00:31<1:07:14,  1.43s/it]


Sample 22
Reference:     Sesunggungnya  memang  diaku  i  bahawa  pembiakan  seketurunan  tidaklah  berlaluas  di  dalam  masyarakat  melayu,  namun  tidak  dapat  dinafikan  bahawa  pembiakan  begini  adalah  lebih  kerat  berlaku  di  kalangan  masyarakat  melayu  kalau  dibandingkan  dengan  kawam  terbesar
Transcription:  Sesungguhnya memang diakui bahawa pembiakan seketurunan tidaklah berleluas di dalam masyarakat Melayu, namun tidak dapat dinafikan bahawa pembayakan begini adalah lebih kerap berlaku di kelanggan masyaretat Melaiu kalau dibandingkan dengan kaum terbesar.
WER:           0.333



Evaluating:   1%|          | 23/2848 [00:31<59:32,  1.26s/it]  


Sample 23
Reference:     yang  lain  di  Malaysia  iya  itu  masyarakat  China.  Sebaliknya,  ada  pekahwinan  orang  China  menghalang  pembiakan  seketurunan.
Transcription:  yang lain di Malaysia iaitu masyarakat China. Sebaliknya adat perkawinan orang China menghalang pembayakan seketurunan.
WER:           0.375



Evaluating:   1%|          | 24/2848 [00:33<1:05:49,  1.40s/it]


Sample 24
Reference:     Kelau  begitu,  memang  wajahlah  dikatakan  bahawa  pembiakan  seketurunan  dan  amalan -kahwin  pak  se  di  kalangan  orang -orang  yang  cacat  telah  menyabakkan  peratus  manusia  yang  gagal  di  kalangan  orang  melayu  lebih  tinggi  kalau  dibandingkan  dengan  kawam -kawam  lain,  keturangan
Transcription:  Kalau begitu, memang wajarlah dikatakan bahawa pembiarkan seketurunan dan amalan kahwin paksa di kalangan orang-orang yang cacak telah menyebabkan peratus manusia yang gagal di kalangan orang Melayu lebih tinggi kalau dibandingkan dengan kaum-kaum lain.
WER:           0.368



Evaluating:   1%|          | 25/2848 [00:34<59:57,  1.27s/it]  


Sample 25
Reference:     ini  diberikan  sebagai  mengalas  setemanyi  okong  pandangan  saya  itu.  Walaupun  bagaimana  pun,  penerangan  ini  tidak  pula  diharapkan  akan  di  terima  dengan  mudah.
Transcription:  ini diberikan sebagai mengalas setemen nyokong pandangan saya itu. Walaupun penerangan ini tidak pula diharapkan akan diterima dengan mudah.
WER:           0.273



Evaluating:   1%|          | 26/2848 [00:36<1:05:48,  1.40s/it]


Sample 26
Reference:     Implikasi  pandangan  begini  adalah  telah  lalu  merumsinkan  sebab  iya  tidak  pula  mempelihatkan  harapan  bagi  pemulahan  yang  mudah  dan  cepat  faktor -faktor  alam  sekitar  yang  mempengaruhi  keadaan  orang  melayu  kurang  kontroversinya.
Transcription:  Implikasi pandangan begini adalah terlalu merumsingkan sebab ia tidak pula memperlihatkan harapan bagi pemulihan yang mudah dan cepat faktor-faktor alam sekitar yang mempengaruhi keadaan orang Melayu kurang kontroversinya.
WER:           0.267



Evaluating:   1%|          | 27/2848 [00:37<56:33,  1.20s/it]  


Sample 27
Reference:     Memang  lebih  senang  kalau  hendak  menyalahkan  faktor -faktor  luaran  dari  pada  faktor -faktor  dalaman.
Transcription:  Memang lebih senang kalau hendak menyalahkan faktor-faktor luaran daripada faktor faktor dalaman.
WER:           0.357



Evaluating:   1%|          | 28/2848 [00:39<1:06:22,  1.41s/it]


Sample 28
Reference:     Lagipun,  alam  sekitar  adalah  lebih  senang  untuk  dibetulkan  dan  berbeza  daripada  faktor -keturunan  yang  mempelihatkan  harapan  bagi  pemulahan  yang  mudah,  selepas  membincangkan  beberapa  faktor  yang  telah  mempengaruhi  evolusi  orang  melayu,  memangwajahlah
Transcription:  Lagipun, alam sekitar adalah lebih senang untuk dibertulkan dan berbeza daripada faktor keturunan, ia memperlihatkan harapan bagi pemulihan yang mudah selepas membincangkan beberapa faktor yang telah mempengaruhi evolusi orang Melayu, memangwajarlah
WER:           0.226



Evaluating:   1%|          | 29/2848 [00:40<1:02:56,  1.34s/it]


Sample 29
Reference:     diteruskan  usaha -mencari  dan  menganali  selain -lain  faktor  yang  telah  menyabakkan  keduungan  orang  melayu  sebegitu  rupa  seperti  yang  terdapat  sekarang  ini.
Transcription:  diteruskan usaha mencari dan menganalisa lain-lain faktor yang telah menyebabkan kedudukan orang Melayu sebegitu rupa seperti yang terdapat sekarang ini.
WER:           0.286



Evaluating:   1%|          | 30/2848 [00:41<1:07:23,  1.43s/it]


Sample 30
Reference:     Rupert  M.  Ersen  yang  menulis  dari  hal  kuasa  orang  melayu  dikedah  dalam  bukunya  Malaysia  menyatakan  bahawa  mereka  terpaksa  bejuang  dalam  keadaan  tersebit  dan  selepas  setiap  bejuangan  itu  kuasa  autonomi  mereka  hilang  sedikit
Transcription:  Rupert M. Ersen yang menulis dari hal kuasa orang Melayu di kedah dalam bukunya Malaysia, menyatakan bahawa, mereka, terpaksa berjuang dalam keadaan tersepit dan selepas setiap perjuangan itu kuasa autonomi mereka hilang sedikit.
WER:           0.281



Evaluating:   1%|          | 31/2848 [00:42<1:00:08,  1.28s/it]


Sample 31
Reference:     demi sedikit.  Pekara  yang  menjadi  kena  tahan  bagi  orang -orang  melayu  dikedah  ternyata  kebenaranya  bagi  orang -orang  melayu  di  negeri -negeri  lain.
Transcription:  Percara yang menjadi kenyataan bagi orang-orang milayu di kedah ternyata kebenarannya bagi Orang-orang Milayu
WER:           0.773



Evaluating:   1%|          | 32/2848 [00:44<1:00:28,  1.29s/it]


Sample 32
Reference:     Kini,  seperti  juga  di  masa  masa  dahulu,  orang  melayu  mempunyai  keinginan  untuk  memperkukukan  hak -hak  yang  diperuntukkan  kepada  mereka  dan  yang  dianggap  memang  milik  mereka.
Transcription:  Kini, seperti juga di masa-masa dahulu, orang Melayu mempunyai keinginan untuk memperkukuhkan hak-hak yang diperuntukkan kepada mereka dan yang dianggap memang milik mereka.
WER:           0.200



Evaluating:   1%|          | 33/2848 [00:44<55:05,  1.17s/it]  


Sample 33
Reference:     Tetapi  di  samping  itu  mereka  juga  mahu  besopan  santun  berada  dan  bertimbang  rasa  terhadap  hak -hak  dan  tuntutan  orang  lain.
Transcription:  Tetapi di samping itu mereka juga mahu bersupan santun, beradab dan bertimbang rasa terhadap hak-hak dan tuntutan orang lain.
WER:           0.250



Evaluating:   1%|          | 34/2848 [00:46<59:18,  1.26s/it]


Sample 34
Reference:     Dalam  Sanubari  mereka  terasa  bahawa  walaupun  yang  mereka  buat  dan  pesetujui  semuanya  akan  beransu  ansu  dan  selepas  dari  kekuasaan  mereka  dan  lama  kelamahan  mereka  tetap  kehilangan  tanah  ayah  mereka  sendiri.
Transcription:  Dalam Sanubari mereka terasa bahawa walaupun apapun yang mereka buat dan persetujui, semuanya akan beranso anso terlepas dari kekuasaan mereka, dan lama-kelamaan mereka tetap kehilangan tanah air mereka sendiri.
WER:           0.333



Evaluating:   1%|          | 35/2848 [00:47<56:28,  1.20s/it]


Sample 35
Reference:     Ini  lah  dileme  melayu,  buku  ini  ditelbitkan  bukanlah  dengan  maksud  hendak  mencari  kepobularan  dari  kalangan  masyarakat  tentu  di  Malaysia.
Transcription:  Inilah dilema Melayu. Buku ini diterbitkan bukanlah dengan maksud hendak mencari kepopularan dari kalangan masyarakat tertentu di Malaysia.
WER:           0.368



Evaluating:   1%|▏         | 36/2848 [00:48<57:01,  1.22s/it]


Sample 36
Reference:     Malahan,  sebaliknya  besar  kemungkinan  is  akan  menimbolkan  rasa  tidak  poas  hati  di  kalangan  bulangan -ulangan  tentu  dan  kemarahan  dari  kalangan  bulangan  yang  berlalu.
Transcription:  Malahan, sebaliknya besar kemungkinan is akan menimbulkan rasa tidak puas hati di kalangan golongan-golongan tertentu dan kemarahan dari kalangan-gologan rata.
WER:           0.391



Evaluating:   1%|▏         | 37/2848 [00:50<1:00:31,  1.29s/it]


Sample 37
Reference:     Tiada  maaf  yang  dipinta  apa  yang  saya  tulis  terlalu  tulis  dengan  ikhlas.  Mahat  Hilbi,  Mohamad,  Pondok  Maharisan  Batu  Namb,  Titigajah  Kota  Setah,  kedah  1907  di  mana  silapnya.
Transcription:  Tiada maaf yang dipinta apa yang saya tulis terhadir tulis dengan ikhlas. Mahat Hilbi, Mohamat, Pondok Maharizan Batu 6, Titik Gajah Kota Seta, Kedah 1970 di Manasilapnya.
WER:           0.370



Evaluating:   1%|▏         | 38/2848 [00:51<59:00,  1.26s/it]  


Sample 38
Reference:     Di  mana  silapnya,  ini  lah  soalan  yang  akan  ditanyakan  oleh  orang -orang  yang  bersimpati  atau  mempunyai  minat  terhadap  Malaysia  selepas  berlakunya  peristiwa  me -139.
Transcription:  Di mana silapnya? Inilah soalan yang akan ditanyakan oleh orang-orang yang bersimpati atau mempunyai minat terhadap Malaysia selepas berlakunya peristiwa May 13, 1100.
WER:           0.333



Evaluating:   1%|▏         | 39/2848 [00:53<1:07:18,  1.44s/it]


Sample 39
Reference:     Di  mana  silapnya,  di  dalam  sebuah  negara  yang  berbilang  kaum,  berbilang  bahasa  dan  berbilang  agama  yang  telah  menikmati  keharmonian  dan  kerja  sama  selama  12  tahun  yang  lalu,  hingga  menyebabkan  toleransi  dan  kefahamantadi  dengan  tiba -tiba  hancur,
Transcription:  Di mana silapnya, di dalam sebuah negara yang berbilang kaum, berbilangs bahasa dan berbilangi agama yang telah menikmati keharmonian dan kerjasama selama 12 tahun yang lalu, hingga menyebabkan toleransi dan kefahaman tadi dengan tiba-tiba hancur.
WER:           0.250



Evaluating:   1%|▏         | 40/2848 [00:54<1:01:42,  1.32s/it]


Sample 40
Reference:     hinggakan  kaum  kaum  tersebut  mula  memandang  dengan  penuh  culiga  setemenolak  cara  hidup  yang  telah  hujut  sejak  sebelum  mendekir  lagi.
Transcription:  Ingerkan kaum-kaum tersebut mula memandang dengan penuh curiga, seter menolak cara hidup yang telah wujud sejak sebelum medeka lagi.
WER:           0.421



Evaluating:   1%|▏         | 41/2848 [00:56<1:07:17,  1.44s/it]


Sample 41
Reference:     Di  mana  silapnya  hingga  menyebabkan  orang  melayu  dan  orang  cina,  dua  kaum  yang  terbesar  di  Malaysia,  begitu  terpisah  hinggakan  sebuah  kerajaan  yang  autoritarian  dan  usaha  pemimpin -pemimpin  kebangsaan  tidak  dapat  memperbaiki  persenketaan  ini.
Transcription:  Di mana silapnya hingga menyebabkan orang Melayu dan orang China, dua kaum yang terbesar di Malaysia, begitu terpisah hinggakan sebuah kerajaan yang autoritarian dan usaha pemimpin-pemimpin kebangsaan tidak dapat memperbaiki persengketaan ini.
WER:           0.121



Evaluating:   1%|▏         | 42/2848 [00:56<1:00:08,  1.29s/it]


Sample 42
Reference:     Di  mana  silapnya,  berdasarkan  kepada  pengalaman  yang  sudah -sudah  memanglah  mudah  untuk  mencari  kesilapan  dan  kecacatan  masa  lalu.
Transcription:  Di mana silapnya, berdasarkan kepada pengalaman yang sudah-sudah, memanglah mudah untuk mencari kesilapan dan kecacatan masa lalu.
WER:           0.111



Evaluating:   2%|▏         | 43/2848 [00:58<1:02:02,  1.33s/it]


Sample 43
Reference:     Namun  demikian,  elok  juga  difikirkan  kembali  dan  menganalisa  atau  menentukan  kesalahan  kesalahan  itu  sekiranya  pengalaman  yang  lalu  hendak  dijadikan  taulah  dan  untuk  menghadapi  masa  hadapan.
Transcription:  Namun demikian, Elok juga difikirkan kembali dan menganalisa atau menentukan kesalahan-kesalahan itu sekiranya pengalaman yang lalu hendak dijadikan taul adan untuk menghadapi masa hadapan.
WER:           0.160



Evaluating:   2%|▏         | 44/2848 [00:59<55:23,  1.19s/it]  


Sample 44
Reference:     Tujuannya  bukanlah  untuk  membbalas  dan  dam,  tetapi  ini  adalah  satu  tanggungjawab  sosial  untuk  mencari  di  mana  silapnya.
Transcription:  Tujuannya bukanlah untuk membalas dendam, tetapi ini adalah satu tanggungjawab sosial untuk mencari di mana silapnya.
WER:           0.176



Evaluating:   2%|▏         | 45/2848 [01:00<1:03:02,  1.35s/it]


Sample 45
Reference:     Kalau  benarlah  segala  hal  yang  berlaku  pada  masa  dahulu,  tidak  ada  cacatnya  dan  tidak  ada  mana -mana  pihak  pun  yang  bersalah,  nescai  tidak  berlaku  gangguan  kepada  kemajuan  negara  dan  kehamonian  antara  kaum  yang  telah  hujut  selama  12  tahun  selepas  mendekar.
Transcription:  Kalau benarlah segala hal yang berlaku pada masa dahulu tidak ada cacatnya dan tidak ada mana-mana pihak pun yang bersalah, Nestia tidak berlakuk gangguan kepada kemajuan negara dan kehamunian antara kaum yang telah wujud selama 12 tahun selepas medeka.
WER:           0.200



Evaluating:   2%|▏         | 46/2848 [01:02<1:00:37,  1.30s/it]


Sample 46
Reference:     Andai  yang  hendak  diketahui  sebab -sebab  suasa  tidak  harmoni  di  malisnya  sekarang,  eloklah  di  teling  tipe  titer  balik  harmoni  antara  kaum  yang  hujut  pada  masa  lalu.
Transcription:  Andaainya hendak diketahui sebab-sebab suasana tidak harmoni di Malaysia sekarang, eloklah ditaliti petik terbalik harmoni antara kaum yang wujud pada masa lalu.
WER:           0.462



Evaluating:   2%|▏         | 47/2848 [01:03<55:00,  1.18s/it]  


Sample 47
Reference:     Pernahkah  harmoni  ini  benar -benar  terjalan  dan  beraka  umbih  secara  mendalam.  Pernahkah  hujut  asas  yang  kukuh.
Transcription:  Penahkah Harmoni ini benar-benar terjalin dan berakak umbi secara mendalam. Penahka hujun asas yang kukuh.
WER:           0.500



Evaluating:   2%|▏         | 48/2848 [01:04<53:30,  1.15s/it]


Sample 48
Reference:     Pernahkah  hujut  perbezaan  hubungan  di  antara  orang  melayu  dengan  orang  bukan  melayu  pada  masa  masa  tentu  dalam  sejarah  tanah  melayu.
Transcription:  Pernahkah wujud perbezaan hubungan di antara orang Melayu dengan orang bukan Melayuh pada masa-masa tertentu dalam sejarah Tanah Melayui?
WER:           0.300



Evaluating:   2%|▏         | 49/2848 [01:04<46:49,  1.00s/it]


Sample 49
Reference:     Apakah  hubungan  yang  sebenarnya  antara  kaum -kaum  itu  pada  tahun  sebelum  13me -1969?
Transcription:  Apakah hubungan yang sebenarnya antara kaum-kaum itu pada tahun-tahun sebelum 13 May 1969?
WER:           0.462



Evaluating:   2%|▏         | 50/2848 [01:06<57:12,  1.23s/it]


Sample 50
Reference:     Apakah  faktor  faktor  lain  juga  turut  menyebabkan  belakunya  keganasan  itu?  Kalau  direnungkan  kembali  masa -masa  yang  lampau  salah  satu  faktor  yang  agak  mengejutkan  dan  harus  diakui  elah  pada  masa  lalu  tidak  hujut  harmoni  yang  sebenarnya  antara  kaum.
Transcription:  Apakah faktor-faktor lain juga turut menyebabkan berlakunya keganasan itu? Kalau direnungkan kembali masa-masa yang lampau, salah satu faktor yang agak mengejutkan dan harus diakui ialah pada masa lalu tidak wujud harmoni yang sebenar antara kau.
WER:           0.270



Evaluating:   2%|▏         | 51/2848 [01:07<55:11,  1.18s/it]


Sample 51
Reference:     Apa  yang  hujut  elah  kurangnya  persialisihan  antara  kaum?  Ada  rasa  toleransi,  ada  terdapat  penyeswayan,  ada  sedikit  sebanyak  perasaan  tolak  ansol.
Transcription:  Apa yang wujud ialah kurangnya perselisihan antara kaum. Ada rasa toleransi, ada terdapat penyesuaian, ada sedikit sebanyak perasaan tolak anso.
WER:           0.300



Evaluating:   2%|▏         | 52/2848 [01:08<50:05,  1.07s/it]


Sample 52
Reference:     Akan  tetapi  tidak  hujut  harmoni  yang  sebenarnya.  Sebaliknya  ada -ada -ada  sumbang  walaupun  tidak  begitu  ketara.
Transcription:  akan tetapi tidak wujud harmoni yang sebenarnya. Sebaliknya, ada nada-nada sumbang walaupun tidak begitu ketara.
WER:           0.250



Evaluating:   2%|▏         | 53/2848 [01:10<58:21,  1.25s/it]


Sample 53
Reference:     Ada  kalinya  nada -nada  sumbang  ini  melangsing  nyaring  lalu  mencetuskan  pergaduhan  kaum  yang  terpencil  atau  merata -rata,  keharmonian  antara  kaum  di  tanah  melayu  tidak  latulin  bahkan  juga  tidak  beraka  umbih  secara  menalam.
Transcription:  Ada kalenya nader-nader Sumbang ini melangsing nyaring lalu mencetuskan pergaduhan kaum yang terpencil atau merata-rata, kehalmonian antara kaum di tanah Melayu tidaklah tulin bahkan juga tidak berakak umbi secara mendalam.
WER:           0.344



Evaluating:   2%|▏         | 54/2848 [01:11<1:02:11,  1.34s/it]


Sample 54
Reference:     Apa  yang  dianggap  sebagai  harmoni  elah  tidak  adanya  persialisihan  kaum  secara  terbuka?  Kalau  pun  tidak  ada  persialisihan  kaum,  bukanlah  semestinya  kerana  kurang  kemahuan  atau  tidak  ada  alasan -alasan  untuk  menimbulkan  persialisihan.
Transcription:  Apa yang dianggap sebagai harmoni adalah tidak adanya perselisihan kaum secara terbuka. Kalau pun tidak ada perselisahan kaum, bukanlah semestinya kerana kurang kemahuan atau tidak ada alasan-alasan untuk menimbulkan perselisehan.
WER:           0.226



Evaluating:   2%|▏         | 55/2848 [01:12<57:51,  1.24s/it]  


Sample 55
Reference:     Sebenarnya  ini  adalah  kerana  kurangnya  keupayaan  untuk  belsen  ketesecara  terang -terang,  orang  melayu  dan  orang  cina  mungkin  hidup  bejiran.
Transcription:  Sebenarnya ini adalah kerana kurangnya keupayaan untuk bersengkete secara terang-terang, orang Melayu dan orang China mungkin hidup berjalan.
WER:           0.316



Evaluating:   2%|▏         | 56/2848 [01:13<52:11,  1.12s/it]


Sample 56
Reference:     Mereka  mungkin  bertemu  sewaktu  menjalankan  kerja -kerja  harian,  malahan  sewaktu  pegawlan  secara  sosial.
Transcription:  Mereka mungkin bertemu sewaktu menjalankan kerja-kejaharian malahan sewaktu pegawalan secara sosial.
WER:           0.308



Evaluating:   2%|▏         | 57/2848 [01:14<54:58,  1.18s/it]


Sample 57
Reference:     Akan  tetapi  setelah  selesai  bekerja,  mereka  kembali  semula  ke  dalam  link  kungan  budaya  dan  kaum  masing -masing  dan  link  kungan  ini  tidak  pernah  dicerobohi  oleh  mana -mana  kaum  tersebut.
Transcription:  akan tetapi setelah selesai bekerja, merek kekembali semula ke dalam lingkungan budaya dan kaum masing-masing dan lingkungannya tidak pernah dicerubohi oleh mana-mana kaum tersebut.
WER:           0.414



Evaluating:   2%|▏         | 58/2848 [01:16<1:05:10,  1.40s/it]


Sample 58
Reference:     Di  dalam  dunia  kaum  masing -masing,  nilai -nilai  mereka  bukan  sahaja  berbeza,  malahan  kadang -kadang  betentangan  jika  di  terima  hakikat  bahawa  memang  tidak  hujur  ke  harmonian  secara  kaum,  maka  lebih  senang  untuk  membuat  urutan  secara  menganai
Transcription:  Di dalam dunia kaum masing-masing, nilai-nilai mereka bukan sahaja berbeza, malahan kadang-kadang bertentangan jika diterima hakikat bahawa memang tidak wujud kehamunian sejati antara kaum, maka lebih senang untuk membuat urutan sejarah manganai sejarat.
WER:           0.444



Evaluating:   2%|▏         | 59/2848 [01:18<1:05:08,  1.40s/it]


Sample 59
Reference:     hubungan  orang  melayu  dengan  bukan  melayu  dan  menerangkan  mengapa  persialisihan  kaum  berlaku.  Malah  mungkin  boleh  dicarikan  jalan  untuk  mengatasi  kelemahan -kelemahan  kepada  cara  hubungan  yang  sedia  hujur.
Transcription:  hubungan orang Melayu dengan bukan Melayun dan menerangkan mengapa perselisihan kaum berlaku. Malah mungkin boleh dicarikan jalan untuk mengatasi kelemahan-kelemahan kepada cara hubungannya sedia wujud.
WER:           0.259



Evaluating:   2%|▏         | 60/2848 [01:19<59:48,  1.29s/it]  


Sample 60
Reference:     Dengan  cara  ini,  sekurang -kurangnya,  kalau  pun  bukan  harmoni,  perkara  perkara  yang  boleh  menimbulkan  persen  ketahan  dapat  diredakan.
Transcription:  Dengan cara ini, sekurang-kurangnya, kalapun bukan halmoni, perkara-perkara yang boleh menimbulkan persengketaan dapat diradakan.
WER:           0.556



Evaluating:   2%|▏         | 61/2848 [01:20<1:03:39,  1.37s/it]


Sample 61
Reference:     Sebelum  kedatangan  orang -orang  portugis,  memang  sudah  ada  orang  bukan  melayu  di  melakir  dan  kedah.  Ramai  juga  di  antara  mereka  itu  adalah  orang  cina,  setakat  yang  diketahui  hubungan  di  antara  orang  melayu  dengan  orang  cina  adalah  dianggap  baik.
Transcription:  Sebelum kedatangan orang-orang Portugis memang sudah ada orang bukan Melayu di Melaka dan kedah. Ramai juga di antara mereka itu adalah orang China. Setakat yang diketahui hubungan di antar orang Melayun dengan orang China adalah dianggap baik.
WER:           0.211



Evaluating:   2%|▏         | 62/2848 [01:22<1:02:46,  1.35s/it]


Sample 62
Reference:     Keadaan  bagi  ni  mudah  di  Faham  kerana  selalunya  kalau  di  tempat  tempat  yang  tidak  ramai  orang  cina,  mereka  akan  mengelak  dari  melakukan  sesuatu  yang  boleh  membangkitkan  kemarahan  orang  melayu.
Transcription:  Keadaan begini mudah difaham kerana selalunya kalau di tempat-tempat yang tidak ramai orang Cina, mereka akan mengelak dari melakukan sesuatu yang boleh membangkitkan kemarahan orang Melayu.
WER:           0.207



Evaluating:   2%|▏         | 63/2848 [01:22<56:07,  1.21s/it]  


Sample 63
Reference:     Hakikat  ini  menerangkan  mengapa  pertelingkahan  kaum  tidak  pernah  berlaku  di  negeri  kelantan,  ternganyu  dan  kedah.
Transcription:  Hakikat ini menerangkan mengapa pertelingkahan kaum tidak pernah berlaku di negeri Kelantan, Frenganu dan Kedah.
WER:           0.067



Evaluating:   2%|▏         | 64/2848 [01:24<1:01:16,  1.32s/it]


Sample 64
Reference:     Sudah  tentunya  orang  orang  cina  telah  mengalami  layanan -layanan  yang  kurang  menyenangkan,  tetapi  mereka  tidak  membantah  walaupun  negeri  cina  menganggap  tanah  melayu  sebagai  sebahagian  daripada  jajahan  tak  lu  mereka.
Transcription:  Sudah tentunya orang-orang China telah mengalami layanan-layanan yang kurang menyenangkan, tetapi, mereka tidak membantah walaupun negeri China menganggap tanah Melayu sebagai sebahagian daripada jajahan takluk mereka.
WER:           0.310



Evaluating:   2%|▏         | 65/2848 [01:25<52:20,  1.13s/it]  


Sample 65
Reference:     Orang  cina  dan  lain -lain  kaum  telah  mempelajari  bahasa  dan  cari  hidup  orang  melayu.
Transcription:  Orang Sinai dan lain-lain kaum telah mempelajari bahasa dan cara hidup orang Melayu.
WER:           0.286



Evaluating:   2%|▏         | 66/2848 [01:26<58:22,  1.26s/it]


Sample 66
Reference:     Oleh  itu,  persenketaan  jarang  belaku  dan  kalau  belaku  jarang  bepanjangan,  kedatangan  orang -orang  iropah  telah  menambahkan  kemasukan  orang -orang  bukan  melayu  terutama  orang  cina  dan  india  ketanah  melayu.
Transcription:  oleh itu pesengketaan jarang berlaku dan kalau berloku jarang bepanjangan. Kedatangan orang-orang Eropah telah menambahkan kemasukan orang-orang bukan Melayu, terutama orang China dan India ke Tanah Melayun.
WER:           0.536



Evaluating:   2%|▏         | 67/2848 [01:27<53:41,  1.16s/it]


Sample 67
Reference:     Meriket  tidak  bermashtautin  di  tanah  melayu  dan  hakikat  ini  minibakkan  mereka  terasing  dan  tidak  bercampur  dengan  orang -orang  melayu.
Transcription:  Mereka tidak bermastautin di tanah Melayu dan hakikat ini menyebabkan mereka terasing dan tidak bercampur dengan orang-orang Melayun.
WER:           0.316



Evaluating:   2%|▏         | 68/2848 [01:29<57:13,  1.24s/it]


Sample 68
Reference:     Terhadnya  hubungan  ini  telah  mengurangkan  persenketaan,  sunggupun  pada  akhir -akhir  pemerintahan  British  orang  melayu  telah  mulai  menyeh  dari  bahaya  orang -orang  cina  dan  india  kepada  kuasa  politik  orang  melayu.
Transcription:  Terhadnya hubungan ini telah mengurangkan pesenketaan, sungguh pun pada akhir-akhir pemerintahan British orang Melayu telah mulai menyerari bahaya orang-orang China dan India kepada kuasa politik orang Melayan.
WER:           0.379



Evaluating:   2%|▏         | 69/2848 [01:30<1:00:29,  1.31s/it]


Sample 69
Reference:     Sekali  sekali  belaku  juga  pergaduhan  kaum  antara  orang  melayu  dan  orang  cina.  Akan  tetapi  disebabkan  ketegasan  pihak  British  mengawal  keadaan  pergaduhan  ini  tidak  meribak  menjadi  perselisahan  kaum  yang  besar.
Transcription:  Sekali-sekala berlaku juga pergaduhan kaum antara orang Melayu dan orang China. Akan tetapi disebabkan ketergasan pihak British mengawal keadaan, pergadaan ini tidak merebak menjadi perselisihan kaum yang besar.
WER:           0.310



Evaluating:   2%|▏         | 70/2848 [01:31<1:01:14,  1.32s/it]


Sample 70
Reference:     Lagipun,  hak  orang  melayu  di  negara  ini  tidak  pernah  dicabar  secara  terang -terang  oleh  pihak  penjajah  British  mahu  pun  oleh  pendatang  pendatang  lain  di  negeri -negri  tanah  melayu.
Transcription:  Lagipun, hak orang Melayu di negara ini tidak pernah dicabar secara terang-terang oleh pihak penjajah British maupun oleh pendatang-pendatang lain di negeri-negri Tanah Melayuh.
WER:           0.321



Evaluating:   2%|▏         | 71/2848 [01:32<55:20,  1.20s/it]  


Sample 71
Reference:     Di  bawah  pemerintahan  British  orang  melayu  hidup  terpisah  dari  orang  cina  dan  india  kecuali  pertemuan  singkat  pada  waktu  siang.
Transcription:  di bawah pemerintahan British orang Melayu hidup terpisah dari orang China dan India, kecuali pertemuan singkat pada waktu siang.
WER:           0.105



Evaluating:   3%|▎         | 72/2848 [01:34<1:00:18,  1.30s/it]


Sample 72
Reference:     Sebahagian  besar  orang  melayu  terutama  yang  tinggal  di  kawasan  desa  tidak  pernah  bersua  muka  dengan  orang  cina  dan  begitu  juga  keadaan  sebaliknya  bagi  orang  cina  yang  tinggal  dibanda -banda  besar  dan  dikongsi.
Transcription:  Sebahagian besar orang Melayu, terutama yang tinggal di kawasan desa tidak pernah bersuai muka dengan orang Cina dan begitu juga keadaan sebaliknya bagi orang Ciner yang tinggalkan di bandar-bandar besar dan di kakak.
WER:           0.250



Evaluating:   3%|▎         | 73/2848 [01:35<57:09,  1.24s/it]  


Sample 73
Reference:     Kauasan  Lombong  Biji.  Pada  waktu  itu  memang  tidak  berlaku  pergaduhan  kaum  secara  besar -besaran,  namun  tidak  pula  boleh  dikatekan  bahawa  wujud  harmoni  dan  toleransi  antara  kaum.
Transcription:  pada waktu itu memang tidak berlaku pergaduhan kaum secara besar-besaran, namun tidak pula boleh dikatakan bahawa wujud harmoni dan toleransi antara kaum.
WER:           0.231



Evaluating:   3%|▎         | 74/2848 [01:36<58:06,  1.26s/it]


Sample 74
Reference:     Orang  orang  yang  hidup  jauh  terpisah  di  antara  satu  sama  lain  tidak  semestinya  hidup  mesle.  Kalau  tidak  ada  singkatir,  hakikannya  ilah  kerennya  tidak  ada  peluang  untuk  bersengkatir.
Transcription:  Orang-orang yang hidup jauh terpisah di antara satu sama lain tidak semestinya hidup Mesra. Kalau tidak ada senkete, hakikatnya ialah kerana tidak ada peluang untuk bersenkete.
WER:           0.296



Evaluating:   3%|▎         | 75/2848 [01:37<56:36,  1.22s/it]


Sample 75
Reference:     Apa  yang  wujud  ilah  kesedaran  tentang  kehadiran  masing -masing  dan  kesedaran  yang  kurang  menyenangkan  ini  sudah  cukup  untuk  menghalang  pergaulan  yang  lebih  rapat?
Transcription:  Apa yang hujur ialah kesedaran tentang kehadiran masing-masing dan kesedaraan yang kurang menyenangkan ini sudah cukup untuk menghalang pergaulan yang lebih rapat.
WER:           0.261



Evaluating:   3%|▎         | 76/2848 [01:39<1:00:34,  1.31s/it]


Sample 76
Reference:     Bibet -bibet  persenketaan  sebenarnya  sudah  pun  ada,  cuma  istidat  sempat  membesah  kerenedis  sekat  oleh  kuasa  British,  penjajahan  oleh  jepun  telah  memisahkan  orang -orang  melayu  dan  cina  lebih  jauh  lagi.
Transcription:  Divit-divit persengketaan sebenarnya sudah pun ada, cuma istidak sempat membesak kerana disekat oleh kuasa British, penjajahan oleh Jepun telah memisahkan orang-orang Melayu dan China lebih jauh lagi.
WER:           0.345



Evaluating:   3%|▎         | 77/2848 [01:40<58:12,  1.26s/it]  


Sample 77
Reference:     Segelongan  orang -melayu  boleh  dianggap  projepun,  sementara  yang  lainnya  walaupun  tidak  bersimpati,  sekurang -kurangnya  bukan  antijepun.
Transcription:  Se golongan orang Melayu boleh dianggap pro-Jepun, sementara yang lainnya walaupun tidak bersimpati, sekurang-kurangnya bukan anti-Japun.
WER:           0.438



Evaluating:   3%|▎         | 78/2848 [01:41<56:50,  1.23s/it]


Sample 78
Reference:     Sebaliknya  orang  cina  telah  mendapat  layanan  buruh  dari  pihak  jepun,  sementara  orang  india  pula  menggabungkan  diri  mereka  dengan  perjuangan  untuk  membebaskan  india.
Transcription:  Sebaliknya orang China telah mendapat layanan buruk dari pihak Jepun, sementara orang India pula menggabungkan diri mereka dengan pejuangan untuk membebaskan India.
WER:           0.136



Evaluating:   3%|▎         | 79/2848 [01:42<55:22,  1.20s/it]


Sample 79
Reference:     Menjalank  akhirnya  perperangan,  hubungan  ini  mula  bertukacora,  sebahagian  besar  orang  cina  telah  bersubahat  dan  di  terima  baik  oleh  pihak  jepun.
Transcription:  Menjelang akhirnya perperangan, hubungan ini mula bertukar corak. Sebahagian besar orang China telah bersubahat dan diterima baik oleh pihak Jepun.
WER:           0.300



Evaluating:   3%|▎         | 80/2848 [01:43<52:26,  1.14s/it]


Sample 80
Reference:     Sementara  itu  orang  jepun  tidak  mengendahkan  lagi  orang  melayu  kerana  mereka  menganggap  orang  melayu  tidak  begitu  berbuna  bagi  tujuan  mereka.
Transcription:  Sementara itu orang Jepun tidak mengendahkan lagi orang Melayu kerana mereka menganggap orang Melaiu tidak begitu berguna bagi tujuan mereka.
WER:           0.100



Evaluating:   3%|▎         | 81/2848 [01:44<51:35,  1.12s/it]


Sample 81
Reference:     Walaupun  sekalipun  cura  hubungan  mereka  dengan  pihak  jepun,  ternyata  bahawa  perbezaan  antara  kaum  semakin  ketara  dan  masing -masing  saling  mencuri.
Transcription:  Walaupun cura hubungan mereka dengan pihak Jepun, ternyata bahawa perbezaan antara kaum semakin ketara dan masing-masing saling menculik.
WER:           0.200



Evaluating:   3%|▎         | 82/2848 [01:46<1:02:31,  1.36s/it]


Sample 82
Reference:     Apabila  British  kembali  ke  tanah  melayu,  hubungan  melayu  cina  boleh  dianggap  tidak  begitu  baik  dan  keadaan  ini  bertambah  runcing  di  legolongan  komunis  kebanyakan  yang  orang  cina,  cubekendak  minu  bukan  kerajaan  sendiri  di  negeri  negeri  tanah  melayu.
Transcription:  Apabila British kembali ke Tanah Melayu, hubungan Melayun China boleh dianggap tidak begitu baik dan keadaan ini bertambah rungcing bila golongan komunis, kebanyakannya orang China, cuba hendak minubukan kerajaan sendiri di negeri-negeri Tanah melayu.
WER:           0.389



Evaluating:   3%|▎         | 83/2848 [01:48<1:03:41,  1.38s/it]


Sample 83
Reference:     Ini  akhirnya  menyebabkan  belakunya  pertumpahan  darah.  Pertempuran  ini  mungkin  akan  merebat  menjadi  pertempuran  kaum  jika  sekiranya  pihak  British  tidak  kembali  dan  mendirikan  pentabiran  tenter  British  yang  dibantu  oleh  angkatan  tenter  British.
Transcription:  Ini akhirnya menyebabkan berlakunya pertumpahan darah. Pertempuran ini mungkin akan merebak menjadi pertempuran kaum jika sekiranya pihak British tidak kembali dan mendirikan pentadiran tentera British yang dibantu oleh angkatan tentera
WER:           0.194



Evaluating:   3%|▎         | 84/2848 [01:49<1:07:44,  1.47s/it]


Sample 84
Reference:     Pihak  komunis  kecewa  dalam  usaha  mereka  untuk  merampas  kuasa  di  tanah  melayu.  Orang  melayu  tanpa  menyedari  apapun  mengalukan  kedatangan  British  kerana  mereka  menyanggap  hubungan  dengan  British  akan  kembali  seperti  keadaan  sebelum  perang.
Transcription:  pihak komunis kecewa dalam usaha mereka untuk merampas kuasa di Tanah Melayu. Orang Melayun, tanpa menyedari apapun, mengalui alukan kedatangan British kerana mereka menyangka hubungan dengan British akan kembali seperti keadaan sebelum Perang.
WER:           0.156



Evaluating:   3%|▎         | 85/2848 [01:51<1:02:14,  1.35s/it]


Sample 85
Reference:     Orang  melayu  merasa  kecewa  bila  pihak  British  mencadangkan  supaya  orang  cina  dan  india  diberi  hak  yang  sama  dengan  orang  melayu  dalam  gagasan  baru  melayuan  union.
Transcription:  Orang Melayu merasa kecewa bila pihak British mencadangkan supaya orang China dan India diberi hak yang sama dengan orang Melayun dalam gagasan baru Melayan Union.
WER:           0.120



Evaluating:   3%|▎         | 86/2848 [01:52<1:01:35,  1.34s/it]


Sample 86
Reference:     Keruncingan  hubungan  melayu  cina  memuncak  semula  tetapi  kali  ini  keadaan  lebih  rational  dan  berterusan  berikutan  kesedaran  umum  bangsa  melayu  terhadap  rancangan  British  itu.
Transcription:  Keruncangan hubungan Melayu-Cina memuncak semula, tetapi kali ini keadaan lebih rasional dan berterusan berikutan kesedaran umum bangsa Melayua terhadap rancangan British itu.
WER:           0.261



Evaluating:   3%|▎         | 87/2848 [01:53<1:00:05,  1.31s/it]


Sample 87
Reference:     Sejak  dari  itulah  sikap  melayu  cina,  bertuka  menjadi  isu  politik  negara  yang  Hams  diselesaikan  bukan  diperingkat  tempatan  tetapi  diperingkat  pihak  berkuasa  yang  berubah.
Transcription:  Sejak dari itulah sikap Melayu-Cina bertukar menjadi isu politik negara yang hams diselesaikan bukan diperingkat tempatan tetapi diperingskat pihak berkuasa yang
WER:           0.217



Evaluating:   3%|▎         | 88/2848 [01:55<1:02:38,  1.36s/it]


Sample 88
Reference:     Orang  melayu  terhadap  orang  melayu  terhadap  orang  bukan  melayu.
Transcription:  hubungan orang Melayu dengan Bukan Melayuh semakin tidak menyenangkan. Malah, pemimpin Melayui yang paling diholmati sekalipun tidak dapat meredakan kecurigaan orang melayu terhadap orang-orang bukan Melayuu.
WER:           2.222



Evaluating:   3%|▎         | 89/2848 [01:56<57:37,  1.25s/it]  


Sample 89
Reference:     Datuk  on,  pengasas  umno,  telah  keluar  dari  umno  kerana  cadangan  beliau  kena  bekerja  sama  dengan  kau  membuka  melayu  tidak  di  terima.
Transcription:  Datuk On, pengasas umno telah keluar dari umno kerana cadangan beliau rendat berkejasama dengan kaum bukannya melayu tidak diterima.
WER:           0.381



Evaluating:   3%|▎         | 90/2848 [01:57<58:56,  1.28s/it]


Sample 90
Reference:     Walaupun  bagaimana  pun,  umno  di  bawah  pimpinan  tunku  Abdul  Rahman,  telah  mencuba  kerja  sama  Mila  Yucina  di  dalam  pilihan  raya  pebandaran  kuala  lumpu  pada  tahun  1952.
Transcription:  Walaubagaimanapun, umno dibawah pimpinan Tunku Abdul Rahman telah mencuba kerja sama Mila Yucina di dalam pilihan raya pebandaran Kuala Lumpur pada tahun 1952.
WER:           0.269



Evaluating:   3%|▎         | 91/2848 [01:58<54:52,  1.19s/it]


Sample 91
Reference:     Keputusan  pilihan  raya  itu  agak  menggalakkan  hingga  telah  mengurangkan  sedikit  kerisauan  dan  kecuri  geandik  halangan  orang  melayu.
Transcription:  Keputusan pilihan raya itu agak menggalakkan hingga telah mengurangkan sedikit kerisawan dan kecurigaan di kalangan orang Melayu.
WER:           0.235



Evaluating:   3%|▎         | 92/2848 [01:59<59:54,  1.30s/it]


Sample 92
Reference:     Kerja  sama  tersebut  telah  dicubel  sekali  lagi  dalam  pilihan  raya  yang  lebih  besar  pada  tahun  1955  dan  kerjaan  dalam  pilihan  raya  ini  telah  memulakan  waktu  berbaik -baik  dan  kerja  sama  yang  tulian  di  antara  kau  mendina  gara  ini.
Transcription:  Kejasama tersebut telah dicuba sekali lagi dalam pilihan raya yang lebih besar pada tahun 1955 dan kejayaan dalam pilingan raya ini telah memulakan waktu berbaik-baik dan kejasama yang tulen di antara kaum di negara ini.
WER:           0.342



Evaluating:   3%|▎         | 93/2848 [02:00<55:47,  1.22s/it]


Sample 93
Reference:     Namun,  keharmonian  yang  sebenarnya  masih  lagi  di  cari  kerana  tiap -tiap  kau  menganggap  pencantuman  tadi  hanya  secara  berkebetulan  sahaja.
Transcription:  Namun, keharmonian yang sebenar masih lagi dicari kerana tiap-tiap kaum menganggap pencantuman tadi hanya secara berkebetulan sahaja.
WER:           0.316



Evaluating:   3%|▎         | 94/2848 [02:02<55:00,  1.20s/it]


Sample 94
Reference:     Di  zaman  berbaik -baik  ini  lah  kemedekaan  dicapai,  secara  rinkas  itu  lah  lata  belakang  hubungan  antara  kau  mendina  melayu  sebelum  mendekar.
Transcription:  Di zaman berbaik-baik inilah kemedekaan dicapai. Secara ringkas itulah latah belakang hubungan antara kaum di tanah Melayu sebelum medeka.
WER:           0.619



Evaluating:   3%|▎         | 95/2848 [02:03<1:02:32,  1.36s/it]


Sample 95
Reference:     Hanya  pada  waktu  Hampi -Medeker  nampak  seperti  ada  harmoni  antara  kau  mendina  melayu.  Sebelum  itu,  apa  yang  sewenangnya  dikatakan  keharmonian  antara  kau  sebenarnya  mempunyai  maknilain,  yang  itu  tidak  ada  senketir  secara  terang -terang.
Transcription:  Hanya pada waktu hampir medeka nampak seperti ada harmoni antara kaum di Tanah Melayu. Sebelum itu, apa yang sewenangnya dikatakan keharmonian antara kawam sebenarnya mempunyai makna lain, iaitu tidak ada seketa secara terang-terang.
WER:           0.364



Evaluating:   3%|▎         | 96/2848 [02:04<58:56,  1.29s/it]  


Sample 96
Reference:     Faktor  faktor  yang  menyebabkan  tidak  adanya  senketir  ini  lebih  didorong  oleh  desakan  luar  daripada  desakan  dalam,  suasa  netahun  1957  adalah  penuh  dengan  harapan.
Transcription:  Faktor-faktor yang menyebabkan tidak adanya senkita ini lebih didorong oleh desakan luar daripada desakan dalam, suasana tahun 1957 adalah penuh dengan harapan.
WER:           0.217



Evaluating:   3%|▎         | 97/2848 [02:05<54:10,  1.18s/it]


Sample 97
Reference:     Kerja  sama  antara  orang  melayu  dan  orang  cinas  emasah  menuntut  kemedekaan  nampaknya  telah  mendatangkan  hasil  yang  baik.
Transcription:  Kerjasama antara orang Melayu dan orang China semasa menuntut kemedekaan, nampaknya telah mendatangkan hasil yang baik.
WER:           0.294



Evaluating:   3%|▎         | 98/2848 [02:07<53:44,  1.17s/it]


Sample 98
Reference:     Kerja  antper  sekutuan  tanah  melayu  yang  ditubuhkan  semasa  kemedekaan  telah  mendapat  sokongan  majoriti  dari  rakyat  berbagai  kau  menditana  melayu.
Transcription:  Kerajaan persekutuan Tanah Melayu yang ditubuhkan semasa kemedekaan telah mendapat sokongan majoriti dari rakyat berbagai kaum di Tanah melayu.
WER:           0.316



Evaluating:   3%|▎         | 99/2848 [02:08<51:28,  1.12s/it]


Sample 99
Reference:     Pihak  pembangkang  adalah  lemah  dan  berpecah  belah  dan  merek  ke  hanya  mempunyai  seorang  wakil  di  dalam  badan  perundangan  tetinggi.
Transcription:  pihak pembangkang adalah lemah dan berpecah belah dan meikah hanya mempunyai seorang wakil di dalam badan perundangan petinggi.
WER:           0.158



Evaluating:   4%|▎         | 100/2848 [02:09<53:31,  1.17s/it]


Sample 100
Reference:     Kauem -kauem  sekutu  dalam  kerja  antperikatan  sedah  akan  senketasin  ketemasa  lalu  dan  amat  berhati -hati  agar  tidak  membangkitkan  masalah  perkawan.
Transcription:  kaum-ka'im seketa dalam kerajaan perikatan sedar akan sengketa-sengketah masa lalu dan amat berhati-hati agar tidak membangkitkan masalah perka'um.
WER:           0.550



Evaluating: 100%|██████████| 2848/2848 [58:16<00:00,  1.23s/it]



Overall WER (Word Error Rate): 0.295
Results (with per-row WER) saved to: evaluation_results_small_e20.csv


0.29532729609549274

In [None]:
import shutil

shutil.make_archive("whisper-small-peft-malay-e3", 'zip', "whisper-small-peft-malay-e3")
print("Zipped model folder: whisper-small-peft-malay-e3.zip")

Zipped model folder: whisper-small-peft-malay-e3.zip


In [None]:
from google.colab import files
files.download("evaluation_results_small_e20.csv")
files.download("whisper-small-peft-malay-e3.zip")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [None]:
def transcribe_audio(file_path, model, processor):
    model.eval()

    # Load and resample audio
    audio_tensor, sr = torchaudio.load(file_path)
    if sr != 16000:
        audio_tensor = torchaudio.transforms.Resample(orig_freq=sr, new_freq=16000)(audio_tensor)
    audio_array = audio_tensor.mean(dim=0).numpy()

    # Process audio
    inputs = processor(audio_array, sampling_rate=16000, return_tensors="pt")
    input_features = inputs.input_features.to(device).half()

    # Generate
    with torch.no_grad():
        generated_ids = model.generate(input_features=input_features)
        transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]

    return transcription