In [None]:
!pip install -q transformers datasets librosa evaluate jiwer gradio bitsandbytes accelerate peft

In [None]:
from huggingface_hub import list_datasets
from datasets import(load_dataset, DatasetDict, load_from_disk,
                     Audio, IterableDatasetDict, Features, Value,
                     Sequence, Dataset)
import IPython.display as ipd
from functools import partial

In [None]:
voice_data = load_dataset("clt013/malay-speech-3k-rows-dataset_v2", token=True)
voice_data

README.md:   0%|          | 0.00/458 [00:00<?, ?B/s]

train-00000-of-00001.parquet:   0%|          | 0.00/216M [00:00<?, ?B/s]

test-00000-of-00001.parquet:   0%|          | 0.00/59.7M [00:00<?, ?B/s]

Generating train split:   0%|          | 0/2544 [00:00<?, ? examples/s]

Generating test split:   0%|          | 0/604 [00:00<?, ? examples/s]

DatasetDict({
    train: Dataset({
        features: ['sentence', 'audio'],
        num_rows: 2544
    })
    test: Dataset({
        features: ['sentence', 'audio'],
        num_rows: 604
    })
})

In [None]:
from transformers import WhisperProcessor
model_name = "openai/whisper-large-v3"
language = "malay"
task = "transcribe"
processor = WhisperProcessor.from_pretrained(model_name, language=language, task=task)

The cache for model files in Transformers v4.22.0 has been updated. Migrating your old cache. This is a one-time only operation. You can interrupt this and resume the migration later on by calling `transformers.utils.move_cache()`.


0it [00:00, ?it/s]

preprocessor_config.json:   0%|          | 0.00/340 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/283k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/2.48M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/494k [00:00<?, ?B/s]

normalizer.json:   0%|          | 0.00/52.7k [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/34.6k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/2.07k [00:00<?, ?B/s]

In [None]:
def prepare_dataset(batch):
    # load audio
    audio = batch["audio"]

    # compute log-Mel input features from input audio array
    batch["input_features"] = processor.feature_extractor(audio["array"], sampling_rate=audio["sampling_rate"]).input_features[0]

    # compute input length of audio sample in seconds
    batch["input_length"] = len(audio["array"]) / audio["sampling_rate"]

    # encode target text to label ids
    batch["labels"] = processor.tokenizer(batch["sentence"]).input_ids
    return batch



def is_audio_in_length_range(length):
    return 1.0 < length <= 30.0

def prepare_dataset_done():
  dt = voice_data.map(prepare_dataset,remove_columns=voice_data["train"].column_names).with_format("torch")
  dt["train"] = dt["train"].filter(
    is_audio_in_length_range,
    input_columns=["input_length"],
  )
  dt["test"] = dt["test"].filter(
    is_audio_in_length_range,
    input_columns=["input_length"],
  )
  return dt

In [None]:
voice_data_new = prepare_dataset_done()
voice_data_new = voice_data_new.shuffle(seed=42)
voice_data_new

Map:   0%|          | 0/2544 [00:00<?, ? examples/s]

Map:   0%|          | 0/604 [00:00<?, ? examples/s]

Filter:   0%|          | 0/2544 [00:00<?, ? examples/s]

Filter:   0%|          | 0/604 [00:00<?, ? examples/s]

DatasetDict({
    train: Dataset({
        features: ['input_features', 'input_length', 'labels'],
        num_rows: 2139
    })
    test: Dataset({
        features: ['input_features', 'input_length', 'labels'],
        num_rows: 513
    })
})

In [None]:
from transformers import WhisperForConditionalGeneration

model = WhisperForConditionalGeneration.from_pretrained(model_name,  load_in_8bit=True, device_map="auto")

config.json:   0%|          | 0.00/1.27k [00:00<?, ?B/s]

The `load_in_4bit` and `load_in_8bit` arguments are deprecated and will be removed in the future versions. Please, pass a `BitsAndBytesConfig` object in `quantization_config` argument instead.


model.safetensors:   0%|          | 0.00/3.09G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/3.90k [00:00<?, ?B/s]

In [None]:
model.generation_config.language = "malay"
model.generation_config.task = "transcribe"
model.generation_config.forced_decoder_ids = None
model.generation_config.suppress_tokens = []
model.config.use_cache = False

In [None]:
import torch

from dataclasses import dataclass
from typing import Any, Dict, List, Union

@dataclass
class DataCollatorSpeechSeq2SeqWithPadding:
    processor: Any

    def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) -> Dict[str, torch.Tensor]:
        # split inputs and labels since they have to be of different lengths and need different padding methods
        # first treat the audio inputs by simply returning torch tensors
        input_features = [{"input_features": feature["input_features"]} for feature in features]
        batch = self.processor.feature_extractor.pad(input_features, return_tensors="pt")
        # get the tokenized label sequences
        label_features = [{"input_ids": feature["labels"]} for feature in features]
        # pad the labels to max length
        labels_batch = self.processor.tokenizer.pad(label_features, return_tensors="pt")

        # replace padding with -100 to ignore loss correctly
        labels = labels_batch["input_ids"].masked_fill(labels_batch.attention_mask.ne(1), -100)

        # if bos token is appended in previous tokenization step,
        # cut bos token here as it's append later anyways
        if (labels[:, 0] == self.processor.tokenizer.bos_token_id).all().cpu().item():
            labels = labels[:, 1:]

        batch["labels"] = labels

        return batch

In [None]:
data_collator = DataCollatorSpeechSeq2SeqWithPadding(processor=processor)

In [None]:
import evaluate

metric = evaluate.load("wer")

Downloading builder script:   0%|          | 0.00/4.49k [00:00<?, ?B/s]

In [None]:
import peft
from peft import prepare_model_for_kbit_training

model = prepare_model_for_kbit_training(model)

In [None]:
def make_inputs_require_grad(module, input, output):
    output.requires_grad_(True)

model.model.encoder.conv1.register_forward_hook(make_inputs_require_grad)

<torch.utils.hooks.RemovableHandle at 0x7addbc5fdbd0>

In [None]:
from peft import LoraConfig, PeftModel, LoraModel, LoraConfig, get_peft_model

config = LoraConfig(r=32, lora_alpha=64, target_modules=["q_proj", "v_proj"], lora_dropout=0.05, bias="none")

model = get_peft_model(model, config)
model.print_trainable_parameters()

trainable params: 15,728,640 || all params: 1,559,219,200 || trainable%: 1.0088


In [None]:
!rm -rf "./whisper-small-ft-malay-peft-v1"

In [None]:
from transformers import Seq2SeqTrainingArguments

training_args = Seq2SeqTrainingArguments(
    output_dir="./whisper-large-v3-ft-malay-peft-v1",  # change to a repo name of your choice
    per_device_train_batch_size=8,
    gradient_accumulation_steps=1,  # increase by 2x for every 2x decrease in batch size
    learning_rate=1e-05,
    warmup_steps=100,
    num_train_epochs=3,
    fp16=True,
    eval_strategy="steps",
    per_device_eval_batch_size=8,
    generation_max_length=128,
    # save_steps=1000,
    # eval_steps=1000,
    logging_steps=25,
    report_to=["tensorboard"],
    remove_unused_columns=False,
    label_names=["labels"]
)

In [None]:
from transformers import Seq2SeqTrainer, TrainerCallback, TrainingArguments, TrainerState, TrainerControl
from transformers.trainer_utils import PREFIX_CHECKPOINT_DIR
import os

# This callback helps to save only the adapter weights and remove the base model weights.
class SavePeftModelCallback(TrainerCallback):
    def on_save(
        self,
        args: TrainingArguments,
        state: TrainerState,
        control: TrainerControl,
        **kwargs,
    ):
        checkpoint_folder = os.path.join(args.output_dir, f"{PREFIX_CHECKPOINT_DIR}-{state.global_step}")

        peft_model_path = os.path.join(checkpoint_folder, "adapter_model")
        kwargs["model"].save_pretrained(peft_model_path)

        pytorch_model_path = os.path.join(checkpoint_folder, "pytorch_model.bin")
        if os.path.exists(pytorch_model_path):
            os.remove(pytorch_model_path)
        return control

trainer = Seq2SeqTrainer(
    args=training_args,
    model=model,
    train_dataset=voice_data_new["train"],
    eval_dataset=voice_data_new["test"],
    data_collator=data_collator,
    tokenizer=processor.feature_extractor,
    callbacks=[SavePeftModelCallback],
)

  self.scaler = torch.cuda.amp.GradScaler(**kwargs)


In [None]:
trainer.train()

  return fn(*args, **kwargs)
  with torch.enable_grad(), device_autocast_ctx, torch.cpu.amp.autocast(**ctx.cpu_autocast_kwargs):  # type: ignore[attr-defined]


Step,Training Loss,Validation Loss
25,2.5614,2.619849
50,2.9109,2.59669
75,2.5414,2.551782
100,2.4919,2.474212
125,2.5861,2.363886
150,2.454,2.221291
175,2.32,2.061605
200,2.1081,1.866753
225,1.7976,1.673579
250,1.7597,1.527973


  return fn(*args, **kwargs)
  with torch.enable_grad(), device_autocast_ctx, torch.cpu.amp.autocast(**ctx.cpu_autocast_kwargs):  # type: ignore[attr-defined]


TrainOutput(global_step=804, training_loss=1.391702568946193, metrics={'train_runtime': 10560.4316, 'train_samples_per_second': 0.608, 'train_steps_per_second': 0.076, 'total_flos': 2.203429092655104e+19, 'train_loss': 1.391702568946193, 'epoch': 3.0})

In [None]:
kwargs = {
    "dataset_tags": "clt013/malay-speech-3k-rows-dataset_v2",
    "dataset": "Malay Speech 3k",  # a 'pretty' name for the training dataset
    "language": "ms",
    "model_name": "Whisper Large v3 FT Malay - CLT013",  # a 'pretty' name for your model
    "finetuned_from": model_name,
    "tasks": "automatic-speech-recognition",
}
trainer.push_to_hub(**kwargs)
repo_id = "clt013/whisper-large-v3-ft-malay-peft-v1"
model.push_to_hub(repo_id)

events.out.tfevents.1728299299.604cd8408840.325.0:   0%|          | 0.00/22.0k [00:00<?, ?B/s]

adapter_model.safetensors:   0%|          | 0.00/63.0M [00:00<?, ?B/s]

Upload 3 LFS files:   0%|          | 0/3 [00:00<?, ?it/s]

training_args.bin:   0%|          | 0.00/5.37k [00:00<?, ?B/s]

README.md:   0%|          | 0.00/3.13k [00:00<?, ?B/s]

No files have been modified since last commit. Skipping to prevent empty commit.


CommitInfo(commit_url='https://huggingface.co/clt013/whisper-large-v3-ft-malay-peft-v1/commit/51b9321ed4545a3facf2691862649ab02be508b5', commit_message='Upload model', commit_description='', oid='51b9321ed4545a3facf2691862649ab02be508b5', pr_url=None, pr_revision=None, pr_num=None)

In [None]:
from peft import PeftModel, PeftConfig
from transformers import WhisperForConditionalGeneration, Seq2SeqTrainer

peft_model_id = repo_id
peft_config = PeftConfig.from_pretrained(peft_model_id)
model_loaded = WhisperForConditionalGeneration.from_pretrained(
    peft_config.base_model_name_or_path, load_in_8bit=True, device_map="auto"
)
model_loaded = PeftModel.from_pretrained(model_loaded, peft_model_id)

adapter_config.json:   0%|          | 0.00/771 [00:00<?, ?B/s]

The `load_in_4bit` and `load_in_8bit` arguments are deprecated and will be removed in the future versions. Please, pass a `BitsAndBytesConfig` object in `quantization_config` argument instead.


adapter_model.safetensors:   0%|          | 0.00/63.0M [00:00<?, ?B/s]

In [None]:
from torch.utils.data import DataLoader
from tqdm import tqdm
import numpy as np
import gc

eval_dataloader = DataLoader(voice_data_new["test"], batch_size=8, collate_fn=data_collator)

model.eval()
for step, batch in enumerate(tqdm(eval_dataloader)):
    with torch.cuda.amp.autocast():
        with torch.no_grad():
            generated_tokens = (
                model.generate(
                    input_features=batch["input_features"].to("cuda"),
                    decoder_input_ids=batch["labels"][:, :4].to("cuda"),
                    max_new_tokens=255,
                )
                .cpu()
                .numpy()
            )
            labels = batch["labels"].cpu().numpy()
            labels = np.where(labels != -100, labels, processor.tokenizer.pad_token_id)
            decoded_preds = processor.tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
            decoded_labels = processor.tokenizer.batch_decode(labels, skip_special_tokens=True)
            metric.add_batch(
                predictions=decoded_preds,
                references=decoded_labels,
            )
            print(step)
            print(decoded_preds)
            print(decoded_labels)
    del generated_tokens, labels, batch
    gc.collect()
wer = 100 * metric.compute()
print(f"{wer=}")


  with torch.cuda.amp.autocast():
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


0
['ah', 'h respi leh tu respi um', 'tarik-tarik', 'sebab Huawei pun senter sini kurang kan kalau macam Samsung', 'badminton seolah-olah tentu badminton', 'kegemaran aku', 'mengelakkan daripada masalah masalah ni berlaku lah macam ah kesihatan kecemasan semua ni sebab dia sangat bahaya lah sebab', 'kemurungan yang boleh berlaku dalam family']
['ah', 'H H P laptop H P tu', 'tarik tarik', 'sebab Huawei pun centre sini kurang kan kalau macam Samsung', 'badminton sudah tentu', 'kegemaran aku', 'mengelakkan daripada masalah-masalah ni berlakulah macam ah kesihatan kencing manis semua ni sebab dia sangat berbahaya la sebab', 'kemurungan boleh berlaku di dalam family']


  2%|▏         | 1/65 [00:13<13:56, 13.07s/it]

1
['kalau nak makan tu memilih so aku macam tak tahu sangat pasal makanan ni', 'tosai ni kaya dengan karbohidrat protein', 'oh', 'kan ada banyak macam ISIS tu kan banyak dia punya ni', 'makanan eh', 'hm okay nanti kalau', 'yang untuk makan makan makan besar tu kan', 'ah boleh awak tahu beritahu lah apa sebab ah adik saya terkena demam tersebut apabila bermain bermain di hujan']
['kalau nak makan tu memilih so aku macam tak tahu sangat pasal makanan ni', 'tosai ni kaya dengan karbohidrat protein', 'oh', 'kan ada banyak macam [UNK] situ kan banyak dia punya ni', 'makanan eh', 'um um okey nanti kalau', 'yang untuk makan makanan makan besar tu kan', 'ah boleh awak tahu bagitahu lah apa sebab ah adik saya terkena demam tersebut apabila bermain bermandi hujan']


  3%|▎         | 2/65 [00:24<12:38, 12.04s/it]

2
['dia macam dia macam istimewa istimewa lah sebab dia dia dipalut dengan', 'apa rasa putung ayam tu', 'kalau macam mahal', 'ah sebab kedua', 'ya ramai yang tak minat datang berenang', 'tu boleh buat keburukan yang ni ha besar tapi kebaikan dia banyak juga dia kira satu benda ni telekomunikasi kan kebaikan keburukan ha', 'stres lah sebab tu suka makan makanan pedas', 'banyak betul eh makanan']
['dia macam dia macam istime-istimewa la sebab dia dia di balut dengan', 'apa rasa putu mayam tu', 'kalau macam mahal ke', 'ah sebab kedua', 'ya ramai yang tak minat tentang berenang', 'tu boleh bawa keburukan yang ni la besar tapi kebaikan nya banyak juga dia kira benda satu benda ni telekomunikasi ni ada kebaikan dan keburukan ah', 'stress la sebab tu suka makan makanan pedas', 'banyak betul eh makanan']


  5%|▍         | 3/65 [00:36<12:37, 12.22s/it]

3
['satu benda tu lepas tu tu lah pergi mendalam mendalam kalau macam kat phone yang kita cari kan dia bagi fakta eh lepas tu kita kena buat sendiri lah', 'cah kuih wow', 'dia macam telah cakap dia macam kau', 'edam pisang lepas tu', 'sebab aku kan belum belum pernah guna laptop kan', 'so', 'inti dia mesti tebal lah kalau tak tebal macam tak setiap sangat lah daripada', 'okay ah kamu juga begitu je sebab kita tak nak negara kita terjejas kan kita nak macam negara kita hidup dengan negara dengan aman dengan sihat ah mempunyai']
['satu benda tu lepas tu dia bagi dalam dalam kalau kita cari dekat telefon an dia bagi fakta lain lepastu kita kena buat sendiri la', 'Chakris wow', 'dia macam tadi lah aku cakap macam kau', 'daun pisang lepas tu', 'sebab aku pun belum belum pernah guna laptop kan', 'so', 'inti dia mesti tebal lah kalau tak tebal macam tak sedap sangat lah daripada', 'okay ah kamu juga begitu ya sebab kita tak nak negara kita terjejas kan kita nak macam negara kita hidup dengan 

  6%|▌         | 4/65 [00:50<12:58, 12.76s/it]

4
['ah jap macam', 'saya minat', 'tapi aku tengah tengok tengok internet ni sebab aku telefon aku rosak so aku nak cari telefon yang baru', 'dia tak perlu ah', 'canon lah canon sebab aku biasa tengok kan kalau orang ambil gambar cantik cantik semua biasa canon lah sebab canon pun dia nama', 'banyak kali saya', 'oh sedap rasa dia', 'ah nasi lemak ke']
['sekejap macam', 'saya minat', 'tapi aku tengah tengok-tengok Internet ni sebab aku telefon aku rosak so kena cari telefon yang baru', 'dia tak perlu ah', 'Canon ah Canon sebab aku biasa tengok en kalau orang ambil gambar cantik cantik semua biasa Canon ah', 'manakala saya', 'oh sedap rasa dia', 'ah nasi lemak ke']


  8%|▊         | 5/65 [01:02<12:21, 12.35s/it]

5
['dia terpaksa', 'siapa yang mesti iklim lain', 'diri sendiri oh masyarakat lah', 'apa yang awak tahu tentang sukan', 'putung mayam', 'tak nak kongsi ke', 'tah tapi macam mana kita nak membe ah kerajaan kerajaan perlulah ambil tindakan lah sebab rakyat dia sendiri kan kalau tak ada rakyat dia macam mana ah negara nak berkembangkan ekonomi macam mana kan ah', 'dia dia dibalut dengan ah apa tu']
['dia terpaksa', 'setiap apa mesti ada kelemahan', 'diri sendiri oh masyarakat lah', 'apa yang awak tahu tentang sukan', 'putu mayam', 'tak nak kongsi ke', 'ah tapi macam mana ek kita nak membe- ah kerajaan-kerajaan perlulah ambil tindakan sebab rakyat dia sendiri kan kalau tak ada rakyat dia macam mana ah negara nak kembangkan ekonomi macam mana en ah', 'di-dia dibalut dengan ah apa tu']


  9%|▉         | 6/65 [01:21<14:32, 14.78s/it]

6
['contohnya kita gabung jogging campur lompat untuk untuk', 'kimera cantik', 'oh', 'kenal macam jiran aku lah dia ada seorang lah macam tu', 'exotic tu ah apa ye exotic', 'tapi ah dia macam kena seimbangkanlah macam dia dah makan budak lainnya mestilah dia kena makan yang benda sihatlah macam tu lah', 'so tu je lah', 'kau pergilah']
['contohnya kita gabung joging campur lompat untuk [UNK] untuk', 'kamera cantik', 'so', 'pernah macam jiran aku lah dia ada seorang lah macam tu', 'eksotik tu ah apa ya eksotik', 'tapi ah dia macam kena seimbangkan lah macam dia dah makan benda alah ni mestilah dia kena makan yang benda sihat macam tu lah', 'so tu je lah', 'kau pergilah']


 11%|█         | 7/65 [01:33<13:19, 13.79s/it]

7
['tapi ah macam keluarga saya ni dia mempunyai satu satu pakcik tau pakcik ni dia dulu ah tahu tak hujan panas hujan panas tahu tak ah dia dia ah dia masa tu kerja dan ah orang kampung biasalah macam kerja ah kat tu lepas tu dia balik dia balik lepas tu hujan panas tau selepas keesokannya', 'tak ada apa-apa lah kerak-kerak', 'ah', 'kalau kau nak makan makanan Korea', 'okey sama-sama', 'boleh beritahu saya apa sukan yang awak minat', 'COVID-19 adalah satu virus yang menyebabkan', 'ah boleh tak']
['tapi ah macam keluarga saya ni dia mempunyai satu satu pak cik tau pak cik ni dia dulu ah tahu tak hujan panas hujan panas tahu tak ah dia dia [UNK] ah dia masatu kerja then ah orang kampung biasa lah macam kerja ah kat tu lepas tu dia balik dia balik lepas tu hujan panas tau selepas keesokannya', 'tiada apa-apa lah [UNK]', 'ah', 'kalau kau nak makan makanan Korea', 'sama-sama', 'boleh bagitahu saya apa sukan yang awak minat', 'Covid ninteen ah adalah satu virus yang menyebabkan', 'ah boleh 

 12%|█▏        | 8/65 [02:00<17:02, 17.94s/it]

8
['oh', 'kualiti phone yang sebelum kau nak guna', 'yang aku suka makan tu', 'apa yang dimasukkan oleh sukan saya macam kurang faham maka saya tahu tak apa yang dia sukan', 'ah sebab tapi SE ni bateri kurang tapi orang kata apa ni dia punya kelebihan sama dengan 11 telat aku', 'kuih bulan ni sejenis kuih', 'yang merupakan bahu luk ah dia dikenakan bahu luk kecil', 'fatah lebih kurang']
['oh', 'kau isi phone yang sebelum kau nak guna', 'yang aku suruh kau makan tu', 'apa yang dimaksudkan oleh sukan saya macam kurang faham boleh saya tahu tak apa itu sukan', 'ah sebab tapi S E ni bateri kurang tapi orang kata apa ni dia punya kelebihan sama dengan eleven tak silap aku', 'Kuih Bulan ni sejenis kuih', 'yang merupakan bahulu ah dia dikenakan bahulu kecil', 'fakta lebih kurang']


 14%|█▍        | 9/65 [02:09<14:23, 15.42s/it]

9
['ha itu adalah pakai face mask lagi ha itu adalah satu punca lah untuk satu cara eh banyak banyak cara untuk ha mengelakkan daripada pengena virus itulah sebab virus tu memang', 'ada lagi 30 saat', 'menjadi', 'cuti', 'ah kerajaan tu dia nak me', 'oh apa', 'oh jadi rak bini', 'makanan tradisional ni berasal daripada India']
['ah itu adalah pakai face mask lagi ah tu adalah satu puncalah untuk satu cara eh banyak banyak cara untuk ah mengelakkan daripada terkena virus itulah sebab virus tu memang', 'ada lagi tiga puluh saat', 'um menjadi', 'cuti', 'ah kerajaan tu dia nak [UNK]', 'oh apa', 'oh jadi rugby ni', 'makanan tradisional ni berasal daripada India']


 15%|█▌        | 10/65 [02:23<13:38, 14.88s/it]

10
['satu tahun sekolah tu mesti macam ada', 'tadikah awak kata awak minat bola sepak', 'selain daripada nasi lemak', 'ah tosi ni dia terdiri daripada', 'tapi', 'dihiris limun tu', 'jalin dunia ke', 'kalau aku jangan kena aku tentu sakit aku bagi dia macam']
['satu tahun sekolah tu mesti macam ada', 'tadi kan awak kata awak minat bola sepak', 'selain daripada nasi lemak', 'ah tosei ni dia terdiri daripada', 'tapi', 'dia hiris timun tu', 'piala dunia ke', 'kalau aku jadi nenek aku time tu sakit aku bagi dia macam']


 17%|█▋        | 11/65 [02:30<11:07, 12.36s/it]

11
['at bangsa', 'ah ok sekarang saya faham', 'oh cakap ni', 'ah so kuik', 'ah so makanan macam', 'dia sebabkan saya minat beliau saya minat badminton', 'dengan', 'ah saya ada kerja tapi saya nak berbincangkan pasal sukan awak tahu apa-apa tak tentang sukan']
['eh ah bangsa', 'hah okey sekarang saya faham', 'oh cat ni', 'ah so kuih Kuih Bahulu ni macam', 'ah ah ah so makanan macam', 'disebabkan saya minat beliau saya minat badminton', 'dengan', 'ah saya ada kerja tapi saya nak membincangkan pasal sukan awak tahu apa-apa tak tentang sukan']


 18%|█▊        | 12/65 [02:39<10:07, 11.46s/it]

12
['kesihatan', 'ha dia lain berpeka dah', 'ha baik sahabat aku', 'yang ramai orang lah cuti', 'tosai di mak tosai ni makan dia dengan banyak kuah la kalau macam roti canai tu', 'kau faham lah', 'kalau boleh kita guna untuk kebaikan ah tapi setengah kita banyak tapi kita kan remaja kan lebih banyak kepada keburukan berbanding kebaikan', 'and']
['kesihatan', 'ah dia lagi lebih pekalah', 'ha', 'yang ramai orang lah cuti', 'thosai di [UNK] thosai ni makan dia dengan banyak kuah lah kalau macam roti canai tu', 'kau faham faham ah', 'kalau boleh kita guna untuk kebaikan ah tapi sesetengah kita banyak tapi kita kan remaja kan banyak untuk keburukan daripada kebaikan', 'and']


 20%|██        | 13/65 [02:51<10:02, 11.58s/it]

13
['tapi ah', 'tu inisiatif kerajaan dia telefon ni canggih supaya rakyat dapat senang lagi lah tahu kalau', 'Inglis negara', 'kau stress kenapa', 'bagi saya semua sukan memang memberi kita kebaikan dia tak memberi kita keberukan pun sebab sukan ni untuk', 'aku nak cuba nanti aku', 'hata nenek aku so macam best lah', 'dan saya minat beliau sebab']
['tapi ah', 'tu inisiatif kerajaan dia telefon ni canggih supaya rakyat dapat senang lagi la tahu kalau', 'imej negara', 'kau stress kenapa', 'bagi saya semua sukan [UNK] member- memberi kita kebaikan dia tak memberi kita keburukan pun sebab sukan ni untuk', 'aku nak cuba nanti aku', 'harta nenek aku so macam best lah', 'dan saya minat beliau sebab']


 23%|██▎       | 15/65 [03:07<08:01,  9.63s/it]

14
['saya nak tahu', 'kalau ni okey ah Samsung', 'dia menunjukkan pada orang lain tak apa hebatnya saja', 'aku nak tahu lo kelebihan kelebihan handphone ni', 'ah tak pun dia macam mempunyai', 'ya itu Datuk Lin Chong Wei', 'contohnya', 'hmm banyak liga yang dimainkan oleh beliau']
['saya nak tahu', 'kalau ni okey tak Samsung', 'yang menunjukkan pada orang lain betapa hebatnya saya', 'aku nak tahu dulu kelebih-kelebihan phone ni', 'ataupun dia macam mempunyai', "iaitu Dato' Lee Chong Wei", 'contohnya', 'urm banyak liga dimainkan oleh beliau']
15
['ah ya saya', 'ah', 'sebab dulu kan yang kita tahu kan telefon awam kan dia orang kan kalau nak berkomunikasi kan kena telefon awam je kan', 'meminta ni dia tak perlukan kebaikan ataupun keburukan sebab bagi bagi saya semua sukan mahu bawa kebaikan', 'aku tak makan sayur so aku tak akan makanlah benda tu', 'tapi kau masih nak keluar kau buat apa', 'ah so kau dah sampai sana tu kau ada makan apa', 'kalau bangsa Cina']
['tengok ayah saya', 'erm ha

 25%|██▍       | 16/65 [03:19<08:16, 10.13s/it]

16
['kalau kau pula kau pernah makan makanan yang daripada luar negara', 'tau sakit', 'biasanya benda ni ada', 'selain daripada makanan kat situ', 'tapi saya rasa bukan kerajaan je kot', 'macam', 'tapi family aku banyak guna HP dengan Toshiba ternyata aku', 'dan macam-macam lagi lah makanan tradisional India ni']
['kalau kau pula kau pernah makan makanan yang daripada luar negara', 'tau sikit', 'biasanya benda ni ada', 'selain daripada makanan kat situ', 'tapi saya rasa bukan kerajaan je kot', 'macam', 'tapi family aku banyak guna H P dengan Toshiba tak silap aku', 'dan macam-macam lagi lah makanan tradisional India ni']


 26%|██▌       | 17/65 [03:26<07:23,  9.23s/it]

17
['balik kampung so aku buat lah lemang', 'tapi kadang-kadang dia macam', 'so apa yang kau tahu pasal stress ni', 'so kenapa seseorang boleh mengalami kemurahannya sebab-sebab dia macam', 'rasanya sebab yang tadilah yang yang diperkatakan tadi ah pemakanan yang tidak seimbang semua tu lah', 'dan kalau bola sepak idola awak adalah Ronaldo', 'tapi kita kena buluh', 'ah ada timun hiris']
['lepas tu balik kampung lepas tu aku buat lah lemang', 'tapi kadang kadang dia macam', 'so apa yang kau tau pasal stress ni', 'so kenapa seseorang boleh mengalami [UNK] ni en sebab-sebab dia macam', 'rasanya sebab yang tadilah yang yang diperkatakan tadi ah pemakanan yang tidak seimbang semua tu lah', 'dan kalau bola sepak idola awak adalah Ronaldo', 'tapi kita guna buluh', 'ah ada timun hiris']


 28%|██▊       | 18/65 [03:35<07:13,  9.23s/it]

18
['sotong ke kerang ke', 'kuih bulan biasanya pasri bulan atau segi empat tepatlah bentuk dia bulat ataupun segi empat', 'itu saja ah saya', 'oh tahu tahu ah tahu sebab', 'setiap ah menyentuh satu barang lah', 'apa nak tahu tak tentang sejarah sukan', 'ata pun yang ada kat Malaysia ni', 'berenang kerana']
['sotong ke kerang ke', 'kuih bulan biasanya [UNK] bulan atau segi empat tepat lah bentuk dia bulat ataupun segi empat', 'itu saja ah saya', 'oh tahu tahu ah tahu sebab', 'setiap ah menyentuh suatu baranglah', 'awak nak tahu tak tentang sejarah sukan', 'atau pun yang ada kat Malaysia ni', 'berenang kerana']


 29%|██▉       | 19/65 [03:45<07:21,  9.61s/it]

19
['bye bye', 'tapi iPhone je dia iPhone iPhone ke boleh dengan phone lain', 'semakin menurun', 'oh yang tu ala mak tak ingatlah peluang makanan dia', 'lepas tu ada ikan milis ada kacang goreng ada telur', 'boleh beli kat rumah kau kan', 'kita patut ah menyebabkan tentang kebaikan sukan ni kepada semua pihak lah sebab saya tengok ramai yang membiarkan ah sukan ini terbiar dia macam dia tak kisah pasal sukan dia ramai yang kurang semangat ke sukan kan', 'ah so kan ada nak aktiviti fizikal']
['bye bye', 'tapi iPhone je dia iPhone dengan iPhone ke boleh dengan phone lain', 'semakin menurun', 'oh yang itu alamak tak ingat la pula makanan dia', 'lepas tu ada ikan bilis ada kacang goreng ada telur', 'boleh beli kat rumah kau kan', 'kita patut ah menyebarkan tentang kebaikan sukan ni kepada semua pihaklah sebab saya tengok ramai yang membiarkan ah sukan ini terbiar dia macam dah tak kisah pasal sukan dia ramai yang kurang semangat kesukanan', 'hm sukan ada lah aktiviti fizikal']


 31%|███       | 20/65 [04:06<09:36, 12.81s/it]

20
['orang tak nampak tau yang sukan yang berenang ni merupakan sukan yang perlukan banyak tenaga bagi orang sukan berenang ni ia lebih kepada rekreasi aktiviti rekreasi atau riadah', 'ah dia dia popular dekat Malaysia ni', 'oh tapi kau cari saya phone yang kali saya ni macam mana', 'makanan kegemaran aku', 'tak pernah makanlah sebab aku ni jenis yang macam', 'okey okey tapi ah', 'ha beliau sudah besar sebab beliau sudah tua dan', 'ah']
['orang tak nampak tau yang [UNK] berenang ni merupakan sukan yang perlukan banyak tenaga bagi orang sukan berenang ni ia lebih kepada rekreasi aktiviti rekreasi atau riadah', 'ah dia dia popular dekat Malaysia ni', 'em tapi kau kira [UNK] phone yang kalis air ni macam mana', 'makanan kegemaran aku', 'tak pernah makan la sebab aku ni jenis yang macam', 'okay-okay tapi ah', 'ha beliau sudah bersara sebab dia sudah tua dan', 'ha ah ah']


 32%|███▏      | 21/65 [04:22<10:13, 13.95s/it]

21
['pelbaga jenis seperti', 'ha saya rasa itu je lah antara sebab saya minat badminton', 'tosai dia ada macam macam jenis lah tosai telur tosai cili tosai bawah eh bawah bawang', 'hmm betul tu', 'ah so kita boleh check dari', 'malas nak keluar ke kan mana tahu kan nak duduk rumah ke', 'ah', 'citi citi']
['pelbagai jenis seperti', 'ha saya rasa itu je lah antara sebab saya minat badminton', 'thosai dia ada macam-macam jenis lah thosai telur thosai cili thosai bawah eh bawah bawang', 'hm betul tu', 'Wan so kita boleh dari', 'malas nak keluar ke kan mana tahu kan nak duduk rumah ke', 'ah', 'cuti cuti']


 34%|███▍      | 22/65 [04:33<09:18, 13.00s/it]

22
['dan dan akhir saya pernah mewakili negara untuk pertandingan berenang ni', 'tusai dimakan sebagai sarapan pagi atau makan malam', 'pun aku suka makan', 'kenapa ya dengan kesihatan di Malaysia', 'oh semenang apa', 'ah mempunyai banyak lemak semua lepas tu tidak bersukan just', 'ah kau pula apa makanan kegemaran kau', 'makanan tu makanan apa']
['[UNK] dan ayah saya pernah mewakili negara untuk per-pertandingan berenang ni', 'thosai dimakan sebagai sarapan pagi atau makan malam', 'pun aku suka makan', 'kenapa ya dengan kesihatan di Malaysia', 'oh mengapa', 'ah mempunyai banyak lemak semua lepas tu tidak bersukan just', 'ah kau pula apa makanan kegemaran kau', 'makanan tu makanan apa']


 35%|███▌      | 23/65 [04:40<07:54, 11.31s/it]

23
['oh maluku', 'percerahan ibu apa', 'tentang kemurungan', 'jadi sama ikut jejak langkah berjauh lah', 'ah kalau ikutkan sukan antara berlena merupakan sukan yang paling banyak paling mudah untuk pakai kalori', 'aku suka makan kuih bulan', 'macam kau buat sendiri', 'sebab orang kata bateri dia okey lepas tu harga pun']
['oh maruku', 'penceraian ibu bapa', 'tentang kemurungan', 'jadi saya mengikut jejak langkah beliau lah', 'ah kalau ikutkan sukan anta- antara berenang merupakan sukan yang paling banyak paling mudah untuk bakar kalori', 'aku suka makan Kuih Bulan', 'macam kau buat sendiri', 'sebab orang kata bateri dia okey lepas tu harga pun']


 37%|███▋      | 24/65 [04:50<07:22, 10.79s/it]

24
['peristiwa atau kejadian yang menyebabkan seseorang tertekan contoh macam', 'macam tu sekolah ke apa ke kan ah macam', 'pada bahawa', 'tapi saya rasa macam', 'hmm pasal kesehatan', 'sayu sayu sayuran acar yang macam orang makan nasi nasi nasi minyak tu ha', 'dia ada juga', 'tapi saya minat dalam sukan berenang']
['peristiwa atau kejadian yang menyebabkan seorang tertekan contoh macam', 'cuti sekolah ke apa ke kan ah macam', 'selain daripada bahulu tu', 'tapi saya rasa macam', 'um pasal kesihatan', 'sayur sayur sayuran acar yang macam orang makan nasi nasi nasi minyak tu ah', 'dia ada juga', 'tapi saya minat dalam sukan berenang']


 38%|███▊      | 25/65 [04:58<06:42, 10.07s/it]

25
['tapi kau ada rasa macam nak makan makanan Korea', 'ah phone ah aku suggest lah iPhone dengan Samsung ah Samsung iPhone dengan Samsung', 'untuk kita melakukan aktiviti tersebut berbanding sukan-sukan yang lain', 'contohnya kalau awak minat bola sepak', 'rank tinggi lepas tu gif ah gif', 'sebagai contoh eh berapa macam kena perlu beli makanan-makanan yang sihat lah macam tu lah', 'dekatan tiga kena NJ tapi tu untuk perempuan je', 'ah Joseph Scully']
['tapi kau ada rasa macam nak makan makanan Korea', 'ah phone ah aku suggest ah iPhone dengan Samsung ah Samsung iPhone dengan Samsung', 'untuk kita melakukan aktiviti tersebut berbanding sukan-sukan yang lain', 'contohnya kalau awak minat bola sepak', 'ram tinggi lepas tu gib ah gib', 'sebagai contoh ibu bapa macam kena perlu beli makanan-makanan yang sihatlah macam tu lah', 'tingkatan tiga kena inject tapi untuk perempuan je', 'ah Joseph Scolding']


 40%|████      | 26/65 [05:07<06:19,  9.74s/it]

26
['saya sangat minat sukan', 'oh sentara yang kau gunalah', 'yang SE ni yang baru', 'lembang ah kalau', 'tuah tu sekarang kita dah maju dengan telekomunikasi', 'untuk jadikan ah bola sepak', 'tapi kalau kau', 'makan ah istimewa nasi lemak tu']
['saya sangat minat sukan', 'oh sementara kau guna lah', 'yang S E punya yang baru', 'lemang [UNK] beb ah kalau', 'tu lah tu sekarang negara kita dah maju dengan telekomunikasi', 'untuk jadikan ah bola sepak', 'tapi kalau kau', 'makanan [UNK] istimewa na-nasi lemak tu']


 42%|████▏     | 27/65 [05:13<05:27,  8.63s/it]

27
['ah isi isi', 'lapisan bahulu tu susah nak jumpa dekat', 'senang lah nak buat cuma lama sikit lah nak kena tunggu', 'tak ah ah ke tentang kekuatan yang kuatlah', 'karena mereka fikir renang ni merupakan sesuatu benda yang mudah', 'so', 'ah dan sakit tekak yang sangat sakit lah yang tu je saya tahulah sebab then ah kita kena jaga ah apa ni masalah ni dengan dia boleh elak tau dengan macam basuh tangan lepas tu pakai hand hand sanitizer', 'makanan']
['ah isi isi', 'lapisan bahulu tu susah nak jumpa dekat', 'senang lah nak buat cuma lama sikit lah nak kena tunggu', 'tahap ah ke [UNK] kekuatan yang kuatlah', 'kerana mereka fikir berenang ni merupakan sesuatu benda yang mudah', 'so', 'ah dan sakit tekak yang sangat sakitlah yang tu je saya tahulah sebab then ah kita kena jaga ah apa ni masalah ni dengan dia boleh elak tau dengan macam membasuh tangan lepas tu pakai hand [UNK] hand sanitizer', 'makanan']


 43%|████▎     | 28/65 [05:30<06:50, 11.10s/it]

28
['dia boleh menorong kepada tindakan membunuh diri', 'kalau kuih raya masa raya ada kuih bahulu', 'sebagai contoh dia makan apa eh', 'daun daun pisang ah so buatkan nasi lemak tu bau wangi sedap', 'dia punya apa', 'aku ada tengok juga kesih pasal kesihatan ni', 'ah sokan kan terdiri daripada aktiviti fizikal yang dilakukan untuk pelbagai tujuan jadi ah misalnya berenang', 'tapi sebelum sebelum ni kan dorang pun makan kelawar kenapa baru aa benda ni terjadi']
['dia boleh mendorong kepada tindakan membunuh diri', 'kalau kuih raya masa raya ada kuih bahulu', 'sebagai contoh dia makan apa eh', 'daun daun pisang ah so buatkan nasi lemak tu bau wangi sedap', 'dia punya apa', 'aku tengok juga kes dia pasal kesihatan ni', 'ah sukan kan terdiri daripada aktiviti-aktiviti fizikal yang dilakukan untuk pelbagai tujuan jadi ah misalnya berenang', 'tapi sebelum-sebelum ni kan dia orang pun makan kelawar kenapa baru ah benda ni terjadi']


 45%|████▍     | 29/65 [05:41<06:33, 10.92s/it]

29
['ah berenang ah adalah satu sebab', 'kenapa tak eh kenapa eh ah dia macam dia tak ambil endah padahal ah dia dah tahu dah kadar kadar apa ni kesihatan di Malaysia sangat merosot tapi kenapa dia melakukan juga ah macam makan benda-benda yang', 'ah antara', 'ha itu lah sebabnya', 'Samsung yang baru-baru ni sebab sebab aku kata Samsung kan kambar lagi cantik berlain sebab aku dengar cerita tu lah so macam', 'cuti macam', 'oh kira dorang cek apa semua tak guna', 'so sedap lah']
['ha berenang ha adalah satu sebab', 'kenapa ek kenapa ek ah dia macam dia tak ambil endah padahal dia dah tahu dah kadar- kadar apa ni kesihatan di Malaysia sangat merosot tapi kenapa dia melakukan jugak ah macam makan benda-benda yang', 'ah antara', 'ha itulah sebabnya', 'Samsung yang baru-baru ni ah sebab sebab orang kata Samsung ni kamera lagi cantik daripada iPhone aku dengar macam tu lah so macam', 'cuti cuti macam', 'oh kira dia orang chat apa semua tak guna', 'so sedap lah']


 46%|████▌     | 30/65 [05:58<07:30, 12.88s/it]

30
['keluar baru kan harga yang full lama kan makin murah murah kan', 'terdiri daripada tiga jenis kuih', 'makanan orang Melayu lah contoh macam', 'ah dihiris', 'kau boleh makan dengan ayam', 'ah pergi dulu ya', 'ya ramai yang tak nampak ah saya rasa itu sahaja kot untuk topik kita tentang sukan terima kasih sebab boleh tahu saya sedikit sebanyak tentang sukan ni lah', 'hobi ayah saya waktu']
['keluar baru kan harga yang phone lama kan makin murah murah en', 'terdiri daripada tiga jenis kuih', 'makanan orang Melayu la contoh macam', 'ah dia hiris', 'kau boleh makan dengan ayam', 'ah pergi dulu ye', 'ya ramai yang tak nampak ah saya rasa itu sahaja kot untuk topik kita tentang sukan terima kasih sebab memberitahu saya sedikit sebanyak tentang sukan ni lah', 'hobi ayah saya waktu']


 48%|████▊     | 31/65 [06:11<07:18, 12.91s/it]

31
['ah ah stop', 'aku suka makan makanan yang tradisional tau', 'ya', 'beliau merupakan seorang yang rendah diri walaupun beliau telah memenangi banyak acara dan pelbagai', 'oh ibu ibu', 'tapi aku tak minat mana kalau power bank baik aku rasa baik Samsung lah cuma Samsung', 'buat lemang cari buluh dekat hutan and then masak pula ah', 'tapi kau kena fungsi apa sekarang']
['ha ah sedap', 'aku suka makan makanan yang tradisional tau', 'ya', 'beliau merupakan seorang yang rendah diri walaupun beliau telah memenangi banyak acara dan pelbagai', 'oh epok-epok', 'tapi aku tak minat mana kalau powerbank baik aku rasa baik Samsung kan cuma Samsung', 'buat lemang cari buluh dekat hutan and then masak pula ah', 'tapi kau guna phone apa sekarang']


 49%|████▉     | 32/65 [06:21<06:35, 11.99s/it]

32
['oke kalau macam tu', 'memang ambil masa untuk memahamikannya dan ia perlukan banyak tenaga', 'kira situ kita dah boleh jimat masa kita boleh buat benda lain lah', 'em kau sihat', 'makan tidur makan tidur makan tidur lah abak kata-kata ah', 'ah saya ada topik nak cerita ni tentang sukan yang saya minat', 'dia dikenali sebagai dosa ataupun dosai', 'tenang sedap sangat']
['okey kalau macam tu', 'mengambil masa untuk memahirkannya dan ia perlukan banyak tenaga', 'kira kita kita dah boleh jimat masa kita boleh buat benda lain la', 'um hm um kau sihat', 'makan tidur makan tidur makan tidurlah bak kata pepatah ah', 'ah saya ada topik nak cerita ni tentang sukan yang saya minat', 'dia dikenali sebagai dosa ataupun dosai', 'pernah sedap sangat']


 51%|█████     | 33/65 [06:28<05:39, 10.62s/it]

33
['okay sama-sama nanti berdi', 'ha ada lah kalau yang dua ribu okey', 'dan roll bahul-bahulu', 'dia kalau dengan iphone ya baru boleh', 'moden sedap', 'ayah saya atlet sekolah rendah sekolah menengah', 'sesiara persaingan di hadapan ribuan penonton rupakan satu perkara yang saya paling minatlah', 'nak buat pun kalau macam aku biasa']
['okay sambung-sambung antibodi', 'ha ada tak kalau yang dua ribu K', 'dan roll bahulu bahulu', 'dia kalau iPhone dengan iPhone je lah baru boleh', 'betul sedap', 'ayah saya atlit sekolah rendah sekolah menengah', 'secara berasingan di hadapan ribuan penonton merupakan satu perkara yang saya paling minatlah', 'nak buat pun kalau macam aku biasa']


 52%|█████▏    | 34/65 [06:38<05:15, 10.19s/it]

34
['hm tapi', 'wajib lah kena ada benda ni kena makan', 'rasa pedas lah ke macam mana', 'oh sekejap lagi lah', 'berbatutan lah', 'fatah lah pemanding eh', 'hmm kalau nak dalam bidang sukan', 'bahulu']
['em tapi', 'wajiblah kena ada benda ni kena makan', 'rasa pedas la ke macam mana', 'oh sedaplah', 'berpatutan ah', 'fakta la berbanding eh', 'hm seronok dalam bidang sukan', 'bahulu']


 54%|█████▍    | 35/65 [06:43<04:26,  8.88s/it]

35
['oh', 'kerajaan ni', 'antara sebab saya minat badminton adalah saya terinspirasi daripada pemain negara Malaysia tu', 'side ah apa ni', 'oh begitu', 'kalau kalau kau yang jenis makanan sayur', 'tuh si ini dia kuah dia macam kuah sambar', 'ah benda ni']
['oh', 'kerajaan ni', 'antara sebab saya minat badminton adalah saya terinspirasi daripada pemain negara Malaysia [UNK]', '[UNK] ah apa ni', 'oh begitu', 'kal-kalau kau yang jenis makan dengan sayur', 'tosei ni dia kuah dia macam kuah sambar', 'ah apa ni']


 55%|█████▌    | 36/65 [06:52<04:18,  8.91s/it]

36
['termasuklah fikiran perasaan tekan laku ah macam itulah', 'latest punya tak ada kot dia yang baru baru dia ada', 'ah besar lah sebab dah tak kuat lagi tapi beliau masih boleh bermain walaupun dia tak masuk lagi pertandingan lawan antara negara lain', 'so kalau cakap pasal kesehatan ni kan biasanya kalau kat sekolah kan macam mesti satu', 'untuk ah kalau kau nak buat kat rumah kau', 'oh kau nak camera ke nak camera dengan phone', 'telur repus', 'apa ni']
['termasuklah fikiran perasaan tingkahlaku ah macam tu lah', 'latest punya tak ada kut dia yang baru-baru je ada', 'ha bersara ah sebab dah tak kuat lagi tapi beliau masih boleh bermain walaupun dia tak masuk lagi pertandingan [UNK] lawan antara negara lain', 'so kalau cakap pasal kesihatan ni kan biasa nya kalau dekat sekolah kan [UNK] macam mesti satu', 'untuk um ah kalau kau nak buat kat rumah kau', 'oh kau nak kamera ke nak kamera dengan phone', 'telur rebus', 'apa ini']


 57%|█████▋    | 37/65 [07:04<04:30,  9.68s/it]

37
['hah itu macam kau', 'ah kalau idola awak adalah Ronaldo idola saya je lah Joseph Scalding ah beliau berasal daripada Singapura', 'macam-macam lah nama dia', 'terutamanya kaum India lah tosai ni boleh didapati di mana-mana gerai atau kedai mamak dan juga di restoran India', 'daripada kecil', 'dia meninggal lunia', 'dari buah-buahan', 'kira kira ah kita kan kalau tak ada terima kasih kira kalau buku tu kan je lah satu benda tu dia']
['itu macam kau', 'ah kalau idola awak adalah Ronaldo idola saya ialah Joseph Scolding ah beliau berasal daripada Singapore', 'macam-macam lah nama dia', 'terutamanya kaum India lah thosai ni boleh didapati di mana-mana gerai atau kedai mamak dan juga di restoran India', 'daripada kecik', 'dia meninggal dunia', 'dari buah-buahan', 'kira kira ha kita kan kalau tak ada telekomunikasi kira kalau buku tu kan satu benda tu dia']


 58%|█████▊    | 38/65 [07:15<04:31, 10.04s/it]

38
['aku makan makanan Melayu je', 'lepas tu kalau', 'jadi', 'ah pertandingan yang dia anjurkan beliau tetap ah rendah rendik rendah diri dan tidak terlalu sombong untuk bertemu atau mengajar orang-orang lain berbanyak badminton itu antara yang saya minat tentang beliau', 'sebenarnya tentu oh sebab pertama saya minat beliau ah beliau berasal daripada tanah air kita sendiri lah baik tu Malaysia tu antara semangat biototik lah kalau kita minat pada beliau kita menyokong produk tanah air kita sendiri', 'ya lah dia dibalut oleh', 'hanya syusi ke', 'ah ah dosa dosai']
['aku makan makanan mela-melayu je', 'lepas tu [UNK]', 'jadi', 'ah pertandingan yang dianjurkan beliau tetap ah rendah [UNK] rendah diri dan tidak terlalu sombong untuk bertemu atau mengajar orang-orang lain bermain badminton itu antara yang saya minat tentang beliau', 'sudah tentu oh sebab pertama saya minat beliau kut ah beliau berasal daripada tanah air kita sendirilah iaitu Malaysia tu antara semangat patriotiklah kalau ki

 60%|██████    | 39/65 [07:34<05:33, 12.83s/it]

39
['macam apa orang cakap', 'ha dia kalau kat internet kan dia dia jelaskan semua kan kira kerja kita jadi lagi senang lah', 'kuih pula', 'diisi dengan kentang dan bawang yang telah dikoreng sehingga rangup so sedap lah kan nak makan', 'menyihatkan badan kita', 'tapi saya ingat berdenang', 'tapi tengok iPhone iPhone satu ya aku kurang naik bateri dia bateri', 'Bau Lu ni macam']
['macam apa orang cakap', 'ha dia kalau dekat internet kan dia ada jelas kan semua kan kira kerja kita akan jadi lagi senang la', 'kuih pula', 'diisi dengan kentang dan bawang yang telah digoreng sehingga rangup so sedaplah kan nak makan', 'menyihatkan badan kita', 'tapi saya minat berenang', 'tapi aku tengok iPhone pun iPhone ni satu je ah kekurangan bateri dia bateri', 'Kuih Bahulu ni macam']


 62%|██████▏   | 40/65 [07:44<04:57, 11.91s/it]

40
['jadi tak bini masuk', 'kalau kalau contoh kau macam', 'ah tapi saya rasa', 'ibu bapa', 'awak kenal tak', 'apa dia', 'tapi yang paling aku suka nasi lemak lah sebab nasi lemak tu', 'assalamualaikum']
['jadi rugby ni memang [UNK]', 'kalau kalau contoh kau macam', 'ah tapi saya rasa', 'ibu bapa', 'awak kenal tak', 'apa dia', 'tapi yang paling aku suka nasi lemak la sebab nasi lemak tu', 'assalamualaikum']


 63%|██████▎   | 41/65 [07:51<04:11, 10.47s/it]

41
['itu ah yang saya tahu dia berbunca ah daripada', 'ha eh aku pakai phone ah phone mak aku ah tapi phone lama mak aku ah', 'berapa dia', 'tapi mahal lah bajet aku bawah dua ribu je', 'oke aku pun tu je lah makanan yang', 'kenal Joseph Scoring tak', 'ah lemang ke macam ah orang Melayu punya kalau kuih tu macam', 'raya tahun baru sini tu ah dia orang memang']
['itu ah yang saya tahu dia berpunca ah daripada', 'ah ah eh aku pakai [UNK] ah phone mak ah tapi phone lama mak aku ah', 'me- apa ni', 'tapi mahal ah bajet aku bawah dua ribu je', 'okey aku pun tu je la makanan yang', 'kenal Joseph Schooling tak', 'ah lemang ke macam ah orang Melayu punya kalau kuih tu macam', 'so Raya Tahun Baru Cina tu ah dia orang memang']


 65%|██████▍   | 42/65 [07:58<03:35,  9.38s/it]

42
['oh', 'i phone X eh', 'layer dan roll agak suka lah', 'tapi iPhone kan sekarang dia keluar SE eh yang baru tapi bateri dia lah 3000 mAh tak kira kau', 'dekat Malaysia ni kan kita banyak banyak bangsa kan budaya so', 'china yang sering dimakan', 'ha kalau fokorosat ni sebab ni masuk air', 'satu benda dia jelas sampai dalam']
['oh', 'iPhone X eh', 'layer dan roll agak sukar lah', 'tapi iPhone kan sekarang ada keluar S E eh yang baru tapi bateri dia ah seribu lebih tak silap aku', 'dekat Malaysia ni kan kita banyak banyak bangsa kan budaya so', 'Cina yang sering dimakan', 'ah [UNK] phone aku rosak ni sebab ni masuk air', 'satu benda tu dia jalan sampai dalam']


 66%|██████▌   | 43/65 [08:06<03:20,  9.11s/it]

43
['dia punya senter-senter nak betulkan', 'untuk hormon lah kalau biasa kalau', 'bukul tertumpu macam satu benda tu kan dia lebih kurang', 'mahal juga eh tapi berpatutan lah sebab dia datang daripada Korea kan', 'ganas sikit dia suka kerja kerja orang', 'kita ni lah', 'kalau macam kalau kau tak nak makan dengan telur kalau kau ada alergi ke ada trauma ke apa', 'kau dah ni belum ses']
['dia punya centre centre nak betulkan', 'tu untuk hormon lah kalau biasa kalau', 'bukan tertumpu macam satu benda tu kan dia lebih kurang', 'mahal juga eh tapi berpatutan la sebab dia datang daripada Korea kan', 'ganas sikit dia suka kejar kejar orang', 'kita ni lah', 'kalau macam kalau kau tak makan dengan telur kalau kau ada alergik ke ada trauma ke apa', 'kau dah ni belum search']


 68%|██████▊   | 44/65 [08:14<03:05,  8.82s/it]

44
['dia membawa kematian kan dan kalau mematikan ah tak ada pekerja-pekerja nanti yang mahir dan ekonomi negara merosot macam mana eh ah kerajaan boleh buat', 'oh macam ujian', 'ah kalau terkena kepada ah golongan yang tua ataupun', 'kerana berenang merupakan', 'sekarang ha banyak jugalah sebab adik saya pun ha dia main dia hujan dia asyik demam je tak tahulah kenapa', 'maruah dia tak dia sebab nak jaga nak kejar nama eh', 'kematian ahli keluarga', 'hmm ada']
['dia membawa kematian kan then kalau mati kan ah tak ada pekerja-pekerja nanti yang mahir then ekonomi negara merosot macam mana ek kerajaan boleh buat', 'oh macam air hujan', 'ah kalau terkena pada ah golongan yang dah tua ataupun', 'kerana berenang merupakan', 'sekarang ah banyak jugalah sebab adik saya pun ah dia main di hujan dia asyik demam je tak tahu lah kenapa', 'maruah dia tak [UNK] dia sebab nak jaga kejar nama eh', 'kematian ahli keluarga', 'um ada']


 69%|██████▉   | 45/65 [08:30<03:37, 10.87s/it]

45
['ha laptop laptopnya aku tak tahu apa tak mana harga', 'dan macam-macam lagi lah', 'ha kuih kuih melaka ha set set lah ketupat semua kan', 'oh baik Samsung RAM pun okey besar', 'tapi nam kau tahu tak sebenarnya nama Tosi ni ah Tosi pun ada nama lain juga', 'mana boleh sambung kena redo tu kau dah cakap benda lain', 'macam ni lah ha', 'kalau kai kau macam ni pula']
['ah laptop laptop ni ah aku tak tau apa apa tengok mana harga', 'dan macam-macam lagi lah', 'ah kuih gula melaka ah [UNK] ketupat semua kan', 'oh baik Samsung ram pun okey besar', 'tapi nama kau tahu tak sebenarnya nama tosei ni [UNK] tosei pun ada nama lain juga', 'mana boleh sambung kena [UNK] doh kau dah cakap benda lain', 'macam ni la ah', 'kalau kait kaum Cina pula']


 71%|███████   | 46/65 [08:38<03:10, 10.04s/it]

46
['jumpa lagi', 'oh so kena ambil rem bat besar sikit lah', 'kalau tak kena ah saya bercerita kan kemudian', 'nama dia unik eh', 'dan awak bagaimana pula adakah awak ada benda lagi yang nak cari pasal sukan', 'ah ah dengan sambal dia Ya Allah sedapnya', 'sambal', 'oh ya sila']
['jumpa lagi', 'oh so kena ambil ram [UNK] besar sikit ah', 'kalau awak tak kenal ha saya boleh cerita kan tentang beliau', 'nama dia unik eh', 'dan awak bagaimana pula adakah awak ada benda lagi awak nak ce- cerita pasal sukan', 'ha ah dengan sambal dia ya Allah sedap nya', 'sambal', 'oh biasa lah']


 72%|███████▏  | 47/65 [08:46<02:50,  9.46s/it]

47
['selek dia boomerang ah boomerang dia ni kan', 'hari raya ke cuti-cuti', 'satu dunia kenal eh', 'hm tapi yang setengah aku ada orang cakap ROG okey tapi ROG tiga ribu ah hm Asus ROG', 'dia ada pemain karibat', 'kan masa akhir-akhir lah', 'baulu ni', 'sebab berenang dia orang fikir ini bukan aktiviti tukan']
['slack dia boomerang je lah boomerang dia ni kan', 'Hari Raya ke cuti cuti', 'satu dunia kenal', 'em tapi [UNK] yang setahu aku ada orang cakap R O G okey tapi R O G tiga ribu ah em Asus R O G', 'dia ada pemain terhebat', 'makan masa Hari Raya lah', 'bahulu ni', 'sebab berenang dia orang fikir ini bukan aktiviti sukan']


 74%|███████▍  | 48/65 [08:56<02:43,  9.60s/it]

48
['ha sebab orang kata telefon ni kan kalau masuk air kan masuk dalam berah aku masuk lah lepas tu dia tetap tak hidup', 'tolong kongsi', 'bawulu layer ni baut', 'hm lapisan bahulu bahulu', 'susah lah kalau kau nak jumpa kat supermarket tu kan bahulu', 'kau masak kau buat apa lagi', 'aku nak', 'oh jadi awak nak sampaikan yang kita ambil sukan yang ringan kita bawa masuk ke sukan sukan yang']
['ah sebab orang kata telefon en kalau masuk air kan masuk dalam beras aku masuk ah lepas tu dia tetap tak hidup', 'kalau engkau perasan', 'bahulu layer ni bahu', 'lapisan bahulu bahulu', 'susah lah kalau kau nak jumpa kat supermarket tu kan bahulu', 'kau masak engkau buat apa lah', 'aku nak', 'oh jadi awak nak sampaikan yang kita ambil sukan yang ringan kita bawa masuk ke sukan sukan yang']


 75%|███████▌  | 49/65 [09:06<02:35,  9.75s/it]

49
['pas tu sambal dia kalau makan panas-panas pas tu pedas memang sedap ah', 'tapi kan anak muda sekarang banyak salah guna macam remaja sekarang', 'ah tu sai ni', 'ada tahu aku boleh makan juga kan lepas ni', 'kalau macam aku suka kalau makanan orang Cina aku suka makan', 'yang saya tahu', 'punyai rakyat rakyat rakyat yang mempunyai kesihatan yang kuat lah tak adalah macam ha lembek je kan okay', 'hmm nasi lemak ke']
['lepas tu sambal dia kalau makan panas panas lepas tu pedas memang sedap ah', 'tapi kan anak muda sekarang banyak salah guna macam remaja sekarang', 'er thosai ni', 'mana tahu aku boleh makan juga kan lepas ni', 'kalau macam aku suka kalau makanan orang Cina aku suka makan', 'yang saya tahu', 'mempunyai rakyat ra-rakyat yang mempunyai kesihatan yang kuatlah tak ada lah macam lembik je kan okay', 'erm nasi lemak ke']


 77%|███████▋  | 50/65 [09:18<02:35, 10.37s/it]

50
['negara Malaysia tak perlu kot ah ambil endah pasal medan ini sebab ini memang isu terhangat sekarang ini yang paling yang ditakuti oleh seluruh negara seluruh negara yang berada di dunia lah itulah saya dapat ah cerita kan pasal ah Covid-19 ini', 'hidupan harian', 'memang jadi tempat pertama di ranking Asia ah mas mas masalah kesihatan pasal obesiti', 'oh senang', 'ya berenang', 'uh', 'ah kalau', 'tak kenalkah']
['negara Malaysia tak perlu kot ah ambik indah pasal benda alah ni sebab ni memang isu terhangat sekarang ni yang paling yang dita- ditakuti oleh seluruh negara seluruh negara yang berada di dunia lah itu lah saya dapat ah ceritakan pasal ah Covid nineteen ni', 'kehidupan harian', '[UNK] menjadi tempat pertama di ranking Asia ah ma-masalah kesihatan pasal obesiti', 'oh senang', 'ya berenang', 'oh', 'ah kalau', 'tak kenal ke']


 78%|███████▊  | 51/65 [09:40<03:12, 13.74s/it]

51
['daripada cari buku kan macam pening sikit kan kalau macam kat internet kan dia ada jelas', 'selepas berenang', 'okey kita pun balik pada topik tadi lah yang masal aa kadar kesihatan negara tahu tak aa dulu Malaysia aa Malaysia mempunyai pada dua ribu dua ribu sebelas Malaysia mempunyai aa jumlah pesakit yang bertambah selepas setahun seramai dua ratus ribu', 'COVID-19 sebab yang satu dunia tu bah yang daripada negara China Wuhan eh tak silap saya lah ah itu', 'hmm tiba-tiba dia macam tiba-tiba datang peluk tak nak lepas ha macam', 'lemang ke ha lain lagi lemang lah', 'ah', 'senang lah nak rapat']
['daripada cari buku an macam pening sikit an kalau macam dekat internet kan dia ada jelas', 'sebab berenang', 'okay okay kita berbalik pada topik tadi lah yang pasal ah kadar kesihatan negara tahu tak ah dulu Malaysia ah Malaysia mempunyai pada dua ribu dua dua ribu sebelas Malaysia mempunyai ah jumlah pesakit yang bertambah selepas setahun seramai dua ratus ribu', 'Covid ninteen sebab y

 80%|████████  | 52/65 [10:03<03:34, 16.46s/it]

52
['istimewa makanan', 'ah kalau macam mana ada rupa kalau macam', 'oh Ronaldo oh', 'oh', 'makan air pada luar negara aku', 'ha kalau baik ah ada apa lagi ya kor', 'ni oh', 'selalu selalulah ada dekat Malaysia ni']
['istimewa makanan', 'ha ah kalau roti canai ada dua kuah kalau macam', 'oh Ronaldo', 'oh', 'makanan yang kalau luar negara aku', 'ah khabar baik ah ada apa lagi ya call', '[UNK] oh', 'selalu selalu lah ada dekat Malaysia ni']


 83%|████████▎ | 54/65 [10:15<02:05, 11.41s/it]

53
['ha ada dia ada face yang ni aku ada tengok juga', 'tahu yang merupakan', 'sendiri kan dengan', 'oh macam benda yang pelik lah macam kita tak makan tapi dia makan oh macam tu', 'ya lah dia lagi', 'dai mei sihat dah', 'kuih bulan kalau kau pula kau suka makan makanan Cina makanan apa', 'ha demam ha lepas tu batuk batuk']
['erm ah ada dia ada face yang ni aku ada tengok juga', 'tau yang merupakan', 'sendirikan dengan', 'oh macam benda yang pelik lah macam kita tak makan tapi dia makan oh macam tu', 'ah ya saya', 'lebih sihat ah', 'kuih bulan kalau kau pula kau suka makan makanan Cina makanan apa', 'ha demam lepas tu batuk batuk']
54
['information', 'oh so kau ni dikita gerikan yang', 'sebelas oh', 'ah seorang yang tu punya gejala seperti demam', 'waktu perayaan so masa', 'saya rasa bukan kerajaan-kerajaan je kot saya rasa sekolah pun boleh bendung masalah ni kot dengan macam dia menerapkan tentang makanan di makanan di macam contoh subject science ah menerapkan bahasa makanan BM ah t

 85%|████████▍ | 55/65 [10:40<02:34, 15.50s/it]

55
['makanan', 'tak ah ni aku kat rumah lain aku tak beli lagi sebab aku tengah', 'kalau samson ni boomerang ah dia satu boomerang ah betty semua okey', 'golongan ah kanak-kanak yang masih bayi tu memang sangat bahayalah sebab dia boleh menyebabkan kematian ah di negara tersebutlah jadinya ah', 'ah aku nak main game semua lah', 'oh okey ada apa-apa lagi tak nak saya pasal ah kesihatan ni', 'mengusah orang', 'gagal azam']
['makanan', 'tak ah ni aku kat rumah lagi aku tak beli lagi sebab aku tengah', 'kalau Samsung ni boomerang ah dia satu boomerang ah bateri semua okey', 'golongan ah kanak-kanak yang masih bayi tu memang sangat bahaya lah sebab dia boleh menyebabkan kematian di ah di negara tersebut lah kiranya ah', 'aku nak main game semua lah', 'okay ada apa-apa lagi tak nak tanya saya ah pasal ah kesihatan ni', 'mood seseorang', 'gagal exam']


 86%|████████▌ | 56/65 [10:54<02:15, 15.06s/it]

56
['Nabi tahu', 'makan bubur ke', 'keluarga ni macam penyakit mental yang menyebabkan perasaan macam mood lah', 'oke tak awak okey tak', 'um', 'ya memang ah', 'ah tahu tahu tahu sekarang', 'oh tu kan']
['nak beritahu', 'makan bubur ke', 'kemurungan ni macam penyakit mental yang menyebabkan perasaan macam mood lah', 'okey tak awak okey tak', 'um hm', 'ya ah memang ah', 'ah tahu tahu tahu sekarang', 'oh tepung']


 89%|████████▉ | 58/65 [11:14<01:27, 12.50s/it]

57
['oh', 'klinik ke', 'ataupun achar India daripada India lah resepi India ataupun kari ke kari ayam kari daging dan macam-macam lagi lah', 'oh', 'ah lagi-lagi kalau masa', 'yang tadi dia paling-paling suka sepak contohnya bola sepak', 'tak lah aku macam kalau lain macam Huawei tu semua aku tak minat sebab bapak aku cakap dari China so macam aku bahagian China ni', 'um']
['oh', 'klinik ke', 'ataupun acar India daripada India lah resepi India ataupun kari ke kari ayam kari daging dan macam-macam lagi lah', 'oh', 'um lagi lagi kalau masa', 'yang terdiri daripada pelbagai [UNK] aspek contohnya bola sepak', 'ah aku macam kalau lain macam Huawei apa semua aku tak minat sebab bapa aku cakap dari China so macam aku kalau Cina ni', 'oh']
58
['dia kecik dia macam senari bentuk tau ah sebagai ah sebagai peribahasa ah meluntur buluk biarlah kena hubungi lah jadi ah saya rasa ah pihak sekolah pun boleh buat pendanaan ni', 'kau pendam sudah menyiksa diri kau macam tu lah', 'ah semua kau nak kau ke

 91%|█████████ | 59/65 [11:31<01:22, 13.79s/it]

59
['masuk air dia macam masak nasi', 'terlalu banyak masalah lepas tu', 'is tak babe', 'kenapa yang boleh saya tahu tak', 'oh masa what', 'hello me', 'lepas tu dia punya ah ukuran tu lebih kurang macam sepuluh cm ke', 'em semak']
['masuk air dia macam masak nasi', 'terlalu banyak masalah lepas tu', 'hisap vape', 'kenapa ya boleh saya tahu tak', 'oh maksud awak', 'hello Umi', 'pas tu dia punya ah ukuran tu lebih kurang macam sepuluh C M ke', 'em sebab']


 92%|█████████▏| 60/65 [11:38<00:59, 11.87s/it]

60
['macam boleh menjelaskan', 'um selain sukan berenang eh', 'oh macam dia oh okey sama sama sama sama', 'tak pernah lah sebab aku tak suka sangat peta payam tu', 'masukkan beras kat dalam tu lepas', 'tentang sejarah sukan saya mahu menceritakan sejarah sukan', 'kau macam kajian', 'ok terima kasih ah hokum salam']
['macam boleh menjejaskan', 'hm selain sukan berenang eh', 'oh macam dia oh okey sama-sama sambung sambung', 'tak pernah lah sebab aku tak suka sangat putu mayam tu', 'kita masukkan beras dekat dalam tu lepas tu', 'tentang sejarah sukan saya mahu menceritakan sejarah sukan', 'kau macam kaji ah', 'okey terima kasih ha waalaikumsalam']


 94%|█████████▍| 61/65 [11:46<00:42, 10.58s/it]

61
['selepas tu makan-makan yang tawar', 'oh aku pun suka tosi juga', 'tapi kau buat hati ah oh kau nak beli iPhone 5 sebab aku tengok apa kan iPhone kan bila', 'kongsi sikit pasal', 'boleh bagi saya satu contoh kategori sukan yang awak minat', 'kalau aku ah kalau aku ni ah asus sebab asus kan aku tak suka tengah talk oleh top dia tu', 'mah sikit', 'ah Malaysia juga ah apa ni mewakili tempat kedua dalam']
['so makan makan yang tawar', 'oh aku pun suka tosei juga', 'tapi kau puas hati tak oh kau nak beli iPhone seven sebab aku tengok pun iPhone kan iPhone kan bila', 'kongsi ah sikit pasal', 'boleh bagi saya satu contoh ketegori sukan yang awak minat', 'kalau aku ah kalau aku ni ah Asus sebab Asus kan aku tengok sekarang tengah top laptop dia tu', 'mahal sikit', 'ah Malaysia ke ah apa ni mewakili tempat kedua dalam']


 95%|█████████▌| 62/65 [11:55<00:30, 10.08s/it]

62
['hai Helmi apa khabar', 'sambung-sambung', 'oh setap tu', 'bateri lah problem sikit', 'kau boleh makan dengan', 'kalau kau kau tahu phone apa yang RAM besar', 'hebat juga ya ya kamu', 'oh mahatkan makan']
['hai Helmi apa khabar', 'sambung-sambung', 'oh sedap tu', 'bateri ah pro-problem sikit', 'kalau boleh makan dengan', 'kalau kau kau tahu phone apa yang ram besar', 'hebat juga ya ayah kamu', 'oh menghadkan makanan']


 97%|█████████▋| 63/65 [12:00<00:17,  8.60s/it]

63
['ah nurse nurse datang lepas tu bagian jet eh', 'sekiranya tak dapat kawal', 'pemakanan jugalah tapi saya tidak tahu ah dari mana pemakanan itu ah boleh berlakunya covid-19 lah sebab', 'sedangkan berenang mengambil', 'ha kuih baulu aku suka sangat kuih baulu ni', 'taksa tu berbeza sikit', 'pergilah kat rumah kau kan nak ah nanti', 'aku mungkin kalau boleh nak cari yang apa ni']
['ha nurse nurse datang lepas tu bagi inject kan', 'kiranya tak dapat kawal', 'pemakanan jugalah tapi saya tidak tahu ah dari mana pemakanan itu boleh berlakunya Covid ninteen la sebab', 'sedangkan berenang mengambil', 'ha Kuih Bahulu aku suka sangat Kuih Bahulu ni', '[UNK] situ berbeza sikit', 'pergilah kat rumah kau kan nak ah nanti', 'aku ingat kalau boleh nak cari yang apa ni']


 98%|█████████▊| 64/65 [12:09<00:08,  8.93s/it]

64
['okey okey okey aa']
['okay okay okay ah']


100%|██████████| 65/65 [12:12<00:00, 11.27s/it]

wer=24.77432296890672



