# Isi Penting Generator HuggingFace

Generate a long text given isi penting (important facts).

<div class="alert alert-info">

This tutorial is available as an IPython notebook at [Malaya/example/isi-penting-generator-huggingface](https://github.com/huseinzol05/Malaya/tree/master/example/isi-penting-generator-huggingface).
    
</div>

<div class="alert alert-warning">

This module trained heavily on news structure.
    
</div>

<div class="alert alert-warning">

Results generated using stochastic methods.
    
</div>

In [1]:
%%time
import malaya
from pprint import pprint

CPU times: user 3.22 s, sys: 3.4 s, total: 6.62 s
Wall time: 2.53 s


### List available HuggingFace

In [2]:
malaya.generator.isi_penting.available_huggingface()

Unnamed: 0,Size (MB),BLEU,ROUGE-1,ROUGE-2,ROUGE-L,Suggested length
mesolitica/finetune-isi-penting-generator-t5-small-standard-bahasa-cased,242.0,61.559203,0.246203,0.058961,0.15159,1024.0
mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased,892.0,58.764876,0.246203,0.058961,0.15159,1024.0


### Load HuggingFace

Transformer Generator in Malaya is quite unique, most of the text generative model we found on the internet like GPT2 or Markov, simply just continue prefix input from user, but not for Transformer Generator. We want to generate an article or karangan like high school when the users give 'isi penting'.

```python
def huggingface(model: str = 'mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased', **kwargs):
    """
    Load HuggingFace model to generate text based on isi penting.

    Parameters
    ----------
    model: str, optional (default='mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased')
        Check available models at `malaya.generator.isi_penting.available_huggingface()`.

    Returns
    -------
    result: malaya.torch_model.huggingface.IsiPentingGenerator
    """
```

In [28]:
model = malaya.generator.isi_penting.huggingface()

#### generate

```python
def generate(
    self,
    strings: List[str],
    **kwargs,
):
    """
    generate a long text given a isi penting.

    Parameters
    ----------
    strings : List[str]
    **kwargs: vector arguments pass to huggingface `generate` method.
        Read more at https://huggingface.co/docs/transformers/main_classes/text_generation

    Returns
    -------
    result: List[str]
    """
```

### Good thing about HuggingFace

In `generate` method, you can do greedy, beam, sampling, nucleus decoder and so much more, read it at https://huggingface.co/blog/how-to-generate

And recently, huggingface released https://huggingface.co/blog/introducing-csearch

In [6]:
isi_penting = ['Dr M perlu dikekalkan sebagai perdana menteri',
              'Muhyiddin perlulah menolong Dr M',
              'rakyat perlu menolong Muhyiddin']

I just want to test the model given this isi penting, because we all know, Dr M and Muhyiddin are not supporting each others in the real world.

In [7]:
pprint(model.generate(isi_penting,
    max_length=256,
    penalty_alpha=0.6, top_k=4))

['KEMENANGAN Perdana Menteri, Tun Dr Mahathir Mohamad sebagai perdana menteri '
 'tidak boleh diulangi. Itu luahan Ahli Parlimen Sembrong, Datuk Seri Dr Wan '
 "Azizah Wan Ismail yang menyifatkan Dr Mahathir sebagai 'pendirian' beliau. "
 '"Beliau (Dr Mahathir) perlu dikekalkan sebagai perdana menteri. "Saya tidak '
 'boleh cakap apa-apa," katanya kepada pemberita selepas merasmikan '
 'Persidangan Perwakilan UMNO Bahagian Sembrong di Pusat Dagangan Dunia Putra '
 '(PWTC), hari ini. Beliau mengulas kenyataan Presiden UMNO, Datuk Seri Dr '
 "Ahmad Zahid Hamidi yang menyifatkan Dr Mahathir sebagai 'pendirian' beliau. "
 'Dr Mahathir yang juga Menteri Dalam Negeri berkata, rakyat perlu membantu '
 'Muhyiddin. "Rakyat perlu bantu Muhyiddin... jangan cakap apa-apa. "Kita '
 'tidak boleh buat apa-apa," katanya.']


Pretty good!

In [20]:
isi_penting = ['Neelofa tetap dengan keputusan untuk berkahwin akhir tahun ini',
              'Long Tiger sanggup membantu Neelofa',
              'Tiba-tiba Long Tiger bergaduh dengan Husein']

We also can give any isi penting even does not make any sense.

In [27]:
pprint(model.generate(isi_penting, do_sample=True,
    max_length=256,
    top_k=50, 
    top_p=0.99, ))

['KUALA LUMPUR: Long Tiger, yang pernah mendapat status selebriti menerusi '
 'drama Lailatul Qadar, sanggup membantu Neelofa yang beraksi di pentas akhir '
 'tahun ini. Neelofa tetap dengan keputusannya untuk berkahwin nanti, namun, '
 'Long Tiger sanggup membantu Neelofa, jika sanggup beraksi di pentas akhir '
 'tahun ini. Bagaimanapun, katanya, kejadian berlaku ketika Long Tiger '
 'bergaduh dengan Husein, sebelum itu. "Apabila dia (Hudley) hendak beraksi, '
 'jadi dia (Hudley) sanggup bantu. "Bagaimanapun, kali ini, saya terpaksa '
 'bergaduh. Tiba-tiba saya bergaduh sesama lelaki. "Saya tidak nampak sebab '
 'dia tak pasti," katanya ketika ditemui di majlis perkahwinan Neelofa yang '
 'berlangsung hari ini. Dalam aksi tumbuk dengan Husein itu, Long Tiger '
 'mengeluarkan sepucuk pistol kepada Neelofa untuk tujuan menyelamatkan. "Saya '
 'sendiri tidak tahu jika mereka mahu melawan Warat Azab dalam drama Lailatul '
 'Qadar. Namun, kerana tidak tahan berdepan masalah, saya terpanggi