# Isi Penting Generator HuggingFace news style

Generate a long text with news style given isi penting (important facts).

<div class="alert alert-info">

This tutorial is available as an IPython notebook at [Malaya/example/isi-penting-generator-huggingface-news-style](https://github.com/huseinzol05/Malaya/tree/master/example/isi-penting-generator-huggingface-news-style).
    
</div>

<div class="alert alert-warning">

Results generated using stochastic methods.
    
</div>

In [1]:
%%time
import malaya
from pprint import pprint

CPU times: user 3.13 s, sys: 3.51 s, total: 6.64 s
Wall time: 2.4 s


### List available HuggingFace

In [2]:
malaya.generator.isi_penting.available_huggingface()

Unnamed: 0,Size (MB),ROUGE-1,ROUGE-2,ROUGE-L,Suggested length
mesolitica/finetune-isi-penting-generator-t5-small-standard-bahasa-cased,242.0,0.246203,0.058961,0.15159,1024.0
mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased,892.0,0.246203,0.058961,0.15159,1024.0


### Load HuggingFace

Transformer Generator in Malaya is quite unique, most of the text generative model we found on the internet like GPT2 or Markov, simply just continue prefix input from user, but not for Transformer Generator. We want to generate an article or karangan like high school when the users give 'isi penting'.

```python
def huggingface(model: str = 'mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased', **kwargs):
    """
    Load HuggingFace model to generate text based on isi penting.

    Parameters
    ----------
    model: str, optional (default='mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased')
        Check available models at `malaya.generator.isi_penting.available_huggingface()`.

    Returns
    -------
    result: malaya.torch_model.huggingface.IsiPentingGenerator
    """
```

In [3]:
model = malaya.generator.isi_penting.huggingface()

Downloading:   0%|          | 0.00/2.54k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/803k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/2.20k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/818 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/892M [00:00<?, ?B/s]

#### generate

```python
def generate(
    self,
    strings: List[str],
    mode: str = 'surat-khabar',
    **kwargs,
):
    """
    generate a long text given a isi penting.

    Parameters
    ----------
    strings : List[str]
    mode: str, optional (default='surat-khabar')
        Mode supported. Allowed values:

        * ``'surat-khabar'`` - news style writing.
        * ``'tajuk-surat-khabar'`` - headline news style writing.
        * ``'artikel'`` - article style writing.
        * ``'penerangan-produk'`` - product description style writing.
        * ``'karangan'`` - karangan sekolah style writing.

    **kwargs: vector arguments pass to huggingface `generate` method.
        Read more at https://huggingface.co/docs/transformers/main_classes/text_generation

    Returns
    -------
    result: List[str]
    """
```

### Good thing about HuggingFace

In `generate` method, you can do greedy, beam, sampling, nucleus decoder and so much more, read it at https://huggingface.co/blog/how-to-generate

And recently, huggingface released https://huggingface.co/blog/introducing-csearch

In [4]:
isi_penting = ['Dr M perlu dikekalkan sebagai perdana menteri',
              'Muhyiddin perlulah menolong Dr M',
              'rakyat perlu menolong Muhyiddin']

In [8]:
pprint(model.generate(isi_penting, mode = 'surat-khabar',
    do_sample=True, 
    max_length=256, 
    top_k=50, 
    top_p=0.95,))

['KEMENTERIAN Dalam Negeri perlu memastikan tidak timbul soal kepemimpinan Dr '
 'Mahathir Mohamad yang bakal menggantikan Perdana Menteri. Ketua Pengarah '
 'Jabatan Perdana Menteri Datuk Seri Dr Mujahid Yusof berkata, sebagai '
 'menteri, Perdana Menteri perlu dikekalkan sebagai perdana menteri, selain '
 'perlu menjadi pemimpin yang membantu rakyat. "Saya difahamkan, Mahathir akan '
 'menjaga Muhyiddin dan rakyat tidak ada yang akan \'jatuh syahid\'. "Saya '
 'tidak pasti siapa (Dr Mahathir) mahu diganti," katanya pada sidang media '
 'selepas sesi taklimat di Putrajaya, hari ini. Muhyiddin semalam mengumumkan '
 'bahawa rakyat perlu menolong Perdana Menteri Dr Mahathir Mohamad untuk '
 'membantu Muhyiddin selain membantu dalam menangani pelbagai isu termasuk isu '
 'penyelewengan dan isu-isu berkaitan rasuah. Dalam sidang media itu juga, '
 'Pengerusi Pakatan Harapan (PH) itu memaklumkan pelantikan Menteri Hal Ehwal '
 'Ekonomi Mohamad Sabu sebagai perdana menteri perlu dilihat jel

In [10]:
isi_penting = ['Neelofa tetap dengan keputusan untuk berkahwin akhir tahun ini',
              'Long Tiger sanggup membantu Neelofa',
              'Tiba-tiba Long Tiger bergaduh dengan Husein']

We also can give any isi penting even does not make any sense.

In [13]:
pprint(model.generate(isi_penting, do_sample=True,
    max_length=256,
    top_k=50, 
    top_p=0.95, ))

['KUALA LUMPUR: Neelofa tetap memberi komitmen besar kepada projek seni '
 'wayang, tiru atau gaduh dengan bekas pemain bola sepak negara, Husein selaku '
 'juara musim keempat. Namun, kejayaan itu bukan saja menjadi kenyataan, malah '
 'membuatkan gandingannya itu terus tertekan. Selain menerima tawaran '
 'berlakon, Long Tiger juga sanggup membantu Neelofa, 34, yang juga anak bekas '
 'jurulatihnya itu yang berhasrat bergelar juara musim keempat sejak Ogos '
 '2016. Tiba-tiba Neelofa bergaduh dengan Husein pada Sabtu lalu menyebabkan '
 "anak sulungnya itu 'dibaham anak' bersama isterinya. Ketika diundang ke "
 'hotel, tular di media sosial apabila seorang lagi teman lelakinya juga tidak '
 'berpuas hati dengan tawaran yang diberikan. Pasangan itu kemudian membuat '
 'laporan di sebuah bank swasta supaya tidak melakukan sebarang perbuatan '
 'terhadap isterinya. Video berdurasi 27 saat yang dimuat naik di Instagram '
 'menunjukkan sekumpulan ahli perniagaan yang membawakan nama merek