# Isi Penting Generator HuggingFace article style

Generate a long text with article style given isi penting (important facts).

<div class="alert alert-info">

This tutorial is available as an IPython notebook at [Malaya/example/isi-penting-generator-huggingface-article-style](https://github.com/huseinzol05/Malaya/tree/master/example/isi-penting-generator-huggingface-article-style).
    
</div>

<div class="alert alert-warning">

Results generated using stochastic methods.
    
</div>

In [1]:
%%time
import malaya
from pprint import pprint

CPU times: user 3.13 s, sys: 3.62 s, total: 6.74 s
Wall time: 2.33 s


### List available HuggingFace

In [2]:
malaya.generator.isi_penting.available_huggingface()

Unnamed: 0,Size (MB),ROUGE-1,ROUGE-2,ROUGE-L,Suggested length
mesolitica/finetune-isi-penting-generator-t5-small-standard-bahasa-cased,242.0,0.246203,0.058961,0.15159,1024.0
mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased,892.0,0.246203,0.058961,0.15159,1024.0


### Load HuggingFace

Transformer Generator in Malaya is quite unique, most of the text generative model we found on the internet like GPT2 or Markov, simply just continue prefix input from user, but not for Transformer Generator. We want to generate an article or karangan like high school when the users give 'isi penting'.

```python
def huggingface(model: str = 'mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased', **kwargs):
    """
    Load HuggingFace model to generate text based on isi penting.

    Parameters
    ----------
    model: str, optional (default='mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased')
        Check available models at `malaya.generator.isi_penting.available_huggingface()`.

    Returns
    -------
    result: malaya.torch_model.huggingface.IsiPentingGenerator
    """
```

In [3]:
model = malaya.generator.isi_penting.huggingface()

#### generate

```python
def generate(
    self,
    strings: List[str],
    mode: str = 'surat-khabar',
    **kwargs,
):
    """
    generate a long text given a isi penting.

    Parameters
    ----------
    strings : List[str]
    mode: str, optional (default='surat-khabar')
        Mode supported. Allowed values:

        * ``'surat-khabar'`` - news style writing.
        * ``'tajuk-surat-khabar'`` - headline news style writing.
        * ``'artikel'`` - article style writing.
        * ``'penerangan-produk'`` - product description style writing.
        * ``'karangan'`` - karangan sekolah style writing.

    **kwargs: vector arguments pass to huggingface `generate` method.
        Read more at https://huggingface.co/docs/transformers/main_classes/text_generation

    Returns
    -------
    result: List[str]
    """
```

### Good thing about HuggingFace

In `generate` method, you can do greedy, beam, sampling, nucleus decoder and so much more, read it at https://huggingface.co/blog/how-to-generate

And recently, huggingface released https://huggingface.co/blog/introducing-csearch

In [4]:
isi_penting = ['Dr M perlu dikekalkan sebagai perdana menteri',
              'Muhyiddin perlulah menolong Dr M',
              'rakyat perlu menolong Muhyiddin']

In [5]:
pprint(model.generate(isi_penting, mode = 'artikel',
    do_sample=True, 
    max_length=256, 
    top_k=50, 
    top_p=0.95,))

You're using a T5TokenizerFast tokenizer. Please note that with a fast tokenizer, using the `__call__` method is faster than using a method to encode the text followed by a call to the `pad` method to get a padded encoding.


['Dr Mahathir harus tetap menjadi perdana menteri selagi dia tetap akan '
 'menyokong menteri dalam kerajaan sebelum menjadi perdana menteri "jika '
 'boleh," kata Perdana Menteri Muhyiddin Yassin. Ahli parlimen Muar itu '
 'berkata Dr M perlu dikekalkan sebagai perdana menteri kerana dia percaya Dr '
 'Mahathir akan memainkan peranan penting dalam peralihan kerajaan.']


In [7]:
isi_penting = ['Neelofa tetap dengan keputusan untuk berkahwin akhir tahun ini',
              'Long Tiger sanggup membantu Neelofa',
              'Tiba-tiba Long Tiger bergaduh dengan Husein']

We also can give any isi penting even does not make any sense.

In [8]:
pprint(model.generate(isi_penting, do_sample=True, mode = 'artikel',
    max_length=256,
    top_k=50, 
    top_p=0.95, ))

['Long Tiger digaduh di gelanggang besbol berhampiran rumahnya di bandar '
 '(Kerdrina, Iran). "Kami berharap untuk menikah pada akhir tahun ini. Itu '
 'adalah hari perkahwinan yang sangat istimewa. "Kami mempunyai rancangan '
 'untuk tinggal dengan kami dalam keadaan yang sangat baik dan indah. Kami '
 'ingin memastikan Neelofa tetap bahagia dan bahagia. Saya gembira untuk '
 'menikah lagi.']


In [16]:
isi_penting = ['Astronomi (dari) adalah sains semula jadi yang mengkaji objek dan fenomena cakerawala.',
 'Ia menggunakan matematik, fizik, dan kimia untuk menjelaskan asal usul dan evolusi mereka.',
 'Objek yang menarik termasuk planet, bulan, bintang, nebula, galaksi, dan komet.',
 'Fenomena yang relevan termasuk letupan supernova, ledakan sinar gamma, kusar, blazar, pulsar, dan radiasi latar belakang gelombang mikro kosmik.',
 'Secara umum, astronomi mengkaji semua yang berasal dari luar atmosfer Bumi.',
 'Kosmologi adalah cabang astronomi.',
 'Ia mengkaji Alam Semesta secara keseluruhan.']

In [20]:
pprint(model.generate(isi_penting, do_sample=True, mode = 'artikel',
    max_length=256,
    top_k=50, 
    top_p=0.95, ))

['Dia menggambarkan fenomena kolimat oleh ahli astronomi pada tahun 1845-an '
 'dan kemudian, pada usia 87.5 tahun. Pemerhatian fenomena kolimat ini '
 'termasuk letupan supernova dari planet di planet, yang dipancarkan oleh '
 'gerakan eksentrik oleh planet kecil dan planet kecil, yang menyebabkan '
 'pengembangan supernova dan kolimat pada usia 87 tahun. Semasa abad ke-20, '
 'kebanyakan pemerhatian astronomi dapat diperoleh menggunakan astronomi, '
 'seperti e. Di planet kecil, terdapat fenomena kolimat dalam jumlah yang '
 'lebih tinggi daripada tempoh itu. Dalam astronomi moden, teknonomi adalah '
 'cabang astronomi dan astronomi yang lebih tinggi. Dalam astronomi, istilah '
 '"astronomi" pertama kali diadopsi oleh saintis Amerika. Kajian astronomi '
 'yang diterima secara antarabangsa ini merangkumi semua jenis organisma yang '
 'mempunyai klasifikasi yang berbeza. Ahli astronomi pertama yang menggunakan '
 'pemerhatian dari planet yang sama dan paling awal adalah, "Planca", dala