# Isi Penting Generator HuggingFace karangan style

Generate a long text with karangan style given isi penting (important facts).

<div class="alert alert-info">

This tutorial is available as an IPython notebook at [Malaya/example/isi-penting-generator-huggingface-karangan-style](https://github.com/huseinzol05/Malaya/tree/master/example/isi-penting-generator-huggingface-karangan-style).
    
</div>

<div class="alert alert-warning">

Results generated using stochastic methods.
    
</div>

In [1]:
%%time
import malaya
from pprint import pprint

CPU times: user 3.12 s, sys: 3.47 s, total: 6.59 s
Wall time: 2.34 s


### List available HuggingFace

In [2]:
malaya.generator.isi_penting.available_huggingface()

Unnamed: 0,Size (MB),ROUGE-1,ROUGE-2,ROUGE-L,Suggested length
mesolitica/finetune-isi-penting-generator-t5-small-standard-bahasa-cased,242.0,0.246203,0.058961,0.15159,1024.0
mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased,892.0,0.246203,0.058961,0.15159,1024.0


### Load HuggingFace

Transformer Generator in Malaya is quite unique, most of the text generative model we found on the internet like GPT2 or Markov, simply just continue prefix input from user, but not for Transformer Generator. We want to generate an article or karangan like high school when the users give 'isi penting'.

```python
def huggingface(model: str = 'mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased', **kwargs):
    """
    Load HuggingFace model to generate text based on isi penting.

    Parameters
    ----------
    model: str, optional (default='mesolitica/finetune-isi-penting-generator-t5-base-standard-bahasa-cased')
        Check available models at `malaya.generator.isi_penting.available_huggingface()`.

    Returns
    -------
    result: malaya.torch_model.huggingface.IsiPentingGenerator
    """
```

In [3]:
model = malaya.generator.isi_penting.huggingface()

#### generate

```python
def generate(
    self,
    strings: List[str],
    mode: str = 'surat-khabar',
    **kwargs,
):
    """
    generate a long text given a isi penting.

    Parameters
    ----------
    strings : List[str]
    mode: str, optional (default='surat-khabar')
        Mode supported. Allowed values:

        * ``'surat-khabar'`` - news style writing.
        * ``'tajuk-surat-khabar'`` - headline news style writing.
        * ``'artikel'`` - article style writing.
        * ``'penerangan-produk'`` - product description style writing.
        * ``'karangan'`` - karangan sekolah style writing.

    **kwargs: vector arguments pass to huggingface `generate` method.
        Read more at https://huggingface.co/docs/transformers/main_classes/text_generation

    Returns
    -------
    result: List[str]
    """
```

### Good thing about HuggingFace

In `generate` method, you can do greedy, beam, sampling, nucleus decoder and so much more, read it at https://huggingface.co/blog/how-to-generate

And recently, huggingface released https://huggingface.co/blog/introducing-csearch

In [5]:
isi_penting = ['ayam yang sihat dan sejahtera', 'nasi ayam yang sedap dan lazat', 'kedai bernama Husein Nasi Ayam']

In [7]:
pprint(model.generate(isi_penting, mode = 'karangan',
    do_sample=True, 
    max_length=256, 
    top_k=50, 
    top_p=0.95,))

['Husein Nasi Ayam merupakan nasi yang sejahtera dan sedap saban tahun. Nasi '
 'ayam merupakan nasi yang sangat istimewa dan sinonim dengan keluarga. Nasi '
 'ayam merupakan hidangan istimewa yang akan dinikmati seisi keluarga. Ia '
 'merupakan sumber tenaga yang besar untuk memulakan kehidupan dan dapat '
 'mengeratkan lagi hubungan kekeluargaan. Jadi, nescaya, ayam mempunyai '
 'potensi yang besar untuk dituai dan disembelih. Hal ini demikian kerana, '
 'santan menjadi bumbu, air serta arang yang menjadi nukleus padu dalam hati '
 'para ibu. Tegasnya, banyak kebaikan yang diperolehi daripada makanan ayam '
 'yang lazat ini, bak kata pepatah, berat sama dipikul, ringan sama dijinjing. '
 'Oleh itu, wajar untuk kita mengenal pasti cara yang betul agar setiap '
 'golongan masyarakat mempunyai akhlak yang baik dalam kehidupan masing-masing '
 'agar menjadi contoh terbaik dan celik dalam tutur kata. Langkah pertama yang '
 'boleh dilakukan adalah dengan memperkenalkan nasi ayam yang memp

In [8]:
# http://mieadham86.blogspot.com/2016/09/isi-isi-penting-karangan-bahasa-melayu.html
# CARA MENJADI MURID CEMERLANG

isi_penting = ['Rajin berusaha – tidak mudah putus asa',
               'Menghormati orang yang lebih tua – mendapat keberkatan',
               'Melibatkan diri secara aktif dalam bidang kokurikulum',
               'Memberi tumpuan ketika guru mengajar.',
               'Berdisiplin – menepati jadual yang disediakan.',
               'Bercita-cita tinggi – mempunyai keazaman yang tinggi untuk berjaya']

In [9]:
pprint(model.generate(isi_penting, do_sample=True, mode = 'karangan',
    max_length=256,
    top_k=50, 
    top_p=0.95, ))

['Pada zaman yang penuh dengan kemajuan sejagat dan kemajuan sejagat, terdapat '
 'segelintir yang tidak bertanggungjawab menidakkan kemajuan minda masyarakat. '
 'Masyarakat yang semakin hari semakin luntur dek perkembangan dan kemajuan '
 'dek kerana kecanggihan teknologi, masalah sosial yang tidak terkawal dan '
 'peningkatan kos sara hidup. Isu-isu ini telah dibincangkan secara '
 'besar-besaran dan dibincang dalam media massa serta bertegas dan tiada '
 'kompromi dalam soal ini. Tidak dinafikan masyarakat di seluruh dunia terus '
 'ingkar terhadap pembangunan dan kemajuan negara malah golongan yang tidak '
 'bertanggungjawab menggunakan teknologi untuk kepentingan diri. Sebagai '
 'contoh, golongan remaja merupakan golongan yang paling terdedah kepada '
 'perkembangan teknologi dan ia menjadi satu ancaman kepada kesihatan. Hal ini '
 'disebabkan kemajuan teknologi dapat membawa limpahan pendapatan yang '
 'signifikan kepada mereka. Maka, adalah tidak adil untuk kita lihat '
 'baga