In [2]:
!pip install seqeval

Collecting seqeval
  Using cached seqeval-1.2.2-py3-none-any.whl
Installing collected packages: seqeval
Successfully installed seqeval-1.2.2


In [37]:
import requests

class GeminiModel:
    def __init__(self, model_name, api_key):
        """
        Initializes the GeminiModel class with the provided model name and API key.
        """
        self.model_name = model_name
        self.api_key = api_key

    def inference(self, prompt):
        """
        Performs inference using the Gemini model with the provided prompt.
        Returns the generated text response.
        """
        # print(self.model_name, self.api_key)
        
        headers = {
            "Content-Type": "application/json",
        }

        data = {"contents": [{"parts": [{"text": prompt}]}]}

        response = requests.post(
            f"https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key={self.api_key}",
            headers=headers,
            json=data,
        )

        resp = response.json()
        # print(resp)

        # Extract and return the generated content
        return resp["candidates"][0]["content"]["parts"][0]["text"]

In [38]:
# Initialize the model
gemini = GeminiModel(model_name="gemini-1.5-flash", api_key="AIzaSyAOVySmLVyqnMgw7PXkiADdButH1Hzgijs")

# Perform inference
response = gemini.inference(prompt="Hello, how are you?")
print(response)

I am well, thank you for asking. How are you doing today?


In [7]:
!gdown --fuzzy "https://drive.google.com/file/d/1ljktFM5mdSQoX0vCNgKqNf6uXzUbU_xe/view?usp=drive_link"

'gdown' is not recognized as an internal or external command,
operable program or batch file.


In [3]:
import argparse
import torch
from transformers import AutoTokenizer, AutoModelForTokenClassification
from datasets import load_dataset
from seqeval.metrics import classification_report
from tqdm import tqdm

In [100]:
dataset = load_dataset("lst-nectec/lst20", split="test", data_dir="D:\Google Drive Mirroring\SuperAI\MT@LST-NECTEC\lst20\LST20_Corpus")

In [12]:
dataset.features[f"ner_tags"].feature

ClassLabel(names=['O', 'B_BRN', 'B_DES', 'B_DTM', 'B_LOC', 'B_MEA', 'B_NUM', 'B_ORG', 'B_PER', 'B_TRM', 'B_TTL', 'I_BRN', 'I_DES', 'I_DTM', 'I_LOC', 'I_MEA', 'I_NUM', 'I_ORG', 'I_PER', 'I_TRM', 'I_TTL', 'E_BRN', 'E_DES', 'E_DTM', 'E_LOC', 'E_MEA', 'E_NUM', 'E_ORG', 'E_PER', 'E_TRM', 'E_TTL'], id=None)

In [59]:
prompt = """\
You are an NER (Named Entity Recognition) token classification assistant. Your task is to classify each token in the provided text using the following NER tags:

['O', 'B_BRN', 'B_DES', 'B_DTM', 'B_LOC', 'B_MEA', 'B_NUM', 'B_ORG', 'B_PER', 'B_TRM', 'B_TTL', 
 'I_BRN', 'I_DES', 'I_DTM', 'I_LOC', 'I_MEA', 'I_NUM', 'I_ORG', 'I_PER', 'I_TRM', 'I_TTL', 
 'E_BRN', 'E_DES', 'E_DTM', 'E_LOC', 'E_MEA', 'E_NUM', 'E_ORG', 'E_PER', 'E_TRM', 'E_TTL']

### NER Tag Definitions:
- **B_XXX**: Beginning of an entity (e.g., B_PER for a person’s name).
- **I_XXX**: Inside an entity.
- **E_XXX**: End of an entity.
- **O**: Other (not part of any entity).

### Entity Type Glossary:
- **O**: Not an entity
- **BRN**: Brand
- **DES**: Description
- **DTM**: Date/Time
- **LOC**: Location
- **MEA**: Measurement
- **NUM**: Number
- **ORG**: Organization
- **PER**: Person
- **TRM**: Term
- **TTL**: Title

### Classification Instructions:
1. **Analyze Context**: Use the surrounding sentence context to accurately classify tokens.
2. **Multi-Token Entities**: For entities spanning multiple tokens:
   - Start with **B_XXX** for the first token,
   - Use **I_XXX** for subsequent tokens,
   - Use **E_XXX** for the final token (if applicable).
3. **Non-Entity Tokens**: Label tokens as **O** if they are not part of any entity.
4. **Consistency**: Ensure classifications are consistent with nearby tokens.
5. **Space Handling**: The character `_` represents a space and should be treated as part of a token, especially for multi-word names.
6. **Equal Length**: The input and output should contain the same number of elements.

---

### Input Format:
`[token1, token2, token3, ..., tokenN]`

### Output Format:
`[(token1, label1), (token2, label2), ..., (tokenN, labelN)]`

---

### Example Input Tokens:
['ซึ่ง', 'นาย', 'อภิชาต', '_', 'สุขัคคานนท์', 'ประธาน', 'กกต.', ...]

### Expected Output:
[('ซึ่ง', 'O'), ('นาย', 'B_TTL'), ('อภิชาต', 'B_PER'), ('_', 'I_PER'), ('สุขัคคานนท์', 'E_PER'), ('ประธาน', 'O'), ('กกต.', 'B_ORG'), ...]

### Explanation:
- **อภิชาต สุขัคคานนท์** is a person, tagged as `B_PER`, `I_PER`, and `E_PER`.
- **กกต.** is an organization, tagged as `B_ORG`.
- Non-entity tokens like **ได้** are labeled as `O`.
- The character `_` represents a space in multi-word entities.

---

### Classify the following tokens:
{}

Answer:
"""

In [104]:
import ast

results = []

ds = dataset.select(range(100))

for item in tqdm(ds, total=len(ds)):
    labels = [dataset.features["ner_tags"].feature.int2str(idx) for idx in item["ner_tags"]]
    try:
        response = gemini.inference(prompt=prompt.format(item["tokens"]))
        results.append({
            "tokens": item["tokens"],
            "label": labels,
            "pred": ast.literal_eval(response)
        })
    except KeyError:
        pass

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [11:17<00:00,  6.77s/it]


In [105]:
results

[{'tokens': ['จีน',
   '-',
   'อินเดีย',
   'เสี่ยง',
   'สูญเสีย',
   'จาก',
   'ภัย',
   'ธรรมชาติ',
   'มาก',
   'สุด'],
  'label': ['B_LOC', 'O', 'B_LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O'],
  'pred': [('จีน', 'B_LOC'),
   ('-', 'O'),
   ('อินเดีย', 'B_LOC'),
   ('เสี่ยง', 'O'),
   ('สูญเสีย', 'O'),
   ('จาก', 'O'),
   ('ภัย', 'B_DES'),
   ('ธรรมชาติ', 'E_DES'),
   ('มาก', 'O'),
   ('สุด', 'O')]},
 {'tokens': ['เจนีวา',
   '_',
   '-',
   '_',
   'จีน',
   '_',
   'อินเดีย',
   '_',
   'และ',
   'ประเทศ',
   'ที่',
   'มี',
   'ประชากร',
   'จำนวน',
   'มาก',
   '_',
   'ติด',
   'อยู่',
   'ใน',
   'กลุ่ม',
   'ย่ำแย่',
   'สุด',
   '_',
   'ของ',
   'การ',
   'จัด',
   'ค่า',
   'เฉลี่ย',
   'ความ',
   'เสี่ยง',
   'จาก',
   'ภัย',
   'ธรรมชาติ'],
  'label': ['B_LOC',
   'O',
   'O',
   'O',
   'B_LOC',
   'O',
   'B_LOC',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O',
   'O'

In [106]:
from seqeval.metrics import classification_report

labels = []
preds = []

for ele in results: 
    l = [item.replace("_", "-") for item in ele["label"]]
    p = [item[1].replace("_", "-") for item in ele["pred"]]
    if len(p) != len(l):
        n = min(len(p), len(l))
        p = p[:n]
        l = l[:n]
    labels.append(l)
    preds.append(p)
report = classification_report(labels, preds)
# print(report)

In [107]:
print(report)

              precision    recall  f1-score   support

         BRN       0.00      0.00      0.00         0
         DES       0.00      0.00      0.00        26
         DTM       0.11      0.15      0.12        26
         LOC       0.24      0.39      0.30       105
         MEA       0.06      0.02      0.03        58
         NUM       0.10      0.33      0.15        18
         ORG       0.23      0.21      0.22        85
         PER       0.23      0.36      0.28        56
         TRM       0.00      0.00      0.00         1
         TTL       0.36      0.51      0.42        41

   micro avg       0.19      0.27      0.22       416
   macro avg       0.13      0.20      0.15       416
weighted avg       0.20      0.27      0.22       416



In [114]:
dataset = load_dataset("nakhun/thaisum", split="test")

Using the latest cached version of the module from C:\Users\isada\.cache\huggingface\modules\datasets_modules\datasets\nakhun--thaisum\347b33c852af4d796e1224e00e15142d626608a9fa3e07ad6d19dfd8fcae5423 (last modified on Sat Aug 31 23:11:18 2024) since it couldn't be found locally at nakhun/thaisum, or remotely on the Hugging Face Hub.


In [124]:
prompt_ts = """\
"Summarize the key points from the following news article, focusing on the most important events and opinions expressed. Aim for a clear, concise summary that captures the core message of the article. Exclude any irrelevant details."

---

Example Input:
Title: ฟลอเรส รับ วัตฟอร์ดห่วยเองเกมพ่ายพาเลซคาบ้าน
Body: กีเก ซานเชซ ฟลอเรส\xa0 กุนซือเลือดกระทิงของทีมวัตฟอร์ด\xa0 เมินประเด็นจุดโทษปัญหาในเกมพรีเมียร์ลีก อังกฤษ นัดที่แตนอาละวาดเปิดบ้านพ่าย คริสตัล พาเลซ 0-1ชี้ทีมของเขาเล่นไม่ดีพอเอง,สำนักข่าวต่างประเทศรายงานวันที่ 27 ก.ย. ว่า กีเก ซานเชซ ฟลอเรส\xa0 ผู้จัดการทีมชาวสเปน ของ แตนอาละวาด วัตฟอร์ด\xa0 ยอมรับทีมของเขาเล่นได้ไม่ดีพอเอง ในเกมพรีเมียร์ลีก อังกฤษ นัดเปิดบ้านพ่าย อินทรีผงาด คริสตัล พาเลซ 0-1 เมื่อคืนวันอาทิตย์ที่ผ่านมา,เกมนี้จุดเปลี่ยนมาอยู่ที่การได้จุดโทษในช่วงครึ่งหลังของ คริสตัล พาเลซ ซึ่งไม่ค่อยชัดเจนเท่าไหร่ว่า อัลลัน นียอม นั้นไปทำฟาล์วใส่ วิลฟรีด ซาฮา ในเขตโทษหรือไม่ แต่ผู้ตัดสินก็ชี้เป็นจุดโทษ ซึ่ง โยอัน กาบาย สังหารไม่พลาด และเป็นประตูชัยช่วยให้ คริสตัล พาเลซ เอาชนะ วัตฟอร์ด ไป 1-0 และเป็นการพ่ายแพ้ในบ้านนัดแรกของวัตฟอร์ดในฤดูกาลนี้อีกด้วย,ฟลอเรส กล่าวว่า มันเป็นเรื่องยากในการหยุดเกมรุกของคริสตัล พาเลซ ซึ่งมันอึดอัดจริงๆสำหรับเรา เราเล่นกันได้ไม่ดีนักในตอนที่ได้ครองบอล เราต้องเล่นทางริมเส้นให้มากกว่านี้ เราไม่สามารถหยุดเกมสวนกลับของพวกเขาได้ และแนวรับของเราก็ยืนไม่เป็นระเบียบสักเท่าไหร่ในช่วงครึ่งแรก ส่วนเรื่องจุดโทษการตัดสินใจขั้นสุดท้ายมันอยู่ที่ผู้ตัดสิน ซึ่งมันเป็นการตัดสินใจที่สำคัญ ผมเองก็ไม่รู้ว่าเขาตัดสินถูกหรือเปล่า บางทีมันอาจเป็นจุดที่ตัดสินเกมนี้เลย แต่เราไม่ได้แพ้เกมนี้เพราะจุดโทษ เราแพ้ในวันนี้เพราะเราเล่นไม่ดีและคริสตัล พาเลซ เล่นดีกว่าเรา เราไม่ได้มีฟอร์มการเล่นที่ดีในเกมนี้เลย

Expected Output:
Summary: กีเก ซานเชซ ฟลอเรส  กุนซือเลือดกระทิงของทีมวัตฟอร์ด  เมินประเด็นจุดโทษปัญหาในเกมพรีเมียร์ลีก อังกฤษ นัดที่แตนอาละวาดเปิดบ้านพ่าย คริสตัล พาเลซ 0-1ชี้ทีมของเขาเล่นไม่ดีพอเอง

---

Title: {}
Body: {}
Summary:
"""

In [127]:
import ast

results = []

ds = dataset.select(range(20))

for item in tqdm(ds, total=len(ds)):
    try:
        response = gemini.inference(prompt=prompt_ts.format(item["title"], item["body"]))
        results.append({
            "title": item["title"],
            "body": item["body"],
            "gold": item["summary"],
            "generation": response,
            "tags" : item["tags"],
            "url" : item["url"],
        })
    except KeyError:
        pass

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [02:05<00:00,  6.25s/it]


In [130]:
results[16]

{'title': 'ศรีลังกาสลด น้ำท่วม-ดินโคลนถล่มหลังฝนตกหนัก ตายแล้วเกือบครึ่งร้อย',
 'body': 'เกิดเหตุดินโคลนถล่มลงมาจากภูเขา หลังฝนตกหนักติดต่อนาน 3 วันในศรีลังกา ถมทับบ้านกว่า 200 หลังใน 3 หมู่บ้าน พบเหยื่อเคราะห์ร้ายแล้ว 13 ราย ทีมกู้ภัยกำลังเร่งค้นหาชาวบ้านที่ยังติดอยู่ใต้ดินโคลนอีกจำนวนมาก ขณะที่มีคนเสียชีวิตจากน้ำท่วม อีก 32 ราย,เมื่อวันที่ 18 พ.ค.59 สำนักข่าวบีบีซี รายงานเกิดเหตุดินโคลนถล่มลงมาจากภูเขาเนื่องจากมีฝนตกหนักติดต่อหลายวัน ในศรีลังกา ถมทับบ้านเรือนประชาชนกว่า 200 หลังใน 3 หมู่บ้าน ของอำเภอคีกัลลี ทางภาคกลางของประเทศ โดยเจ้าหน้าที่กู้ภัยกำลังเร่งค้นหาเหยื่อเคราะห์ร้ายจำนวนหนึ่งที่ติดอยู่ใต้ดินโคลน ขณะที่พบศพผู้เสียชีวิตแล้วอย่างน้อย 13 ราย,เจ้าหน้าที่ศรีลังกา เปิดเผยว่า ทีมกู้ภัยสามารถช่วยเหลือประชาชนที่ประสบเหตุดินโคลนถล่มลงมาจากภูเขาถมทับบ้านเรือนใน 3 หมู่บ้าน ได้แก่ หมู่บ้านศิริปุระ, ปัลลีบากี และอีลากิปิตยา ออกมาได้แล้วประมาณ 150 คน แต่ยังคงมีบ้านอีกกว่า 60 หลังที่ถูกดินโคลนทับถมสูง ส่วนสถานการณ์น้ำท่วมในศรีลังกา หลังจากเกิดฝนตกหนักต่อเนื่องติดต่อนานถึง 3 วัน ทำให้มีผู้

In [133]:
predictions = [r["generation"] for r in results]
references = [r["gold"] for r in results]

In [134]:
references

['มีชัย ไม่ยี่หระเสียงค้านชงสูตรพิสดารเลือกตั้ง ส.ส. ประกาศ ผลช้าไปชั่วโมงสองชั่วโมงไม่เห็นเป็นไร แสลงหูชื่อ สมชัย ชิ่งหนีดื้อๆ พรเพชร ให้นายกฯ ตัดสินใจปลดล็อกพรรคการเมือง',
 'กีเก ซานเชซ ฟลอเรส  กุนซือเลือดกระทิงของทีมวัตฟอร์ด  เมินประเด็นจุดโทษปัญหาในเกมพรีเมียร์ลีก อังกฤษ นัดที่แตนอาละวาดเปิดบ้านพ่าย คริสตัล พาเลซ 0-1ชี้ทีมของเขาเล่นไม่ดีพอเอง',
 'เนปาลระทึก หลังเกิดพายุฝนฟ้าคะนองถล่มทางใต้ สร้างความเสียหายหลายหมู่บ้าน เบื้องต้นพบผู้เสียชีวิตแล้ว 30 ศพ บาดเจ็บ 400 ราย ระบบสาธารณูปโภคพังพินาศ',
 'เป็นศูนย์รวมของความคิดสร้างสรรค์และคอมมูนิตี้คนรุ่นใหม่ ล่าสุด อุสรา ยงปิยะกุล คว้าศิลปินไทยรุ่นใหม่จากนิวยอร์ก กันตภณ เมธีกุล มาร่วมคอลลาโบเรชั่น สินค้าลิมิเต็ด อิดิชั่น  ODS X GONGKAN',
 'สหประชาชาติประเมินว่า สังคมเมียนมากำลังก้าวเข้าสู่สังคมผู้สูงอายุ ประชากรเมียนมากว่า 9% มีอายุมากกว่า 65 ปีขึ้นไป เเละจะเพิ่มสูงขึ้นเป็น 25% ภายในปี 2050บ้านตะวันลับ Twilight Villa ถูกจัดตั้งขึ้นในปี 2010 เพื่อแก้ไขปัญหาผู้สูงอายุที่ถูกทอดทิ้งเพิ่มมากขึ้นในสังคมเมียนมา ปัจจุบันมีผู้พักอาศัยอยู่ในบ้านหลังน

In [138]:
import evaluate

# Load ROUGE and BLEU metrics
rouge = evaluate.load("rouge")
bleu = evaluate.load("bleu")

In [142]:
rouge_result

{'rouge1': np.float64(0.36777777777777776),
 'rouge2': np.float64(0.2369047619047619),
 'rougeL': np.float64(0.36333333333333334),
 'rougeLsum': np.float64(0.3733333333333333)}

In [144]:
!pip install attacut

Collecting attacut
  Using cached attacut-1.0.6-py3-none-any.whl.metadata (4.0 kB)
Collecting docopt>=0.6.2 (from attacut)
  Using cached docopt-0.6.2-py2.py3-none-any.whl
Collecting fire>=0.1.3 (from attacut)
  Using cached fire-0.6.0-py2.py3-none-any.whl
Collecting nptyping>=0.2.0 (from attacut)
  Using cached nptyping-2.5.0-py3-none-any.whl.metadata (7.6 kB)
Collecting ssg>=0.0.4 (from attacut)
  Using cached ssg-0.0.8-py3-none-any.whl.metadata (762 bytes)
Collecting termcolor (from fire>=0.1.3->attacut)
  Using cached termcolor-2.4.0-py3-none-any.whl.metadata (6.1 kB)
Collecting numpy>=1.17.0 (from attacut)
  Using cached numpy-1.26.4-cp311-cp311-win_amd64.whl.metadata (61 kB)
Collecting python-crfsuite>=0.9.6 (from ssg>=0.0.4->attacut)
  Using cached python_crfsuite-0.9.10-cp311-cp311-win_amd64.whl.metadata (4.3 kB)
Using cached attacut-1.0.6-py3-none-any.whl (1.3 MB)
Using cached nptyping-2.5.0-py3-none-any.whl (37 kB)
Using cached numpy-1.26.4-cp311-cp311-win_amd64.whl (15.8 MB)

In [150]:
# from attacut import tokenize, Tokenizer

In [161]:
preds = [" ".join(tokenize(p)) for p in predictions]
refs = [" ".join(tokenize(r)) for r in references]

# Compute ROUGE scores
rouge_result = rouge.compute(predictions=preds, references=refs, use_aggregator=True)

# Compute BLEU scores
bleu_result = bleu.compute(
    predictions=preds,
    references=refs,
    )

In [162]:
rouge_result

{'rouge1': np.float64(0.36777777777777776),
 'rouge2': np.float64(0.2369047619047619),
 'rougeL': np.float64(0.36333333333333334),
 'rougeLsum': np.float64(0.3733333333333333)}

In [163]:
bleu_result
    

{'bleu': 0.10381817605179183,
 'precisions': [0.22724338282763074,
  0.12034009156311315,
  0.07620941020543406,
  0.05574210879785091],
 'brevity_penalty': 1.0,
 'length_ratio': 1.7003293084522502,
 'translation_length': 1549,
 'reference_length': 911}