In [8]:
import csv

def kiem_tra_do_dai_csv(duong_dan_file_csv):
    """
    Đọc file CSV và kiểm tra độ dài chuỗi trong cột "input:" và "output:".

    Args:
        duong_dan_file_csv (str): Đường dẫn đến file CSV.

    Returns:
        list: Một danh sách các thông báo lỗi.  Mỗi thông báo lỗi là một tuple
              (so_dong, cot, do_dai_thuc_te, chuoi_ngan).  Trả về danh sách rỗng nếu không có lỗi.
    """

    cac_loi = []

    try:
        with open(duong_dan_file_csv, 'r', encoding='utf-8') as file_csv:
            doc_csv = csv.DictReader(file_csv)
            for so_dong, dong in enumerate(doc_csv, start=2):  # Bắt đầu từ dòng 2 (bỏ qua header)
                try:
                    input_text = dong.get('input:')
                    output_text = dong.get('output:')

                    if input_text is not None and len(input_text) > 40000:
                        chuoi_ngan = input_text[:50]
                        cac_loi.append((so_dong, 'input:', len(input_text), chuoi_ngan))
                    
                    if output_text is not None and len(output_text) > 5000:
                        chuoi_ngan = output_text[:50]
                        cac_loi.append((so_dong, 'output:', len(output_text), chuoi_ngan))
                
                except Exception as e:
                    print(f"Lỗi khi xử lý dòng {so_dong}: {e}")
                    cac_loi.append((so_dong, 'Lỗi xử lý dòng', str(e), ""))  # Thêm thông tin lỗi vào danh sách

    except FileNotFoundError:
        print(f"Lỗi: Không tìm thấy file CSV tại '{duong_dan_file_csv}'.")
        return [("File", "Không tìm thấy file", duong_dan_file_csv, "")] #Trả về một list với thông báo lỗi

    except Exception as e:
        print(f"Lỗi không xác định khi đọc file CSV: {e}")
        return [("File", "Lỗi đọc file", str(e), "")]

    return cac_loi


# Ví dụ sử dụng
duong_dan_file = './extract_infor.csv'  # Thay đổi đường dẫn file của bạn ở đây
cac_loi = kiem_tra_do_dai_csv(duong_dan_file)

if cac_loi:
    print("Các dòng vượt quá độ dài cho phép:")
    for so_dong, cot, do_dai, chuoi_ngan in cac_loi:
        print(f"  - Dòng {so_dong}, cột '{cot}': Độ dài {do_dai}, 50 ký tự đầu: '{chuoi_ngan}'")
else:
    print("Không có dòng nào vượt quá độ dài cho phép.")

Các dòng vượt quá độ dài cho phép:
  - Dòng 7, cột 'output:': Độ dài 5120, 50 ký tự đầu: '{
  "Conference dates": "March 31 - April 2, 2025"'


In [15]:
import csv
import json

def kiem_tra_csv_va_json(duong_dan_file_csv, context_size=50):
    """
    Đọc file CSV, kiểm tra xem cột "output:" có phải là JSON hợp lệ hay không,
    và log dòng lỗi ra cùng với context xung quanh vị trí lỗi.

    Args:
        duong_dan_file_csv (str): Đường dẫn đến file CSV.
        context_size (int): Số lượng ký tự trước và sau vị trí lỗi để hiển thị.

    Returns:
        list: Một danh sách các thông báo lỗi. Mỗi thông báo lỗi là một tuple
              (so_dong, cot, thong_tin_loi). Trả về danh sách rỗng nếu không có lỗi.
    """

    cac_loi = []

    try:
        with open(duong_dan_file_csv, 'r', encoding='utf-8') as file_csv:
            doc_csv = csv.DictReader(file_csv)
            for so_dong, dong in enumerate(doc_csv, start=2):  # Bắt đầu từ dòng 2 (bỏ qua header)
                try:
                    input_text = dong.get('input:')
                    output_text = dong.get('output:')

                    # Kiểm tra JSON
                    if output_text is not None:
                        try:
                            json.loads(output_text)
                        except json.JSONDecodeError as e:
                            # Log dòng lỗi ra và context
                            position = e.pos
                            start = max(0, position - context_size)
                            end = min(len(output_text), position + context_size)
                            context = output_text[start:end]

                            print(f"Lỗi JSON ở dòng {so_dong}: {e}")
                            print(f"Vị trí lỗi: {position}")
                            print(f"Context: ...{context}...")
                            cac_loi.append((so_dong, 'output:', f"Lỗi JSON: {e}"))


                except Exception as e:
                    print(f"Lỗi khi xử lý dòng {so_dong}: {e}")
                    cac_loi.append((so_dong, 'Lỗi xử lý dòng', str(e)))  # Thêm thông tin lỗi vào danh sách

    except FileNotFoundError:
        print(f"Lỗi: Không tìm thấy file CSV tại '{duong_dan_file_csv}'.")
        return [("File", "Không tìm thấy file", duong_dan_file_csv)]  # Trả về một list với thông báo lỗi

    except Exception as e:
        print(f"Lỗi không xác định khi đọc file CSV: {e}")
        return [("File", "Lỗi đọc file", str(e))]

    return cac_loi


# Ví dụ sử dụng
duong_dan_file = './fine_tune_extract_infor.csv'  # Thay đổi đường dẫn file của bạn ở đây
cac_loi = kiem_tra_csv_va_json(duong_dan_file)

if cac_loi:
    print("Các lỗi được tìm thấy:")
    for so_dong, cot, thong_tin_loi in cac_loi:
        print(f"  - Dòng {so_dong}, cột '{cot}': {thong_tin_loi}")
else:
    print("Không có lỗi nào được tìm thấy.")

Không có lỗi nào được tìm thấy.


In [5]:
import requests

API_KEY = "AIzaSyDK5eYs2PBVYP3l9UH0YMIFshxBMq6EsE8"  # API Key từ Google Cloud
CX = "45ff1f0418c594bde"  # Search Engine ID từ Google Custom Search Engine
query = "Conference of the Association of Asian-Pacific Operational Research Societies (APORS) conference 2025 OR 2026 OR 2024"
# or_terms = "2024 OR 2025"

url = f"https://www.googleapis.com/customsearch/v1?q={query}&key={API_KEY}&cx={CX}"

response = requests.get(url)
data = response.json()
# print(data)

# In kết quả tìm kiếm
for item in data.get("items", []):
    print(f"Title: {item['title']}")
    print(f"Link: {item['link']}")
    print(f"Snippet: {item['snippet']}\n")



Title: APORS – Asia-Pacific Operational Research Society
Link: http://apors.org/
Snippet: APORS 2024 in China · The First APORS Youth Forum · 13th Triennial International Conference of the Association of Asia Pacific Operational Research Societies ( ...

Title: Academy of Mathematics and Systems Science
Link: http://english.amss.cas.cn/
Snippet: The 14th Triennial Conference of the Association of Asia-Pacific Operations Research Societies ... Operational Research Societies (IFORS) for the 2025–2027 ...

Title: Zhi Chen (陈植) - Curriculum Vitae
Link: https://sites.google.com/view/z-chen/cv
Snippet: The 14th Triennial Conference of the Association of Asia Pacific Operational Research Societies (APORS 2024), Hangzhou, China. 11/24. Jianxing College ...

Title: CORE Computer Science Conference Rankings
Link: https://www.iiti.ac.in/people/~artiwari/cseconflist.html
Snippet: Asia Pacific Association for Medical Informatics Conference, B. APBC, Asia ... Asia-Pacific Network Operations and Mana

In [None]:
import requests
import json

API_KEY = "AIzaSyDK5eYs2PBVYP3l9UH0YMIFshxBMq6EsE8"  # Thay thế bằng API Key của bạn từ Google Cloud
CX = "45ff1f0418c594bde"  # Thay thế bằng Search Engine ID của bạn từ Google Custom Search Engine
ISSN = "1471-0080"
# query = f'"{ISSN}"'  # Tìm kiếm chính xác ISSN.  Dấu ngoặc kép để tìm chính xác.
query = ISSN # Tìm chính xác ISSN

# Thêm các tham số cho tìm kiếm hình ảnh
url = f"https://www.googleapis.com/customsearch/v1?q={query}&key={API_KEY}&cx={CX}&searchType=image"

try:
    response = requests.get(url)
    response.raise_for_status()  # Raises HTTPError for bad requests (4xx or 5xx)
    data = response.json()

    # In kết quả tìm kiếm hình ảnh
    if "items" in data:
        for item in data["items"]:
            print(f"Title: {item.get('title', 'No title')}")  # Xử lý trường hợp không có tiêu đề
            print(f"Image Link: {item.get('link', 'No link')}") # Lấy link ảnh
            print(f"Context Link: {item.get('image', {}).get('contextLink', 'No context link')}") # link trang chứa ảnh (nếu cần)
            print(f"Snippet: {item.get('snippet', 'No snippet')}\n")
    else:
        print("No image results found.")


except requests.exceptions.RequestException as e:
    print(f"An error occurred: {e}")
    if response:
        print(f"Status code: {response.status_code}")
        try:
            print(f"Response content: {response.json()}")  # In nội dung JSON nếu có
        except json.JSONDecodeError:
            print(f"Response content (not JSON): {response.text}")
except Exception as e:
      print(f"An unexpected error: {e}")