# Load Data từ Bronze Layer sang Silver Layer

Notebook này sẽ đọc dữ liệu từ Bronze layer (MinIO) và xử lý để load vào các bảng Iceberg trong Silver layer với Nessie catalog.

## 1. Import Libraries và Khởi tạo Spark Session

In [1]:
from pyspark.sql import SparkSession
from pyspark.sql.functions import *
from pyspark.sql.types import *
from pyspark.sql.window import Window
import csv, io, os, re
from datetime import datetime
from typing import Dict

# Cấu hình AWS/MinIO credentials
os.environ.update({
    'AWS_REGION': 'us-east-1',
    'AWS_ACCESS_KEY_ID': 'admin',
    'AWS_SECRET_ACCESS_KEY': 'admin123'
})

# Khởi tạo Spark Session với Nessie Catalog
spark = (
    SparkSession.builder
    .appName("Load_Bronze_To_Silver")
    .master("spark://spark-master:7077")
    .config("spark.executor.memory", "2g")
    .config("spark.executor.cores", "2")
    # Nessie Catalog
    .config("spark.sql.catalog.nessie", "org.apache.iceberg.spark.SparkCatalog")
    .config("spark.sql.catalog.nessie.catalog-impl", "org.apache.iceberg.nessie.NessieCatalog")
    .config("spark.sql.catalog.nessie.uri", "http://nessie:19120/api/v2")
    .config("spark.sql.catalog.nessie.ref", "main")
    .config("spark.sql.catalog.nessie.warehouse", "s3a://silver/")
    .config("spark.sql.catalog.nessie.io-impl", "org.apache.iceberg.aws.s3.S3FileIO")
    # S3/MinIO Config
    .config("spark.sql.catalog.nessie.s3.endpoint", "http://minio:9000")
    .config("spark.sql.catalog.nessie.s3.access-key-id", "admin")
    .config("spark.sql.catalog.nessie.s3.secret-access-key", "admin123")
    .config("spark.sql.catalog.nessie.s3.path-style-access", "true")
    .config("spark.sql.catalog.nessie.s3.region", "us-east-1")
    # Hadoop S3A Config
    .config("spark.hadoop.fs.s3a.endpoint", "http://minio:9000")
    .config("spark.hadoop.fs.s3a.access.key", "admin")
    .config("spark.hadoop.fs.s3a.secret.key", "admin123")
    .config("spark.hadoop.fs.s3a.path.style.access", "true")
    .config("spark.hadoop.fs.s3a.impl", "org.apache.hadoop.fs.s3a.S3AFileSystem")
    .config("spark.hadoop.fs.s3a.connection.ssl.enabled", "false")
    .config("spark.hadoop.fs.s3a.region", "us-east-1")
    # Executor Environment
    .config("spark.executorEnv.AWS_REGION", "us-east-1")
    .config("spark.executorEnv.AWS_ACCESS_KEY_ID", "admin")
    .config("spark.executorEnv.AWS_SECRET_ACCESS_KEY", "admin123")
    # Local JAR files
    .config("spark.jars", "/opt/spark/jars/hadoop-aws-3.3.4.jar,/opt/spark/jars/aws-java-sdk-bundle-1.12.262.jar")
    .getOrCreate()
)

spark.sparkContext.setLogLevel("ERROR")
spark.sql("CREATE DATABASE IF NOT EXISTS nessie.silver_tables")
spark.sql("USE nessie.silver_tables")
print(f"✅ Spark Session initialized | Master: {spark.sparkContext.master} | App ID: {spark.sparkContext.applicationId}")


25/12/02 14:08:53 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
25/12/02 14:08:53 WARN DependencyUtils: Local jar /opt/spark/jars/aws-java-sdk-bundle-1.12.262.jar does not exist, skipping.
25/12/02 14:08:54 INFO SparkContext: Running Spark version 3.5.5
25/12/02 14:08:54 INFO SparkContext: OS info Linux, 5.15.167.4-microsoft-standard-WSL2, amd64
25/12/02 14:08:54 INFO SparkContext: Java version 17.0.14
25/12/02 14:08:54 INFO ResourceUtils: No custom resources configured for spark.driver.
25/12/02 14:08:54 INFO SparkContext: Submitted application: Load_Bronze_To_Silver
25/12/02 14:08:54 INFO ResourceProfile: Default ResourceProfile created, executor resources: Map(cores -> name: cores, amount: 2, script: , vendor: , memory -> name: memory, amount: 2048, script: , vendor: , offHeap -> name: offHeap, amount: 0, script: , vendor: ), task resources: Map(cpus -> name: cpus, amount: 1.0)
25/12/02 14:08:54 INFO Reso

✅ Spark Session initialized | Master: spark://spark-master:7077 | App ID: app-20251202140855-0000


In [1]:
# from pyspark.sql import SparkSession
# from pyspark.sql.functions import *
# from pyspark.sql.types import *
# from pyspark.sql.window import Window
# from datetime import datetime
# import os
# import hashlib  # Để dùng trong batch processing nếu cần
# import csv
# import io


# # Khởi tạo Spark Session với Iceberg và Nessie catalog
# spark = (
#     SparkSession.builder
#     # .master("spark://spark-master:7077") # để chạy DAG bên Spark Cluster
#     .appName("Load_Bronze_To_Silver")
#     .config("spark.sql.catalog.nessie", "org.apache.iceberg.spark.SparkCatalog")
#     .config("spark.sql.catalog.nessie.catalog-impl", "org.apache.iceberg.nessie.NessieCatalog")
#     .config("spark.sql.catalog.nessie.uri", "http://nessie:19120/api/v2")
#     .config("spark.sql.catalog.nessie.ref", "main")
#     .config("spark.sql.catalog.nessie.warehouse", "s3a://silver/")
#     .config("spark.sql.catalog.nessie.s3.endpoint", "http://minio:9000")
#     .config("spark.sql.catalog.nessie.s3.access-key", "admin")
#     .config("spark.sql.catalog.nessie.s3.secret-key", "admin123")
#     .config("spark.sql.catalog.nessie.s3.path-style-access", "true")
#     .config("spark.hadoop.fs.s3a.endpoint", "http://minio:9000")
#     .config("spark.hadoop.fs.s3a.access.key", "admin")
#     .config("spark.hadoop.fs.s3a.secret.key", "admin123")
#     .config("spark.hadoop.fs.s3a.path.style.access", "true")
#     .config("spark.hadoop.fs.s3a.impl", "org.apache.hadoop.fs.s3a.S3AFileSystem")
#     .getOrCreate()
# )
# spark.sparkContext.setLogLevel("ERROR")
# print("Spark Session đã được khởi tạo với Nessie catalog!")

Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
25/12/02 05:20:08 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable


Spark Session đã được khởi tạo với Nessie catalog!


## 2. Load Bảng SCHOOL

In [2]:
print("=" * 80)
print("LOAD BẢNG SCHOOL")
print("=" * 80)

# Đọc và merge tất cả các năm
years = [2021, 2022, 2023, 2024, 2025]
base_path = "s3a://bronze/structured_data/danh sách các trường Đại Học (2021-2025)/Danh_sách_các_trường_Đại_Học_"
df_school = spark.read.option("header", "true").option("inferSchema", "true").csv([f"{base_path}{year}.csv" for year in years]).select("TenTruong", "MaTruong", "TinhThanh").dropDuplicates()

# Transform
df_school_silver = df_school.select(
    col("MaTruong").cast("string").alias("schoolId"),
    col("TenTruong").cast("string").alias("schoolName"),
    col("TinhThanh").cast("string").alias("province"),
    current_timestamp().alias("created_at"),
    current_timestamp().alias("updated_at")
).filter(col("schoolId").isNotNull() & col("schoolName").isNotNull())

# Ghi vào Silver
df_school_silver.writeTo("nessie.silver_tables.school").using("iceberg").createOrReplace()
print(f"Đã ghi {df_school_silver.count()} dòng vào school")

# Verify
spark.table("nessie.silver_tables.school").show(5, truncate=False)

LOAD BẢNG SCHOOL


                                                                                

Đã ghi 265 dòng vào school
+--------+--------------------------------------+-----------+--------------------------+--------------------------+
|schoolId|schoolName                            |province   |created_at                |updated_at                |
+--------+--------------------------------------+-----------+--------------------------+--------------------------+
|DHF     |Đại học Ngoại Ngữ - Đại học Huế       |Huế        |2025-12-01 15:39:04.602019|2025-12-01 15:39:04.602019|
|DVB     |Đại học Việt Bắc                      |Thái Nguyên|2025-12-01 15:39:04.602019|2025-12-01 15:39:04.602019|
|DCQ     |Đại học Công Nghệ và Quản Lý Hữu Nghị |Hà Nội     |2025-12-01 15:39:04.602019|2025-12-01 15:39:04.602019|
|NTT     |Đại học Nguyễn Tất Thành              |TP HCM     |2025-12-01 15:39:04.602019|2025-12-01 15:39:04.602019|
|KGH     |Trường Sĩ Quan Không Quân - Hệ Đại học|Khánh Hòa  |2025-12-01 15:39:04.602019|2025-12-01 15:39:04.602019|
+--------+-----------------------------------

## 3. Load Bảng MAJOR

In [3]:
from pyspark.sql.functions import col, lower, trim, regexp_replace, current_timestamp

df_major = spark.read.option("header", "true") \
    .option("inferSchema", "false") \
    .option("encoding", "UTF-8") \
    .csv("s3a://bronze/structured_data/danh sách các ngành đại học/Danh_sách_các_ngành.csv")

df_major_clean = df_major.select(
    regexp_replace(trim(col(df_major.columns[0])).cast("string"), r"\.0$", "").alias("majorId"),
    trim(col(df_major.columns[1])).cast("string").alias("majorName")
).filter(
    (col("majorId").isNotNull()) &
    (col("majorName").isNotNull()) &
    (col("majorId") != "") &
    (col("majorName") != "") &
    (lower(col("majorId")) != "nan")
)

# Chuẩn hoá để dedupe theo lowercase
df_major_silver = df_major_clean \
    .withColumn("majorId_lower", lower(col("majorId"))) \
    .dropDuplicates(["majorId_lower"]) \
    .select(
        col("majorId"),
        col("majorName"),
        current_timestamp().alias("created_at"),
        current_timestamp().alias("updated_at")
    )

df_major_silver.writeTo("nessie.silver_tables.major").using("iceberg").createOrReplace()

print(f"Đã ghi {df_major_silver.count()} dòng vào major")
spark.table("nessie.silver_tables.major").show(5, truncate=False)


Đã ghi 3085 dòng vào major
+-------+------------------------------------------------------------+-------------------------+-------------------------+
|majorId|majorName                                                   |created_at               |updated_at               |
+-------+------------------------------------------------------------+-------------------------+-------------------------+
|106    |Khoa học Máy tính                                           |2025-12-01 15:39:08.82324|2025-12-01 15:39:08.82324|
|107    |Kỹ thuật Máy tính                                           |2025-12-01 15:39:08.82324|2025-12-01 15:39:08.82324|
|108    |Điện - Điện tử - Viễn Thông - Tự động hoá - Thiết kế vi mạch|2025-12-01 15:39:08.82324|2025-12-01 15:39:08.82324|
|109    |Kỹ Thuật Cơ khí                                             |2025-12-01 15:39:08.82324|2025-12-01 15:39:08.82324|
|110    |Kỹ Thuật Cơ Điện tử                                         |2025-12-01 15:39:08.82324|2025-12-01 15:39

## 4. Load Bảng SUBJECT_GROUP và SUBJECT

In [4]:
print("=" * 80)
print("LOAD BẢNG SUBJECT_GROUP và SUBJECT")
print("=" * 80)

# Đọc file tohop_mon_fixed.csv
df_tohop = spark.read.option("header", "true").option("inferSchema", "true").option("encoding", "UTF-8").csv("s3a://bronze/structured_data/tohop_mon_fixed.csv")

# --- SUBJECT_GROUP ---
df_subject_group_silver = df_tohop.select(
    col(df_tohop.columns[0]).cast("int").alias("subjectGroupId"),
    col(df_tohop.columns[1]).cast("string").alias("subjectGroupName"),
    col(df_tohop.columns[2]).cast("string").alias("subjectCombination"),
    current_timestamp().alias("created_at"),
    current_timestamp().alias("updated_at")
).filter(col("subjectGroupId").isNotNull() & col("subjectGroupName").isNotNull() & col("subjectCombination").isNotNull()).dropDuplicates(["subjectGroupName", "subjectCombination"])
df_subject_group_silver.writeTo("nessie.silver_tables.subject_group").using("iceberg").createOrReplace()
print(f"Đã ghi {df_subject_group_silver.count()} dòng vào subject_group")

# --- SUBJECT ---
df_subject = (
    df_tohop.select(explode(split(col(df_tohop.columns[2]), "-")).alias("subjectName"))
            .withColumn("subjectName", trim(col("subjectName")))
            .filter(col("subjectName").isNotNull() & (col("subjectName") != ""))
            .withColumn("subjectName_lower", lower(col("subjectName")))
            # loại bỏ trùng theo chữ thường
            .dropDuplicates(["subjectName_lower"])
)

window_spec = Window.orderBy("subjectName_lower")
df_subject_silver = df_subject.withColumn("subjectId", row_number().over(window_spec)).select(
    col("subjectId").cast("int"),
    col("subjectName").cast("string"),
    current_timestamp().alias("created_at"),
    current_timestamp().alias("updated_at")
)
df_subject_silver.writeTo("nessie.silver_tables.subject").using("iceberg").createOrReplace()
print(f"Đã ghi {df_subject_silver.count()} dòng vào subject")

# Verify
spark.table("nessie.silver_tables.subject_group").orderBy("subjectGroupId").show(5, truncate=False)
spark.table("nessie.silver_tables.subject").show(5, truncate=False)

LOAD BẢNG SUBJECT_GROUP và SUBJECT
Đã ghi 232 dòng vào subject_group
Đã ghi 51 dòng vào subject
+--------------+----------------+------------------+--------------------------+--------------------------+
|subjectGroupId|subjectGroupName|subjectCombination|created_at                |updated_at                |
+--------------+----------------+------------------+--------------------------+--------------------------+
|1             |A00             |Toán-Lí-Hóa       |2025-12-01 15:39:10.880774|2025-12-01 15:39:10.880774|
|2             |A01             |Toán-Lí-Ngoại ngữ |2025-12-01 15:39:10.880774|2025-12-01 15:39:10.880774|
|3             |A02             |Toán-Lí-Sinh      |2025-12-01 15:39:10.880774|2025-12-01 15:39:10.880774|
|4             |A03             |Toán-Lí-Sử        |2025-12-01 15:39:10.880774|2025-12-01 15:39:10.880774|
|5             |A04             |Toán-Lí-Địa       |2025-12-01 15:39:10.880774|2025-12-01 15:39:10.880774|
+--------------+----------------+---------------

## 5. Load Bảng SELECTION_METHOD

In [5]:
print("=" * 80)
print("LOAD BẢNG SELECTION_METHOD")
print("=" * 80)

# Đọc từ file benchmark để lấy các phương thức xét tuyển
df_benchmark = spark.read.option("header", "true").option("inferSchema", "true").option("encoding", "UTF-8").csv("s3a://bronze/structured_data/điểm chuẩn các trường (2021-2025)/Điểm_chuẩn_các_ngành_đại_học_năm(2021-2025)*.csv")

# Lấy PhuongThuc và loại bỏ "năm ..."
df_selection = df_benchmark.select(trim(regexp_replace(col("PhuongThuc"), r"\s*năm\s+\d{4}.*$", "")).alias("selectionMethodName")).filter(col("selectionMethodName").isNotNull() & (col("selectionMethodName") != "")).distinct()

window_spec = Window.orderBy("selectionMethodName")
df_selection_method_silver = df_selection.withColumn("selectionMethodId", row_number().over(window_spec)).select(
    col("selectionMethodId").cast("int"),
    col("selectionMethodName").cast("string"),
    current_timestamp().alias("created_at"),
    current_timestamp().alias("updated_at")
)
df_selection_method_silver.writeTo("nessie.silver_tables.selection_method").using("iceberg").createOrReplace()
print(f"Đã ghi {df_selection_method_silver.count()} dòng vào selection_method")

# Verify
spark.table("nessie.silver_tables.selection_method").show(10, truncate=False)

LOAD BẢNG SELECTION_METHOD
Đã ghi 10 dòng vào selection_method
+-----------------+------------------------------------------------------+--------------------------+--------------------------+
|selectionMethodId|selectionMethodName                                   |created_at                |updated_at                |
+-----------------+------------------------------------------------------+--------------------------+--------------------------+
|1                |Điểm chuẩn theo phương thức Điểm học bạ               |2025-12-01 15:39:14.369252|2025-12-01 15:39:14.369252|
|2                |Điểm chuẩn theo phương thức Điểm thi THPT             |2025-12-01 15:39:14.369252|2025-12-01 15:39:14.369252|
|3                |Điểm chuẩn theo phương thức Điểm xét tuyển kết hợp    |2025-12-01 15:39:14.369252|2025-12-01 15:39:14.369252|
|4                |Điểm chuẩn theo phương thức Điểm xét tốt nghiệp THPT  |2025-12-01 15:39:14.369252|2025-12-01 15:39:14.369252|
|5                |Điểm chuẩn theo

## 6. Load Bảng GradingScale

In [6]:
print("=" * 80)
print("LOAD BẢNG GRADING_SCALE TỪ PHANLOAITHANGDIEM")
print("=" * 80)

# 1. Đọc dữ liệu gốc từ file CSV (giống benchmark)
df_raw = (
    spark.read
        .option("header", "true")
        .option("inferSchema", "true")
        .option("encoding", "UTF-8")
        .csv("s3a://bronze/structured_data/điểm chuẩn các trường (2021-2025)/Điểm_chuẩn_các_ngành_đại_học_năm(2021-2025)*.csv")
)

# 2. Lấy unique PhanLoaiThangDiem
df_grading_raw = (
    df_raw
        .select(trim(col("PhanLoaiThangDiem")).alias("description"))
        .filter(col("description").isNotNull() & (col("description") != ""))
        .dropDuplicates(["description"])
)

# 3. Tách giá trị số trong description làm "value" (nếu có, vd: "thang 40" -> 40)
df_grading = (
    df_grading_raw
        .withColumn(
            "value",
            regexp_extract(col("description"), r"(\d+(?:\.\d+)?)", 1).cast("float")
        )
        .withColumn("gradingScaleId", monotonically_increasing_id().cast("int"))
        .withColumn("created_at", current_timestamp())
        .withColumn("updated_at", current_timestamp())
        .select(
            "gradingScaleId",
            "value",
            "description",
            "created_at",
            "updated_at"
        )
)

# 4. Ghi vào bảng Iceberg grading_scale đã tạo trước đó
df_grading.writeTo("nessie.silver_tables.grading_scale") \
          .using("iceberg") \
          .createOrReplace()

print(f"Đã ghi {df_grading.count()} dòng vào grading_scale")

# 5. Verify
spark.table("nessie.silver_tables.grading_scale").show(truncate=False)


LOAD BẢNG GRADING_SCALE TỪ PHANLOAITHANGDIEM
Đã ghi 10 dòng vào grading_scale
+--------------+------+---------------+--------------------------+--------------------------+
|gradingScaleId|value |description    |created_at                |updated_at                |
+--------------+------+---------------+--------------------------+--------------------------+
|0             |30.0  |Thang điểm 30  |2025-12-01 15:39:16.761752|2025-12-01 15:39:16.761752|
|1             |1200.0|Thang điểm 1200|2025-12-01 15:39:16.761752|2025-12-01 15:39:16.761752|
|2             |40.0  |Thang điểm 40  |2025-12-01 15:39:16.761752|2025-12-01 15:39:16.761752|
|3             |50.0  |Thang điểm 50  |2025-12-01 15:39:16.761752|2025-12-01 15:39:16.761752|
|4             |150.0 |Thang điểm 150 |2025-12-01 15:39:16.761752|2025-12-01 15:39:16.761752|
|5             |10.0  |Thang điểm 10  |2025-12-01 15:39:16.761752|2025-12-01 15:39:16.761752|
|6             |100.0 |Thang điểm 100 |2025-12-01 15:39:16.761752|2025-12-01

## 6. Load Bảng BENCHMARK

In [11]:
from pyspark.sql.functions import (
    col, trim, regexp_replace, current_timestamp,
    avg, round, expr
)

print("=" * 80)
print("LOAD BẢNG BENCHMARK")
print("=" * 80)

# =========================
# 1. ĐỌC & CHUẨN HÓA DỮ LIỆU BRONZE
# =========================

df_benchmark = (
    spark.read
    .option("header", "true")
    .option("inferSchema", "true")
    .option("encoding", "UTF-8")
    .csv("s3a://bronze/structured_data/điểm chuẩn các trường (2021-2025)/Điểm_chuẩn_các_ngành_đại_học_năm(2021-2025)*.csv")
)

# Chuẩn hóa cột PhuongThuc: bỏ phần "năm XXXX ..."
df_benchmark = df_benchmark.withColumn(
    "PhuongThuc_cleaned",
    trim(regexp_replace(col("PhuongThuc"), r"\s*năm\s+\d{4}.*$", ""))
)

# Lookup tables từ Silver
df_selection_lookup     = spark.table("nessie.silver_tables.selection_method")
df_subject_group_lookup = spark.table("nessie.silver_tables.subject_group")
df_grading_scale_lookup = spark.table("nessie.silver_tables.grading_scale")

# Join lookup + chuẩn hóa
df_benchmark_base = (
    df_benchmark
    .join(
        df_selection_lookup,
        df_benchmark["PhuongThuc_cleaned"] == df_selection_lookup["selectionMethodName"],
        "left"
    )
    .join(
        df_subject_group_lookup,
        df_benchmark["KhoiThi"] == df_subject_group_lookup["subjectGroupName"],
        "left"
    )
    .join(
        df_grading_scale_lookup,
        trim(df_benchmark["PhanLoaiThangDiem"]) == df_grading_scale_lookup["description"],
        "left"
    )
    .select(
        col("MaTruong").cast("string").alias("schoolId"),
        col("MaNganh").cast("string").alias("majorId"),
        col("subjectGroupId").cast("int"),
        col("selectionMethodId").cast("int"),
        col("gradingScaleId").cast("int"),
        col("Nam").cast("int").alias("year"),
        col("DiemChuan").cast("double").alias("score"),
    )
    .filter(
        col("schoolId").isNotNull() &
        col("majorId").isNotNull() &
        col("gradingScaleId").isNotNull() &
        col("year").isNotNull() &
        col("score").isNotNull() &
        col("selectionMethodId").isNotNull()
        # col("subjectGroupId").isNotNull()  # nếu muốn bắt buộc khối thi thì mở dòng này
    )
    .dropDuplicates([
        "schoolId",
        "majorId",
        "subjectGroupId",
        "selectionMethodId",
        "year",
        "gradingScaleId",
        "score"
    ])
)

# =========================
# 2. GROUP BY & LẤY ĐIỂM TRUNG BÌNH
# =========================

df_benchmark_grouped = (
    df_benchmark_base
    .groupBy(
        "schoolId",
        "majorId",
        "subjectGroupId",
        "selectionMethodId",
        "gradingScaleId",
        "year"
    )
    .agg(
        round(avg("score"), 2).alias("score")
    )
)

table_name = "nessie.silver_tables.benchmark"

# =========================
# 3. CHECK BẢNG SILVER ĐÃ TỒN TẠI CHƯA
# =========================

try:
    spark.table(table_name)
    table_exists = True
    print(f"Bảng {table_name} đã tồn tại → dùng MERGE (upsert).")
except Exception:
    table_exists = False
    print(f"Bảng {table_name} chưa tồn tại → tạo mới full-load.")

# =========================
# 4. LẦN ĐẦU: TẠO BẢNG FULL (DÙNG xxhash64 LÀM benchmarkId)
# =========================

if not table_exists:
    df_benchmark_silver = (
        df_benchmark_grouped
        .withColumn(
            "benchmarkId",
            expr(
                """
                CAST(
                    xxhash64(
                        schoolId,
                        majorId,
                        COALESCE(subjectGroupId, -1),
                        selectionMethodId,
                        gradingScaleId,
                        year
                    ) AS BIGINT
                )
                """
            )
        )
        .withColumn("created_at", current_timestamp())
        .withColumn("updated_at", current_timestamp())
        .select(
            "benchmarkId",
            "schoolId",
            "majorId",
            "subjectGroupId",
            "selectionMethodId",
            "gradingScaleId",
            "year",
            "score",
            "created_at",
            "updated_at"
        )
    )

    df_benchmark_silver.writeTo(table_name).using("iceberg").createOrReplace()
    print(f"Đã tạo mới benchmark với {df_benchmark_silver.count()} dòng")

# =========================
# 5. CÁC LẦN SAU: MERGE / UPSERT
# =========================

else:
    # Staging từ bronze sau khi chuẩn hóa + group
    df_staging = (
        df_benchmark_grouped
        .withColumn("created_at", current_timestamp())
        .withColumn("updated_at", current_timestamp())
    )

    df_staging.createOrReplaceTempView("benchmark_staging")

    # MERGE:
    # - MATCHED: update score + updated_at
    # - NOT MATCHED: insert bản ghi mới với benchmarkId = hash(business key)
    spark.sql(f"""
        MERGE INTO {table_name} AS t
        USING benchmark_staging AS s
        ON  t.schoolId          = s.schoolId
        AND t.majorId           = s.majorId
        AND COALESCE(t.subjectGroupId,  -1) = COALESCE(s.subjectGroupId,  -1)
        AND t.selectionMethodId = s.selectionMethodId
        AND t.gradingScaleId    = s.gradingScaleId
        AND t.year              = s.year

        WHEN MATCHED THEN UPDATE SET
            t.score      = s.score,
            t.updated_at = current_timestamp()

        WHEN NOT MATCHED THEN INSERT (
            benchmarkId,
            schoolId,
            majorId,
            subjectGroupId,
            selectionMethodId,
            gradingScaleId,
            year,
            score,
            created_at,
            updated_at
        ) VALUES (
            CAST(
                xxhash64(
                    s.schoolId,
                    s.majorId,
                    COALESCE(s.subjectGroupId, -1),
                    s.selectionMethodId,
                    s.gradingScaleId,
                    s.year
                ) AS BIGINT
            ),
            s.schoolId,
            s.majorId,
            s.subjectGroupId,
            s.selectionMethodId,
            s.gradingScaleId,
            s.year,
            s.score,
            s.created_at,
            s.updated_at
        )
    """)

    print("Đã MERGE dữ liệu mới vào bảng benchmark")

# =========================
# 6. VERIFY
# =========================

spark.table(table_name).show(5, truncate=False)
spark.table(table_name).groupBy("year").count().orderBy("year").show()


LOAD BẢNG BENCHMARK
Bảng nessie.silver_tables.benchmark đã tồn tại → dùng MERGE (upsert).
Đã MERGE dữ liệu mới vào bảng benchmark
+--------------------+--------+--------+--------------+-----------------+--------------+----+-----+--------------------------+--------------------------+
|benchmarkId         |schoolId|majorId |subjectGroupId|selectionMethodId|gradingScaleId|year|score|created_at                |updated_at                |
+--------------------+--------+--------+--------------+-----------------+--------------+----+-----+--------------------------+--------------------------+
|676054869222677887  |HHK     |7510302A|2             |2                |0             |2025|18.0 |2025-12-01 16:00:01.747504|2025-12-01 16:00:01.747504|
|-4276703068313169330|HIU     |7340122 |35            |2                |0             |2025|15.0 |2025-12-01 16:00:01.747504|2025-12-01 16:00:01.747504|
|-1430534741141047354|DCT     |7480201 |NULL          |5                |1             |2025|740.0|2

## 7. Load Bảng REGION

In [8]:
print("=" * 80)
print("LOAD BẢNG REGION")
print("=" * 80)

df_region = spark.read.option("header", "true").option("inferSchema", "true").option("encoding", "UTF-8").csv("s3a://bronze/structured_data/region.csv")
df_region_silver = df_region.select(
    lpad(col(df_region.columns[0]).cast("string"), 2, "0").alias("regionId"),  # Format thành 2 chữ số: "1" -> "01"
    col(df_region.columns[1]).cast("string").alias("regionName"),
    current_timestamp().alias("created_at"),
    current_timestamp().alias("updated_at")
).filter(col("regionId").isNotNull() & col("regionName").isNotNull()).dropDuplicates(["regionId"])

df_region_silver.writeTo("nessie.silver_tables.region").using("iceberg").createOrReplace()
print(f"Đã ghi {df_region_silver.count()} dòng vào region")

# Verify
spark.table("nessie.silver_tables.region").show(10, truncate=False)

LOAD BẢNG REGION
Đã ghi 64 dòng vào region
+--------+-----------------------+-------------------------+-------------------------+
|regionId|regionName             |created_at               |updated_at               |
+--------+-----------------------+-------------------------+-------------------------+
|01      |Sở GDĐT Hà Nội         |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|02      |Sở GDĐT TP. Hồ Chí Minh|2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|03      |Sở GDĐT Hải Phòng      |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|04      |Sở GDĐT Đà Nẵng        |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|05      |Sở GDĐT Hà Giang       |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|06      |Sở GDĐT Cao Bằng       |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|07      |Sở GDĐT Lai Châu       |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|
|08      |Sở GDĐT Lào Cai        |2025-12-01 15:39:24.67929|2025-12-01 15:39:24.67929|


## 8. Load Bảng STUDENT_SCORES

In [22]:
from pyspark.sql.functions import (
    col, trim, regexp_replace, current_timestamp, lit,
    concat, substring, udf, input_file_name, regexp_extract
)
from pyspark.sql.types import MapType, IntegerType, DoubleType
from typing import Dict

print("=" * 80)
print("LOAD BẢNG STUDENT_SCORES - INCREMENTAL BY FILE (DELETE + APPEND)")
print("=" * 80)

# =====================================================
# 0. TẠO BẢNG LOG INGEST (LƯU FILE ĐÃ XỬ LÝ) NẾU CHƯA CÓ
# =====================================================
spark.sql("""
CREATE TABLE IF NOT EXISTS nessie.silver_tables.student_scores_ingest_log (
    path STRING,
    year INT,
    processed_at TIMESTAMP
) USING iceberg
""")

# =====================================================
# 1. LẤY DANH SÁCH TẤT CẢ FILE CSV HIỆN CÓ TRONG BRONZE
#    + TRỪ ĐI NHỮNG FILE ĐÃ INGEST (log)
# =====================================================

df_files = (
    spark.read.format("binaryFile")
    .option("pathGlobFilter", "*.csv")
    .load("s3a://bronze/structured_data/điểm từng thí sinh/*/*.csv")
    .select("path")
)

df_log = spark.table("nessie.silver_tables.student_scores_ingest_log")

df_new_files = df_files.join(df_log, on="path", how="left_anti")
new_files = [r.path for r in df_new_files.collect()]

if not new_files:
    print("❌ Không có file mới nào, dừng job.")
else:
    print(f"✅ Phát hiện {len(new_files)} file mới cần xử lý.")

    # =====================================================
    # 2. ĐỌC CHỈ CÁC FILE MỚI + THÊM CỘT YEAR
    # =====================================================

    df_scores_raw = (
        spark.read
        .option("header", "true")
        .option("inferSchema", "false")
        .option("encoding", "UTF-8")
        .csv(new_files)
        .withColumn("path", input_file_name())
    )

    df_scores_raw = df_scores_raw.withColumn(
        "Year",
        regexp_extract(col("path"), r"/(\d{4})/", 1).cast("int")
    )

    # =====================================================
    # 3. LOAD LOOKUP MÔN HỌC
    # =====================================================

    df_subject_lookup = spark.table("nessie.silver_tables.subject").select("subjectId", "subjectName")
    subject_map = {row.subjectName: row.subjectId for row in df_subject_lookup.collect()}
    print(f"\nĐã load {len(subject_map)} môn học để mapping")

    # =====================================================
    # 4. UDF PARSE ĐIỂM → Map<subjectId, score>
    # =====================================================

    def parse_scores_with_subject_id(score_string: str) -> Dict[int, float]:
        if not score_string or score_string.strip() == "":
            return {}
        scores_dict = {}
        try:
            pairs = score_string.split(",")
            for pair in pairs:
                if ":" in pair:
                    subject_name, score = pair.split(":")
                    subject_name = subject_name.strip()
                    # Map tên môn -> subjectId
                    if subject_name in subject_map:
                        subject_id = subject_map[subject_name]
                        try:
                            scores_dict[subject_id] = float(score.strip())
                        except:
                            pass
        except:
            pass
        return scores_dict

    parse_scores_udf = udf(parse_scores_with_subject_id, MapType(IntegerType(), DoubleType()))

    # =====================================================
    # 5. TRANSFORM → DATAFRAME STAGING (KHÔNG MERGE)
    # =====================================================

    # 1️⃣ Biến đầy đủ để append vào silver
    df_student_scores_stage = (
        df_scores_raw
        .withColumn("studentId", concat(col("SBD"), col("Year").cast("string")))
        .withColumn("scores", parse_scores_udf(col("DiemThi")))   # UDF ở đây
        .withColumn("regionId", substring(col("SBD"), 1, 2).cast("string"))
        .select(
            col("studentId").cast("string"),
            col("regionId").cast("string"),
            col("Year").cast("int").alias("year"),
            col("scores")
        )
        .filter(
            col("studentId").isNotNull() &
            col("year").isNotNull() &
            col("scores").isNotNull()
        )
    )
    
    # 2️⃣ Biến thứ hai chỉ có studentId — KHÔNG UDF → dùng để DELETE
    df_student_ids = (
        df_scores_raw
        .withColumn("studentId", concat(col("SBD"), col("Year").cast("string")))
        .select("studentId")
        .filter(col("studentId").isNotNull())
        # .dropDuplicates(["studentId"])
    )
    
    df_student_ids.createOrReplaceTempView("student_scores_new_ids")


    staging_count = df_student_scores_stage.count()
    print(f"Staging có {staging_count:,} dòng.")

    table_name = "nessie.silver_tables.student_scores"

        # =====================================================
    # 6. XOÁ studentId CŨ BẰNG CÁCH COLLECT RA PYTHON + DELETE IN (...)
    # =====================================================

    # Lấy list studentId distinct trong batch mới
    new_ids = [
        row.studentId
        for row in df_student_scores_stage.select("studentId").distinct().collect()
    ]

    print(f"Số studentId distinct trong batch mới: {len(new_ids):,}")

    # Kiểm tra bảng silver đã tồn tại chưa
    try:
        spark.table(table_name)
        table_exists = True
        print(f"Bảng {table_name} đã tồn tại → DELETE theo list studentId + APPEND.")
    except Exception:
        table_exists = False
        print(f"Bảng {table_name} chưa tồn tại → tạo mới từ batch, không cần xoá.")

    silver_count = spark.table(table_name).count() if table_exists else 0
    print(f"Số dòng trong bảng silver hiện tại: {silver_count:,}")

    if not table_exists:
        # 1️⃣ BẢNG CHƯA TỒN TẠI → TẠO MỚI
        (
            df_student_scores_stage
            .withColumn("created_at", current_timestamp())
            .withColumn("updated_at", current_timestamp())
            .writeTo(table_name)
            .using("iceberg")
            .createOrReplace()
        )
        print(f"✅ Đã tạo mới bảng {table_name} với {staging_count:,} dòng.")
    
    elif silver_count == 0:
        # 2️⃣ BẢNG TỒN TẠI NHƯNG RỖNG → KHÔNG XOÁ, CHỈ APPEND
        print("⚠️ Bảng silver đã tồn tại nhưng rỗng → chỉ append, không xoá.")
    
        (
            df_student_scores_stage
            .withColumn("created_at", current_timestamp())
            .withColumn("updated_at", current_timestamp())
            .writeTo(table_name)
            .using("iceberg")
            .append()
        )
        print(f"✅ Đã append {staging_count:,} dòng mới vào {table_name}.")
    
    elif new_ids:
        # 3️⃣ BẢNG TỒN TẠI VÀ new_ids KHÔNG RỖNG → DELETE + APPEND
        print("Bảng silver có dữ liệu → DELETE + APPEND.")
    
        chunk_size = 500
        from math import ceil
    
        num_chunks = ceil(len(new_ids) / chunk_size)
        print(f"Chia studentId thành {num_chunks} chunk để xoá...")
    
        for i in range(num_chunks):
            chunk = new_ids[i * chunk_size:(i + 1) * chunk_size]
            escaped_ids = [sid.replace("'", "''") for sid in chunk]
            in_list = ",".join([f"'{sid}'" for sid in escaped_ids])
    
            sql_delete = f"""
                DELETE FROM {table_name}
                WHERE studentId IN ({in_list})
            """
            spark.sql(sql_delete)
    
        print("✅ Đã xoá xong các studentId cũ trong silver.")
    
        (
            df_student_scores_stage
            .withColumn("created_at", current_timestamp())
            .withColumn("updated_at", current_timestamp())
            .writeTo(table_name)
            .using("iceberg")
            .append()
        )
        print(f"✅ Đã append {staging_count:,} dòng mới.")
    
    else:
        # 4️⃣ new_ids rỗng → không xoá, không append
        print("⚠️ Batch mới không có studentId nào hợp lệ → không làm gì cả.")


    # =====================================================
    # 7. GHI LOG FILE ĐÃ XỬ LÝ
    # =====================================================

    from pyspark.sql.functions import array, explode

    df_new_files_log = (
        df_new_files
        .withColumn("year", regexp_extract(col("path"), r"/(\d{4})/", 1).cast("int"))
        .withColumn("processed_at", current_timestamp())
    )

    (
        df_new_files_log
        .writeTo("nessie.silver_tables.student_scores_ingest_log")
        .using("iceberg")
        .append()
    )

    print(f"Đã ghi log {df_new_files_log.count():,} file đã xử lý.")

    # =====================================================
    # 8. VERIFY
    # =====================================================

    print("\nMẫu dữ liệu student_scores:")
    spark.table(table_name).show(5, truncate=False)
    spark.table(table_name).groupBy("year").count().orderBy("year").show()


LOAD BẢNG STUDENT_SCORES - INCREMENTAL BY FILE (DELETE + APPEND)
❌ Không có file mới nào, dừng job.


## 9. Load Bảng ARTICLE và COMMENT từ TikTok Data

In [2]:
import re, csv, io
from datetime import datetime

import pyspark.sql.functions as F
from pyspark.sql.functions import input_file_name, col, trim, current_timestamp
from pyspark.sql.types import (
    StructType, StructField, IntegerType, StringType, TimestampType
)
from pyspark.sql.utils import AnalysisException

# ===== Helpers =====
def clean_url(url: str):
    """Bỏ prefix 'https://www.tiktok.com/' trong urlUser"""
    if not url:
        return url
    prefix = "https://www.tiktok.com/"
    if url.startswith(prefix):
        return url[len(prefix):]
    return url

def clean_reply_to(name: str):
    """Bỏ suffix '?lang=vi-VN' trong replyTo"""
    if not name:
        return name
    suffix = "?lang=vi-VN"
    if name.endswith(suffix):
        return name[:-len(suffix)]
    return name

print("=" * 80)
print("LOAD BẢNG ARTICLE VÀ COMMENT TỪ TIKTOK DATA (INCREMENTAL)")
print("=" * 80)

# ===== 0. Tạo bảng log file nếu chưa có =====
spark.sql("""
CREATE TABLE IF NOT EXISTS nessie.silver_tables.tiktok_comment_files_log (
  file_path STRING,
  load_time TIMESTAMP
) USING iceberg
""")

# ===== 1. Xác định các file comment MỚI =====
tiktok_path = "s3a://bronze/MangXaHoi/tiktok-data/comments/*.csv"
print(f"Đọc danh sách file từ: {tiktok_path}")

df_all_files = (
    spark.read
         .option("header", "false")
         .option("encoding", "UTF-8")
         .csv(tiktok_path)
         .select(input_file_name().alias("file_path"))
         .distinct()
)

try:
    df_processed = spark.table("nessie.silver_tables.tiktok_comment_files_log") \
                        .select("file_path").distinct()
except AnalysisException:
    df_processed = spark.createDataFrame([], "file_path STRING")

df_new_files = df_all_files.join(df_processed, "file_path", "left_anti")

tiktok_files = [r.file_path for r in df_new_files.collect()]
print(f"Số file comment mới: {len(tiktok_files)}")

if not tiktok_files:
    print("Không có file comment mới, bỏ qua phần load comment.")
else:
    # ===== 2. Lấy max articleID & commentID hiện có =====
    try:
        max_article_id = spark.table("nessie.silver_tables.article") \
                              .agg(F.max("articleID")).collect()[0][0]
        if max_article_id is None:
            max_article_id = 0
    except AnalysisException:
        max_article_id = 0

    try:
        max_comment_id = spark.table("nessie.silver_tables.comment") \
                              .agg(F.max("commentID")).collect()[0][0]
        if max_comment_id is None:
            max_comment_id = 0
    except AnalysisException:
        max_comment_id = 0

    article_counter = max_article_id
    comment_counter = max_comment_id

    print(f"max articleID hiện có: {article_counter}")
    print(f"max commentID hiện có: {comment_counter}")

    # ===== Schema article & comment =====
    article_schema = StructType([
        StructField("articleID", IntegerType(), False),
        StructField("title", StringType(), True),
        StructField("description", StringType(), True),
        StructField("author", StringType(), True),
        StructField("url", StringType(), True),
        StructField("timePublish", TimestampType(), True),
        StructField("likeCount", IntegerType(), True),
        StructField("commentCount", IntegerType(), True),
        StructField("shareCount", IntegerType(), True),
        StructField("type", StringType(), True),
        StructField("created_at", TimestampType(), True),
        StructField("updated_at", TimestampType(), True)
    ])

    comment_schema = StructType([
        StructField("commentID", IntegerType(), False),
        StructField("articleID", IntegerType(), True),
        StructField("name", StringType(), True),
        StructField("tagName", StringType(), True),
        StructField("urlUser", StringType(), True),
        StructField("comment", StringType(), True),
        StructField("commentTime", TimestampType(), True),
        StructField("commentLike", IntegerType(), True),
        StructField("levelComment", IntegerType(), True),
        StructField("replyTo", StringType(), True),
        StructField("numberOfReply", IntegerType(), True),
        StructField("created_at", TimestampType(), True),
        StructField("updated_at", TimestampType(), True)
    ])

    total_article_new = 0
    total_comment_new = 0

    # ===== 3. Xử lý từng file comment MỚI =====
    for file_path in tiktok_files:
        try:
            print(f"\nXử lý file: {file_path}")

            # Đọc raw để lấy metadata
            df_raw = (spark.read
                      .option("header", "false")
                      .option("encoding", "UTF-8")
                      .csv(file_path))
            rows = df_raw.collect()

            # ----- Parse metadata bài post -----
            post_url = ""
            author = ""
            tag_name = ""
            author_url = ""
            time_publish = ""
            like_count = 0
            comment_count_meta = 0
            share_count = 0
            title = ""

            for r in rows[:20]:
                line = r[0] if r[0] else ""

                if "Post URL:" in line:
                    post_url = line.split("Post URL:")[1].strip()
                elif "Người đăng:" in line:
                    author = line.split("Người đăng:")[1].strip()
                elif "Tag người đăng:" in line:
                    tag_name = line.split("Tag người đăng:")[1].strip()
                elif "URL người đăng:" in line:
                    author_url = line.split("URL người đăng:")[1].strip()
                elif "Thời gian đăng:" in line:
                    time_str = line.split("Thời gian đăng:")[1].strip()
                    try:
                        time_publish = datetime.strptime(time_str, "%d-%m-%Y")
                    except:
                        time_publish = datetime.now()
                elif "Số lượt tym:" in line:
                    tym_str = line.split("Số lượt tym:")[1].strip()
                    try:
                        if "K" in tym_str:
                            like_count = int(float(tym_str.replace("K", "")) * 1000)
                        else:
                            like_count = int(tym_str)
                    except:
                        like_count = 0
                elif "Số lượt comment:" in line:
                    try:
                        c_str = line.split("Số lượt comment:")[1].strip()
                        if "K" in c_str:
                            comment_count_meta = int(float(c_str.replace("K", "")) * 1000)
                        else:
                            comment_count_meta = int(c_str)
                    except:
                        comment_count_meta = 0
                elif "Số lượt share:" in line:
                    share_str = line.split("Số lượt share:")[1].strip()
                    try:
                        if share_str != "N/A":
                            if "K" in share_str:
                                share_count = int(float(share_str.replace("K", "")) * 1000)
                            else:
                                share_count = int(share_str)
                        else:
                            share_count = 0
                    except:
                        share_count = 0
                elif "Mô tả của bài đăng:" in line:
                    first_part = line.split("Mô tả của bài đăng:")[1].strip()

                    if first_part.endswith('"') and first_part.count('"') >= 2:
                        title = first_part.strip('"')
                    else:
                        desc_lines = []
                        if first_part != "":
                            desc_lines.append(first_part.lstrip('"'))

                        j = rows.index(r) + 1
                        while j < len(rows):
                            next_line = rows[j][0] if rows[j][0] else ""
                            desc_lines.append(next_line)
                            if next_line.endswith('"'):
                                break
                            j += 1

                        full_desc = "\n".join(desc_lines).strip()
                        title = full_desc.strip('"').strip()

            video_url = clean_url(post_url)

            # ----- Xác định articleID (cũ → dùng lại, mới → tăng counter) -----
            try:
                df_article_exist = (spark.table("nessie.silver_tables.article")
                                         .select("articleID", "url")
                                         .filter(col("url") == video_url))
                exist_rows = df_article_exist.collect()
            except AnalysisException:
                exist_rows = []

            if exist_rows:
                article_id = exist_rows[0].articleID
                is_new_article = False
                print(f"Video {video_url} đã có articleID={article_id} → xoá comment cũ rồi insert lại")
                # Xoá comment cũ
                spark.sql(f"""
                    DELETE FROM nessie.silver_tables.comment
                    WHERE articleID = {article_id}
                """)
            else:
                article_counter += 1
                article_id = article_counter
                is_new_article = True
                print(f"Video {video_url} là mới → tạo articleID={article_id}")

            # ----- Nếu là article mới → insert vào bảng article -----
            if is_new_article:
                article_data = {
                    "articleID": article_id,
                    "title": title,
                    "description": None,   # Description sẽ được cập nhật sau từ sub
                    "author": author,
                    "url": video_url,
                    "timePublish": time_publish,
                    "likeCount": like_count,
                    "commentCount": comment_count_meta,
                    "shareCount": share_count,
                    "type": "TikTok",
                    "created_at": datetime.now(),
                    "updated_at": datetime.now()
                }
                df_article_one = spark.createDataFrame([article_data], article_schema)
                (df_article_one.writeTo("nessie.silver_tables.article")
                               .using("iceberg")
                               .append())
                total_article_new += 1

            # ----- Đọc lại file dạng text để parse comment chuẩn CSV -----
            df_text = spark.read.text(file_path)
            text_lines = [r.value if r.value is not None else "" for r in df_text.collect()]

            header_row_index = -1
            header_line = None

            for i, line in enumerate(text_lines):
                line_norm = line.strip()
                if (
                    line_norm.startswith("STT,")
                    and "Tên" in line_norm
                    and "Tag tên" in line_norm
                    and "URL" in line_norm
                    and "Comment" in line_norm
                    and "Time" in line_norm
                    and "Likes" in line_norm
                    and "Level Comment" in line_norm
                    and "Replied To Tag Name" in line_norm
                    and "Number of Replies" in line_norm
                ):
                    header_row_index = i
                    header_line = line_norm
                    break

            if header_row_index >= 0:
                print(f"  Tìm thấy header comment ở dòng {header_row_index}")
                print(f"  Header: {header_line}")

                csv_lines = text_lines[header_row_index:]
                csv_str = "\n".join(csv_lines)

                reader = csv.DictReader(io.StringIO(csv_str))
                comment_dict_rows = list(reader)
                print(f"  Tìm thấy {len(comment_dict_rows)} comment (sau khi parse CSV)")

                file_comments = []

                for r in comment_dict_rows:
                    try:
                        comment_time_str = r.get("Time", "") or ""
                        try:
                            comment_time = datetime.strptime(comment_time_str, "%d-%m-%Y")
                        except:
                            comment_time = datetime.now()

                        level_comment = 2 if (r.get("Level Comment") == "Yes") else 1

                        reply_to_raw = r.get("Replied To Tag Name", "")
                        if reply_to_raw and reply_to_raw != "---":
                            reply_to = clean_reply_to(reply_to_raw)
                        else:
                            reply_to = None

                        likes_raw = r.get("Likes", "")
                        comment_like = int(likes_raw) if (likes_raw and str(likes_raw).isdigit()) else 0

                        num_reply_raw = r.get("Number of Replies", "")
                        number_of_reply = int(num_reply_raw) if (num_reply_raw and str(num_reply_raw).isdigit()) else 0

                        comment_counter += 1
                        comment_data = {
                            "commentID": comment_counter,
                            "articleID": article_id,
                            "name": r.get("Tên", "") or "",
                            "tagName": r.get("Tag tên", "") or "",
                            "urlUser": clean_url(r.get("URL", "") or ""),
                            "comment": r.get("Comment", "") or "",
                            "commentTime": comment_time,
                            "commentLike": comment_like,
                            "levelComment": level_comment,
                            "replyTo": reply_to,
                            "numberOfReply": number_of_reply,
                            "created_at": datetime.now(),
                            "updated_at": datetime.now()
                        }
                        file_comments.append(comment_data)
                    except Exception as e:
                        print(f"  Lỗi xử lý comment: {e}")
                        continue

                # if file_comments:
                #     # tạo DF từ list
                #     df_comment_batch = spark.createDataFrame(file_comments, comment_schema)
                
                #     # CHIA NHỎ ra nhiều partition để mỗi task ghi ít dữ liệu hơn
                #     df_comment_batch = df_comment_batch.repartition(16)  # thử 4, nếu vẫn OOM thì tăng 8, 16
                
                #     # số bản ghi đã biết sẵn từ list, không cần .count()
                #     # written = len(file_comments)
                #     written = 0
                
                #     (df_comment_batch.writeTo("nessie.silver_tables.comment")
                #                      .using("iceberg")
                #                      .append())
                
                #     total_comment_new += written
                #     print(f"  Đã ghi {written} comment mới cho articleID={article_id}")
                # else:
                #     print("  File này không có comment nào để ghi")
                # chỗ này nên sửa lại nếu chạy trên spark cluster ( hiện đang tối ưu nhỏ hơn để chạy trên jupyter)
                if file_comments:
                    # CHUNK_SIZE: số comment tối đa mỗi lần ghi
                    CHUNK_SIZE = 1000  # nếu vẫn OOM thì giảm còn 2000 hoặc 1000
                
                    total_for_article = 0
                
                    for i in range(0, len(file_comments), CHUNK_SIZE):
                        chunk = file_comments[i:i + CHUNK_SIZE]
                
                        # Tạo DataFrame cho chunk hiện tại
                        df_chunk = spark.createDataFrame(chunk, comment_schema)
                
                        # Chia nhỏ thêm trong JVM (nếu muốn)
                        df_chunk = df_chunk.repartition(2)  # có thể thử 2 / 4 / 8
                
                        # Ghi chunk vào Iceberg
                        (df_chunk.writeTo("nessie.silver_tables.comment")
                                .using("iceberg")
                                .append())
                
                        total_for_article += len(chunk)
                        print(f"  Đã ghi thêm {len(chunk)} comment cho articleID={article_id} (tổng tạm: {total_for_article})")
                
                    total_comment_new += total_for_article
                    print(f"  ==> Tổng cộng ghi {total_for_article} comment cho articleID={article_id}")
                else:
                    print("  File này không có comment nào để ghi")

            else:
                print("  Không tìm thấy header comment trong file")

            # ----- Ghi log file đã xử lý -----
            df_log = spark.createDataFrame(
                [(file_path, datetime.now())],
                "file_path STRING, load_time TIMESTAMP"
            )
            (df_log.writeTo("nessie.silver_tables.tiktok_comment_files_log")
                  .using("iceberg")
                  .append())

            print(f"Đã xử lý xong file {file_path}")

        except Exception as e:
            print(f"Lỗi xử lý file {file_path}: {e}")
            import traceback
            traceback.print_exc()
            continue

    print("\n" + "=" * 80)
    print(f"TỔNG ARTICLE MỚI:  {total_article_new}")
    print(f"TỔNG COMMENT MỚI:  {total_comment_new}")
    print("=" * 80)


LOAD BẢNG ARTICLE VÀ COMMENT TỪ TIKTOK DATA (INCREMENTAL)
Đọc danh sách file từ: s3a://bronze/MangXaHoi/tiktok-data/comments/*.csv


                                                                                

Số file comment mới: 1700
max articleID hiện có: 70
max commentID hiện có: 100357

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-05-17.csv
Video @thaihoa_entertainment/video/7529828371610488072 đã có articleID=70 → xoá comment cũ rồi insert lại
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 658 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 658 comment cho articleID=70 (tổng tạm: 658)
  ==> Tổng cộng ghi 658 comment cho articleID=70


                                                                                

Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-05-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T01-07-16.csv
Video @nh_gem/video/7382458058544336145 là mới → tạo articleID=71
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 507 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 507 comment cho articleID=71 (tổng tạm: 507)
  ==> Tổng cộng ghi 507 comment cho articleID=71
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T01-07-16.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T11-25-59.csv
Video @vietnamstats.net/video/7374874369736133921 là mới → tạo articleID=72
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 518 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 518 comment cho articleID=72 (tổng tạm: 518)
  ==> Tổng cộng ghi 518 comment cho articleID=72
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T11-25-59.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-37-37.csv
Video @nguyenminhthu.bm/video/7363206575651081489 là mới → tạo articleID=73
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 686 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 686 comment cho articleID=73 (tổng tạm: 686)
  ==> Tổng cộng ghi 686 comment cho articleID=73
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-37-37.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-46-16.csv
Video @embehocy/video/7489680934829182213 là mới → tạo articleID=74
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 705 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 705 comment cho articleID=74 (tổng tạm: 705)
  ==> Tổng cộng ghi 705 comment cho articleID=74
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-46-16.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-19T12-39-10.csv
Video @biquyetdodaihoc/video/7122453821632089371 là mới → tạo articleID=75
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 754 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 754 comment cho articleID=75 (tổng tạm: 754)
  ==> Tổng cộng ghi 754 comment cho articleID=75
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-19T12-39-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T03-48-29.csv
Video @fpt_btec/video/7077883163963313409 là mới → tạo articleID=76
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 993 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 993 comment cho articleID=76 (tổng tạm: 993)
  ==> Tổng cộng ghi 993 comment cho articleID=76
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T03-48-29.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-58-57.csv
Video @vutrunganhnghe/video/7527284933069409543 là mới → tạo articleID=77
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 520 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 520 comment cho articleID=77 (tổng tạm: 520)
  ==> Tổng cộng ghi 520 comment cho articleID=77
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-58-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T18-41-22.csv
Video @usersmtwsklo2s/video/7542405924170829074 là mới → tạo articleID=78
  Tìm thấy header comment ở dòng 31
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 743 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 743 comment cho articleID=78 (tổng tạm: 743)
  ==> Tổng cộng ghi 743 comment cho articleID=78
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T18-41-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T06-38-44.csv
Video @biquyetdodaihoc/video/7122800561170156827 là mới → tạo articleID=79
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 712 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 712 comment cho articleID=79 (tổng tạm: 712)
  ==> Tổng cộng ghi 712 comment cho articleID=79
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T06-38-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-32-46.csv
Video @mong.hust/video/7378841639118327048 là mới → tạo articleID=80
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 966 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 966 comment cho articleID=80 (tổng tạm: 966)
  ==> Tổng cộng ghi 966 comment cho articleID=80
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-32-46.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T05-42-55.csv
Video @hapodcast_offical/video/7348423171072085250 là mới → tạo articleID=81
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 846 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 846 comment cho articleID=81 (tổng tạm: 846)
  ==> Tổng cộng ghi 846 comment cho articleID=81
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T05-42-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-36-18.csv
Video @minanowifi/video/7372032075777576200 là mới → tạo articleID=82
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 732 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 732 comment cho articleID=82 (tổng tạm: 732)
  ==> Tổng cộng ghi 732 comment cho articleID=82
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-36-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-56-04.csv
Video @dangthicamhang56983/video/7396569170525064456 là mới → tạo articleID=83
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 496 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 496 comment cho articleID=83 (tổng tạm: 496)
  ==> Tổng cộng ghi 496 comment cho articleID=83
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-56-04.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-23T08-53-06.csv
Video @kinhtethongke_/video/7487836042196798726 là mới → tạo articleID=84
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 759 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 759 comment cho articleID=84 (tổng tạm: 759)
  ==> Tổng cộng ghi 759 comment cho articleID=84
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-23T08-53-06.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-50-55.csv
Video @vutrunganhnghe/video/7420613189466885384 là mới → tạo articleID=85
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 642 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 642 comment cho articleID=85 (tổng tạm: 642)
  ==> Tổng cộng ghi 642 comment cho articleID=85
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-50-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T10-45-22.csv
Video @kenh7.news/video/7517599927569026312 là mới → tạo articleID=86
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 920 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 920 comment cho articleID=86 (tổng tạm: 920)
  ==> Tổng cộng ghi 920 comment cho articleID=86
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T10-45-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T08-22-36.csv
Video @benuuuuuu3/video/7489070013375155461 là mới → tạo articleID=87
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 670 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 670 comment cho articleID=87 (tổng tạm: 670)
  ==> Tổng cộng ghi 670 comment cho articleID=87
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T08-22-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-41-51.csv
Video @ncanhhh01/video/7499253608924384530 là mới → tạo articleID=88
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 458 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 458 comment cho articleID=88 (tổng tạm: 458)
  ==> Tổng cộng ghi 458 comment cho articleID=88
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-41-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-20T05-21-26.csv
Video @green.aca/video/7460479525504306450 là mới → tạo articleID=89
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 776 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 776 comment cho articleID=89 (tổng tạm: 776)
  ==> Tổng cộng ghi 776 comment cho articleID=89
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-20T05-21-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-19T10-28-38.csv
Video @vnbay.net/video/7526505855848680711 là mới → tạo articleID=90
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 629 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 629 comment cho articleID=90 (tổng tạm: 629)
  ==> Tổng cộng ghi 629 comment cho articleID=90
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-19T10-28-38.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T15-42-35.csv
Video @thaihoa_entertainment/video/7505991891452759314 là mới → tạo articleID=91
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 558 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 558 comment cho articleID=91 (tổng tạm: 558)
  ==> Tổng cộng ghi 558 comment cho articleID=91
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T15-42-35.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-13-55.csv
Video @duonghaa2k1/video/7080487586963148059 là mới → tạo articleID=92
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 884 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 884 comment cho articleID=92 (tổng tạm: 884)
  ==> Tổng cộng ghi 884 comment cho articleID=92
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-13-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T03-44-51.csv
Video @hoangmanh8383/video/7171829358334709019 là mới → tạo articleID=93
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 649 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 649 comment cho articleID=93 (tổng tạm: 649)
  ==> Tổng cộng ghi 649 comment cho articleID=93
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T03-44-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-30-47.csv
Video @paulduongcanada/video/7435631866981453063 là mới → tạo articleID=94
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 524 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 524 comment cho articleID=94 (tổng tạm: 524)
  ==> Tổng cộng ghi 524 comment cho articleID=94
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-30-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-24-54.csv
Video @tuancamcui/video/7393312504203513096 là mới → tạo articleID=95
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 362 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 362 comment cho articleID=95 (tổng tạm: 362)
  ==> Tổng cộng ghi 362 comment cho articleID=95
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-24-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-15-22.csv
Video @mai.trang.92p/video/7462014372722871570 là mới → tạo articleID=96
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 558 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 558 comment cho articleID=96 (tổng tạm: 558)
  ==> Tổng cộng ghi 558 comment cho articleID=96
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-15-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-28-33.csv
Video @tonyphat8968/video/7515254414056213768 là mới → tạo articleID=97
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 428 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 428 comment cho articleID=97 (tổng tạm: 428)
  ==> Tổng cộng ghi 428 comment cho articleID=97
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-28-33.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T10-38-34.csv
Video @dieuhoalanggo/video/7478640033012976912 là mới → tạo articleID=98
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 734 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 734 comment cho articleID=98 (tổng tạm: 734)
  ==> Tổng cộng ghi 734 comment cho articleID=98
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T10-38-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-22-36.csv
Video @quachthikimcuong_/video/7473715301352361224 là mới → tạo articleID=99
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 410 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 410 comment cho articleID=99 (tổng tạm: 410)
  ==> Tổng cộng ghi 410 comment cho articleID=99
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-22-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T17-53-32.csv
Video @daothinhvuongofficial255/video/7403962581603421458 là mới → tạo articleID=100
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 477 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 477 comment cho articleID=100 (tổng tạm: 477)
  ==> Tổng cộng ghi 477 comment cho articleID=100
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T17-53-32.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-41-22.csv
Video @otanetwork/video/7303835373124390152 là mới → tạo articleID=101
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 758 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 758 comment cho articleID=101 (tổng tạm: 758)
  ==> Tổng cộng ghi 758 comment cho articleID=101
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-41-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T13-41-45.csv
Video @truongnguyen198286/video/7530829444928294151 là mới → tạo articleID=102
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 397 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 397 comment cho articleID=102 (tổng tạm: 397)
  ==> Tổng cộng ghi 397 comment cho articleID=102
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T13-41-45.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T19-58-26.csv
Video @c.emm0/video/7496695222290664721 là mới → tạo articleID=103
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 407 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 407 comment cho articleID=103 (tổng tạm: 407)
  ==> Tổng cộng ghi 407 comment cho articleID=103
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T19-58-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-17-17.csv
Video @thayquyethuongnghiep/video/7483033058967342343 là mới → tạo articleID=104
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 393 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 393 comment cho articleID=104 (tổng tạm: 393)
  ==> Tổng cộng ghi 393 comment cho articleID=104
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-17-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-22-05.csv
Video @conghieu__/video/7521321282172980498 là mới → tạo articleID=105
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 449 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 449 comment cho articleID=105 (tổng tạm: 449)
  ==> Tổng cộng ghi 449 comment cho articleID=105
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-22-05.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-20-15.csv
Video @satokhanh/video/7542404281836637448 là mới → tạo articleID=106
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 670 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 670 comment cho articleID=106 (tổng tạm: 670)
  ==> Tổng cộng ghi 670 comment cho articleID=106
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-20-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T12-28-47.csv
Video @nkl.k15/video/7368376410039127314 là mới → tạo articleID=107
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 494 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 494 comment cho articleID=107 (tổng tạm: 494)
  ==> Tổng cộng ghi 494 comment cho articleID=107
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T12-28-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-18-08.csv
Video @__maihuong__/video/7278632599432498433 là mới → tạo articleID=108
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 492 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 492 comment cho articleID=108 (tổng tạm: 492)
  ==> Tổng cộng ghi 492 comment cho articleID=108
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-18-08.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-14-28.csv
Video @vutrunganhnghe/video/7417691748958244104 là mới → tạo articleID=109
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 845 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 845 comment cho articleID=109 (tổng tạm: 845)
  ==> Tổng cộng ghi 845 comment cho articleID=109
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-14-28.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T09-56-30.csv
Video @quang123depzai/video/7009894053714136346 là mới → tạo articleID=110
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 508 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 508 comment cho articleID=110 (tổng tạm: 508)
  ==> Tổng cộng ghi 508 comment cho articleID=110
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T09-56-30.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-53-16.csv
Video @sotaymarcom.official/video/6969142555149618433 là mới → tạo articleID=111
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 503 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 503 comment cho articleID=111 (tổng tạm: 503)
  ==> Tổng cộng ghi 503 comment cho articleID=111
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-53-16.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-19-44.csv
Video @trendf/video/7453032993968377095 là mới → tạo articleID=112
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 353 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 353 comment cho articleID=112 (tổng tạm: 353)
  ==> Tổng cộng ghi 353 comment cho articleID=112
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-19-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-24-12.csv
Video @ngan12467/video/7282912442013863170 là mới → tạo articleID=113
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 752 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 752 comment cho articleID=113 (tổng tạm: 752)
  ==> Tổng cộng ghi 752 comment cho articleID=113
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-24-12.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T06-17-00.csv
Video @phathungvlog/video/7485683963822886162 là mới → tạo articleID=114
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 386 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 386 comment cho articleID=114 (tổng tạm: 386)
  ==> Tổng cộng ghi 386 comment cho articleID=114
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T06-17-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-13-17.csv
Video @d.dragon1712/video/7483106121528495367 là mới → tạo articleID=115
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 441 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 441 comment cho articleID=115 (tổng tạm: 441)
  ==> Tổng cộng ghi 441 comment cho articleID=115
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-13-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T04-08-51.csv
Video @loponlichsuthpt/video/7491177042839457031 là mới → tạo articleID=116
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 566 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 566 comment cho articleID=116 (tổng tạm: 566)
  ==> Tổng cộng ghi 566 comment cho articleID=116
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T04-08-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-05-56.csv
Video @topcv/video/6933186808234691841 là mới → tạo articleID=117
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 485 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 485 comment cho articleID=117 (tổng tạm: 485)
  ==> Tổng cộng ghi 485 comment cho articleID=117
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-05-56.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T16-28-03.csv
Video @hocsinhreview/video/7251854019780431109 là mới → tạo articleID=118
  Tìm thấy header comment ở dòng 58
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 494 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 494 comment cho articleID=118 (tổng tạm: 494)
  ==> Tổng cộng ghi 494 comment cho articleID=118
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T16-28-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T04-12-03.csv
Video @kinhtethongke_/video/7484153063108791560 là mới → tạo articleID=119
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 464 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 464 comment cho articleID=119 (tổng tạm: 464)
  ==> Tổng cộng ghi 464 comment cho articleID=119
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T04-12-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T15-45-34.csv
Video @thuvienphapluat.vn/video/7547665622994291985 là mới → tạo articleID=120
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 391 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 391 comment cho articleID=120 (tổng tạm: 391)
  ==> Tổng cộng ghi 391 comment cho articleID=120
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T15-45-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-59-28.csv
Video @cothuy88/video/7206297318952406299 là mới → tạo articleID=121
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 544 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 544 comment cho articleID=121 (tổng tạm: 544)
  ==> Tổng cộng ghi 544 comment cho articleID=121
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-59-28.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T02-25-47.csv
Video @daihocdunghocdaiofficial/video/7509484801762577671 là mới → tạo articleID=122
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 514 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 514 comment cho articleID=122 (tổng tạm: 514)
  ==> Tổng cộng ghi 514 comment cho articleID=122
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T02-25-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-24-24.csv
Video @dc_thanh_2/video/7523816403191794952 là mới → tạo articleID=123
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 481 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 481 comment cho articleID=123 (tổng tạm: 481)
  ==> Tổng cộng ghi 481 comment cho articleID=123
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-24-24.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T08-54-26.csv
Video @vutrunganhnghe/video/7324667269743693064 là mới → tạo articleID=124
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 462 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 462 comment cho articleID=124 (tổng tạm: 462)
  ==> Tổng cộng ghi 462 comment cho articleID=124
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T08-54-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-30-54.csv
Video @fpt.polytechnic.official/video/7355831194077990145 là mới → tạo articleID=125
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 528 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 528 comment cho articleID=125 (tổng tạm: 528)
  ==> Tổng cộng ghi 528 comment cho articleID=125
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-30-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T20-08-40.csv
Video @peanutottt/video/7517585307252821255 là mới → tạo articleID=126
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 386 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 386 comment cho articleID=126 (tổng tạm: 386)
  ==> Tổng cộng ghi 386 comment cho articleID=126
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T20-08-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-29-07.csv
Video @nga.marketing/video/6992949434015288603 là mới → tạo articleID=127
  Tìm thấy header comment ở dòng 34
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 317 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 317 comment cho articleID=127 (tổng tạm: 317)
  ==> Tổng cộng ghi 317 comment cho articleID=127
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-29-07.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T16-32-36.csv
Video @insight.saigon/video/7501255804184530218 là mới → tạo articleID=128
  Tìm thấy header comment ở dòng 23
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 364 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 364 comment cho articleID=128 (tổng tạm: 364)
  ==> Tổng cộng ghi 364 comment cho articleID=128
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T16-32-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-12-19.csv
Video @_na.vux_/video/7479754095478181138 là mới → tạo articleID=129
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 515 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 515 comment cho articleID=129 (tổng tạm: 515)
  ==> Tổng cộng ghi 515 comment cho articleID=129
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-12-19.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T05-30-00.csv
Video @thanh_dc/video/6960636958779493634 là mới → tạo articleID=130
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 450 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 450 comment cho articleID=130 (tổng tạm: 450)
  ==> Tổng cộng ghi 450 comment cho articleID=130
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T05-30-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T18-02-05.csv
Video @truonghocgenz/video/7002195462371446018 là mới → tạo articleID=131
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 443 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 443 comment cho articleID=131 (tổng tạm: 443)
  ==> Tổng cộng ghi 443 comment cho articleID=131
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T18-02-05.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-31-08.csv
Video @vnbay.net/video/7371380987869023489 là mới → tạo articleID=132
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 522 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 522 comment cho articleID=132 (tổng tạm: 522)
  ==> Tổng cộng ghi 522 comment cho articleID=132
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-31-08.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-01-29.csv
Video @nguyenphuc.bm/video/7512332022233255186 là mới → tạo articleID=133
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 399 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 399 comment cho articleID=133 (tổng tạm: 399)
  ==> Tổng cộng ghi 399 comment cho articleID=133
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-01-29.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-22-52.csv
Video @exhale.sha/video/7328340816953445637 là mới → tạo articleID=134
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 571 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 571 comment cho articleID=134 (tổng tạm: 571)
  ==> Tổng cộng ghi 571 comment cho articleID=134
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-22-52.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T07-25-56.csv
Video @biquyetdodaihoc/video/7485011541457128722 là mới → tạo articleID=135
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 413 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 413 comment cho articleID=135 (tổng tạm: 413)
  ==> Tổng cộng ghi 413 comment cho articleID=135
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T07-25-56.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-45-19.csv
Video @hocmai.official/video/7112403998958734618 là mới → tạo articleID=136
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 593 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 593 comment cho articleID=136 (tổng tạm: 593)
  ==> Tổng cộng ghi 593 comment cho articleID=136
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-45-19.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T10-48-36.csv
Video @congg_showbiz__/video/7548130267198754055 là mới → tạo articleID=137
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 510 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 510 comment cho articleID=137 (tổng tạm: 510)
  ==> Tổng cộng ghi 510 comment cho articleID=137
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T10-48-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-44-17.csv
Video @kyyeusaigon/video/7003217956901555482 là mới → tạo articleID=138
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 358 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 358 comment cho articleID=138 (tổng tạm: 358)
  ==> Tổng cộng ghi 358 comment cho articleID=138
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-44-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-08-06.csv
Video @lamgidayta.channel/video/7529134118416682248 là mới → tạo articleID=139
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 384 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 384 comment cho articleID=139 (tổng tạm: 384)
  ==> Tổng cộng ghi 384 comment cho articleID=139
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-08-06.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T08-30-04.csv
Video @tulieu.com/video/7520803018397191442 là mới → tạo articleID=140
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 366 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 366 comment cho articleID=140 (tổng tạm: 366)
  ==> Tổng cộng ghi 366 comment cho articleID=140
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T08-30-04.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-15-26.csv
Video @longshushi/video/7522091162967018760 là mới → tạo articleID=141
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 237 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 237 comment cho articleID=141 (tổng tạm: 237)
  ==> Tổng cộng ghi 237 comment cho articleID=141
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-15-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-20-42.csv
Video @thaihoa_entertainment/video/7452081522070392071 là mới → tạo articleID=142
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 322 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 322 comment cho articleID=142 (tổng tạm: 322)
  ==> Tổng cộng ghi 322 comment cho articleID=142
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-20-42.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-21T03-25-13.csv
Video @dieuhoalanggo/video/7526106344810728722 là mới → tạo articleID=143
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 365 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 365 comment cho articleID=143 (tổng tạm: 365)
  ==> Tổng cộng ghi 365 comment cho articleID=143
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-21T03-25-13.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-00-21.csv
Video @tennganthoi/video/7440125057763921168 là mới → tạo articleID=144
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 504 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 504 comment cho articleID=144 (tổng tạm: 504)
  ==> Tổng cộng ghi 504 comment cho articleID=144
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-00-21.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T01-30-26.csv
Video @tamchi1008/video/7537164615155780882 là mới → tạo articleID=145
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 320 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 320 comment cho articleID=145 (tổng tạm: 320)
  ==> Tổng cộng ghi 320 comment cho articleID=145
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T01-30-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-23T06-11-36.csv
Video @biquyetdodaihoc/video/7257393260329536774 là mới → tạo articleID=146
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 388 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 388 comment cho articleID=146 (tổng tạm: 388)
  ==> Tổng cộng ghi 388 comment cho articleID=146
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-23T06-11-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-01T04-28-18.csv
Video @biquyetdodaihoc/video/7120205593901649179 là mới → tạo articleID=147
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 425 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 425 comment cho articleID=147 (tổng tạm: 425)
  ==> Tổng cộng ghi 425 comment cho articleID=147
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-01T04-28-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-27-27.csv
Video @itstamhn/video/7353463373100633349 là mới → tạo articleID=148
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 391 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 391 comment cho articleID=148 (tổng tạm: 391)
  ==> Tổng cộng ghi 391 comment cho articleID=148
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-27-27.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T12-34-13.csv
Video @hocmai.official/video/7234505951821319429 là mới → tạo articleID=149
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 410 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 410 comment cho articleID=149 (tổng tạm: 410)
  ==> Tổng cộng ghi 410 comment cho articleID=149
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T12-34-13.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-17T05-00-25.csv
Video @nguyenminhthu.bm/video/7366926544192802066 là mới → tạo articleID=150
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 444 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 444 comment cho articleID=150 (tổng tạm: 444)
  ==> Tổng cộng ghi 444 comment cho articleID=150
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-17T05-00-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-21-25.csv
Video @tr.kin_06/video/7392595028218039560 là mới → tạo articleID=151
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 614 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 614 comment cho articleID=151 (tổng tạm: 614)
  ==> Tổng cộng ghi 614 comment cho articleID=151
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-21-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T04-46-07.csv
Video @duongdeofficial/video/7253424859521223941 là mới → tạo articleID=152
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 343 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 343 comment cho articleID=152 (tổng tạm: 343)
  ==> Tổng cộng ghi 343 comment cho articleID=152
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T04-46-07.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-21-14.csv
Video @secconews.official/video/7504935460276374802 là mới → tạo articleID=153
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 439 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 439 comment cho articleID=153 (tổng tạm: 439)
  ==> Tổng cộng ghi 439 comment cho articleID=153
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-21-14.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-45-03.csv
Video @saigonfapharma/video/7358276700955741458 là mới → tạo articleID=154
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 570 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 570 comment cho articleID=154 (tổng tạm: 570)
  ==> Tổng cộng ghi 570 comment cho articleID=154
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-45-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T04-07-56.csv
Video @beatgenz/video/7429202806650834192 là mới → tạo articleID=155
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 460 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 460 comment cho articleID=155 (tổng tạm: 460)
  ==> Tổng cộng ghi 460 comment cho articleID=155
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T04-07-56.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T02-37-13.csv
Video @dltrungquoc_top10travel/video/7406246770470046992 là mới → tạo articleID=156
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 395 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 395 comment cho articleID=156 (tổng tạm: 395)
  ==> Tổng cộng ghi 395 comment cho articleID=156
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T02-37-13.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-26-40.csv
Video @vtv24news/video/7460873670970412305 là mới → tạo articleID=157
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 313 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 313 comment cho articleID=157 (tổng tạm: 313)
  ==> Tổng cộng ghi 313 comment cho articleID=157
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-26-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-04-24.csv
Video @cobethichhoc03/video/7541674204240842002 là mới → tạo articleID=158
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 240 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 240 comment cho articleID=158 (tổng tạm: 240)
  ==> Tổng cộng ghi 240 comment cho articleID=158
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-04-24.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-16-55.csv
Video @congg_showbiz__/video/7541385871589739784 là mới → tạo articleID=159
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 339 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 339 comment cho articleID=159 (tổng tạm: 339)
  ==> Tổng cộng ghi 339 comment cho articleID=159
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-16-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-13-24.csv
Video @thuvienphapluat.vn/video/7374730329413799175 là mới → tạo articleID=160
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 327 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 327 comment cho articleID=160 (tổng tạm: 327)
  ==> Tổng cộng ghi 327 comment cho articleID=160
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-13-24.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T16-10-40.csv
Video @duhocsarang/video/7487967915417947447 là mới → tạo articleID=161
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 258 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 258 comment cho articleID=161 (tổng tạm: 258)
  ==> Tổng cộng ghi 258 comment cho articleID=161
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T16-10-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T03-34-00.csv
Video @btnmop/video/7531705466775244050 là mới → tạo articleID=162
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 273 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 273 comment cho articleID=162 (tổng tạm: 273)
  ==> Tổng cộng ghi 273 comment cho articleID=162
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T03-34-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-13-34.csv
Video @uet.vnu.edu.vn/video/7486049285914561793 là mới → tạo articleID=163
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 213 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 213 comment cho articleID=163 (tổng tạm: 213)
  ==> Tổng cộng ghi 213 comment cho articleID=163
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-13-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-13-49.csv
Video @thangtuvanduhoc/video/7347570181046127890 là mới → tạo articleID=164
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 252 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 252 comment cho articleID=164 (tổng tạm: 252)
  ==> Tổng cộng ghi 252 comment cho articleID=164
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-13-49.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T03-05-08.csv
Video @truongcaodangyduochanoi/video/7501884621752175892 là mới → tạo articleID=165
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 312 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 312 comment cho articleID=165 (tổng tạm: 312)
  ==> Tổng cộng ghi 312 comment cho articleID=165
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T03-05-08.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-24-51.csv
Video @thanh_dc/video/7193934429843229979 là mới → tạo articleID=166
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 322 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 322 comment cho articleID=166 (tổng tạm: 322)
  ==> Tổng cộng ghi 322 comment cho articleID=166
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-24-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-33-10.csv
Video @kb_cyh/video/7518658076996586759 là mới → tạo articleID=167
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 297 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 297 comment cho articleID=167 (tổng tạm: 297)
  ==> Tổng cộng ghi 297 comment cho articleID=167
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-33-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-27-08.csv
Video @nguyenphuc.bm/video/7510512847219199240 là mới → tạo articleID=168
  Tìm thấy header comment ở dòng 50
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 256 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 256 comment cho articleID=168 (tổng tạm: 256)
  ==> Tổng cộng ghi 256 comment cho articleID=168
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-27-08.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T09-25-14.csv
Video @duhocvadaotaokep/video/7267921041773579526 là mới → tạo articleID=169
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 345 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 345 comment cho articleID=169 (tổng tạm: 345)
  ==> Tổng cộng ghi 345 comment cho articleID=169
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T09-25-14.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T07-01-27.csv
Video @kristinenguyen411/video/7508317766311529736 là mới → tạo articleID=170
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 341 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 341 comment cho articleID=170 (tổng tạm: 341)
  ==> Tổng cộng ghi 341 comment cho articleID=170
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T07-01-27.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T07-56-58.csv
Video @ngocanh.buii/video/7259378106341821701 là mới → tạo articleID=171
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 266 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 266 comment cho articleID=171 (tổng tạm: 266)
  ==> Tổng cộng ghi 266 comment cho articleID=171
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T07-56-58.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-10-00.csv
Video @homenest.media/video/7392573502194191637 là mới → tạo articleID=172
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 364 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 364 comment cho articleID=172 (tổng tạm: 364)
  ==> Tổng cộng ghi 364 comment cho articleID=172
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-10-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T07-58-50.csv
Video @biquyetdodaihoc/video/7203969732330982683 là mới → tạo articleID=173
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 269 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 269 comment cho articleID=173 (tổng tạm: 269)
  ==> Tổng cộng ghi 269 comment cho articleID=173
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T07-58-50.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T07-23-34.csv
Video @biquyetdodaihoc/video/6986979543257042202 là mới → tạo articleID=174
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 282 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 282 comment cho articleID=174 (tổng tạm: 282)
  ==> Tổng cộng ghi 282 comment cho articleID=174
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T07-23-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T03-27-53.csv
Video @caothaochiase/video/7367627754726034695 là mới → tạo articleID=175
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 314 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 314 comment cho articleID=175 (tổng tạm: 314)
  ==> Tổng cộng ghi 314 comment cho articleID=175
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T03-27-53.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T15-54-10.csv
Video @arin180803/video/7388073862182882567 là mới → tạo articleID=176
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 264 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 264 comment cho articleID=176 (tổng tạm: 264)
  ==> Tổng cộng ghi 264 comment cho articleID=176
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T15-54-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T06-55-59.csv
Video @vutrunganhnghe/video/7523223544495492370 là mới → tạo articleID=177
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 337 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 337 comment cho articleID=177 (tổng tạm: 337)
  ==> Tổng cộng ghi 337 comment cho articleID=177
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T06-55-59.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-41-41.csv
Video @tuyensinhcmet/video/7545854936760732936 là mới → tạo articleID=178
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 300 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 300 comment cho articleID=178 (tổng tạm: 300)
  ==> Tổng cộng ghi 300 comment cho articleID=178
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-41-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T12-27-57.csv
Video @itstamhn/video/7350874851474738437 là mới → tạo articleID=179
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 301 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 301 comment cho articleID=179 (tổng tạm: 301)
  ==> Tổng cộng ghi 301 comment cho articleID=179
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T12-27-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-04-00.csv
Video @chuyennghegenz/video/7512488463237713170 là mới → tạo articleID=180
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 300 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 300 comment cho articleID=180 (tổng tạm: 300)
  ==> Tổng cộng ghi 300 comment cho articleID=180
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-04-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-25-40.csv
Video @tuyensinh.vietmy/video/7355503846619221256 là mới → tạo articleID=181
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 346 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 346 comment cho articleID=181 (tổng tạm: 346)
  ==> Tổng cộng ghi 346 comment cho articleID=181
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-25-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-07-58.csv
Video @nguyenminhthu.bm/video/7354334055871155463 là mới → tạo articleID=182
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 292 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 292 comment cho articleID=182 (tổng tạm: 292)
  ==> Tổng cộng ghi 292 comment cho articleID=182
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-07-58.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T11-04-03.csv
Video @itstamhn/video/7353792632188914950 là mới → tạo articleID=183
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 307 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 307 comment cho articleID=183 (tổng tạm: 307)
  ==> Tổng cộng ghi 307 comment cho articleID=183
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T11-04-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-38-49.csv
Video @duhochanquocemmanuel_/video/7520218414510542087 là mới → tạo articleID=184
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 311 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 311 comment cho articleID=184 (tổng tạm: 311)
  ==> Tổng cộng ghi 311 comment cho articleID=184
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-38-49.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-53-27.csv
Video @tonynoi.ik/video/7232534469280877830 là mới → tạo articleID=185
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 454 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 454 comment cho articleID=185 (tổng tạm: 454)
  ==> Tổng cộng ghi 454 comment cho articleID=185
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-53-27.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T07-56-38.csv
Video @toanthaybqtien/video/7129519367796100379 là mới → tạo articleID=186
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 307 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 307 comment cho articleID=186 (tổng tạm: 307)
  ==> Tổng cộng ghi 307 comment cho articleID=186
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T07-56-38.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-06-50.csv
Video @soctruyenthong/video/7541334577655237906 là mới → tạo articleID=187
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 225 comment (sau khi parse CSV)
  Đã ghi thêm 225 comment cho articleID=187 (tổng tạm: 225)
  ==> Tổng cộng ghi 225 comment cho articleID=187
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-06-50.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-10-49.csv
Video @dieuhoalanggo/video/7497199773506637057 là mới → tạo articleID=188
  Tìm thấy header comment ở dòng 17
  Header: STT,T

                                                                                

  Đã ghi thêm 265 comment cho articleID=188 (tổng tạm: 265)
  ==> Tổng cộng ghi 265 comment cho articleID=188
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-10-49.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-50-44.csv
Video @_trending_douyin/video/7459678495510187271 là mới → tạo articleID=189
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 347 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 347 comment cho articleID=189 (tổng tạm: 347)
  ==> Tổng cộng ghi 347 comment cho articleID=189
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-50-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-03-44.csv
Video @hanhtrinh120hsawithta/video/7490797151266589959 là mới → tạo articleID=190
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 234 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 234 comment cho articleID=190 (tổng tạm: 234)
  ==> Tổng cộng ghi 234 comment cho articleID=190
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-03-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-33-55.csv
Video @huhzytrn_8707/video/7541703491220196615 là mới → tạo articleID=191
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 250 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 250 comment cho articleID=191 (tổng tạm: 250)
  ==> Tổng cộng ghi 250 comment cho articleID=191
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-33-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T01-38-02.csv
Video @thayquyethuongnghiep/video/7487910693425925381 là mới → tạo articleID=192
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 240 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 240 comment cho articleID=192 (tổng tạm: 240)
  ==> Tổng cộng ghi 240 comment cho articleID=192
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T01-38-02.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-41-36.csv
Video @bachkhoahanoi_hust/video/7530460346335661320 là mới → tạo articleID=193
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 235 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 235 comment cho articleID=193 (tổng tạm: 235)
  ==> Tổng cộng ghi 235 comment cho articleID=193
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-41-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T09-03-09.csv
Video @phong280698/video/7516335207541230856 là mới → tạo articleID=194
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 235 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 235 comment cho articleID=194 (tổng tạm: 235)
  ==> Tổng cộng ghi 235 comment cho articleID=194
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T09-03-09.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T15-14-15.csv
Video @tutinvaodoi.vn/video/7525359360655101202 là mới → tạo articleID=195
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 236 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 236 comment cho articleID=195 (tổng tạm: 236)
  ==> Tổng cộng ghi 236 comment cho articleID=195
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T15-14-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-40-10.csv
Video @hoccunghai/video/7111150947161656602 là mới → tạo articleID=196
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 241 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 241 comment cho articleID=196 (tổng tạm: 241)
  ==> Tổng cộng ghi 241 comment cho articleID=196
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-40-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-01T04-33-54.csv
Video @hapvieu/video/7528771589454957842 là mới → tạo articleID=197
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 267 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 267 comment cho articleID=197 (tổng tạm: 267)
  ==> Tổng cộng ghi 267 comment cho articleID=197
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-01T04-33-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T03-08-31.csv
Video @soctruyenthong/video/7454021790910729488 là mới → tạo articleID=198
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 317 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 317 comment cho articleID=198 (tổng tạm: 317)
  ==> Tổng cộng ghi 317 comment cho articleID=198
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T03-08-31.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-33-40.csv
Video @duahaaukhonghat/video/7505656322289945876 là mới → tạo articleID=199
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 260 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 260 comment cho articleID=199 (tổng tạm: 260)
  ==> Tổng cộng ghi 260 comment cho articleID=199
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-33-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T14-34-27.csv
Video @khoaqtkd.hvpn/video/7541321115629538580 là mới → tạo articleID=200
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 277 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 277 comment cho articleID=200 (tổng tạm: 277)
  ==> Tổng cộng ghi 277 comment cho articleID=200
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T14-34-27.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-56-03.csv
Video @fb_vuthihongnhung/video/7029642983716785435 là mới → tạo articleID=201
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 197 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 197 comment cho articleID=201 (tổng tạm: 197)
  ==> Tổng cộng ghi 197 comment cho articleID=201
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-56-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T09-58-04.csv
Video @sinhvienconfession/video/7270039368515996933 là mới → tạo articleID=202
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 217 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 217 comment cho articleID=202 (tổng tạm: 217)
  ==> Tổng cộng ghi 217 comment cho articleID=202
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T09-58-04.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-25-35.csv
Video @duhochanquoccungbgc/video/7377745263319944455 là mới → tạo articleID=203
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 178 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 178 comment cho articleID=203 (tổng tạm: 178)
  ==> Tổng cộng ghi 178 comment cho articleID=203
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-25-35.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T06-50-34.csv
Video @vutrunganhnghe/video/7502405374440688904 là mới → tạo articleID=204
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 292 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 292 comment cho articleID=204 (tổng tạm: 292)
  ==> Tổng cộng ghi 292 comment cho articleID=204
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T06-50-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-51-53.csv
Video @vutrunganhnghe/video/7376096344273997064 là mới → tạo articleID=205
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 222 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 222 comment cho articleID=205 (tổng tạm: 222)
  ==> Tổng cộng ghi 222 comment cho articleID=205
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-51-53.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-17T02-14-59.csv
Video @cothuyhuongnghiep/video/7475349084027522311 là mới → tạo articleID=206
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 274 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 274 comment cho articleID=206 (tổng tạm: 274)
  ==> Tổng cộng ghi 274 comment cho articleID=206
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-17T02-14-59.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T05-36-44.csv
Video @tam_mia.93/video/7495216446893460754 là mới → tạo articleID=207
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 235 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 235 comment cho articleID=207 (tổng tạm: 235)
  ==> Tổng cộng ghi 235 comment cho articleID=207
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T05-36-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-01T04-31-18.csv
Video @dr_sam_sam/video/7541964809646984455 là mới → tạo articleID=208
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 150 comment (sau khi parse CSV)
  Đã ghi thêm 150 comment cho articleID=208 (tổng tạm: 150)
  ==> Tổng cộng ghi 150 comment cho articleID=208
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-01T04-31-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-10-42.csv
Video @hanguyenhrm/video/6947668475431243010 là mới → tạo articleID=209
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag

                                                                                

  Đã ghi thêm 234 comment cho articleID=209 (tổng tạm: 234)
  ==> Tổng cộng ghi 234 comment cho articleID=209
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-10-42.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-20-36.csv
Video @chindanai.sri/video/7377190126633471237 là mới → tạo articleID=210
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 301 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 301 comment cho articleID=210 (tổng tạm: 301)
  ==> Tổng cộng ghi 301 comment cho articleID=210
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-20-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-56-03.csv
Video @itstamhn/video/7350526961627811077 là mới → tạo articleID=211
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 205 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 205 comment cho articleID=211 (tổng tạm: 205)
  ==> Tổng cộng ghi 205 comment cho articleID=211
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-56-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-35-13.csv
Video @kyen_bngoc_2k6_bctt_ussh/video/7530172799411850503 là mới → tạo articleID=212
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 259 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 259 comment cho articleID=212 (tổng tạm: 259)
  ==> Tổng cộng ghi 259 comment cho articleID=212
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-35-13.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-17-27.csv
Video @tuyensinhfptpolytechnic/video/7527572131652242696 là mới → tạo articleID=213
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 253 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 253 comment cho articleID=213 (tổng tạm: 253)
  ==> Tổng cộng ghi 253 comment cho articleID=213
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-17-27.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-52-44.csv
Video @hayonline24h/video/6886364523549183234 là mới → tạo articleID=214
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 271 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 271 comment cho articleID=214 (tổng tạm: 271)
  ==> Tổng cộng ghi 271 comment cho articleID=214
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-52-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-44-11.csv
Video @thayquyethuongnghiep/video/7497109247155653895 là mới → tạo articleID=215
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 202 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 202 comment cho articleID=215 (tổng tạm: 202)
  ==> Tổng cộng ghi 202 comment cho articleID=215
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-44-11.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T01-00-45.csv
Video @c.gng.ri.s.vt.qua/video/7535036996822060308 là mới → tạo articleID=216
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 211 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 211 comment cho articleID=216 (tổng tạm: 211)
  ==> Tổng cộng ghi 211 comment cho articleID=216
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T01-00-45.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-21-19.csv
Video @biquyetdodaihoc/video/7120090424319954202 là mới → tạo articleID=217
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 251 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 251 comment cho articleID=217 (tổng tạm: 251)
  ==> Tổng cộng ghi 251 comment cho articleID=217
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-21-19.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T07-12-05.csv
Video @thayquyethuongnghiep/video/7392922859674373393 là mới → tạo articleID=218
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 186 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 186 comment cho articleID=218 (tổng tạm: 186)
  ==> Tổng cộng ghi 186 comment cho articleID=218
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T07-12-05.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T13-31-17.csv
Video @ruby.chuyenanh/video/7087931142690671899 là mới → tạo articleID=219
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 250 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 250 comment cho articleID=219 (tổng tạm: 250)
  ==> Tổng cộng ghi 250 comment cho articleID=219
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T13-31-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T23-04-46.csv
Video @trang.020901/video/7370985110058945810 là mới → tạo articleID=220
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 186 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 186 comment cho articleID=220 (tổng tạm: 186)
  ==> Tổng cộng ghi 186 comment cho articleID=220
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T23-04-46.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-06-15.csv
Video @hannnh_651/video/7384827978640788743 là mới → tạo articleID=221
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 211 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 211 comment cho articleID=221 (tổng tạm: 211)
  ==> Tổng cộng ghi 211 comment cho articleID=221
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-06-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T03-40-12.csv
Video @thaihoang_huongnghiep/video/6949749777537993985 là mới → tạo articleID=222
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 215 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 215 comment cho articleID=222 (tổng tạm: 215)
  ==> Tổng cộng ghi 215 comment cho articleID=222
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T03-40-12.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T03-12-40.csv
Video @itstamhn/video/7350821028085452038 là mới → tạo articleID=223
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 290 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 290 comment cho articleID=223 (tổng tạm: 290)
  ==> Tổng cộng ghi 290 comment cho articleID=223
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T03-12-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T01-51-37.csv
Video @truyenhinhhatinh/video/7443085376060787976 là mới → tạo articleID=224
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 157 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 157 comment cho articleID=224 (tổng tạm: 157)
  ==> Tổng cộng ghi 157 comment cho articleID=224
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T01-51-37.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-32-41.csv
Video @2k8hocgioilop12/video/7148812097063750939 là mới → tạo articleID=225
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 194 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 194 comment cho articleID=225 (tổng tạm: 194)
  ==> Tổng cộng ghi 194 comment cho articleID=225
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-32-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T07-09-34.csv
Video @hoanggleee/video/7386865350735875344 là mới → tạo articleID=226
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 222 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 222 comment cho articleID=226 (tổng tạm: 222)
  ==> Tổng cộng ghi 222 comment cho articleID=226
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T07-09-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-15-03.csv
Video @_chuyensinhvien/video/7518247331767061778 là mới → tạo articleID=227
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 205 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 205 comment cho articleID=227 (tổng tạm: 205)
  ==> Tổng cộng ghi 205 comment cho articleID=227
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-15-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-09-43.csv
Video @topcv/video/6942835102204398850 là mới → tạo articleID=228
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 205 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 205 comment cho articleID=228 (tổng tạm: 205)
  ==> Tổng cộng ghi 205 comment cho articleID=228
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-09-43.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T03-05-54.csv
Video @cafef_official/video/7190749487659273474 là mới → tạo articleID=229
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 264 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 264 comment cho articleID=229 (tổng tạm: 264)
  ==> Tổng cộng ghi 264 comment cho articleID=229
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T03-05-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-01-36.csv
Video @svdd.phenikaa/video/7518663915736288532 là mới → tạo articleID=230
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 227 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 227 comment cho articleID=230 (tổng tạm: 227)
  ==> Tổng cộng ghi 227 comment cho articleID=230
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-01-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-06-21.csv
Video @vutrunganhnghe/video/7338771596103912722 là mới → tạo articleID=231
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 184 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 184 comment cho articleID=231 (tổng tạm: 184)
  ==> Tổng cộng ghi 184 comment cho articleID=231
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-06-21.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T09-52-00.csv
Video @jami.fiooq/video/7543571611870317840 là mới → tạo articleID=232
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 153 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 153 comment cho articleID=232 (tổng tạm: 153)
  ==> Tổng cộng ghi 153 comment cho articleID=232
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T09-52-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-38-23.csv
Video @krumalee0/video/6989586382280822043 là mới → tạo articleID=233
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 146 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 146 comment cho articleID=233 (tổng tạm: 146)
  ==> Tổng cộng ghi 146 comment cho articleID=233
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-38-23.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-34-45.csv
Video @lamhangduong/video/6992155324501282075 là mới → tạo articleID=234
  Tìm thấy header comment ở dòng 44
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 175 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 175 comment cho articleID=234 (tổng tạm: 175)
  ==> Tổng cộng ghi 175 comment cho articleID=234
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-34-45.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T13-02-55.csv
Video @studywith_othk/video/7379129531644267792 là mới → tạo articleID=235
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 283 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 283 comment cho articleID=235 (tổng tạm: 283)
  ==> Tổng cộng ghi 283 comment cho articleID=235
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T13-02-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-43-36.csv
Video @loponlichsuthpt/video/7445626165374602504 là mới → tạo articleID=236
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 195 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 195 comment cho articleID=236 (tổng tạm: 195)
  ==> Tổng cộng ghi 195 comment cho articleID=236
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-43-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T06-45-17.csv
Video @congchuc.247/video/7449583693980617992 là mới → tạo articleID=237
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 173 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 173 comment cho articleID=237 (tổng tạm: 173)
  ==> Tổng cộng ghi 173 comment cho articleID=237
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T06-45-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T13-07-53.csv
Video @cothuy88/video/7006292400821783834 là mới → tạo articleID=238
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 295 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 295 comment cho articleID=238 (tổng tạm: 295)
  ==> Tổng cộng ghi 295 comment cho articleID=238
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T13-07-53.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-06-40.csv
Video @itstamhn/video/7481253270229372215 là mới → tạo articleID=239
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 198 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 198 comment cho articleID=239 (tổng tạm: 198)
  ==> Tổng cộng ghi 198 comment cho articleID=239
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-06-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-50-47.csv
Video @k.linhsothanlan/video/7539157584004074760 là mới → tạo articleID=240
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 184 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 184 comment cho articleID=240 (tổng tạm: 184)
  ==> Tổng cộng ghi 184 comment cho articleID=240
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-50-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-09-39.csv
Video @minboi_hoctruyenthong/video/7245266503791152390 là mới → tạo articleID=241
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 226 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 226 comment cho articleID=241 (tổng tạm: 226)
  ==> Tổng cộng ghi 226 comment cho articleID=241
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-09-39.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T10-37-45.csv
Video @thanhthuy_dieuduonglamme/video/7405354867742625041 là mới → tạo articleID=242
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 169 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 169 comment cho articleID=242 (tổng tạm: 169)
  ==> Tổng cộng ghi 169 comment cho articleID=242
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T10-37-45.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-33-00.csv
Video @chienhochanh/video/7405827177146567943 là mới → tạo articleID=243
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 196 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 196 comment cho articleID=243 (tổng tạm: 196)
  ==> Tổng cộng ghi 196 comment cho articleID=243
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-33-00.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T03-49-32.csv
Video @t1000wiki/video/7313128416532909314 là mới → tạo articleID=244
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 217 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 217 comment cho articleID=244 (tổng tạm: 217)
  ==> Tổng cộng ghi 217 comment cho articleID=244
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T03-49-32.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T02-03-03.csv
Video @emnane_/video/7479036630582529298 là mới → tạo articleID=245
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 160 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 160 comment cho articleID=245 (tổng tạm: 160)
  ==> Tổng cộng ghi 160 comment cho articleID=245
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T02-03-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-41-49.csv
Video @pun_th03/video/7312108715295984914 là mới → tạo articleID=246
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 204 comment (sau khi parse CSV)
  Đã ghi thêm 204 comment cho articleID=246 (tổng tạm: 204)
  ==> Tổng cộng ghi 204 comment cho articleID=246
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-41-49.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T13-22-43.csv
Video @dai_hoc_quoc_te_bac_ha/video/7390575298653261063 là mới → tạo articleID=247
  Tìm thấy header comment ở dòng 16
  Header: ST

                                                                                

  Đã ghi thêm 162 comment cho articleID=247 (tổng tạm: 162)
  ==> Tổng cộng ghi 162 comment cho articleID=247
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T13-22-43.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T06-53-19.csv
Video @.study_meow/video/7311684353728204040 là mới → tạo articleID=248
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 238 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 238 comment cho articleID=248 (tổng tạm: 238)
  ==> Tổng cộng ghi 238 comment cho articleID=248
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T06-53-19.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-38-58.csv
Video @luatsudrnathanle/video/7444367622461738248 là mới → tạo articleID=249
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 146 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 146 comment cho articleID=249 (tổng tạm: 146)
  ==> Tổng cộng ghi 146 comment cho articleID=249
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-38-58.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-17-58.csv
Video @lamgidayta.channel/video/7396720428980374802 là mới → tạo articleID=250
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 217 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 217 comment cho articleID=250 (tổng tạm: 217)
  ==> Tổng cộng ghi 217 comment cho articleID=250
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-17-58.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-34-24.csv
Video @cafef_official/video/7154184145885973761 là mới → tạo articleID=251
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 159 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 159 comment cho articleID=251 (tổng tạm: 159)
  ==> Tổng cộng ghi 159 comment cho articleID=251
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-34-24.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-26-13.csv
Video @travinhuniversity/video/7529829191953534226 là mới → tạo articleID=252
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 226 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 226 comment cho articleID=252 (tổng tạm: 226)
  ==> Tổng cộng ghi 226 comment cho articleID=252
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-26-13.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-28-55.csv
Video @fnewsmediaclub/video/7011362283188243738 là mới → tạo articleID=253
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 197 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 197 comment cho articleID=253 (tổng tạm: 197)
  ==> Tổng cộng ghi 197 comment cho articleID=253
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-28-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-26-16.csv
Video @thanh_dc/video/6999482929470590209 là mới → tạo articleID=254
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 216 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 216 comment cho articleID=254 (tổng tạm: 216)
  ==> Tổng cộng ghi 216 comment cho articleID=254
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T00-26-16.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-58-18.csv
Video @hayonline24h/video/6887405406369434881 là mới → tạo articleID=255
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 153 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 153 comment cho articleID=255 (tổng tạm: 153)
  ==> Tổng cộng ghi 153 comment cho articleID=255
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-58-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T07-11-15.csv
Video @thaihoa_entertainment/video/7524182856457800980 là mới → tạo articleID=256
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 130 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 130 comment cho articleID=256 (tổng tạm: 130)
  ==> Tổng cộng ghi 130 comment cho articleID=256
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T07-11-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-38-21.csv
Video @beduyhamhoc/video/7544171614779231496 là mới → tạo articleID=257
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 126 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 126 comment cho articleID=257 (tổng tạm: 126)
  ==> Tổng cộng ghi 126 comment cho articleID=257
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-38-21.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-03-37.csv
Video @up3835/video/7378015346315300097 là mới → tạo articleID=258
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 136 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 136 comment cho articleID=258 (tổng tạm: 136)
  ==> Tổng cộng ghi 136 comment cho articleID=258
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-03-37.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-12-36.csv
Video @kyyeusaigon/video/6986891744239422746 là mới → tạo articleID=259
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 166 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 166 comment cho articleID=259 (tổng tạm: 166)
  ==> Tổng cộng ghi 166 comment cho articleID=259
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-12-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T13-18-47.csv
Video @camnanggiaoducjes/video/7416347169776553224 là mới → tạo articleID=260
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 155 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 155 comment cho articleID=260 (tổng tạm: 155)
  ==> Tổng cộng ghi 155 comment cho articleID=260
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T13-18-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-27-07.csv
Video @chinhbic.89/video/7457422906038013191 là mới → tạo articleID=261
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 184 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 184 comment cho articleID=261 (tổng tạm: 184)
  ==> Tổng cộng ghi 184 comment cho articleID=261
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-27-07.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-10-08.csv
Video @hoehocnongnghiep/video/7468656402102373640 là mới → tạo articleID=262
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 146 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 146 comment cho articleID=262 (tổng tạm: 146)
  ==> Tổng cộng ghi 146 comment cho articleID=262
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-10-08.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T13-42-59.csv
Video @laikey9292/video/7413217221524196629 là mới → tạo articleID=263
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 136 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 136 comment cho articleID=263 (tổng tạm: 136)
  ==> Tổng cộng ghi 136 comment cho articleID=263
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T13-42-59.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-59-45.csv
Video @nghegiao.official/video/7547021700597026049 là mới → tạo articleID=264
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 138 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 138 comment cho articleID=264 (tổng tạm: 138)
  ==> Tổng cộng ghi 138 comment cho articleID=264
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-59-45.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T15-57-47.csv
Video @cothuy88/video/6972465547602676993 là mới → tạo articleID=265
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 163 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 163 comment cho articleID=265 (tổng tạm: 163)
  ==> Tổng cộng ghi 163 comment cho articleID=265
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T15-57-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T08-35-25.csv
Video @quang123depzai/video/7009108978076519707 là mới → tạo articleID=266
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 157 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 157 comment cho articleID=266 (tổng tạm: 157)
  ==> Tổng cộng ghi 157 comment cho articleID=266
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T08-35-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-32-38.csv
Video @hanhtrinh120hsawithta/video/7507573841896525074 là mới → tạo articleID=267
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 178 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 178 comment cho articleID=267 (tổng tạm: 178)
  ==> Tổng cộng ghi 178 comment cho articleID=267
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-32-38.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-47-41.csv
Video @thanhhang.lee/video/7331711526052564242 là mới → tạo articleID=268
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 194 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 194 comment cho articleID=268 (tổng tạm: 194)
  ==> Tổng cộng ghi 194 comment cho articleID=268
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-47-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-46-57.csv
Video @hocduongchill/video/7342504902188453140 là mới → tạo articleID=269
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 160 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 160 comment cho articleID=269 (tổng tạm: 160)
  ==> Tổng cộng ghi 160 comment cho articleID=269
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-46-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-16-31.csv
Video @bnnew99/video/7546084607192599815 là mới → tạo articleID=270
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 139 comment (sau khi parse CSV)
  Đã ghi thêm 139 comment cho articleID=270 (tổng tạm: 139)
  ==> Tổng cộng ghi 139 comment cho articleID=270
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T14-16-31.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T12-06-24.csv
Video @duhoctrungquocfastedu/video/7421727882793323784 là mới → tạo articleID=271
  Tìm thấy header comment ở dòng 16
  Header: STT,

                                                                                

  Đã ghi thêm 155 comment cho articleID=271 (tổng tạm: 155)
  ==> Tổng cộng ghi 155 comment cho articleID=271
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T12-06-24.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-59-54.csv
Video @duhoctrungquocfastedu/video/7490760393250376978 là mới → tạo articleID=272
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 172 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 172 comment cho articleID=272 (tổng tạm: 172)
  ==> Tổng cộng ghi 172 comment cho articleID=272
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-59-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-49-18.csv
Video @thayquyethuongnghiep/video/7491879047849413896 là mới → tạo articleID=273
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 237 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 237 comment cho articleID=273 (tổng tạm: 237)
  ==> Tổng cộng ghi 237 comment cho articleID=273
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-49-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-50-35.csv
Video @huongnghiepaloha/video/7517485797721918738 là mới → tạo articleID=274
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 140 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 140 comment cho articleID=274 (tổng tạm: 140)
  ==> Tổng cộng ghi 140 comment cho articleID=274
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-50-35.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T16-29-57.csv
Video @hoccunghai/video/7266094669367495954 là mới → tạo articleID=275
  Tìm thấy header comment ở dòng 21
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 143 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 143 comment cho articleID=275 (tổng tạm: 143)
  ==> Tổng cộng ghi 143 comment cho articleID=275
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T16-29-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-56-31.csv
Video @nguyenminhthu.bm/video/7381040930767392020 là mới → tạo articleID=276
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 245 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 245 comment cho articleID=276 (tổng tạm: 245)
  ==> Tổng cộng ghi 245 comment cho articleID=276
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-56-31.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T13-25-35.csv
Video @mclass.official/video/7453818859452108050 là mới → tạo articleID=277
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 162 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 162 comment cho articleID=277 (tổng tạm: 162)
  ==> Tổng cộng ghi 162 comment cho articleID=277
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T13-25-35.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T11-36-56.csv
Video @biquyetdodaihoc/video/7079034713955962138 là mới → tạo articleID=278
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 171 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 171 comment cho articleID=278 (tổng tạm: 171)
  ==> Tổng cộng ghi 171 comment cho articleID=278
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-16T11-36-56.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-58-34.csv
Video @cepluyenthiquandoi/video/7533092387376074002 là mới → tạo articleID=279
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 215 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 215 comment cho articleID=279 (tổng tạm: 215)
  ==> Tổng cộng ghi 215 comment cho articleID=279
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-58-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T06-25-29.csv
Video @chuyennhasonglinh/video/7541356881827204360 là mới → tạo articleID=280
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 84 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 84 comment cho articleID=280 (tổng tạm: 84)
  ==> Tổng cộng ghi 84 comment cho articleID=280
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T06-25-29.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-37-36.csv
Video @homenest.media/video/7417040994778025217 là mới → tạo articleID=281
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 255 comment (sau khi parse CSV)
  Đã ghi thêm 255 comment cho articleID=281 (tổng tạm: 255)
  ==> Tổng cộng ghi 255 comment cho articleID=281
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-37-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T13-33-36.csv
Video @thaodan_podcast/video/7503770466260159752 là mới → tạo articleID=282
  Tìm thấy header comment ở dòng 17
  Header: STT,Tê

                                                                                

  Đã ghi thêm 176 comment cho articleID=282 (tổng tạm: 176)
  ==> Tổng cộng ghi 176 comment cho articleID=282
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T13-33-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T16-02-11.csv
Video @linhobackinhtq/video/7380714365961391376 là mới → tạo articleID=283
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 155 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 155 comment cho articleID=283 (tổng tạm: 155)
  ==> Tổng cộng ghi 155 comment cho articleID=283
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T16-02-11.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-31-14.csv
Video @tienganhkhovaiii/video/7543205686738554120 là mới → tạo articleID=284
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 227 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 227 comment cho articleID=284 (tổng tạm: 227)
  ==> Tổng cộng ghi 227 comment cho articleID=284
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-31-14.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-19-01.csv
Video @dedacademyy/video/7407019106978778376 là mới → tạo articleID=285
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 141 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 141 comment cho articleID=285 (tổng tạm: 141)
  ==> Tổng cộng ghi 141 comment cho articleID=285
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-19-01.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-50-46.csv
Video @peanutottt/video/7086064828254702874 là mới → tạo articleID=286
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 135 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 135 comment cho articleID=286 (tổng tạm: 135)
  ==> Tổng cộng ghi 135 comment cho articleID=286
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-50-46.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T06-27-15.csv
Video @luongandy01/video/7398340228924050696 là mới → tạo articleID=287
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 127 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 127 comment cho articleID=287 (tổng tạm: 127)
  ==> Tổng cộng ghi 127 comment cho articleID=287
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T06-27-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-50-11.csv
Video @duytanuni/video/7145403885388139803 là mới → tạo articleID=288
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 172 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 172 comment cho articleID=288 (tổng tạm: 172)
  ==> Tổng cộng ghi 172 comment cho articleID=288
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-50-11.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-08-35.csv
Video @vutrunganhnghe/video/7331344477359033608 là mới → tạo articleID=289
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 161 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 161 comment cho articleID=289 (tổng tạm: 161)
  ==> Tổng cộng ghi 161 comment cho articleID=289
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-08-35.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-08-46.csv
Video @thaihoang_huongnghiep/video/6972144327904595201 là mới → tạo articleID=290
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 220 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 220 comment cho articleID=290 (tổng tạm: 220)
  ==> Tổng cộng ghi 220 comment cho articleID=290
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-08-46.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-59-50.csv
Video @xoen7952/video/7526025251440889096 là mới → tạo articleID=291
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 133 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 133 comment cho articleID=291 (tổng tạm: 133)
  ==> Tổng cộng ghi 133 comment cho articleID=291
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T01-59-50.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-32-38.csv
Video @mong.hust/video/7452964579191082258 là mới → tạo articleID=292
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 223 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 223 comment cho articleID=292 (tổng tạm: 223)
  ==> Tổng cộng ghi 223 comment cho articleID=292
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-32-38.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-41-36.csv
Video @vutrunganhnghe/video/7326888905611988232 là mới → tạo articleID=293
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 153 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 153 comment cho articleID=293 (tổng tạm: 153)
  ==> Tổng cộng ghi 153 comment cho articleID=293
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-41-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-03-51.csv
Video @cogangmoingay14/video/7529784880461303048 là mới → tạo articleID=294
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 146 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 146 comment cho articleID=294 (tổng tạm: 146)
  ==> Tổng cộng ghi 146 comment cho articleID=294
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-03-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-18-12.csv
Video @vutrunganhnghe/video/7380542879053188359 là mới → tạo articleID=295
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 146 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 146 comment cho articleID=295 (tổng tạm: 146)
  ==> Tổng cộng ghi 146 comment cho articleID=295
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-18-12.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T03-16-29.csv
Video @ezi.english.official/video/7124655076408315163 là mới → tạo articleID=296
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 150 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 150 comment cho articleID=296 (tổng tạm: 150)
  ==> Tổng cộng ghi 150 comment cho articleID=296
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T03-16-29.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-54-19.csv
Video @peanutottt/video/7035213000944422146 là mới → tạo articleID=297
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 154 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 154 comment cho articleID=297 (tổng tạm: 154)
  ==> Tổng cộng ghi 154 comment cho articleID=297
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-54-19.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-21-38.csv
Video @fpt.polytechnic.official/video/6998848023765798170 là mới → tạo articleID=298
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 140 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 140 comment cho articleID=298 (tổng tạm: 140)
  ==> Tổng cộng ghi 140 comment cho articleID=298
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-21-38.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-45-57.csv
Video @ngltdat/video/7546815855707901202 là mới → tạo articleID=299
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 153 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 153 comment cho articleID=299 (tổng tạm: 153)
  ==> Tổng cộng ghi 153 comment cho articleID=299
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-45-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-30-52.csv
Video @itstamhn/video/7383932236912987398 là mới → tạo articleID=300
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 129 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 129 comment cho articleID=300 (tổng tạm: 129)
  ==> Tổng cộng ghi 129 comment cho articleID=300
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-30-52.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T20-30-50.csv
Video @landoanhr/video/6983268331721657626 là mới → tạo articleID=301
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 125 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 125 comment cho articleID=301 (tổng tạm: 125)
  ==> Tổng cộng ghi 125 comment cho articleID=301
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T20-30-50.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-38-57.csv
Video @dvnneu/video/6969188178263608577 là mới → tạo articleID=302
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 204 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 204 comment cho articleID=302 (tổng tạm: 204)
  ==> Tổng cộng ghi 204 comment cho articleID=302
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-38-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-18-42.csv
Video @insightnghean/video/7503914099282038024 là mới → tạo articleID=303
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 167 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 167 comment cho articleID=303 (tổng tạm: 167)
  ==> Tổng cộng ghi 167 comment cho articleID=303
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-18-42.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-45-10.csv
Video @toptphcm/video/6932718929835986178 là mới → tạo articleID=304
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 219 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 219 comment cho articleID=304 (tổng tạm: 219)
  ==> Tổng cộng ghi 219 comment cho articleID=304
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-45-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-10-34.csv
Video @tutinvaodoi.vn/video/7381122537033387280 là mới → tạo articleID=305
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 118 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 118 comment cho articleID=305 (tổng tạm: 118)
  ==> Tổng cộng ghi 118 comment cho articleID=305
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T05-10-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-17T03-54-39.csv
Video @vutrunganhnghe/video/7507618100959841543 là mới → tạo articleID=306
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 158 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 158 comment cho articleID=306 (tổng tạm: 158)
  ==> Tổng cộng ghi 158 comment cho articleID=306
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-17T03-54-39.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-37-49.csv
Video @echos.reporter/video/7231411912162987269 là mới → tạo articleID=307
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 142 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 142 comment cho articleID=307 (tổng tạm: 142)
  ==> Tổng cộng ghi 142 comment cho articleID=307
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-37-49.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T06-50-03.csv
Video @glintsvn/video/7366485281891028240 là mới → tạo articleID=308
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 133 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 133 comment cho articleID=308 (tổng tạm: 133)
  ==> Tổng cộng ghi 133 comment cho articleID=308
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T06-50-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-32-58.csv
Video @cothuy88/video/7200347521141542170 là mới → tạo articleID=309
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 140 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 140 comment cho articleID=309 (tổng tạm: 140)
  ==> Tổng cộng ghi 140 comment cho articleID=309
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-32-58.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-31-16.csv
Video @hanne04121999/video/7502033835899587848 là mới → tạo articleID=310
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 129 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 129 comment cho articleID=310 (tổng tạm: 129)
  ==> Tổng cộng ghi 129 comment cho articleID=310
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-31-16.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T14-14-50.csv
Video @55dhxaydunghanoi/video/7270474414926368006 là mới → tạo articleID=311
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 133 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 133 comment cho articleID=311 (tổng tạm: 133)
  ==> Tổng cộng ghi 133 comment cho articleID=311
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T14-14-50.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-36-06.csv
Video @hieudayyzz/video/7391109382341152007 là mới → tạo articleID=312
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 226 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 226 comment cho articleID=312 (tổng tạm: 226)
  ==> Tổng cộng ghi 226 comment cho articleID=312
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-36-06.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T03-15-05.csv
Video @yiyeon.2/video/7485250200693378312 là mới → tạo articleID=313
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 166 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 166 comment cho articleID=313 (tổng tạm: 166)
  ==> Tổng cộng ghi 166 comment cho articleID=313
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T03-15-05.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-43-21.csv
Video @peanutottt/video/7541719971303361810 là mới → tạo articleID=314
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 203 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 203 comment cho articleID=314 (tổng tạm: 203)
  ==> Tổng cộng ghi 203 comment cho articleID=314
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-43-21.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-31-19.csv
Video @ttplife/video/7378876005232037138 là mới → tạo articleID=315
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 134 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 134 comment cho articleID=315 (tổng tạm: 134)
  ==> Tổng cộng ghi 134 comment cho articleID=315
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-31-19.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-05-55.csv
Video @huydao/video/7533270583900081416 là mới → tạo articleID=316
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 131 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 131 comment cho articleID=316 (tổng tạm: 131)
  ==> Tổng cộng ghi 131 comment cho articleID=316
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-05-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T13-00-12.csv
Video @dieuhoalanggo/video/7280849940719471880 là mới → tạo articleID=317
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 190 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 190 comment cho articleID=317 (tổng tạm: 190)
  ==> Tổng cộng ghi 190 comment cho articleID=317
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T13-00-12.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-41-06.csv
Video @thaytrungnguyen/video/7397266649868520725 là mới → tạo articleID=318
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 176 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 176 comment cho articleID=318 (tổng tạm: 176)
  ==> Tổng cộng ghi 176 comment cho articleID=318
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-41-06.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-14-33.csv
Video @ngosylan97/video/7545309928462748946 là mới → tạo articleID=319
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 159 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 159 comment cho articleID=319 (tổng tạm: 159)
  ==> Tổng cộng ghi 159 comment cho articleID=319
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-14-33.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-09-22.csv
Video @biquyetdodaihoc/video/7139757410834566426 là mới → tạo articleID=320
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 108 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 108 comment cho articleID=320 (tổng tạm: 108)
  ==> Tổng cộng ghi 108 comment cho articleID=320
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T00-09-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-39-36.csv
Video @nvt95/video/7548063969794149650 là mới → tạo articleID=321
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 92 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 92 comment cho articleID=321 (tổng tạm: 92)
  ==> Tổng cộng ghi 92 comment cho articleID=321
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T00-39-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T05-54-33.csv
Video @truonghoitruong01/video/7468962133334707474 là mới → tạo articleID=322
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 98 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 98 comment cho articleID=322 (tổng tạm: 98)
  ==> Tổng cộng ghi 98 comment cho articleID=322
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T05-54-33.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-11-11.csv
Video @kts.dinhhoa/video/7525504136931200274 là mới → tạo articleID=323
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 107 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 107 comment cho articleID=323 (tổng tạm: 107)
  ==> Tổng cộng ghi 107 comment cho articleID=323
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-11-11.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T10-09-57.csv
Video @dotiensinh90/video/7545901495565159688 là mới → tạo articleID=324
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 135 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 135 comment cho articleID=324 (tổng tạm: 135)
  ==> Tổng cộng ghi 135 comment cho articleID=324
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T10-09-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-05-37.csv
Video @lil..nguyn/video/7470987542200880402 là mới → tạo articleID=325
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 107 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 107 comment cho articleID=325 (tổng tạm: 107)
  ==> Tổng cộng ghi 107 comment cho articleID=325
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-05-37.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-08-22.csv
Video @huydao/video/7050319357511027969 là mới → tạo articleID=326
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 91 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 91 comment cho articleID=326 (tổng tạm: 91)
  ==> Tổng cộng ghi 91 comment cho articleID=326
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T05-08-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-03-10.csv
Video @caodangyduocpasteur/video/7519914700776197384 là mới → tạo articleID=327
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 108 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 108 comment cho articleID=327 (tổng tạm: 108)
  ==> Tổng cộng ghi 108 comment cho articleID=327
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-03-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T17-29-32.csv
Video @daihoccongnghedonga/video/7261126444653268225 là mới → tạo articleID=328
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 129 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 129 comment cho articleID=328 (tổng tạm: 129)
  ==> Tổng cộng ghi 129 comment cho articleID=328
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T17-29-32.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T14-07-10.csv
Video @phannhatnam.ceo/video/6863690315665100034 là mới → tạo articleID=329
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 119 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 119 comment cho articleID=329 (tổng tạm: 119)
  ==> Tổng cộng ghi 119 comment cho articleID=329
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T14-07-10.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-46-25.csv
Video @chienhochanh/video/7407678376619609352 là mới → tạo articleID=330
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 91 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 91 comment cho articleID=330 (tổng tạm: 91)
  ==> Tổng cộng ghi 91 comment cho articleID=330
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-46-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-52-51.csv
Video @nguyenminhthu.bm/video/7356498975756717320 là mới → tạo articleID=331
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 117 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 117 comment cho articleID=331 (tổng tạm: 117)
  ==> Tổng cộng ghi 117 comment cho articleID=331
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T04-52-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-24-07.csv
Video @kimthao19/video/7519502769728785672 là mới → tạo articleID=332
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 101 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 101 comment cho articleID=332 (tổng tạm: 101)
  ==> Tổng cộng ghi 101 comment cho articleID=332
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-24-07.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-21T03-54-34.csv
Video @cobelogistics/video/7257127314713087238 là mới → tạo articleID=333
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 136 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 136 comment cho articleID=333 (tổng tạm: 136)
  ==> Tổng cộng ghi 136 comment cho articleID=333
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-21T03-54-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T12-28-39.csv
Video @thanhdong.edu.vn/video/7489833452250991890 là mới → tạo articleID=334
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 82 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 82 comment cho articleID=334 (tổng tạm: 82)
  ==> Tổng cộng ghi 82 comment cho articleID=334
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T12-28-39.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-42-25.csv
Video @chng.no.ht.khng.i73/video/7510819051648716039 là mới → tạo articleID=335
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 151 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 151 comment cho articleID=335 (tổng tạm: 151)
  ==> Tổng cộng ghi 151 comment cho articleID=335
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-42-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-46-16.csv
Video @top723071999/video/7103138503155895579 là mới → tạo articleID=336
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 173 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 173 comment cho articleID=336 (tổng tạm: 173)
  ==> Tổng cộng ghi 173 comment cho articleID=336
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T12-46-16.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-12-46.csv
Video @roger.thanhcong/video/7511253623003696391 là mới → tạo articleID=337
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 109 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 109 comment cho articleID=337 (tổng tạm: 109)
  ==> Tổng cộng ghi 109 comment cho articleID=337
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-12-46.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T06-35-20.csv
Video @vnbay.net/video/7432259197506424072 là mới → tạo articleID=338
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 136 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 136 comment cho articleID=338 (tổng tạm: 136)
  ==> Tổng cộng ghi 136 comment cho articleID=338
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-11T06-35-20.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-02-15.csv
Video @sinhvienconfession/video/7270596973382700294 là mới → tạo articleID=339
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 151 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 151 comment cho articleID=339 (tổng tạm: 151)
  ==> Tổng cộng ghi 151 comment cho articleID=339
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-02-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T18-42-39.csv
Video @astuhw9/video/7229289997269060870 là mới → tạo articleID=340
  Tìm thấy header comment ở dòng 40
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 106 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 106 comment cho articleID=340 (tổng tạm: 106)
  ==> Tổng cộng ghi 106 comment cho articleID=340
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T18-42-39.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T10-13-02.csv
Video @blogtamsu.cntt/video/7150853393509125377 là mới → tạo articleID=341
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 118 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 118 comment cho articleID=341 (tổng tạm: 118)
  ==> Tổng cộng ghi 118 comment cho articleID=341
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T10-13-02.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T03-52-22.csv
Video @hocynenngungon/video/7400376921659362568 là mới → tạo articleID=342
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 108 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 108 comment cho articleID=342 (tổng tạm: 108)
  ==> Tổng cộng ghi 108 comment cho articleID=342
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T03-52-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T15-12-59.csv
Video @quyttw.03/video/7529041233365191943 là mới → tạo articleID=343
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 135 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 135 comment cho articleID=343 (tổng tạm: 135)
  ==> Tổng cộng ghi 135 comment cho articleID=343
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T15-12-59.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-26-33.csv
Video @vtv24news/video/7100081403127221505 là mới → tạo articleID=344
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 118 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 118 comment cho articleID=344 (tổng tạm: 118)
  ==> Tổng cộng ghi 118 comment cho articleID=344
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-26-33.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-23T11-19-18.csv
Video @coachduynguyenofficial/video/7449645650981031188 là mới → tạo articleID=345
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 129 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 129 comment cho articleID=345 (tổng tạm: 129)
  ==> Tổng cộng ghi 129 comment cho articleID=345
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-23T11-19-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T13-31-13.csv
Video @nghiembaoanh/video/7525445830317329671 là mới → tạo articleID=346
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 109 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 109 comment cho articleID=346 (tổng tạm: 109)
  ==> Tổng cộng ghi 109 comment cho articleID=346
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T13-31-13.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T01-32-54.csv
Video @biquyetdodaihoc/video/7386694190433963282 là mới → tạo articleID=347
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 103 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 103 comment cho articleID=347 (tổng tạm: 103)
  ==> Tổng cộng ghi 103 comment cho articleID=347
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-22T01-32-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-34-25.csv
Video @hng.ht.skincare/video/7531992196178791688 là mới → tạo articleID=348
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 84 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 84 comment cho articleID=348 (tổng tạm: 84)
  ==> Tổng cộng ghi 84 comment cho articleID=348
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T07-34-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-09-28.csv
Video @nguyenha10.6/video/7187016646488378651 là mới → tạo articleID=349
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 175 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 175 comment cho articleID=349 (tổng tạm: 175)
  ==> Tổng cộng ghi 175 comment cho articleID=349
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-09-28.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T06-13-41.csv
Video @dangnhung1409/video/6846563619224800514 là mới → tạo articleID=350
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 118 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 118 comment cho articleID=350 (tổng tạm: 118)
  ==> Tổng cộng ghi 118 comment cho articleID=350
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T06-13-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-27-03.csv
Video @duhocngheduchuongsudwn/video/7518619273003044103 là mới → tạo articleID=351
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 78 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 78 comment cho articleID=351 (tổng tạm: 78)
  ==> Tổng cộng ghi 78 comment cho articleID=351
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T00-27-03.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-24T05-04-48.csv
Video @mai_anh_dao_1702/video/7491395257884593415 là mới → tạo articleID=352
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 117 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 117 comment cho articleID=352 (tổng tạm: 117)
  ==> Tổng cộng ghi 117 comment cho articleID=352
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-24T05-04-48.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-20-47.csv
Video @long.tr58/video/7525122001690807559 là mới → tạo articleID=353
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 78 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 78 comment cho articleID=353 (tổng tạm: 78)
  ==> Tổng cộng ghi 78 comment cho articleID=353
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-20-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-41-55.csv
Video @vutrunganhnghe/video/7343583995109625106 là mới → tạo articleID=354
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 105 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 105 comment cho articleID=354 (tổng tạm: 105)
  ==> Tổng cộng ghi 105 comment cho articleID=354
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-13T08-41-55.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-39-48.csv
Video @hvtaichinh.aof/video/7524298985603861778 là mới → tạo articleID=355
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 86 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 86 comment cho articleID=355 (tổng tạm: 86)
  ==> Tổng cộng ghi 86 comment cho articleID=355
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-39-48.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T04-17-25.csv
Video @channuoithuy/video/7320933390893501704 là mới → tạo articleID=356
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 100 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 100 comment cho articleID=356 (tổng tạm: 100)
  ==> Tổng cộng ghi 100 comment cho articleID=356
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T04-17-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-01-56.csv
Video @caodangquoctetphcm1/video/7501697432980327688 là mới → tạo articleID=357
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 87 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 87 comment cho articleID=357 (tổng tạm: 87)
  ==> Tổng cộng ghi 87 comment cho articleID=357
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-01-56.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-27-34.csv
Video @alochrisnghe/video/7280508899038334215 là mới → tạo articleID=358
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 105 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 105 comment cho articleID=358 (tổng tạm: 105)
  ==> Tổng cộng ghi 105 comment cho articleID=358
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T06-27-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T11-46-58.csv
Video @hcmue.longan/video/7541594927512276232 là mới → tạo articleID=359
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 84 comment (sau khi parse CSV)
  Đã ghi thêm 84 comment cho articleID=359 (tổng tạm: 84)
  ==> Tổng cộng ghi 84 comment cho articleID=359
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T11-46-58.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-26-56.csv
Video @ph_ngocnga/video/7517641068893031698 là mới → tạo articleID=360
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tê

                                                                                

  Đã ghi thêm 95 comment cho articleID=360 (tổng tạm: 95)
  ==> Tổng cộng ghi 95 comment cho articleID=360
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T16-26-56.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T10-35-47.csv
Video @giang54379/video/7407252303637531912 là mới → tạo articleID=361
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 94 comment (sau khi parse CSV)
  Đã ghi thêm 94 comment cho articleID=361 (tổng tạm: 94)
  ==> Tổng cộng ghi 94 comment cho articleID=361
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T10-35-47.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T18-04-11.csv
Video @hrglobal_vieclamduc/video/7373958810739789074 là mới → tạo articleID=362
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Ta

                                                                                

  Đã ghi thêm 94 comment cho articleID=362 (tổng tạm: 94)
  ==> Tổng cộng ghi 94 comment cho articleID=362
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T18-04-11.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-29-17.csv
Video @duhocbic.net/video/7516496822760688914 là mới → tạo articleID=363
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 133 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 133 comment cho articleID=363 (tổng tạm: 133)
  ==> Tổng cộng ghi 133 comment cho articleID=363
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-29-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T01-38-48.csv
Video @yentran941999/video/7018514613138656538 là mới → tạo articleID=364
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 112 comment (sau khi parse CSV)
  Đã ghi thêm 112 comment cho articleID=364 (tổng tạm: 112)
  ==> Tổng cộng ghi 112 comment cho articleID=364
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T01-38-48.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-38-41.csv
Video @educational000/video/7332338765312134408 là mới → tạo articleID=365
  Tìm thấy header comment ở dòng 16
  Header: STT,T

                                                                                

  Đã ghi thêm 75 comment cho articleID=365 (tổng tạm: 75)
  ==> Tổng cộng ghi 75 comment cho articleID=365
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-38-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-16-07.csv
Video @mc_leminh/video/7476400550590926098 là mới → tạo articleID=366
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 143 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 143 comment cho articleID=366 (tổng tạm: 143)
  ==> Tổng cộng ghi 143 comment cho articleID=366
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T05-16-07.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T12-43-26.csv
Video @kenh14official/video/7548461098547121415 là mới → tạo articleID=367
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 111 comment (sau khi parse CSV)
  Đã ghi thêm 111 comment cho articleID=367 (tổng tạm: 111)
  ==> Tổng cộng ghi 111 comment cho articleID=367
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-27T12-43-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-53-40.csv
Video @nguyenphuc.bm/video/7525347903259348232 là mới → tạo articleID=368
  Tìm thấy header comment ở dòng 16
  Header: STT,T

                                                                                

  Đã ghi thêm 87 comment cho articleID=368 (tổng tạm: 87)
  ==> Tổng cộng ghi 87 comment cho articleID=368
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-53-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-08-34.csv
Video @ha_thiii/video/7542025359751924999 là mới → tạo articleID=369
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 98 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 98 comment cho articleID=369 (tổng tạm: 98)
  ==> Tổng cộng ghi 98 comment cho articleID=369
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-08-34.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-24T05-39-08.csv
Video @thayqueo/video/7532521800098401557 là mới → tạo articleID=370
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 77 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 77 comment cho articleID=370 (tổng tạm: 77)
  ==> Tổng cộng ghi 77 comment cho articleID=370
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-24T05-39-08.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T23-40-36.csv
Video @thaihoang_huongnghiep/video/6981666374984731930 là mới → tạo articleID=371
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 143 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 143 comment cho articleID=371 (tổng tạm: 143)
  ==> Tổng cộng ghi 143 comment cho articleID=371
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-04T23-40-36.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-41-37.csv
Video @thaihoang_huongnghiep/video/7445151292143570194 là mới → tạo articleID=372
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 100 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 100 comment cho articleID=372 (tổng tạm: 100)
  ==> Tổng cộng ghi 100 comment cho articleID=372
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-41-37.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-38-49.csv
Video @mc_leminh/video/7507296932201532680 là mới → tạo articleID=373
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 88 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 88 comment cho articleID=373 (tổng tạm: 88)
  ==> Tổng cộng ghi 88 comment cho articleID=373
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T02-38-49.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-17-52.csv
Video @afamilyngaylucnay/video/7526470637745982721 là mới → tạo articleID=374
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 154 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 154 comment cho articleID=374 (tổng tạm: 154)
  ==> Tổng cộng ghi 154 comment cho articleID=374
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T10-17-52.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-19T10-10-15.csv
Video @chienhochanh/video/7504244644998384897 là mới → tạo articleID=375
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 92 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 92 comment cho articleID=375 (tổng tạm: 92)
  ==> Tổng cộng ghi 92 comment cho articleID=375
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-19T10-10-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-27-52.csv
Video @inher30ss/video/7484290956754308359 là mới → tạo articleID=376
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 107 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 107 comment cho articleID=376 (tổng tạm: 107)
  ==> Tổng cộng ghi 107 comment cho articleID=376
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-27-52.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-45-26.csv
Video @vutrunganhnghe/video/7393161429362216200 là mới → tạo articleID=377
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 159 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 159 comment cho articleID=377 (tổng tạm: 159)
  ==> Tổng cộng ghi 159 comment cho articleID=377
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-45-26.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-41-42.csv
Video @xuanlam_jp/video/7120957047679585562 là mới → tạo articleID=378
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 140 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 140 comment cho articleID=378 (tổng tạm: 140)
  ==> Tổng cộng ghi 140 comment cho articleID=378
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-41-42.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T01-03-40.csv
Video @thayquyethuongnghiep/video/7470020362756033810 là mới → tạo articleID=379
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 72 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 72 comment cho articleID=379 (tổng tạm: 72)
  ==> Tổng cộng ghi 72 comment cho articleID=379
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T01-03-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-22T13-24-51.csv
Video @vutrunganhnghe/video/7501662695511330055 là mới → tạo articleID=380
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 112 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 112 comment cho articleID=380 (tổng tạm: 112)
  ==> Tổng cộng ghi 112 comment cho articleID=380
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-22T13-24-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-44-31.csv
Video @vutrunganhnghe/video/7481999853967445256 là mới → tạo articleID=381
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 103 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 103 comment cho articleID=381 (tổng tạm: 103)
  ==> Tổng cộng ghi 103 comment cho articleID=381
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T18-44-31.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T11-13-51.csv
Video @caodangquoctehanoi/video/6997384864219680027 là mới → tạo articleID=382
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 89 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 89 comment cho articleID=382 (tổng tạm: 89)
  ==> Tổng cộng ghi 89 comment cho articleID=382
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-28T11-13-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T09-58-44.csv
Video @nmd.256/video/7507146597445242119 là mới → tạo articleID=383
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 85 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 85 comment cho articleID=383 (tổng tạm: 85)
  ==> Tổng cộng ghi 85 comment cho articleID=383
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T09-58-44.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-46-29.csv
Video @chcftu/video/6977723133193194753 là mới → tạo articleID=384
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 98 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 98 comment cho articleID=384 (tổng tạm: 98)
  ==> Tổng cộng ghi 98 comment cho articleID=384
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-46-29.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-36-42.csv
Video @_n.lzy/video/7080109543694421274 là mới → tạo articleID=385
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 93 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 93 comment cho articleID=385 (tổng tạm: 93)
  ==> Tổng cộng ghi 93 comment cho articleID=385
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T06-36-42.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-46-46.csv
Video @jennngx/video/7542143721316306194 là mới → tạo articleID=386
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 67 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 67 comment cho articleID=386 (tổng tạm: 67)
  ==> Tổng cộng ghi 67 comment cho articleID=386
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-46-46.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-47-18.csv
Video @daihocdunghocdaiofficial/video/7361662969366842640 là mới → tạo articleID=387
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 83 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 83 comment cho articleID=387 (tổng tạm: 83)
  ==> Tổng cộng ghi 83 comment cho articleID=387
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T22-47-18.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T06-30-50.csv
Video @cafef_official/video/7530228400431041809 là mới → tạo articleID=388
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 86 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 86 comment cho articleID=388 (tổng tạm: 86)
  ==> Tổng cộng ghi 86 comment cho articleID=388
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T06-30-50.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T07-48-54.csv
Video @cepdgnlcand.cep/video/7458558566757059847 là mới → tạo articleID=389
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 89 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 89 comment cho articleID=389 (tổng tạm: 89)
  ==> Tổng cộng ghi 89 comment cho articleID=389
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-14T07-48-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T09-04-25.csv
Video @trusochinhcaodangyhanoi/video/7392882014728293640 là mới → tạo articleID=390
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 83 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 83 comment cho articleID=390 (tổng tạm: 83)
  ==> Tổng cộng ghi 83 comment cho articleID=390
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T09-04-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-17-20.csv
Video @hayonline24h/video/6883397273997397250 là mới → tạo articleID=391
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 84 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 84 comment cho articleID=391 (tổng tạm: 84)
  ==> Tổng cộng ghi 84 comment cho articleID=391
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-17-20.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-19-40.csv
Video @covuthimaiphuong/video/7541371632909126933 là mới → tạo articleID=392
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 143 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 143 comment cho articleID=392 (tổng tạm: 143)
  ==> Tổng cộng ghi 143 comment cho articleID=392
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T10-19-40.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-29-41.csv
Video @gtr_ang/video/7544931718323653904 là mới → tạo articleID=393
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 145 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 145 comment cho articleID=393 (tổng tạm: 145)
  ==> Tổng cộng ghi 145 comment cho articleID=393
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-29-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T23-35-32.csv
Video @hotbachkhoa/video/7509512537218485511 là mới → tạo articleID=394
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 83 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 83 comment cho articleID=394 (tổng tạm: 83)
  ==> Tổng cộng ghi 83 comment cho articleID=394
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T23-35-32.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-52-53.csv
Video @quan.log/video/7482288381276294408 là mới → tạo articleID=395
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 75 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 75 comment cho articleID=395 (tổng tạm: 75)
  ==> Tổng cộng ghi 75 comment cho articleID=395
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T20-52-53.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T13-00-17.csv
Video @biquyetdodaihoc/video/7393578512675867911 là mới → tạo articleID=396
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 96 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 96 comment cho articleID=396 (tổng tạm: 96)
  ==> Tổng cộng ghi 96 comment cho articleID=396
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T13-00-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-10-51.csv
Video @toptphcm/video/6932834955022060802 là mới → tạo articleID=397
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 88 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 88 comment cho articleID=397 (tổng tạm: 88)
  ==> Tổng cộng ghi 88 comment cho articleID=397
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-10-51.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-12-17.csv
Video @congnghe.blogtamsu/video/7144162538811444482 là mới → tạo articleID=398
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 131 comment (sau khi parse CSV)
  Đã ghi thêm 131 comment cho articleID=398 (tổng tạm: 131)
  ==> Tổng cộng ghi 131 comment cho articleID=398
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-05T11-12-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-12-28.csv
Video @biquyetdodaihoc/video/7255914264995630341 là mới → tạo articleID=399
  Tìm thấy header comment ở dòng 17
  Header: ST

                                                                                

  Đã ghi thêm 99 comment cho articleID=399 (tổng tạm: 99)
  ==> Tổng cộng ghi 99 comment cho articleID=399
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T10-12-28.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-24-54.csv
Video @mong.hust/video/7450701751331638535 là mới → tạo articleID=400


                                                                                

  Tìm thấy header comment ở dòng 48
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 81 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 81 comment cho articleID=400 (tổng tạm: 81)
  ==> Tổng cộng ghi 81 comment cho articleID=400
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T17-24-54.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-35-05.csv
Video @ifi.khoaqtpn/video/7395122375462882567 là mới → tạo articleID=401
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 129 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 129 comment cho articleID=401 (tổng tạm: 129)
  ==> Tổng cộng ghi 129 comment cho articleID=401
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-35-05.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-01-02.csv
Video @huflit.official/video/7529739362553072916 là mới → tạo articleID=402
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 140 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 140 comment cho articleID=402 (tổng tạm: 140)
  ==> Tổng cộng ghi 140 comment cho articleID=402
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T12-01-02.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-06-41.csv
Video @hayonline24h/video/6888593744493382914 là mới → tạo articleID=403
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 93 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 93 comment cho articleID=403 (tổng tạm: 93)
  ==> Tổng cộng ghi 93 comment cho articleID=403
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T18-06-41.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T06-29-25.csv
Video @laogiadautu8688/video/7499491215226785042 là mới → tạo articleID=404
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 108 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 108 comment cho articleID=404 (tổng tạm: 108)
  ==> Tổng cộng ghi 108 comment cho articleID=404
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T06-29-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-18-48.csv
Video @han_duhochanquockgeul/video/7415132532544425234 là mới → tạo articleID=405
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 90 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 90 comment cho articleID=405 (tổng tạm: 90)
  ==> Tổng cộng ghi 90 comment cho articleID=405
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-18-48.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-14-25.csv
Video @qtrangotamly/video/7542522433010519304 là mới → tạo articleID=406
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 62 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 62 comment cho articleID=406 (tổng tạm: 62)
  ==> Tổng cộng ghi 62 comment cho articleID=406
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-14-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-14-01.csv
Video @anhnongmenoi/video/7253437842922228997 là mới → tạo articleID=407
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 132 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 132 comment cho articleID=407 (tổng tạm: 132)
  ==> Tổng cộng ghi 132 comment cho articleID=407
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-14-01.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T12-25-15.csv
Video @_plinh0701_/video/7520847409040198930 là mới → tạo articleID=408
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 101 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 101 comment cho articleID=408 (tổng tạm: 101)
  ==> Tổng cộng ghi 101 comment cho articleID=408
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T12-25-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T12-18-48.csv
Video @phathungvlog/video/7546535696186477831 là mới → tạo articleID=409
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 100 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 100 comment cho articleID=409 (tổng tạm: 100)
  ==> Tổng cộng ghi 100 comment cho articleID=409
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T12-18-48.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T05-47-28.csv
Video @itstamhn/video/7358612635350207750 là mới → tạo articleID=410
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 137 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 137 comment cho articleID=410 (tổng tạm: 137)
  ==> Tổng cộng ghi 137 comment cho articleID=410
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T05-47-28.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-30-57.csv
Video @thanh_dc/video/7481159226333662472 là mới → tạo articleID=411
  Tìm thấy header comment ở dòng 17
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 143 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 143 comment cho articleID=411 (tổng tạm: 143)
  ==> Tổng cộng ghi 143 comment cho articleID=411
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T11-30-57.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-43-21.csv
Video @duhochanquocmap/video/7476447387897072904 là mới → tạo articleID=412
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 69 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 69 comment cho articleID=412 (tổng tạm: 69)
  ==> Tổng cộng ghi 69 comment cho articleID=412
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-43-21.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-54-14.csv
Video @itstamhn/video/7367947215895104773 là mới → tạo articleID=413
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 88 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 88 comment cho articleID=413 (tổng tạm: 88)
  ==> Tổng cộng ghi 88 comment cho articleID=413
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T04-54-14.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T09-06-30.csv
Video @minhduc47/video/7008164591637253378 là mới → tạo articleID=414
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 68 comment (sau khi parse CSV)
  Đã ghi thêm 68 comment cho articleID=414 (tổng tạm: 68)
  ==> Tổng cộng ghi 68 comment cho articleID=414
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T09-06-30.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-10-17.csv
Video @tuyendungviettrien/video/7474079187364629768 là mới → tạo articleID=415
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag 

                                                                                

  Đã ghi thêm 68 comment cho articleID=415 (tổng tạm: 68)
  ==> Tổng cộng ghi 68 comment cho articleID=415
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-28T23-10-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T01-59-38.csv
Video @hong.hot.quy.nhon.bd/video/7541774088885341458 là mới → tạo articleID=416
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 78 comment (sau khi parse CSV)
  Đã ghi thêm 78 comment cho articleID=416 (tổng tạm: 78)
  ==> Tổng cộng ghi 78 comment cho articleID=416
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-29T01-59-38.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T18-50-22.csv
Video @tin_giao_duc/video/7515195789249973522 là mới → tạo articleID=417
  Tìm thấy header comment ở dòng 117
  Header: STT,Tê

                                                                                

  Đã ghi thêm 75 comment cho articleID=417 (tổng tạm: 75)
  ==> Tổng cộng ghi 75 comment cho articleID=417
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-25T18-50-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-24-22.csv
Video @duhocalpha/video/6999181432685858049 là mới → tạo articleID=418
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 77 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 77 comment cho articleID=418 (tổng tạm: 77)
  ==> Tổng cộng ghi 77 comment cho articleID=418
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-24-22.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-30-07.csv
Video @bahadivn/video/7250472360845790469 là mới → tạo articleID=419
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 88 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 88 comment cho articleID=419 (tổng tạm: 88)
  ==> Tổng cộng ghi 88 comment cho articleID=419
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-27T08-30-07.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T11-54-45.csv
Video @tathiloan266/video/7541954953196227847 là mới → tạo articleID=420
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 61 comment (sau khi parse CSV)
  Đã ghi thêm 61 comment cho articleID=420 (tổng tạm: 61)
  ==> Tổng cộng ghi 61 comment cho articleID=420
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-26T11-54-45.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-07-53.csv
Video @f10_hpt/video/7546594120916045074 là mới → tạo articleID=421
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,

                                                                                

  Đã ghi thêm 112 comment cho articleID=421 (tổng tạm: 112)
  ==> Tổng cộng ghi 112 comment cho articleID=421
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T04-07-53.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T12-30-15.csv
Video @daihocmohanoi/video/7521401785332796690 là mới → tạo articleID=422
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 80 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 80 comment cho articleID=422 (tổng tạm: 80)
  ==> Tổng cộng ghi 80 comment cho articleID=422
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-30T12-30-15.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-46-42.csv
Video @ictu.edu.vn/video/7525066975110909191 là mới → tạo articleID=423
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 122 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 122 comment cho articleID=423 (tổng tạm: 122)
  ==> Tổng cộng ghi 122 comment cho articleID=423
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-06T11-46-42.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T15-04-09.csv
Video @duhocalpha/video/7027041515650256129 là mới → tạo articleID=424
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 73 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 73 comment cho articleID=424 (tổng tạm: 73)
  ==> Tổng cộng ghi 73 comment cho articleID=424
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-02T15-04-09.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T01-04-17.csv
Video @ngatichcuc/video/7212107157091765530 là mới → tạo articleID=425
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 86 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 86 comment cho articleID=425 (tổng tạm: 86)
  ==> Tổng cộng ghi 86 comment cho articleID=425
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-09-18T01-04-17.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-50-25.csv
Video @hayonline24h/video/6885625088654314753 là mới → tạo articleID=426
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 89 comment (sau khi parse CSV)


                                                                                

  Đã ghi thêm 89 comment cho articleID=426 (tổng tạm: 89)
  ==> Tổng cộng ghi 89 comment cho articleID=426
Đã xử lý xong file s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-10-29T17-50-25.csv

Xử lý file: s3a://bronze/MangXaHoi/tiktok-data/comments/tiktok_comments_2025-11-07T00-32-07.csv
Video @hunre.uni/video/6990335452523826459 là mới → tạo articleID=427
  Tìm thấy header comment ở dòng 16
  Header: STT,Tên,Tag tên,URL,Comment,Time,Likes,Level Comment,Replied To Tag Name,Number of Replies
  Tìm thấy 114 comment (sau khi parse CSV)


ERROR:root:KeyboardInterrupt while sending command.
Traceback (most recent call last):
  File "/opt/spark/python/lib/py4j-0.10.9.7-src.zip/py4j/java_gateway.py", line 1038, in send_command
    response = connection.send_command(command)
  File "/opt/spark/python/lib/py4j-0.10.9.7-src.zip/py4j/clientserver.py", line 511, in send_command
    answer = smart_decode(self.stream.readline()[:-1])
  File "/usr/local/lib/python3.10/socket.py", line 717, in readinto
    return self._sock.recv_into(b)
KeyboardInterrupt
[Stage 4784:>                                                       (0 + 1) / 1]

KeyboardInterrupt: 

                                                                                

In [None]:
# # Tạo DataFrame cho article
# if all_articles:
#     article_schema = StructType([
#         StructField("articleID", IntegerType(), False),
#         StructField("title", StringType(), True),
#         StructField("description", StringType(), True),
#         StructField("author", StringType(), True),
#         StructField("url", StringType(), True),
#         StructField("timePublish", TimestampType(), True),
#         StructField("likeCount", IntegerType(), True),
#         StructField("commentCount", IntegerType(), True),
#         StructField("shareCount", IntegerType(), True),
#         StructField("type", StringType(), True),
#         StructField("created_at", TimestampType(), True),
#         StructField("updated_at", TimestampType(), True)
#     ])
    
#     df_article_silver = spark.createDataFrame(all_articles, article_schema)
    
#     # Ghi vào bảng article
#     df_article_silver.writeTo("nessie.silver_tables.article").using("iceberg").createOrReplace()
#     print(f"Đã ghi {df_article_silver.count()} dòng vào bảng article")
    
#     # Verify
#     # spark.table("nessie.silver_tables.article").show(5, truncate=False)
# else:
#     print("Không có dữ liệu article để ghi")

In [None]:
# # Tạo DataFrame cho comment
# if all_comments:
#     comment_schema = StructType([
#         StructField("commentID", IntegerType(), False),
#         StructField("articleID", IntegerType(), True),
#         StructField("name", StringType(), True),
#         StructField("tagName", StringType(), True),
#         StructField("urlUser", StringType(), True),
#         StructField("comment", StringType(), True),
#         StructField("commentTime", TimestampType(), True),
#         StructField("commentLike", IntegerType(), True),
#         StructField("levelComment", IntegerType(), True),
#         StructField("replyTo", StringType(), True),
#         StructField("numberOfReply", IntegerType(), True),
#         StructField("created_at", TimestampType(), True),
#         StructField("updated_at", TimestampType(), True)
#     ])
    
#     df_comment_silver = spark.createDataFrame(all_comments, comment_schema)
    
#     # Ghi vào bảng comment
#     df_comment_silver.writeTo("nessie.silver_tables.comment").using("iceberg").createOrReplace()
#     print(f"Đã ghi {df_comment_silver.count()} dòng vào bảng comment")
    
#     # Verify
#     spark.table("nessie.silver_tables.comment").show(5, truncate=False)
    
#     # Thống kê theo article
#     print("\nThống kê comment theo article:")
#     spark.table("nessie.silver_tables.comment").groupBy("articleID").count().orderBy("articleID").show()
# else:
#     print("Không có dữ liệu comment để ghi")

In [None]:
#### Load sub vào cột description cho tiktok posts

In [None]:
print("=" * 80)
print("CẬP NHẬT TITLE & DESCRIPTION CHO BẢNG ARTICLE TỪ FILE SUB (INCREMENTAL)")
print("=" * 80)

# Tạo bảng log file sub nếu chưa có
spark.sql("""
CREATE TABLE IF NOT EXISTS nessie.silver_tables.tiktok_sub_files_log (
  file_path STRING,
  load_time TIMESTAMP
) USING iceberg
""")

SUB_PATH = "s3a://bronze/MangXaHoi/tiktok-data/sub/*.csv"

# ----- Lấy danh sách file sub hiện có -----
df_all_sub_files = (
    spark.read
         .option("header", "true")
         .option("inferSchema", "false")
         .option("encoding", "UTF-8")
         .csv(SUB_PATH)
         .select(input_file_name().alias("file_path"))
         .distinct()
)

try:
    df_sub_processed = spark.table("nessie.silver_tables.tiktok_sub_files_log") \
                            .select("file_path").distinct()
except AnalysisException:
    df_sub_processed = spark.createDataFrame([], "file_path STRING")

df_new_sub_files = df_all_sub_files.join(df_sub_processed, "file_path", "left_anti")
new_sub_files = [r.file_path for r in df_new_sub_files.collect()]

print(f"Số file sub mới: {len(new_sub_files)}")

if not new_sub_files:
    print("Không có file sub mới, bỏ qua bước cập nhật title/description.")
else:
    # ----- Đọc data từ các file sub MỚI -----
    df_desc_raw = (
        spark.read
             .option("header", "true")
             .option("inferSchema", "false")
             .option("encoding", "UTF-8")
             .csv(new_sub_files)
    )

    print(f"Đọc được {df_desc_raw.count():,} dòng từ các file sub mới")

    # Chuẩn hoá cột url, title, description
    # new_title: thường là caption / mô tả ngắn
    # new_description: toàn bộ sub
    df_desc = (
        df_desc_raw
            .select(
                trim(col("url")).alias("url"),
                trim(col("description")).alias("new_title"),
                trim(col("sub")).alias("new_description")
            )
            .filter(col("url").isNotNull() & (col("url") != ""))
    )

    print(f"Số dòng dùng để cập nhật: {df_desc.count():,}")

    df_desc.createOrReplaceTempView("article_desc_update")

    # ----- CHỈ UPDATE các article đã tồn tại, KHÔNG insert mới -----
    spark.sql("""
    MERGE INTO nessie.silver_tables.article AS a
    USING article_desc_update AS d
    ON a.url = d.url
    WHEN MATCHED THEN UPDATE SET
      a.title       = d.new_title,
      a.description = d.new_description,
      a.updated_at  = current_timestamp()
    """)

    print("Đã cập nhật title & description cho các article có url trùng trong bảng article!")

    # Ghi log các file sub đã xử lý
    df_sub_log = spark.createDataFrame(
        [(p, datetime.now()) for p in new_sub_files],
        "file_path STRING, load_time TIMESTAMP"
    )
    (df_sub_log.writeTo("nessie.silver_tables.tiktok_sub_files_log")
              .using("iceberg")
              .append())


In [None]:
#### Load Facebook data

In [13]:
import re
from datetime import datetime
from pyspark.sql.functions import udf
from pyspark.sql.types import StringType

# Map tháng tiếng Việt -> số
MONTH_MAP = {
    "Tháng 1": "01", "Tháng 2": "02", "Tháng 3": "03", "Tháng 4": "04",
    "Tháng 5": "05", "Tháng 6": "06", "Tháng 7": "07", "Tháng 8": "08",
    "Tháng 9": "09", "Tháng 10": "10", "Tháng 11": "11", "Tháng 12": "12"
}

def parse_vietnam_datetime(dt_str):
    """
    Convert:
    'Thứ Sáu, 1 Tháng 8, 2025 lúc 20:18'
          ↓
    '2025-08-01 20:18:00'
    """
    if not dt_str:
        return None
    
    try:
        # Bỏ tiền tố thứ ngày
        # Ví dụ: "Thứ Sáu, " → ""
        dt_str = dt_str.split(",", 1)[1].strip()

        # dt_str còn lại:
        # "1 Tháng 8, 2025 lúc 20:18"

        # Tách ngày – tháng tiếng Việt
        # 1 Tháng 8
        match = re.search(r"(\d+)\s+(Tháng\s+\d+)", dt_str)
        if not match:
            return None

        day = match.group(1)
        month_text = match.group(2)
        month = MONTH_MAP.get(month_text)

        # Lấy năm
        year_match = re.search(r",\s*(\d{4})", dt_str)
        if not year_match:
            return None
        year = year_match.group(1)

        # Lấy giờ phút
        time_match = re.search(r"lúc\s+(\d{1,2}:\d{2})", dt_str)
        if time_match:
            time_str = time_match.group(1)
        else:
            time_str = "00:00"

        # Format chuẩn: yyyy-MM-dd HH:mm:ss
        final_str = f"{year}-{month}-{int(day):02d} {time_str}:00"
        return final_str

    except Exception:
        return None


parse_vn_time_udf = udf(parse_vietnam_datetime, StringType())


In [11]:
# spark.sql("""
# DELETE FROM nessie.silver_tables.article
# WHERE type = 'facebook'
# """)


DataFrame[]

In [12]:
# spark.sql("""
# DELETE FROM nessie.silver_tables.comment
# WHERE articleID NOT IN (
#     SELECT articleID FROM nessie.silver_tables.article
# )
# """)


                                                                                

DataFrame[]

In [14]:
from pyspark.sql import Window
from pyspark.sql.functions import (
    col, trim, current_timestamp, to_timestamp,
    row_number, lit, max as F_max
)

print("=" * 80)
print("LOAD DỮ LIỆU FACEBOOK VÀO BẢNG ARTICLE & COMMENT (KHÔNG TRÙNG ID)")
print("=" * 80)

posts_path = "s3a://bronze/MangXaHoi/Face-data/posts_FB.csv"
comments_path = "s3a://bronze/MangXaHoi/Face-data/comments_FB.csv"

# ====================================================
# 0. LẤY MAX ID HIỆN CÓ TRONG BẢNG
# ====================================================
# Nếu bảng rỗng thì maxID = None -> dùng 0
try:
    max_article_row = (
        spark.table("nessie.silver_tables.article")
             .agg(F_max("articleID").alias("maxID"))
             .collect()[0]
    )
    base_article_id = max_article_row["maxID"] or 0
except Exception:
    base_article_id = 0

try:
    max_comment_row = (
        spark.table("nessie.silver_tables.comment")
             .agg(F_max("commentID").alias("maxID"))
             .collect()[0]
    )
    base_comment_id = max_comment_row["maxID"] or 0
except Exception:
    base_comment_id = 0

print(f"base_article_id (offset) = {base_article_id}")
print(f"base_comment_id (offset) = {base_comment_id}")

# ====================================================
# 1. ĐỌC BẢNG POSTS_FB -> ARTICLE
# ====================================================
df_posts_raw = (
    spark.read
        .option("header", "true")
        .option("inferSchema", "false")
        .option("encoding", "UTF-8")
        .csv(posts_path)
)

print(f"Đọc được {df_posts_raw.count():,} dòng từ posts_FB")

df_posts_clean = df_posts_raw.select(
    trim(col("ID")).alias("url_post"),      # URL bài viết (dùng để join)
    trim(col("Title")).alias("title"),
    trim(col("Description")).alias("description"),
    trim(col("Author")).alias("author"),
    trim(col("Url")).alias("url_extra"),
    trim(col("TimePublish")).alias("TimePublish_raw"),
    trim(col("Like")).alias("Like_raw"),
    trim(col("Share")).alias("Share_raw"),
    trim(col("Comment")).alias("Comment_raw")
)

df_posts_parsed = (
    df_posts_clean
        # Chuẩn hoá string tiếng Việt -> 'yyyy-MM-dd HH:mm:ss'
        .withColumn("TimePublish_clean", parse_vn_time_udf(col("TimePublish_raw")))
        # Convert string chuẩn -> timestamp
        .withColumn("timePublish", to_timestamp(col("TimePublish_clean")))
        .withColumn("likeCount", col("Like_raw").cast("int"))
        .withColumn("shareCount", col("Share_raw").cast("int"))
        .withColumn("commentCount", col("Comment_raw").cast("int"))
)


# Window để đánh số local trong batch FB
w_article = Window.orderBy("url_post")

df_article_silver = (
    df_posts_parsed
        # articleID_local: 1,2,3,... trong batch Facebook
        .withColumn("articleID_local", row_number().over(w_article))
        # articleID thật = offset + local
        .withColumn(
            "articleID",
            (col("articleID_local") + lit(base_article_id)).cast("int")
        )
        .select(
            col("articleID"),
            col("title"),
            col("description"),
            col("author"),
            col("url_post").alias("url"),
            col("timePublish"),
            col("likeCount"),
            col("commentCount"),
            col("shareCount"),
            lit("facebook").alias("type"),
            current_timestamp().alias("created_at"),
            current_timestamp().alias("updated_at")
        )
)

print("Mẫu dữ liệu article_silver:")
df_article_silver.show(5, truncate=False)

# Ghi vào bảng article
df_article_silver.writeTo("nessie.silver_tables.article").using("iceberg").append()
print(f"Đã ghi {df_article_silver.count():,} dòng vào nessie.silver_tables.article")

# Tạo lookup cho batch FB (chỉ cần url & articleID của batch này)
df_article_fb_lookup = df_article_silver.select("articleID", "url").distinct()

# ====================================================
# 2. ĐỌC BẢNG COMMENT_FB -> COMMENT, JOIN THEO URL
# ====================================================
df_cmt_raw = (
    spark.read
        .option("header", "true")
        .option("inferSchema", "false")
        .option("encoding", "UTF-8")
        .csv(comments_path)
)

print(f"Đọc được {df_cmt_raw.count():,} dòng từ comment_FB")

# comment_FB: STT,Id_post,Comment
df_cmt_clean = df_cmt_raw.select(
    trim(col("STT")).alias("stt"),
    trim(col("Id_post")).alias("post_url"),
    trim(col("Comment")).alias("comment_text")
).filter(col("post_url").isNotNull() & (col("post_url") != ""))

# JOIN comment với batch article FB vừa tạo (không join toàn bộ bảng để tránh nhầm nguồn khác)
df_cmt_joined = (
    df_cmt_clean.alias("c")
        .join(
            df_article_fb_lookup.alias("a"),
            col("c.post_url") == col("a.url"),
            "inner"
        )
)

print(f"Số dòng comment match với article FB: {df_cmt_joined.count():,}")

# Window để đánh số local comment trong batch FB
w_comment = Window.orderBy(col("a.articleID"), col("c.stt"))

df_comment_silver = (
    df_cmt_joined
        .withColumn("commentID_local", row_number().over(w_comment))
        .withColumn(
            "commentID",
            (col("commentID_local") + lit(base_comment_id)).cast("int")
        )
        .select(
            col("commentID"),
            col("a.articleID").alias("articleID"),
            lit(None).cast("string").alias("name"),
            lit(None).cast("string").alias("tagName"),
            lit(None).cast("string").alias("urlUser"),
            col("comment_text").alias("comment"),
            lit(None).cast("timestamp").alias("commentTime"),
            lit(None).cast("int").alias("commentLike"),
            lit(1).cast("int").alias("levelComment"),
            lit(None).cast("string").alias("replyTo"),
            lit(0).cast("int").alias("numberOfReply"),
            current_timestamp().alias("created_at"),
            current_timestamp().alias("updated_at")
        )
)

print("Mẫu dữ liệu comment_silver:")
df_comment_silver.show(5, truncate=False)

df_comment_silver.writeTo("nessie.silver_tables.comment").using("iceberg").append()
print(f"Đã ghi {df_comment_silver.count():,} dòng vào nessie.silver_tables.comment")

# ====================================================
# 3. CHECK LẠI
# ====================================================
print("\nCHECK lại article (facebook):")
spark.table("nessie.silver_tables.article").where("type = 'facebook'").show(5, truncate=False)

print("\nCHECK lại comment (facebook, join với article):")
spark.sql("""
SELECT c.commentID, c.articleID, a.title, c.comment
FROM nessie.silver_tables.comment c
JOIN nessie.silver_tables.article a
  ON c.articleID = a.articleID
WHERE a.type = 'facebook'
LIMIT 10
""").show(truncate=False)


LOAD DỮ LIỆU FACEBOOK VÀO BẢNG ARTICLE & COMMENT (KHÔNG TRÙNG ID)
base_article_id (offset) = 1770
base_comment_id (offset) = 210746
Đọc được 1,295 dòng từ posts_FB
Mẫu dữ liệu article_silver:
+---------+-----+----------------------------------------------------------------------------------------------------------+----------------------+----------------+-------------------+---------+------------+----------+--------+--------------------------+--------------------------+
|articleID|title|description                                                                                               |author                |url             |timePublish        |likeCount|commentCount|shareCount|type    |created_at                |updated_at                |
+---------+-----+----------------------------------------------------------------------------------------------------------+----------------------+----------------+-------------------+---------+------------+----------+--------+-----------------