In [None]:
import gensim
import pyLDAvis
import pyLDAvis.gensim_models as gensimvis
import pandas as pd
import os

save_dir = "best_lda_model"

# Load the saved LDA model
print("Loading saved LDA model...")
lda_model = gensim.models.LdaModel.load(os.path.join(save_dir, 'best_lda_model.model'))

# Load the dictionary and corpus
# Note: You must have the same dictionary and corpus used during training
print("Loading dictionary and corpus...")
dictionary = gensim.corpora.Dictionary.load(os.path.join(save_dir, 'dictionary.dict'))
corpus = gensim.corpora.MmCorpus(os.path.join(save_dir, 'corpus.mm'))

# Print topics from the loaded model
print("\nTop terms per topic:")
topics = lda_model.print_topics(num_words=10)  # Adjust num_words as needed
for topic in topics:
    print(f"\nTopic {topic[0]}:")
    print(topic[1])

# Prepare data for pyLDAvis visualization
print("\nPreparing data for visualization...")
vis_data = gensimvis.prepare(lda_model, corpus, dictionary)

# Save the visualization as an HTML file
print("Saving visualization to 'lda_visualization.html'...")
pyLDAvis.save_html(vis_data, 'lda_visualization.html')

# Display the visualization in the notebook (if using Jupyter)
print("Displaying visualization...")
pyLDAvis.display(vis_data)

Loading saved LDA model...
Loading dictionary and corpus...

Top terms per topic:

Topic 26:
0.027*"ตำแหน่ง" + 0.026*"สรรหา" + 0.024*"ประธาน" + 0.017*"วาระ" + 0.016*"ดำรง" + 0.013*"สังคม" + 0.012*"ชุด" + 0.012*"คณะกรรมการ" + 0.012*"คะแนน" + 0.011*"กิจกรรม"

Topic 9:
0.086*"กระดาษ" + 0.060*"พิมพ์" + 0.021*"วัตถุ" + 0.021*"เยื่อ" + 0.020*"ดิบ" + 0.018*"กล่อง" + 0.014*"รองเท้า" + 0.012*"วงจร" + 0.011*"ปริมาณ" + 0.011*"จักร"

Topic 20:
0.243*"น้ำ" + 0.030*"บำบัด" + 0.021*"ท่อ" + 0.020*"พื้นที่" + 0.020*"ประปา" + 0.017*"ปริมาณ" + 0.012*"ระบาย" + 0.010*"ดิบ" + 0.010*"ทิ้ง" + 0.009*"สาร"

Topic 7:
0.034*"กิจกรรม" + 0.031*"สังคม" + 0.026*"ศึกษา" + 0.025*"เรียน" + 0.024*"ชุมชน" + 0.009*"เด็ก" + 0.009*"มอบ" + 0.009*"หลักสูตร" + 0.009*"บริจาค" + 0.008*"ชีวิต"

Topic 5:
0.033*"ประธาน" + 0.025*"ตำแหน่ง" + 0.016*"สรรหา" + 0.016*"คณะกรรมการ" + 0.014*"ยั่งยืน" + 0.012*"เจ้าหน้าที่" + 0.012*"วาระ" + 0.011*"ดำรง" + 0.010*"ระเบียบ" + 0.010*"บริหารจัดการ"

Topic 48:
0.180*"น้ำมัน" + 0.050*"ปาล์ม" + 0.040*