[EN/TH]
โครงงานวิเคราะห์ข้อมูลเว็บไซต์ Stack Overflow ผ่านคำถาม, คำตอบ, ความคิดเห็น และพฤติกรรมโดยรวมของผู้ใช้บนเว็บไซต์
- โครงงานนี้เป็นส่วนหนึ่งของรายวิชาการแก้ปัญหาทางด้านเทคโนโลยีสารสนเทศ (06016314) สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
หัวข้อในการวิเคราะห์
วิเคราะห์ความนิยมจากแท็กที่ผู้ใช้ใส่ไว้กับคำถามในแต่ละตัว
วิเคราะห์พฤติกรรมของผู้ใช้ผ่านบริบทเชิงบวกและเชิงลบ ของความคิดเห็นที่แสดงลงบนคำถามและคำตอบ
วิเคราะห์ว่าช่วงเวลาในแต่ละปีนั้นส่งผลกระทบต่อกิจกรรมของผู้ใช้อย่างไร
ผลการวิเคราะห์
แหล่งที่มาของข้อมูล
badges
- เหรียญตราที่ได้รับ - 1.19 GBcomments
- ความคิดเห็นที่แสดง - 12.01 GBpost_questions
- คำถามที่ถูกถาม - 25.10 GBpost_answers
- คำตอบที่ตอบ - 20.17 GBtags
- แท็กที่ใส่ลงในคำถาม - 2.08 MBusers
- ข้อมูลผู้ใช้ - 1.4 GB
ช่วงเวลาของข้อมูล - 2008 - 2018
ขนาดโดยรวม - 59.87 GB (โดยประมาณ)
เครื่องมือที่ใช้
- Python
3.7.0
- pygal
2.4.0
- pygal
- Google Cloud Platform
- BigQuery
การตั้งค่าเพื่อการพัฒนา
ลงไลบราลีที่จำเป็น
pip install pygal
โครงสร้างไดเรกทอรี
dataset
data
- ข้อมูลดิบและข้อมูลที่ประมวลผลแล้วquery
- กระบวนการ Query ข้อมูลผ่าน BigQuery
convert
- ไฟล์สำหรับแปลงข้อมูลดิบเป็นข้อมูลสำหรับการการแปลงเป็นกราฟvisualize
- ไฟล์สำหรับแปลงข้อมูลเป็นกราฟdocs
- เว็บไซต์ของโครงงาน
หมายเหตุ - ที่อยู่ของไฟล์ทั้งหมดนั้นตั้งไว้ตรงกับรูทไดเรกทอรีของโครงงานทั้งหมด (./StackBehavior/...
)
ผู้จัดทำ
- นายภูวทิตต์ สัมมาวิวัฒน์ - 61070173 - phwt
- นายวีรพงศ์ ทันจันทึก - 61070213 - veerapong76
- นายณภัทร พรบุญเรือง - 61070044 - tian-np
- นายสหัสวรรษ หิรัญเพชร - 61070239 - maizerocom