# Data Preprocessing Student Council of Chulalongkorn University Annual Survey 2024

In [1]:
#Importing library
import pandas as pd
import os
import io
import csv
import numpy as np
#importing Google sheets API library
from google.auth.transport.requests import Request
from google.oauth2.credentials import Credentials
from google_auth_oauthlib.flow import InstalledAppFlow
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError 



# Importing Using Google Sheets API

##### Importing function

In [2]:
SCOPES = ["https://www.googleapis.com/auth/spreadsheets"]
SPREADSHEET_ID = "1gN1Lon1R7c7WxNv-TRplnNZEJZDp4hyNw-KKAtHMvSk"

def main():
    credentials = None

    # Check if token file exists for stored credentials
    if os.path.exists("token.json"):
        credentials = Credentials.from_authorized_user_file("token.json", SCOPES)

    # If no valid credentials, authenticate the user
    if not credentials or not credentials.valid:
        if credentials and credentials.expired and credentials.refresh_token:
            credentials.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file("surveycred.json", SCOPES)
            credentials = flow.run_local_server(port=0)
            # Save the credentials for future use
            with open("token.json", "w") as token:
                token.write(credentials.to_json())

    try:
        # Build the Google Sheets service
        service = build("sheets", "v4", credentials=credentials)
        
        # Fetch the data from the specified range
        result = service.spreadsheets().values().get(
            spreadsheetId=SPREADSHEET_ID, range="Sheet1"
        ).execute()
        values = result.get('values', [])

        # Ensure values exist
        if values:
            # Use the first row for headers
            headers = values[0]
            # Normalize data to match the number of headers
            data = [row + [''] * (len(headers) - len(row)) for row in values[1:]]

            # Create DataFrame with normalized data
            df = pd.DataFrame(data, columns=headers)
            print(df)
            return df
        else:
            print("No data found.")

    except HttpError as error:
        print(f"An error occurred: {error}")

if __name__ == "__main__":
    main()

               ประทับเวลา  \
0    28/10/2024, 17:06:20   
1    28/10/2024, 17:30:44   
2     29/10/2024, 2:28:10   
3    29/10/2024, 11:14:39   
4    29/10/2024, 18:12:31   
..                    ...   
173   8/11/2024, 16:48:24   
174   9/11/2024, 19:13:43   
175   9/11/2024, 21:55:01   
176   11/11/2024, 8:42:51   
177   12/11/2024, 3:57:55   

    ความรู้จักสภานิสิต\nhttps://www.instagram.com/sapanisitchula?igsh=MXRydmU2azVkbHY0bg==  \
0                            รู้จักสภานิสิตเป็นอย่างดี                                       
1                          รู้จักสภานิสิตเพียงเล็กน้อย                                       
2                            รู้จักสภานิสิตเป็นอย่างดี                                       
3                          รู้จักสภานิสิตเพียงเล็กน้อย                                       
4                          รู้จักสภานิสิตเพียงเล็กน้อย                                       
..                                                 ...                                 

##### Initial Observation

Loading into survey

In [3]:
survey = main()
survey.replace("", np.nan, inplace=True)

               ประทับเวลา  \
0    28/10/2024, 17:06:20   
1    28/10/2024, 17:30:44   
2     29/10/2024, 2:28:10   
3    29/10/2024, 11:14:39   
4    29/10/2024, 18:12:31   
..                    ...   
173   8/11/2024, 16:48:24   
174   9/11/2024, 19:13:43   
175   9/11/2024, 21:55:01   
176   11/11/2024, 8:42:51   
177   12/11/2024, 3:57:55   

    ความรู้จักสภานิสิต\nhttps://www.instagram.com/sapanisitchula?igsh=MXRydmU2azVkbHY0bg==  \
0                            รู้จักสภานิสิตเป็นอย่างดี                                       
1                          รู้จักสภานิสิตเพียงเล็กน้อย                                       
2                            รู้จักสภานิสิตเป็นอย่างดี                                       
3                          รู้จักสภานิสิตเพียงเล็กน้อย                                       
4                          รู้จักสภานิสิตเพียงเล็กน้อย                                       
..                                                 ...                                 

  survey.replace("", np.nan, inplace=True)


Renaming Columns Name

In [4]:
#New name
newname = [
    'timestamp',
    'know_student_council',
    'data_privacy_consent',
    'faculty',
    'year_of_study',
    'healthcare_benefits_used',
    'learning_center_services_used',
    'it_services_satisfaction',
    'campus_transport_satisfaction',
    'public_restrooms_satisfaction',
    'campus_security_satisfaction',
    'bookstore_and_welfare_shops_satisfaction',
    'overall_welfare_impression',
    'welfare_improvement_suggestions',
    'frequent_welfare_issues',
    'urgent_welfare_issues',
    'welfare_usage_frequency',
    'additional_welfare_suggestions',
    'personal_issues_health',
    'personal_issues_mental_health',
    'personal_issues_social_life',
    'personal_issues_academics',
    'personal_issues_work',
    'personal_issues_family',
    'personal_issues_finances',
    'campus_facilities_satisfaction',
    'campus_rules_satisfaction',
    'campus_transport_system_satisfaction',
    'general_healthcare_services_satisfaction',
    'mental_health_services_satisfaction',
    'animal_welfare_satisfaction',
    'campus_community_satisfaction',
    'student_union_satisfaction',
    'special_council_feedback_topic',
    'favorite_campus_location',
    'visited_checkin_spots',
    'campus_location_feedback',
    'campus_location_issues',
    'campus_rules_feedback',
    'campus_rules_compliance_issues',
    'rules_to_remove_suggestion',
    'overall_rules_satisfaction',
    'cu_pop_bus_experience',
    'cu_pop_bus_feedback',
    'campus_transport_issues',
    'overall_transport_satisfaction',
    'general_healthcare_feedback',
    'frequent_general_healthcare_issues',
    'overall_general_healthcare_satisfaction',
    'frequent_mental_health_issues',
    'future_mental_health_service_use',
    'campus_animal_impression',
    'frequent_animal_welfare_issues',
    'animal_welfare_feedback',
    'overall_animal_welfare_satisfaction',
    'community_engagement_feedback',
    'campus_community_feedback',
    'frequent_community_issues',
    'student_union_awareness',
    'student_union_suggestions',
    'student_union_improvement_feedback',
    'overall_student_union_satisfaction',
    'special_council_feedback',
    'consent_confirmation',
    'rules_feedback',
    'future_general_healthcare_use',
    'future_mental_health_service_use',
    'mental_health_service_feedback',
    'email_address'
]

survey.columns = newname
survey

Unnamed: 0,timestamp,know_student_council,data_privacy_consent,faculty,year_of_study,healthcare_benefits_used,learning_center_services_used,it_services_satisfaction,campus_transport_satisfaction,public_restrooms_satisfaction,...,student_union_suggestions,student_union_improvement_feedback,overall_student_union_satisfaction,special_council_feedback,consent_confirmation,rules_feedback,future_general_healthcare_use,future_mental_health_service_use,mental_health_service_feedback,email_address
0,"28/10/2024, 17:06:20",รู้จักสภานิสิตเป็นอย่างดี,ยินยอม,คณะนิติศาสตร์,ปี 3,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ไม่พอใจ,ปานกลาง,ไม่พอใจ,...,,,,,จบแบบสอบถาม,,,,,
1,"28/10/2024, 17:30:44",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะศิลปกรรมศาสตร์,ปี 3,"สนามกีฬาในร่ม 1, CU Wellness","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ปานกลาง,ปานกลาง,พอใจ,...,,,,เราทำงานกับอบจ.มา 2 สมัย พบว่าหลายๆ โครงการและ...,จบแบบสอบถาม,,,,,
2,"29/10/2024, 2:28:10",รู้จักสภานิสิตเป็นอย่างดี,ยินยอม,คณะนิติศาสตร์,ปี 2,"สนามกีฬาในร่ม 1, ศูนย์ส่งเสริมสุขภาพ อาคารจามจ...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ปานกลาง,พอใจ,พอใจมาก,...,,,,,จบแบบสอบถาม,,,มากที่สุด,,
3,"29/10/2024, 11:14:39",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะอักษรศาสตร์,ปี 2,"สนามกีฬาในร่ม 1, ศูนย์ส่งเสริมสุขภาพ อาคารจามจ...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ปานกลาง,พอใจ,พอใจ,...,,,,,จบแบบสอบถาม,,,,,
4,"29/10/2024, 18:12:31",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะนิติศาสตร์,ปี 1,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2",ห้องสมุดของคณะต่างๆ,พอใจมาก,พอใจ,พอใจ,...,,,,,จบแบบสอบถาม,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
173,"8/11/2024, 16:48:24",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะสหเวชศาสตร์,ปี 1,ไม่เคย,"ห้องสมุดของคณะต่างๆ, สถาบันภาษาแห่งจุฬาลงกรณ์ม...",พอใจมาก,ปานกลาง,พอใจมาก,...,,,,,จบแบบสอบถาม,,,,,
174,"9/11/2024, 19:13:43",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะวิศวกรรมศาสตร์,ปี 3,สนามกีฬาในร่ม 2,"สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",พอใจมาก,พอใจ,ปานกลาง,...,,,,,จบแบบสอบถาม,,,น้อย,,
175,"9/11/2024, 21:55:01",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะวิศวกรรมศาสตร์,ปี 1,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), สถาบันภาษาแ...",พอใจมาก,พอใจมาก,ปานกลาง,...,,,,,จบแบบสอบถาม,,,,,
176,"11/11/2024, 8:42:51",รู้จักสภานิสิตเพียงเล็กน้อย,ยินยอม,คณะครุศาสตร์,ปี 4,"โรงพยาบาลจุฬาลงกรณ์ สภากาชาดไทย, ศูนย์ส่งเสริม...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",พอใจมาก,พอใจ,พอใจมาก,...,,,,-,จบแบบสอบถาม,,,,ขอบคุณที่ช่วยให้หายจากโรคซึมเศร้าขั้นรุนแรงค่ะ...,


In [5]:
print(survey.shape)
# Get the data types of each column
dtypes_table = pd.DataFrame(survey.dtypes, columns=['Data Type'])

# Reset index to make it more readable
dtypes_table.reset_index(inplace=True)
dtypes_table.columns = ['Column', 'Data Type']

dtypes_table

(178, 69)


Unnamed: 0,Column,Data Type
0,timestamp,object
1,know_student_council,object
2,data_privacy_consent,object
3,faculty,object
4,year_of_study,object
...,...,...
64,rules_feedback,object
65,future_general_healthcare_use,float64
66,future_mental_health_service_use,object
67,mental_health_service_feedback,object


##### Missing Value Observation

In [6]:
null_percentage = survey.isnull().sum() / len(survey) * 100

# Create a DataFrame for display
null_table = pd.DataFrame({
    'Column': null_percentage.index,
    'Null Percentage (%)': null_percentage.values
})

null_table_sort = null_table.sort_values(["Null Percentage (%)"],ascending= False)
null_table_sort

Unnamed: 0,Column,Null Percentage (%)
68,email_address,100.0
42,cu_pop_bus_experience,100.0
45,overall_transport_satisfaction,100.0
48,overall_general_healthcare_satisfaction,100.0
54,overall_animal_welfare_satisfaction,100.0
...,...,...
9,public_restrooms_satisfaction,0.0
21,personal_issues_academics,0.0
18,personal_issues_health,0.0
19,personal_issues_mental_health,0.0


# Data Transformation

## Data Partitioning
- Partition require features and non-require features

In [7]:
survey_req = survey.loc[:, survey.notnull().all()]
survey_unreq = survey.loc[:, survey.isnull().any()]

print(survey_req.shape)
print(survey_unreq.shape)

print('Required Survey Columns: ' + str(survey_req.columns.to_list()))
print('Unrequired Survey Columns: ' + str(survey_unreq.columns.to_list()))

(178, 34)
(178, 35)
Required Survey Columns: ['timestamp', 'know_student_council', 'data_privacy_consent', 'faculty', 'year_of_study', 'healthcare_benefits_used', 'learning_center_services_used', 'it_services_satisfaction', 'campus_transport_satisfaction', 'public_restrooms_satisfaction', 'campus_security_satisfaction', 'bookstore_and_welfare_shops_satisfaction', 'overall_welfare_impression', 'welfare_improvement_suggestions', 'frequent_welfare_issues', 'urgent_welfare_issues', 'welfare_usage_frequency', 'personal_issues_health', 'personal_issues_mental_health', 'personal_issues_social_life', 'personal_issues_academics', 'personal_issues_work', 'personal_issues_family', 'personal_issues_finances', 'campus_facilities_satisfaction', 'campus_rules_satisfaction', 'campus_transport_system_satisfaction', 'general_healthcare_services_satisfaction', 'mental_health_services_satisfaction', 'animal_welfare_satisfaction', 'campus_community_satisfaction', 'student_union_satisfaction', 'special_coun

## Transforming Survey With Require Features

##### Dropping unneccsary columns

In [8]:
# Drop columns with 1 unique values
survey_req = df_dropped = survey_req.loc[:, survey_req.nunique() > 1]
print(survey_req.shape)

survey_req


(178, 32)


Unnamed: 0,timestamp,know_student_council,faculty,year_of_study,healthcare_benefits_used,learning_center_services_used,it_services_satisfaction,campus_transport_satisfaction,public_restrooms_satisfaction,campus_security_satisfaction,...,personal_issues_finances,campus_facilities_satisfaction,campus_rules_satisfaction,campus_transport_system_satisfaction,general_healthcare_services_satisfaction,mental_health_services_satisfaction,animal_welfare_satisfaction,campus_community_satisfaction,student_union_satisfaction,special_council_feedback_topic
0,"28/10/2024, 17:06:20",รู้จักสภานิสิตเป็นอย่างดี,คณะนิติศาสตร์,ปี 3,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ไม่พอใจ,ปานกลาง,ไม่พอใจ,ไม่พอใจอย่างมาก,...,มาก,น้อย,น้อย,ปานกลาง,ปานกลาง,ปานกลาง,ปานกลาง,น้อยที่สุด,น้อย,สโมสรนิสิต
1,"28/10/2024, 17:30:44",รู้จักสภานิสิตเพียงเล็กน้อย,คณะศิลปกรรมศาสตร์,ปี 3,"สนามกีฬาในร่ม 1, CU Wellness","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ปานกลาง,ปานกลาง,พอใจ,พอใจ,...,น้อย,มาก,ปานกลาง,ปานกลาง,ปานกลาง,มาก,ปานกลาง,ปานกลาง,ปานกลาง,สถานที่
2,"29/10/2024, 2:28:10",รู้จักสภานิสิตเป็นอย่างดี,คณะนิติศาสตร์,ปี 2,"สนามกีฬาในร่ม 1, ศูนย์ส่งเสริมสุขภาพ อาคารจามจ...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ปานกลาง,พอใจ,พอใจมาก,ไม่พอใจ,...,น้อย,มาก,น้อยที่สุด,มาก,ปานกลาง,มากที่สุด,น้อยที่สุด,น้อยที่สุด,ปานกลาง,บริการทางอนามัย และสาธารณสุขทั่วไป
3,"29/10/2024, 11:14:39",รู้จักสภานิสิตเพียงเล็กน้อย,คณะอักษรศาสตร์,ปี 2,"สนามกีฬาในร่ม 1, ศูนย์ส่งเสริมสุขภาพ อาคารจามจ...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",ปานกลาง,พอใจ,พอใจ,พอใจ,...,ปานกลาง,มาก,น้อย,มาก,มาก,ปานกลาง,ปานกลาง,น้อย,ปานกลาง,ชุมชน
4,"29/10/2024, 18:12:31",รู้จักสภานิสิตเพียงเล็กน้อย,คณะนิติศาสตร์,ปี 1,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2",ห้องสมุดของคณะต่างๆ,พอใจมาก,พอใจ,พอใจ,พอใจ,...,น้อย,มาก,ปานกลาง,ปานกลาง,ปานกลาง,ปานกลาง,ปานกลาง,ปานกลาง,ปานกลาง,บริการสุขภาพจิต
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
173,"8/11/2024, 16:48:24",รู้จักสภานิสิตเพียงเล็กน้อย,คณะสหเวชศาสตร์,ปี 1,ไม่เคย,"ห้องสมุดของคณะต่างๆ, สถาบันภาษาแห่งจุฬาลงกรณ์ม...",พอใจมาก,ปานกลาง,พอใจมาก,พอใจมาก,...,มาก,มากที่สุด,มากที่สุด,ปานกลาง,มากที่สุด,มากที่สุด,มากที่สุด,มากที่สุด,มากที่สุด,ระบบการคมนาคมขนส่งภายในมหาวิทยาลัย
174,"9/11/2024, 19:13:43",รู้จักสภานิสิตเพียงเล็กน้อย,คณะวิศวกรรมศาสตร์,ปี 3,สนามกีฬาในร่ม 2,"สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",พอใจมาก,พอใจ,ปานกลาง,พอใจ,...,น้อยที่สุด,มาก,ปานกลาง,มาก,ปานกลาง,น้อย,ปานกลาง,มาก,ปานกลาง,บริการทางอนามัย และสาธารณสุขทั่วไป
175,"9/11/2024, 21:55:01",รู้จักสภานิสิตเพียงเล็กน้อย,คณะวิศวกรรมศาสตร์,ปี 1,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), สถาบันภาษาแ...",พอใจมาก,พอใจมาก,ปานกลาง,พอใจมาก,...,น้อยที่สุด,มาก,ปานกลาง,มากที่สุด,มากที่สุด,มากที่สุด,มากที่สุด,มากที่สุด,มากที่สุด,ต้องการที่จอดเพิ่ม
176,"11/11/2024, 8:42:51",รู้จักสภานิสิตเพียงเล็กน้อย,คณะครุศาสตร์,ปี 4,"โรงพยาบาลจุฬาลงกรณ์ สภากาชาดไทย, ศูนย์ส่งเสริม...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",พอใจมาก,พอใจ,พอใจมาก,พอใจ,...,มากที่สุด,มากที่สุด,ปานกลาง,มาก,มากที่สุด,มากที่สุด,มาก,มากที่สุด,มากที่สุด,บริการสุขภาพจิต


##### Survey Label Encoding

In [9]:
survey_encoded = survey_req.replace({
    "ไม่พอใจอย่างมาก": 1, 
    "ไม่พอใจ" : 2,
    "ปานกลาง":3,
    "พอใจ":4,
    "พอใจมาก":5,
    "น้อยที่สุด":1,
    "น้อย":2,
    "มาก":4,
    "มากที่สุด" :5,
    "ปี 1" : 1,
    "ปี 2": 2,
    "ปี 3": 3,
    "ปี 4": 4,
    "ปี 5": 5,
    "ปี 6": 6
})

survey_encoded


  survey_encoded = survey_req.replace({


Unnamed: 0,timestamp,know_student_council,faculty,year_of_study,healthcare_benefits_used,learning_center_services_used,it_services_satisfaction,campus_transport_satisfaction,public_restrooms_satisfaction,campus_security_satisfaction,...,personal_issues_finances,campus_facilities_satisfaction,campus_rules_satisfaction,campus_transport_system_satisfaction,general_healthcare_services_satisfaction,mental_health_services_satisfaction,animal_welfare_satisfaction,campus_community_satisfaction,student_union_satisfaction,special_council_feedback_topic
0,"28/10/2024, 17:06:20",รู้จักสภานิสิตเป็นอย่างดี,คณะนิติศาสตร์,3,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",2,3,2,1,...,4,2,2,3,3,3,3,1,2,สโมสรนิสิต
1,"28/10/2024, 17:30:44",รู้จักสภานิสิตเพียงเล็กน้อย,คณะศิลปกรรมศาสตร์,3,"สนามกีฬาในร่ม 1, CU Wellness","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",3,3,4,4,...,2,4,3,3,3,4,3,3,3,สถานที่
2,"29/10/2024, 2:28:10",รู้จักสภานิสิตเป็นอย่างดี,คณะนิติศาสตร์,2,"สนามกีฬาในร่ม 1, ศูนย์ส่งเสริมสุขภาพ อาคารจามจ...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",3,4,5,2,...,2,4,1,4,3,5,1,1,3,บริการทางอนามัย และสาธารณสุขทั่วไป
3,"29/10/2024, 11:14:39",รู้จักสภานิสิตเพียงเล็กน้อย,คณะอักษรศาสตร์,2,"สนามกีฬาในร่ม 1, ศูนย์ส่งเสริมสุขภาพ อาคารจามจ...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",3,4,4,4,...,3,4,2,4,4,3,3,2,3,ชุมชน
4,"29/10/2024, 18:12:31",รู้จักสภานิสิตเพียงเล็กน้อย,คณะนิติศาสตร์,1,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2",ห้องสมุดของคณะต่างๆ,5,4,4,4,...,2,4,3,3,3,3,3,3,3,บริการสุขภาพจิต
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
173,"8/11/2024, 16:48:24",รู้จักสภานิสิตเพียงเล็กน้อย,คณะสหเวชศาสตร์,1,ไม่เคย,"ห้องสมุดของคณะต่างๆ, สถาบันภาษาแห่งจุฬาลงกรณ์ม...",5,3,5,5,...,4,5,5,3,5,5,5,5,5,ระบบการคมนาคมขนส่งภายในมหาวิทยาลัย
174,"9/11/2024, 19:13:43",รู้จักสภานิสิตเพียงเล็กน้อย,คณะวิศวกรรมศาสตร์,3,สนามกีฬาในร่ม 2,"สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",5,4,3,4,...,1,4,3,4,3,2,3,4,3,บริการทางอนามัย และสาธารณสุขทั่วไป
175,"9/11/2024, 21:55:01",รู้จักสภานิสิตเพียงเล็กน้อย,คณะวิศวกรรมศาสตร์,1,"สนามกีฬาในร่ม 1, สนามกีฬาในร่ม 2","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), สถาบันภาษาแ...",5,5,3,5,...,1,4,3,5,5,5,5,5,5,ต้องการที่จอดเพิ่ม
176,"11/11/2024, 8:42:51",รู้จักสภานิสิตเพียงเล็กน้อย,คณะครุศาสตร์,4,"โรงพยาบาลจุฬาลงกรณ์ สภากาชาดไทย, ศูนย์ส่งเสริม...","สำนักงานวิทยทรัพยากร (หอสมุดกลาง), ห้องสมุดของ...",5,4,5,4,...,5,5,3,4,5,5,4,5,5,บริการสุขภาพจิต


##### One-hot Encoding lists in the records

In [10]:
# Encodinghealthcare_benefits_used
dummy = survey_encoded['healthcare_benefits_used'].str.get_dummies(sep=', ')
dummy.columns = ['healthcare_benefits_used_' + col for col in dummy.columns]

# Merge 
survey_temp1 = pd.concat([survey_encoded, dummy], axis=1)

# Encoding learning_center_services_used
dummy = survey_encoded['learning_center_services_used'].str.get_dummies(sep=', ')
dummy.columns = ['learning_center_services_used_' + col for col in dummy.columns]

# Merge
survey_temp2 = pd.concat([survey_temp1, dummy], axis=1)

# Encoding welfare_improvement_suggestions
dummy = survey_encoded['welfare_improvement_suggestions'].str.get_dummies(sep=', ')
dummy.columns = ['welfare_improvement_suggestions_' + col for col in dummy.columns]

#Merge
survey_temp3 = pd.concat([survey_temp2, dummy], axis=1)


#Dropping transform columns
survey_transformed = survey_temp3.drop(columns=['healthcare_benefits_used', 
                              'learning_center_services_used', 
                              'welfare_improvement_suggestions'])

#Display
survey_transformed


Unnamed: 0,timestamp,know_student_council,faculty,year_of_study,it_services_satisfaction,campus_transport_satisfaction,public_restrooms_satisfaction,campus_security_satisfaction,bookstore_and_welfare_shops_satisfaction,overall_welfare_impression,...,welfare_improvement_suggestions_ควรเพิ่มที่อ่านหนังสือเพราะช่วงสอบมีทึ่ไม่พอ,welfare_improvement_suggestions_ที่จอดรถ,welfare_improvement_suggestions_บริการคมนาคมขนส่งภายในมหาวิทยาลัย (CU Pop Bus),welfare_improvement_suggestions_ระบบรักษาความปลอดภัย,welfare_improvement_suggestions_ระบบเทคโนโลยีสารสนเทศเพื่อการเรียนรู้สำหรับนิสิต,welfare_improvement_suggestions_ร้านค้าสวัสดิการ สหกรณ์ โรงอาหาร,welfare_improvement_suggestions_ศูนย์หนังสือ,welfare_improvement_suggestions_สุขาสาธารณะ,welfare_improvement_suggestions_หอพัก,welfare_improvement_suggestions_เว็ป mycourseville
0,"28/10/2024, 17:06:20",รู้จักสภานิสิตเป็นอย่างดี,คณะนิติศาสตร์,3,2,3,2,1,3,3,...,0,0,1,1,1,1,1,1,1,0
1,"28/10/2024, 17:30:44",รู้จักสภานิสิตเพียงเล็กน้อย,คณะศิลปกรรมศาสตร์,3,3,3,4,4,4,3,...,0,0,1,0,1,1,0,0,1,0
2,"29/10/2024, 2:28:10",รู้จักสภานิสิตเป็นอย่างดี,คณะนิติศาสตร์,2,3,4,5,2,5,4,...,0,0,1,1,0,0,0,0,1,0
3,"29/10/2024, 11:14:39",รู้จักสภานิสิตเพียงเล็กน้อย,คณะอักษรศาสตร์,2,3,4,4,4,2,3,...,0,0,0,0,1,1,0,0,0,0
4,"29/10/2024, 18:12:31",รู้จักสภานิสิตเพียงเล็กน้อย,คณะนิติศาสตร์,1,5,4,4,4,4,4,...,0,0,0,0,0,1,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
173,"8/11/2024, 16:48:24",รู้จักสภานิสิตเพียงเล็กน้อย,คณะสหเวชศาสตร์,1,5,3,5,5,5,4,...,0,0,1,0,0,1,0,0,0,0
174,"9/11/2024, 19:13:43",รู้จักสภานิสิตเพียงเล็กน้อย,คณะวิศวกรรมศาสตร์,3,5,4,3,4,4,4,...,0,0,0,0,0,1,0,1,0,0
175,"9/11/2024, 21:55:01",รู้จักสภานิสิตเพียงเล็กน้อย,คณะวิศวกรรมศาสตร์,1,5,5,3,5,5,5,...,0,1,0,0,0,0,0,0,0,0
176,"11/11/2024, 8:42:51",รู้จักสภานิสิตเพียงเล็กน้อย,คณะครุศาสตร์,4,5,4,5,4,5,5,...,0,0,1,0,0,0,0,0,0,0


## Transforming Unrequired Survey Features

In [31]:
#Importing unrequired features dataframe
unique_columns = [col for col in survey.columns if col not in survey_req.columns]

survey_unreq = survey[unique_columns]
survey_unreq = pd.concat([survey_unreq,survey["timestamp"]], axis = 1 )
survey_unreq = survey_unreq.drop(columns = ["data_privacy_consent", "email_address", "consent_confirmation" ],axis=1)

#Reordering columns
columns_order = ['timestamp'] + [col for col in survey_unreq.columns if col != 'A']
survey_unreq = survey_unreq[columns_order]

#Replacing Nan with Blank
survey_unreq = survey_unreq.fillna("")
survey_unreq

Unnamed: 0,timestamp,additional_welfare_suggestions,favorite_campus_location,visited_checkin_spots,campus_location_feedback,campus_location_issues,campus_rules_feedback,campus_rules_compliance_issues,rules_to_remove_suggestion,overall_rules_satisfaction,...,future_mental_health_service_use,future_mental_health_service_use.1,future_mental_health_service_use.2,future_mental_health_service_use.3,future_mental_health_service_use.4,future_mental_health_service_use.5,future_mental_health_service_use.6,future_mental_health_service_use.7,mental_health_service_feedback,timestamp.1
0,"28/10/2024, 17:06:20",,,,,,,,,,...,,,,,,,,,,"28/10/2024, 17:06:20"
1,"28/10/2024, 17:30:44",,ศูนย์หนังสือจุฬาฯ (สาขาสยาม),"หอประชุมจุฬาลงกรณ์มหาวิทยาลัย, พระบรมราชานุสาว...",,,,,,,...,,,,,,,,,,"28/10/2024, 17:30:44"
2,"29/10/2024, 2:28:10",,,,,,,,,,...,,มากที่สุด,,มากที่สุด,,มากที่สุด,,มากที่สุด,,"29/10/2024, 2:28:10"
3,"29/10/2024, 11:14:39",ร้านค้าในโรงอาหารบางร้าน เช่น ร้านข้าวแกงร้านห...,,,,,,,,,...,,,,,,,,,,"29/10/2024, 11:14:39"
4,"29/10/2024, 18:12:31",,,,,,,,,,...,น้อย,,น้อย,,น้อย,,น้อย,,,"29/10/2024, 18:12:31"
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
173,"8/11/2024, 16:48:24",อยากให้มีการเพิ่มจำนวนรถ pop bus ที่จะมาจอดรออ...,,,,,,,,,...,,,,,,,,,,"8/11/2024, 16:48:24"
174,"9/11/2024, 19:13:43",,,,,,,,,,...,,น้อย,,น้อย,,น้อย,,น้อย,,"9/11/2024, 19:13:43"
175,"9/11/2024, 21:55:01",,,,,,,,,,...,,,,,,,,,,"9/11/2024, 21:55:01"
176,"11/11/2024, 8:42:51",-,,,,,,,,,...,มากที่สุด,,มากที่สุด,,มากที่สุด,,มากที่สุด,,ขอบคุณที่ช่วยให้หายจากโรคซึมเศร้าขั้นรุนแรงค่ะ...,"11/11/2024, 8:42:51"


# Exporting Survey Data

## Exporting Survey With Required Features onto Google Sheets

In [32]:
#Exporting Sheets ID
exportID = "12h4mgvidJfiK0axjSfKj3oXkDxCiM3179jiKM2uGwhg"


def export_transform(data, exportID, sheets):
    credentials = None

    # Check if token file exists for stored credentials
    if os.path.exists("token.json"):
        credentials = Credentials.from_authorized_user_file("token.json", SCOPES)

    # If no valid credentials, authenticate the user
    if not credentials or not credentials.valid:
        if credentials and credentials.expired and credentials.refresh_token:
            credentials.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file("surveycred.json", SCOPES)
            credentials = flow.run_local_server(port=0)
            # Save the credentials for future use
            with open("token.json", "w") as token:
                token.write(credentials.to_json())

    try:
        # Build the Google Sheets service
        service = build("sheets", "v4", credentials=credentials)
        
        # Prepare data for export
        data_values = [data.columns.tolist()] + data.values.tolist()

        # Export the data to the specified sheet and range
        response = service.spreadsheets().values().append(
            spreadsheetId=exportID,
            range= sheets,  # Update with your sheet name or range
            valueInputOption='RAW',
            insertDataOption='INSERT_ROWS',  # Adjust if needed
            body={'values': data_values}
        ).execute()

        print(f"Data successfully exported. Response: {response}")

    except HttpError as error:
        print(f"An error occurred: {error}")

export_transform(data = survey_transformed, exportID= exportID, sheets= "Survey_Required")
export_transform(data = survey_unreq, exportID= exportID, sheets= "Survey_Unrequired")

Data successfully exported. Response: {'spreadsheetId': '12h4mgvidJfiK0axjSfKj3oXkDxCiM3179jiKM2uGwhg', 'tableRange': 'Survey_Required!A1:BA1253', 'updates': {'spreadsheetId': '12h4mgvidJfiK0axjSfKj3oXkDxCiM3179jiKM2uGwhg', 'updatedRange': 'Survey_Required!A1254:BA1432', 'updatedRows': 179, 'updatedColumns': 53, 'updatedCells': 9487}}
Data successfully exported. Response: {'spreadsheetId': '12h4mgvidJfiK0axjSfKj3oXkDxCiM3179jiKM2uGwhg', 'updates': {'spreadsheetId': '12h4mgvidJfiK0axjSfKj3oXkDxCiM3179jiKM2uGwhg', 'updatedRange': 'Survey_Unrequired!A1:AX179', 'updatedRows': 179, 'updatedColumns': 50, 'updatedCells': 8950}}
