# •	Plotting Vertical Bar Graphs Menggunakan Dataset Iris

In [3]:
# Mengimpor modul yang dibutuhkan
import pandas as pd        # Modul untuk manipulasi data
import seaborn as sns      # Modul untuk memuat dataset dan analisis statistik
from bokeh.plotting import figure, output_file, show  # Modul Bokeh untuk membuat dan menampilkan grafik
from bokeh.io import show  # Untuk menampilkan grafik di browser

# Memuat dataset Iris menggunakan seaborn
iris = sns.load_dataset('iris')  # Dataset Iris sudah tersedia di seaborn dan langsung dimuat

# Menghitung rata-rata panjang sepal untuk setiap spesies
avg_sepal_length = iris.groupby('species')['sepal_length'].mean().reset_index()
# Fungsi groupby() digunakan untuk mengelompokkan data berdasarkan kolom 'species'
# Kemudian kita menghitung rata-rata panjang sepal untuk setiap spesies dengan mean()

# Menyiapkan data untuk plotting
x = avg_sepal_length['species']  # Mengambil nama spesies untuk sumbu-x
top = avg_sepal_length['sepal_length']  # Mengambil nilai rata-rata panjang sepal untuk sumbu-y
width = 0.5  # Lebar batang pada grafik batang (bar chart)

# Menentukan file output untuk menyimpan grafik
output_file("iris_sepal_length_bar_chart.html")  # Grafik akan disimpan sebagai file HTML

# Membuat objek grafik menggunakan Bokeh
graph = figure(title="Average Sepal Length by Species", x_range=x.tolist())  # Menentukan judul grafik dan rentang sumbu-x berdasarkan nama spesies

# Membuat grafik batang vertikal
graph.vbar(x=x, top=top, width=width)  
# vbar() digunakan untuk membuat grafik batang vertikal
# 'x' adalah posisi batang pada sumbu-x (berdasarkan nama spesies)
# 'top' adalah nilai yang akan menentukan tinggi batang (rata-rata panjang sepal)
# 'width' adalah lebar dari setiap batang

# Menampilkan grafik di browser
show(graph)  # Fungsi show() digunakan untuk menampilkan grafik di browser


In [6]:
# Membaca file CSV dengan mencoba berbagai delimiter umum (',' atau ';')
# dan menangani potensi error pembacaan
try:
    data_mahasiswa = pd.read_csv('Data_Mahasiswa.csv', sep=',')
except:
    data_mahasiswa = pd.read_csv('Data_Mahasiswa.csv', sep=';')

# Menampilkan beberapa baris pertama untuk melihat struktur dataset
data_mahasiswa.head(5)


Unnamed: 0,Email Address,Nama Lengkap Mahasiswa,NIM,Program Studi Mahasiswa,Angkatan Mahasiswa,Berapa lama waktu yang Anda habiskan menggunakan laptop setiap hari?,Apakah Anda biasanya menggunakan media sosial melalui laptop?,Berapa lama waktu yang Anda habiskan menggunakan media sosial melalui Laptop setiap hari?,Media sosial apa yang Anda aktifkan saat menggunakan laptop? (Centang semua yang sesuai),Jenis konten apa yang paling sering Anda tonton atau akses di media sosial Instagram melalui laptop? (Hubungkan dengan media sosial yang dipilih),...,Apakah Anda pernah mengikuti olimpiade atau kompetisi akademik?,Tingkat manakah Anda mengikuti olimpiade?,Berapa jumlah saudara yang Anda miliki?,Apa Pekerjaan Ayah Anda?,Apa Pendidikan Terakhir Ayah Anda?,Berapa Range Penghasilan Ayah Anda?,Apa Pekerjaan Ibu Anda?,Apa Pendidikan Terakhir Ibu Anda?,Berapa Rentang Penghasilan Ibu Anda?,Programming Skill
0,,,,,,,,,,,...,,,,,,,,,,43
1,,Samuel Saut Royzeki Aritonang,11422026.0,Sarjana Terapan Teknologi Rekayasa Perangkat L...,2022.0,9 - 11 jam,Ya,3 - 5 jam,"Instagram, Tiktok","Hiburan (Video lucu, meme, dll.), Edukasi (Tut...",...,Tidak,,05-Jun,telah meninggal dunia,SMP/sederajat,"Rp. 500,000 - Rp. 999,999",Pegawai negeri sipil,Diploma III,"Rp. 2,000,000 - Rp. 4,999,999",70
2,,Calvin Josep Silaen,11422038.0,Sarjana Terapan Teknologi Rekayasa Perangkat L...,2022.0,6 - 8 jam,Tidak,,,,...,Tidak,,03-Apr,Petani/pekebun,Diploma IV atau Strata I,"Rp. 2,000,000 - Rp. 4,999,999",Perdagangan,Diploma IV atau Strata I,"Rp. 2,000,000 - Rp. 4,999,999",42
3,,Indah Silitonga,11422060.0,Sarjana Terapan Teknologi Rekayasa Perangkat L...,2022.0,6 - 8 jam,Ya,0 - 2 jam,Instagram,"Hiburan (Video lucu, meme, dll.)",...,Tidak,,03-Apr,Petani/pekebun,SMA/sederajat,"Rp. 1,000,000 - Rp. 1,999,999",Pegawai negeri sipil,Diploma IV atau Strata I,"Rp. 2,000,000 - Rp. 4,999,999",36
4,,Asri Yohana Sirait,11422029.0,Sarjana Terapan Teknologi Rekayasa Perangkat L...,2022.0,3 - 5 jam,Tidak,,,,...,Ya,"Tingkat Lokal (Kabupaten/Kota), Tingkat Region...",03-Apr,Petani/pekebun,SMA/sederajat,"Rp. 2,000,000 - Rp. 4,999,999",Petani/pekebun,SMA/sederajat,"Rp. 2,000,000 - Rp. 4,999,999",56


# Plotting Vertical Bar Graphs Menggunakan Dataset Mahasiswa (Dengan Tambahan Efek Hover Dari Bokeh)
# HOVER

In [8]:
from bokeh.plotting import figure, output_file, show
from bokeh.io import output_notebook
from bokeh.models import ColumnDataSource, HoverTool

# Mengaktifkan output langsung di notebook
output_notebook()

# Menghitung jumlah mahasiswa per program studi
program_studi_counts = data_mahasiswa['Program Studi Mahasiswa'].value_counts().reset_index()
program_studi_counts.columns = ['Program Studi', 'Jumlah Mahasiswa']

# Menyiapkan data untuk Bokeh
source = ColumnDataSource(program_studi_counts)

# Membuat figure Bokeh
p = figure(x_range=program_studi_counts['Program Studi'].tolist(), 
            title="Jumlah Mahasiswa per Program Studi",
            x_axis_label='Program Studi',
            y_axis_label='Jumlah Mahasiswa',
            height=800,
            width=800)

# Membuat grafik batang vertikal
p.vbar(x='Program Studi', top='Jumlah Mahasiswa', width=0.5, source=source)

# Mengatur tampilan sumbu x agar miring agar label tidak tumpang tindih
p.xaxis.major_label_orientation = "vertical"

# Menambahkan HoverTool untuk menampilkan nilai ketika di-hover
hover = HoverTool()
hover.tooltips = [("Program Studi", "@{Program Studi}"), ("Jumlah Mahasiswa", "@{Jumlah Mahasiswa}")]
p.add_tools(hover)

# Menampilkan grafik
show(p)


# LINKED CROSSHAIR

In [11]:
import pandas as pd
from bokeh.plotting import figure, show
from bokeh.models import CrosshairTool, ColumnDataSource, HoverTool
from bokeh.layouts import row

# Membaca dataset
file_path = 'Data_Mahasiswa.csv'
df = pd.read_csv(file_path, sep=';')

# Membersihkan spasi ekstra di nama kolom
df.columns = df.columns.str.strip()

# Fungsi untuk mengonversi waktu penggunaan laptop ke jam (numerik)
def parse_time(time_str):
    if pd.isna(time_str):
        return 0
    if 'jam' in time_str:
        parts = time_str.split(' - ')
        if len(parts) == 2:
            low, high = parts[0], parts[1].split()[0]
            return (int(low) + int(high)) / 2
        elif 'lebih dari' in time_str:
            return int(time_str.split()[2])
    return 0

# Parsing kolom
df['Laptop Usage (hrs)'] = df['Berapa lama waktu yang Anda habiskan menggunakan laptop setiap hari?'].apply(parse_time)
df['Programming Skill'] = pd.to_numeric(df['Programming Skill'], errors='coerce')

# Menghapus baris dengan nilai NaN
df = df.dropna(subset=['Laptop Usage (hrs)', 'Programming Skill'])

# Membuat ColumnDataSource untuk Bokeh
source = ColumnDataSource(df)

# Membuat HoverTool
hover = HoverTool()
hover.tooltips = [
    ("Laptop Usage (hrs)", "@{Laptop Usage (hrs)}"),
    ("Programming Skill", "@{Programming Skill}")
]

# Scatter plot pertama
p1 = figure(height=400, width=400, title="Laptop Usage vs Programming Skill",
            x_axis_label='Laptop Usage (hrs)', y_axis_label='Programming Skill')

p1.add_tools(CrosshairTool(), hover)  # Menambahkan HoverTool
p1.circle('Laptop Usage (hrs)', 'Programming Skill', source=source, size=8, alpha=0.6, color='blue')

# Scatter plot kedua (duplikasi untuk linked crosshair)
p2 = figure(height=400, width=400, title="Duplicate Plot with Linked Crosshair",
            x_axis_label='Laptop Usage (hrs)', y_axis_label='Programming Skill')

p2.add_tools(CrosshairTool(), hover)  # Menambahkan HoverTool
p2.circle('Laptop Usage (hrs)', 'Programming Skill', source=source, size=8, alpha=0.6, color='green')

# Menampilkan plot berdampingan
show(row(p1, p2))




#  HIDING GLYPHS

In [15]:
import pandas as pd
from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource, HoverTool
from bokeh.palettes import Spectral4

# Membaca dataset
file_path = 'Data_Mahasiswa.csv'
df = pd.read_csv(file_path, sep=';')

# Membersihkan spasi ekstra di nama kolom
df.columns = df.columns.str.strip()

# Mengonversi Programming Skill ke numerik
df['Programming Skill'] = pd.to_numeric(df['Programming Skill'], errors='coerce')

# Mengonversi waktu penggunaan laptop ke jam (numerik)
def parse_time(time_str):
    if pd.isna(time_str):
        return 0
    if 'jam' in time_str:
        parts = time_str.split(' - ')
        if len(parts) == 2:
            low, high = parts[0], parts[1].split()[0]
            return (int(low) + int(high)) / 2
        elif 'lebih dari' in time_str:
            return int(time_str.split()[2])
    return 0

df['Laptop Usage (hrs)'] = df['Berapa lama waktu yang Anda habiskan menggunakan laptop setiap hari?'].apply(parse_time)

# Menghapus NaN
df = df.dropna(subset=['Programming Skill', 'Laptop Usage (hrs)'])

# Mengambil beberapa program studi untuk visualisasi
program_studi = df['Program Studi Mahasiswa'].unique()[:4]

# Menyiapkan figure
p = figure(width=800, height=400, title='Click on legend entries to hide the corresponding points',
           x_axis_label='Programming Skill', y_axis_label='Laptop Usage (hrs)')

# Menambahkan HoverTool
hover = HoverTool()
hover.tooltips = [
    ("Programming Skill", "@{Programming Skill}"),
    ("Laptop Usage (hrs)", "@{Laptop Usage (hrs)}"),
    ("Program Studi", "@{Program Studi Mahasiswa}")
]
p.add_tools(hover)

# Menambahkan scatter plot untuk setiap program studi
for program, color in zip(program_studi, Spectral4):
    subset = df[df['Program Studi Mahasiswa'] == program]
    source = ColumnDataSource(subset)
    p.scatter('Programming Skill', 'Laptop Usage (hrs)', source=source, size=8, color=color, alpha=0.6, legend_label=str(program))

# Menyesuaikan legend
p.legend.location = "top_left"
p.legend.click_policy = "hide"

# Menampilkan plot
show(p)
