In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from ipywidgets import interact, IntSlider

In [None]:
# Ganti 'nama_file.csv' dengan nama file CSV Anda
file_path = '/content/sample_data/california_housing_train.csv'

# Baca file CSV menjadi dataframe
df = pd.read_csv(file_path)

# Tampilkan lima baris pertama dari dataframe
df.head()

In [None]:
df.info()

In [None]:
# Tampilkan jumlah nilai unik untuk setiap fitur
unique_value_counts = df.nunique()
print(unique_value_counts)

In [None]:
# Ringkasan statistik dari dataframe
summary = df.describe()

# Tampilkan ringkasan statistik
summary

In [None]:
# Visualisasi distribusi untuk setiap fitur
for column in df.columns:
    if df[column].dtype == 'float64':
        plt.figure(figsize=(8, 6))
        sns.histplot(df[column], kde=True, color='skyblue')
        plt.title(f'Distribusi {column}', size=15)
        plt.xlabel(column, size=12)
        plt.ylabel('Frequency', size=12)
        plt.show()

In [None]:
# Visualisasi distribusi untuk setiap fitur
for column in df.columns:
    if df[column].dtype == 'float64':
        plt.figure(figsize=(8, 6))
        sns.histplot(df[column], kde=True, color='khaki')  # Ubah warna menjadi khaki
        plt.title(f'Distribusi {column}', size=15)
        plt.xlabel(column, size=12)
        plt.ylabel('Frequency', size=12)
        plt.show()

In [None]:
# Mengatur ukuran dan tata letak subplot
fig, axes = plt.subplots(3, 3, figsize=(15, 15))

# Visualisasi distribusi untuk setiap fitur dalam tata letak 3x3
for i, column in enumerate(df.columns):
    if df[column].dtype == 'float64':
        sns.histplot(df[column], kde=True, color='khaki', ax=axes[i//3, i%3])
        axes[i//3, i%3].set_title(f'Distribusi {column}', size=12)
        axes[i//3, i%3].set_xlabel(column, size=10)
        axes[i//3, i%3].set_ylabel('Frequency', size=10)

# Mengatur tata letak secara rapi
plt.tight_layout()
plt.show()

In [None]:
# Fungsi untuk memplot distribusi dengan bin width interaktif
def plot_distribution(feature, bin_width):
    plt.figure(figsize=(8, 6))
    sns.histplot(df[feature], bins=bin_width, kde=True, color='khaki')
    plt.title(f'Distribusi {feature} (Bin Width: {bin_width})', size=15)
    plt.xlabel(feature, size=12)
    plt.ylabel('Frequency', size=12)
    plt.show()

# Interaksi untuk memilih fitur dan bin width
interact(plot_distribution, feature=df.columns, bin_width=IntSlider(min=1, max=50, step=1, value=10))

In [None]:
# Visualisasi boxplot untuk setiap fitur
for column in df.columns:
    if df[column].dtype == 'float64':
        plt.figure(figsize=(8, 6))
        sns.boxplot(y=df[column], color='khaki')
        plt.title(f'Boxplot {column}', size=15)
        plt.ylabel(column, size=12)
        plt.show()

In [None]:
# Mengatur ukuran dan tata letak subplot
fig, axes = plt.subplots(3, 3, figsize=(15, 15))

# Visualisasi boxplot untuk setiap fitur dalam tata letak 3x3
for i, column in enumerate(df.columns):
    if df[column].dtype == 'float64':
        sns.boxplot(x=df[column], color='purple', orient='h', ax=axes[i//3, i%3])
        axes[i//3, i%3].set_title(f'Boxplot {column}', size=12)
        axes[i//3, i%3].set_xlabel(column, size=10)
        axes[i//3, i%3].set_ylabel('Value', size=10)

# Mengatur tata letak secara rapi
plt.tight_layout()
plt.show()

In [None]:
# Membuat scatter plot untuk setiap pasang fitur
sns.set(style="ticks")
sns.pairplot(df, kind="scatter", diag_kind="kde", palette="husl")
plt.show()

In [None]:
# Membuat heatmap untuk setiap fitur
plt.figure(figsize=(10, 8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', fmt='.2f', linewidths=0.5)
plt.title('Heatmap Korelasi Fitur', size=15)
plt.show()

In [None]:
# Mengatur tata letak secara rapi
plt.figure(figsize=(12, 8))

# Membuat violin chart untuk setiap fitur
for i, column in enumerate(df.columns):
    if df[column].dtype == 'float64':
        plt.subplot(3, 3, i+1)
        sns.violinplot(y=df[column], color='skyblue')
        plt.title(f'Violin Chart {column}', size=12)
        plt.ylabel(column, size=10)

# Menampilkan plot
plt.tight_layout()
plt.show()