# Self Practice 5 - Evaluation of Modeling Results
___

## Material

### **Practice Material**

- [](#)
- [](#)
- [](#)
- [](#)
- [](#)
- [](#)

### **Library Material**

- Pandas
- Scikit-Learn
- Matplotlib
- Seaborn

## Preparing Model Parameters

In [None]:
# Identifikasi Parameter untuk Model

print("Parameter yang mungkin relevan untuk model:")
print("- Fitur terpilih: ", selected_features)
print("  - Parameter ini digunakan sebagai input untuk model, dipilih berdasarkan skor ANOVA F-value.")
print("- Target label: 'target_label'")
print("  - Parameter ini merupakan output yang ingin diprediksi oleh model, mewakili label jenis bunga iris.")
print("- Data setelah normalisasi dan pembersihan.")
print("  - Data yang telah dibersihkan dan dinormalisasi diharapkan meningkatkan performa model.")

# Catatan:
# - Parameter-parameter lain yang mungkin relevan bergantung pada model yang akan digunakan.
# - Misalnya, jika menggunakan model pohon keputusan, parameter seperti kedalaman pohon dan jumlah daun bisa dipertimbangkan.
# - Jika menggunakan model regresi logistik, parameter seperti regularization dan learning rate bisa dipertimbangkan.
# - Selanjutnya, Anda dapat melakukan analisis lebih lanjut terkait parameter model yang paling optimal untuk dipilih berdasarkan model yang diinginkan dan dataset yang dimiliki.

In [None]:
# Tentukan toleransi untuk parameter evaluasi pengujian
# Berdasarkan tujuan teknis yang telah ditentukan (misalnya, akurasi minimal 95%),
# kita dapat menetapkan toleransi sebagai selisih antara nilai target dan nilai yang diperoleh.

target_accuracy = 0.95  # Target akurasi yang diinginkan
tolerance = 0.05  # Toleransi dalam persen (misalnya, 5%)

print(f"\nToleransi untuk evaluasi pengujian: {tolerance}")
print(f"Target akurasi: {target_accuracy}")

# Catatan: 
# - Nilai toleransi ini dapat disesuaikan berdasarkan tujuan teknis dan kebutuhan proyek.
# - Toleransi yang lebih rendah menunjukkan bahwa kita menginginkan model yang lebih akurat.
# - Anda dapat menyesuaikan nilai target_accuracy dan tolerance sesuai kebutuhan analisis Anda.

## Selecting Modeling Tools

In [None]:
# Select one data science modeling software (e.g., RapidMiner, Weka, Python, or R).
# The chosen tool is Python because Python is a flexible programming language widely used in data science. Python offers various specialized libraries for data modeling, such as scikit-learn for machine learning, pandas for data manipulation, and matplotlib and seaborn for visualization. Additionally, Python has a large community and comprehensive documentation, making it easier to find solutions and references.

## Building Modeling Algorithms

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

# Pisahkan data menjadi data training dan testing
X_train, X_test, y_train, y_test = train_test_split(
    df[selected_features], df['target'], test_size=0.2, random_state=42
)

# Buat model Logistic Regression
model = LogisticRegression(max_iter=1000)  # Menentukan jumlah iterasi maksimum

# Latih model dengan data training
model.fit(X_train, y_train)

# Lakukan prediksi dengan data testing
y_pred = model.predict(X_test)

# Evaluasi model
accuracy = accuracy_score(y_test, y_pred)
print(f"Akurasi model: {accuracy}")
print("\nLaporan Klasifikasi:")
print(classification_report(y_test, y_pred))

# Catatan hasil eksekusi dan parameter model
print("\nHasil Eksekusi:")
print(f"- Algoritma yang digunakan: Logistic Regression")
print(f"- Fitur yang digunakan: {selected_features}")
print(f"- Akurasi model: {accuracy}")
print(f"- Parameter model: max_iter={model.max_iter}")
print("- Laporan Klasifikasi:")
print(classification_report(y_test, y_pred))

## Model Parameter Optimization

In [None]:
# lakukan optimasi pada parameter model algoritma 
# untuk menghasilkan nilai parameter evaluasi yang sesuai dengan skenario pengujian.

from sklearn.model_selection import GridSearchCV

# Definisikan parameter yang akan dioptimalkan
param_grid = {
    'C': [0.001, 0.01, 0.1, 1, 10, 100],  # Parameter regularization strength
    'solver': ['liblinear', 'lbfgs', 'saga'],  # Algoritma solver
    'max_iter': [500, 1000, 2000]  # Jumlah iterasi maksimum
}

# Buat model Logistic Regression
model = LogisticRegression()

# Gunakan GridSearchCV untuk menemukan parameter terbaik
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, scoring='accuracy')
grid_search.fit(X_train, y_train)

# Tampilkan parameter terbaik yang ditemukan
print("Parameter terbaik:", grid_search.best_params_)

# Gunakan model dengan parameter terbaik untuk prediksi
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)

# Evaluasi model dengan parameter terbaik
accuracy = accuracy_score(y_test, y_pred)

print(f"Akurasi model dengan parameter terbaik: {accuracy}")
print("\nLaporan Klasifikasi dengan parameter terbaik:")
print(classification_report(y_test, y_pred))

# Periksa apakah akurasi memenuhi toleransi
if accuracy >= target_accuracy:
    print("\nModel memenuhi toleransi akurasi yang ditentukan.")
else:
    print("\nModel tidak memenuhi toleransi akurasi yang ditentukan.")

# Catatan hasil eksekusi dan parameter model
print("\nHasil Eksekusi dengan Optimasi Parameter:")
print(f"- Algoritma yang digunakan: Logistic Regression")
print(f"- Fitur yang digunakan: {selected_features}")
print(f"- Akurasi model: {accuracy}")
print(f"- Parameter model terbaik: {grid_search.best_params_}")
print("- Laporan Klasifikasi:")
print(classification_report(y_test, y_pred))

## Model Testing

In [None]:
# Uji model dengan data testing
y_pred = best_model.predict(X_test)

# Evaluasi model
accuracy = accuracy_score(y_test, y_pred)
print(f"Akurasi model pada data testing: {accuracy}")
print("\nLaporan Klasifikasi pada data testing:")
print(classification_report(y_test, y_pred))

# Catat hasil pengujian
print("\nHasil Pengujian Model:")
print(f"- Akurasi: {accuracy}")
print("- Laporan Klasifikasi:")
print(classification_report(y_test, y_pred))

# Simpan hasil pengujian ke dalam file (opsional)
with open('hasil_pengujian_model.txt', 'w') as f:
  f.write(f"Akurasi: {accuracy}\n")
  f.write("Laporan Klasifikasi:\n")
  f.write(classification_report(y_test, y_pred))

print("\nHasil pengujian telah dicatat.")

## Evaluating Modeling Results

In [None]:
# Evaluate the model testing output based on predetermined evaluation parameters (e.g., accuracy, precision, recall, F1 score, MAE). Create a table showing these values.

# Business objective achievement:

# The business objective is to predict iris flower types with high accuracy. Based on this evaluation, the model has met and even exceeded expectations with 100% accuracy.
# This model is highly suitable for applications where accurate classification of the three iris flower types is critical, such as in biological analysis or pattern recognition in botanical data processing.