MACHINE LEARNING

UAS

NAMA : RAFIF ZALFA FRADINA
NIM  : 20220801422

SOAL_ESSAY

1.Jelaskan bagaimana memanfaatkan Machine Learning untuk Call API

Pemanfaatan Machine Learning (ML) untuk Call API dapat dilakukan dalam berbagai skenario, seperti untuk prediksi, klasifikasi, rekomendasi, atau analisis data. Berikut adalah langkah-langkah umum yang dapat diambil untuk menerapkan Machine Learning dalam konteks Call API:

### Langkah-langkah Implementasi

1. **Pemilihan Model Machine Learning:**
   - Tentukan jenis masalah yang ingin dipecahkan (regresi, klasifikasi, clustering, dll).
   - Pilih model yang sesuai (misalnya, Linear Regression, Random Forest, Neural Networks).

2. **Training Model:**
   - Kumpulkan dan persiapkan data yang relevan.
   - Latih model menggunakan data tersebut.
   - Evaluasi kinerja model menggunakan metrik yang sesuai (misalnya, akurasi, precision, recall, F1 score).

3. **Deployment Model:**
   - Setelah model dilatih dan dievaluasi, model harus dideploy. Model ini bisa disimpan dalam format yang dapat diakses oleh API (misalnya, menggunakan framework seperti TensorFlow Serving, Flask, atau FastAPI).

4. **Membangun API:**
   - Gunakan framework web seperti Flask atau FastAPI untuk membuat endpoint API.
   - Endpoint API ini akan menerima permintaan (request) dari client, memprosesnya menggunakan model ML, dan mengembalikan hasilnya (response).

### Contoh Implementasi

Berikut adalah contoh sederhana menggunakan Python dengan Flask untuk membuat API yang memanfaatkan model Machine Learning:

1. **Membangun Model dan Menyimpannya:**
   ```python
   from sklearn.linear_model import LinearRegression
   import pickle
   import numpy as np

   # Contoh data dan model
   X = np.array([[1, 2], [2, 3], [3, 4]])
   y = np.array([3, 5, 7])

   model = LinearRegression()
   model.fit(X, y)

   # Menyimpan model
   with open('model.pkl', 'wb') as file:
       pickle.dump(model, file)
   ```

2. **Membangun API dengan Flask:**
   ```python
   from flask import Flask, request, jsonify
   import pickle
   import numpy as np

   # Memuat model
   with open('model.pkl', 'rb') as file:
       model = pickle.load(file)

   app = Flask(__name__)

   @app.route('/predict', methods=['POST'])
   def predict():
       data = request.get_json(force=True)
       prediction = model.predict(np.array(data['input']).reshape(1, -2))
       return jsonify({'prediction': prediction[0]})

   if __name__ == '__main__':
       app.run(port=5000, debug=True)
   ```

### Cara Kerja API

1. **Client Request:**
   Client mengirimkan permintaan POST ke endpoint `/predict` dengan data input yang sesuai.
   ```json
   {
       "input": [2, 3]
   }
   ```

2. **Server Processing:**
   Server menerima permintaan, memproses data input menggunakan model ML, dan menghasilkan prediksi.

3. **Server Response:**
   Server mengembalikan hasil prediksi dalam format JSON.
   ```json
   {
       "prediction": 5.0
   }
   ```

### Keuntungan Menggunakan API untuk Machine Learning

1. **Scalability:**
   API memungkinkan model ML diakses oleh berbagai aplikasi dan layanan dengan mudah, memfasilitasi skalabilitas.
   
2. **Modularity:**
   Pemisahan antara model ML dan aplikasi memungkinkan pengembangan modular dan perawatan yang lebih mudah.
   
3. **Accessibility:**
   API menyediakan antarmuka yang seragam dan dapat diakses dari berbagai platform dan bahasa pemrograman.

### Alat dan Framework yang Dapat Digunakan

- **Flask / FastAPI:** Untuk membangun dan mengelola endpoint API.
- **TensorFlow Serving:** Untuk melayani model TensorFlow.
- **Docker:** Untuk containerization dan deployment.
- **Kubernetes:** Untuk orkestrasi dan manajemen skala besar.

Dengan langkah-langkah ini, Anda dapat mengintegrasikan model Machine Learning ke dalam aplikasi melalui API, memungkinkan pemanfaatan prediksi dan analisis yang didukung ML dalam berbagai konteks aplikasi.

2.Jelaskan apa yang dimaksud dengan unsupervised learning

Unsupervised learning adalah salah satu jenis pembelajaran dalam machine learning di mana model dilatih menggunakan data yang tidak memiliki label atau target. Tujuan utama dari unsupervised learning adalah untuk menemukan pola atau struktur tersembunyi dalam data tanpa bimbingan eksplisit. Berikut adalah penjelasan lebih lanjut mengenai unsupervised learning:

### Definisi dan Tujuan

**Unsupervised learning** adalah pendekatan dalam machine learning yang mencoba untuk mengekstrak informasi atau menemukan pola dari data input yang tidak memiliki label atau output yang telah ditentukan sebelumnya. Ini berarti bahwa algoritma tidak diberi tahu secara langsung apa yang harus dipelajari atau diidentifikasi, melainkan harus menemukan pola dan hubungan dalam data secara mandiri.

### Contoh-Contoh Unsupervised Learning

1. **Clustering (Pengelompokan):**
   - **K-Means:** Algoritma yang membagi data ke dalam sejumlah klaster berdasarkan kedekatan atau kesamaan antara data poin.
   - **Hierarchical Clustering:** Algoritma yang membangun hierarki klaster yang dapat divisualisasikan sebagai dendrogram.

2. **Dimensionality Reduction (Pengurangan Dimensi):**
   - **Principal Component Analysis (PCA):** Metode yang mengurangi dimensi data dengan menemukan komponen utama yang menjelaskan variabilitas terbesar dalam data.
   - **t-Distributed Stochastic Neighbor Embedding (t-SNE):** Teknik untuk mengurangi dimensi dan visualisasi data dalam ruang dua atau tiga dimensi.

3. **Association (Asosiasi):**
   - **Apriori Algorithm:** Digunakan untuk menemukan aturan asosiasi dalam data transaksi, seperti dalam analisis keranjang belanja (market basket analysis).
   - **FP-Growth:** Algoritma lain untuk menemukan pola frekuen dalam dataset besar.

### Keuntungan Unsupervised Learning

1. **Mengidentifikasi Struktur Data:**
   - Mampu menemukan pola dan struktur dalam data yang tidak terlihat oleh metode lainnya.
   
2. **Mengurangi Dimensi Data:**
   - Membantu dalam mengurangi jumlah fitur dalam data, yang dapat meningkatkan efisiensi dan kinerja model.

3. **Mengelompokkan Data:**
   - Dapat digunakan untuk mengelompokkan data ke dalam kategori atau klaster yang mirip, yang dapat berguna dalam segmentasi pasar, analisis gambar, dan lain-lain.

### Tantangan Unsupervised Learning

1. **Tidak Ada Label:**
   - Karena tidak ada label atau target, sulit untuk mengevaluasi kinerja model secara langsung.
   
2. **Interpretasi Hasil:**
   - Pola atau klaster yang ditemukan mungkin sulit untuk diinterpretasikan dan mungkin memerlukan pengetahuan domain yang mendalam.

### Contoh Penerapan

1. **Analisis Pelanggan:**
   - Mengelompokkan pelanggan berdasarkan perilaku belanja untuk kampanye pemasaran yang ditargetkan.
   
2. **Pengenalan Pola dalam Data Gambar:**
   - Mengidentifikasi objek atau pola dalam gambar tanpa label yang diberikan sebelumnya.
   
3. **Deteksi Anomali:**
   - Mendeteksi pola yang tidak biasa dalam data, seperti transaksi penipuan atau kesalahan manufaktur.

### Algoritma Populer dalam Unsupervised Learning

1. **K-Means Clustering:**
   - Membagi dataset menjadi \( k \) klaster yang berbeda berdasarkan kedekatan atau kesamaan.

2. **Hierarchical Clustering:**
   - Membuat klaster secara bertahap dan menyusun hierarki yang dapat divisualisasikan dalam bentuk dendrogram.

3. PCA (Principal Component Analysis):
   - Mengurangi dimensi data dengan mengidentifikasi komponen utama yang menjelaskan variabilitas terbesar dalam dataset.

4. DBSCAN (Density-Based Spatial Clustering of Applications with Noise):
   - Algoritma pengelompokan berbasis kepadatan yang mampu menemukan klaster dengan bentuk arbitrer dan menangani data dengan noise.

Dengan memahami dan menggunakan metode unsupervised learning, kita dapat menggali informasi tersembunyi dalam data yang tidak berlabel, memungkinkan kita untuk mengidentifikasi pola, mengurangi dimensi data, dan mengelompokkan data secara efektif.

3.Sebutkan beberapa tools yang di gunakan untuk mengolah machine learning

Ada berbagai alat dan pustaka yang digunakan dalam machine learning, masing-masing dengan fitur dan kegunaan khusus. Berikut adalah beberapa tools populer yang sering digunakan dalam pengolahan machine learning, lengkap dengan penjelasan detailnya:

### 1. **TensorFlow**

- **Pengembang:** Google Brain
- **Fitur Utama:**
  - Mendukung berbagai algoritma machine learning dan deep learning.
  - Dapat digunakan untuk pelatihan dan inferensi model dalam skala besar.
  - TensorFlow Serving untuk model deployment.
  - TensorFlow Lite untuk implementasi di perangkat mobile dan embedded.
- **Kegunaan:** Pengembangan dan deployment model machine learning dan deep learning.

### 2. **PyTorch**

- **Pengembang:** Facebook AI Research (FAIR)
- **Fitur Utama:**
  - Dinamis dan fleksibel, memudahkan eksperimen dan debugging.
  - Dukungan kuat untuk GPU, memfasilitasi pelatihan model yang cepat.
  - TorchScript untuk konversi model menjadi format yang dapat dioptimalkan dan dieksekusi.
- **Kegunaan:** Pengembangan model deep learning, penelitian, dan eksperimen.

### 3. **Scikit-Learn**

- **Pengembang:** Tim Scikit-Learn
- **Fitur Utama:**
  - Berbagai algoritma machine learning untuk klasifikasi, regresi, clustering, dan reduksi dimensi.
  - Alat untuk preprocessing data dan evaluasi model.
  - Mudah digunakan dan diintegrasikan dengan pustaka lain seperti NumPy dan pandas.
- **Kegunaan:** Implementasi algoritma machine learning tradisional dan preprocessing data.

### 4. **Keras**

- **Pengembang:** Francois Chollet, dengan dukungan dari komunitas open source
- **Fitur Utama:**
  - Antarmuka yang mudah digunakan untuk pengembangan model neural network.
  - Backend yang dapat dipilih, seperti TensorFlow atau Theano.
  - Mendukung model sekuensial dan fungsional.
- **Kegunaan:** Pengembangan cepat model neural network.

### 5. **XGBoost**

- **Pengembang:** Tianqi Chen
- **Fitur Utama:**
  - Implementasi gradient boosting yang sangat cepat dan efisien.
  - Mendukung regresi, klasifikasi, dan ranking.
  - Fitur untuk penanganan data yang hilang dan regularisasi untuk menghindari overfitting.
- **Kegunaan:** Meningkatkan kinerja model melalui teknik boosting.

### 6. **LightGBM**

- **Pengembang:** Microsoft
- **Fitur Utama:**
  - Gradient boosting yang cepat dan efisien.
  - Mendukung categorical features secara langsung.
  - Optimasi untuk kecepatan dan efisiensi memori.
- **Kegunaan:** Pengembangan model gradient boosting untuk tugas regresi, klasifikasi, dan ranking.

### 7. **H2O.ai**

- **Pengembang:** H2O.ai
- **Fitur Utama:**
  - Mendukung berbagai algoritma machine learning dan deep learning.
  - Alat otomatisasi machine learning (AutoML).
  - Integrasi dengan berbagai bahasa pemrograman seperti R, Python, dan Java.
- **Kegunaan:** Pengembangan model machine learning dengan fokus pada otomatisasi dan efisiensi.

### 8. **Apache Spark MLlib**

- **Pengembang:** Apache Software Foundation
- **Fitur Utama:**
  - Skala besar, mendukung pemrosesan data terdistribusi.
  - Berbagai algoritma machine learning untuk klasifikasi, regresi, clustering, dan collaborative filtering.
  - Integrasi dengan ekosistem Spark untuk analisis data besar.
- **Kegunaan:** Pengolahan dan analisis data dalam skala besar.

### 9. **RapidMiner**

- **Pengembang:** RapidMiner, Inc.
- **Fitur Utama:**
  - Platform end-to-end untuk data preparation, machine learning, dan deployment.
  - Antarmuka drag-and-drop untuk mempermudah pengembangan model.
  - Dukungan untuk berbagai algoritma machine learning dan deep learning.
- **Kegunaan:** Pengembangan model machine learning tanpa banyak coding, cocok untuk data scientists dan business analysts.

### 10. **Weka**

- **Pengembang:** University of Waikato, New Zealand
- **Fitur Utama:**
  - Berbagai algoritma machine learning untuk tugas-tugas seperti klasifikasi, regresi, clustering, dan asosiasi.
  - Antarmuka grafis yang memudahkan penggunaan tanpa coding.
  - Alat untuk preprocessing data dan evaluasi model.
- **Kegunaan:** Pengajaran dan penelitian machine learning, serta eksperimen dalam lingkungan GUI.

### 11. **MLflow**

- **Pengembang:** Databricks
- **Fitur Utama:**
  - Pelacakan eksperimen machine learning.
  - Manajemen model.
  - Deployment model.
  - Alat untuk reproduksi eksperimen.
- **Kegunaan:** Manajemen siklus hidup machine learning, dari eksperimen hingga deployment.

### 12. **DataRobot**

- **Pengembang:** DataRobot, Inc.
- **Fitur Utama:**
  - Platform otomatisasi machine learning.
  - Alat untuk preprocessing data, pemilihan model, dan tuning hyperparameter.
  - Kemampuan deployment model.
- **Kegunaan:** Otomatisasi proses machine learning dari awal hingga akhir, memungkinkan pengguna bisnis untuk mengembangkan model tanpa keahlian mendalam dalam ML.

Dengan berbagai alat ini, pengembangan dan penerapan machine learning menjadi lebih mudah dan efisien, memungkinkan peneliti dan praktisi untuk fokus pada peningkatan kinerja model dan penerapan solusi dalam skala besar.

SOAL STUDI KAMPUSS

In [None]:
import requests

url = "https://shared.djambred.my.id/uas-nim-ganjil.txt"
response = requests.get(url)

# Menyimpan konten teks
text_data = response.text
print(text_data[:500])  # Menampilkan sebagian kecil teks


UAS MACHINE LEARNING ESA UNGGUL

Lakukan import Library Pandas dan Library Numpy

In [15]:
Jawaban
#Import Library Pandas


#Import Library Numpy

NameError: name 'Jawaban' is not defined


SOAL 4 B

DATAFRAME

DataFrame adalah struktur data 2 dimensi yang berbentuk tabular (mempunyai baris dan kolom). Hampir semua data tidak hanya memiliki 1 kolom tetapi lebih dari 1 kolom, sehingga lebih cocok menggunakan pandas DataFrame untuk mengolahnya.

Penggunaan dataframe pada Python dengan menggunakan syntaks: df.

SOAL 4 C

Telaah Data Pada telaah data, dapat dilakukan untuk mengetahui:

tipe data dari setiap kolom
deskripsi statistik data

#Jawaban
#Tampilkan tipe data dari kolom yang ada pada dataset

SOAL 4 D
Apakah tipe Data dari kolom berikut ini: (silakan diisi pada cell di bawah ini)

Jawaban
#Tipe Data dari kolom yang ada di dataset

#Kolom  "Id" memiliki tipe data = ................ <isikan jawaban di sini>
#Kolom "SepalLengthCm" memiliki tipe data = ...... <isikan jawaban di sini>
#Kolom "Species" memiliki tipe data = ............ <isikan jawaban di sini>

In [17]:
SOAL 4 E

SyntaxError: invalid syntax (4262166607.py, line 1)

In [18]:
Hitunglah ukuran (jumlah baris dan kolom) dari dataset.

SyntaxError: invalid syntax (2245418274.py, line 1)

In [20]:
#Latihan (6)
#Hitung ukuran (jumlah baris dan kolom) dari dataset

SOAL 4 F
Tampilkan data yang hanya berisi kolom "Id" dan kolom "Species" dalam bentuk dataframe.




#Jawaban
#Tampilkan data untuk kolom "Id" dan kolom "Species" dalam bentuk dataframe

SOAL 4 G
Tampilkan data dengan dataframe, dan data yang ditampilkan adalah data pada baris dengan indeks 0 (nol) sampai dengan indeks 9 (sembilan)

#Jawaban
#Tampilkan data dengan dataframe, dan data yang ditampilkan adalah baris dengan indeks 0 (nol) sampai dengan indeks 9 (sembilan)

SOAL 4 H
Tampilkan data hanya kolom "Id" dan kolom "Species" dengan dataframe, dan yang ditampilkan adalah data pada baris dengan indeks 11 (sebelas) sampai dengan indeks 15 (limabelas)

#Jawaban
#Tampilkan data hanya kolom "Id" dan kolom "Species", pada baris dengan indeks 0 (nol) sampai dengan indeks 9 (sembilan)

# kolom = "Species"
# indexno = df.columns.get_loc(kolom)

# print ("index of {} kolom {}".format(kolom, indexno))
SOAL 4 I
Pada DataFrame dapat menampilkan beberapa baris pertama/terakhir dari dataset yang di load. Gunakan Method head() dan tail().

Latihan: Tampilkan data pada 8 (delapan) baris pertama dari dataset, dengan dataframe.

#Jawaban
#Tampilkan data pada 8 (delapan) baris pertama dari dataset, dengan dataframe
