TASK 1 BASIC OPP
Buatlah class MarketingDataETL yang memiliki tiga metode:

extract(): akan membaca data dari sebuah file CSV (Misalkan, marketing_data.csv)

transform(): akan melakukan pembersihan dan transformasi sederhana pada data (seperti mengubah format tanggal atau membersihkan nilai yang kosong)

store(): akan menyimpan data yang telah ditransformasi ke dalam struktur data DataFramet.


In [None]:
import pandas as pd

In [None]:
class MarketingDataETL:
    def __init__(self, file_path):
        self.file_path = file_path
        self.data = None

    def extract(self):
                self.data = pd.read_csv(self.file_path, delimiter=';')
                return self.data

    def transform(self):
                self.data['purchase_date'] = pd.to_datetime(self.data['purchase_date'], format='%d/%m/%y')
                self.data.dropna(inplace=True)
                return self.data

    def store(self, output_file):
                self.data.to_csv(output_file, index=False)
                print(f"Data berhasil disimpan di {output_file}.")

data_marketing = MarketingDataETL('marketing_data.csv')
data_marketing.extract()
data_marketing.transform()
data_marketing.store('transformed_marketing_data.csv')

Data berhasil disimpan di transformed_marketing_data.csv.


In [None]:
pd.read_csv('transformed_marketing_data.csv')

Unnamed: 0,customer_id,purchase_date,product_category,amount_spent
0,C001,2023-03-01,Electronics,250.0
1,C002,2023-03-02,Books,45.5
2,C003,2023-03-03,Home & Garden,150.75
3,C001,2023-03-04,Books,20.0
4,C002,2023-03-05,Electronics,525.0
5,C005,2023-03-07,Beauty,75.0


TASK 2 INHERITANCE & POLYMORPHISM
Gunakan inheritance untuk membuat class TargetedMarketingETL yang mewarisi dari MarketingDataETL.

Tambahkan metode segment_customers() yang mengelompokkan pelanggan berdasarkan kriteria tertentu (misalnya, pengeluaran total atau kategori produk yang dibeli).

Demonstrasi polymorphism dengan meng-override metode transform() dalam TargetedMarketingETL untuk menambahkan logika segmentasi pelanggan ke dalam proses transformasi.

In [None]:
class MarketingDataETL:

    def __init__(self, file):
        self.file = file

    def extract(self):
        df = pd.read_csv(f'{self.file}', sep=';')

        return df

    def transform(self):
        df = self.extract()
        df['purchase_date'] = pd.to_datetime(df['purchase_date'], format='%d/%m/%y')
        df.dropna(inplace=True)
        df.reset_index(drop=True, inplace=True)

        return df

    def store(self):
        df = self.transform()
        df = pd.DataFrame(df)

        return df

In [None]:
data_marketing = MarketingDataETL('marketing_data.csv')
data_marketing.extract()
data_marketing.transform()
data_marketing.store()

Unnamed: 0,customer_id,purchase_date,product_category,amount_spent
0,C001,2023-03-01,Electronics,250.0
1,C002,2023-03-02,Books,45.5
2,C003,2023-03-03,Home & Garden,150.75
3,C001,2023-03-04,Books,20.0
4,C002,2023-03-05,Electronics,525.0
5,C005,2023-03-07,Beauty,75.0


In [None]:
class TargetedMarketingETL(MarketingDataETL):
    def segment_customer(self, amount_spent):
        if amount_spent > 500:
            return 'Kelas A'

        elif amount_spent > 200 and amount_spent <= 500:
            return 'Kelas B'

        elif amount_spent > 0  and amount_spent <= 200:
            return 'Kelas C'

        else:
            return 'unknown'

    def transform(self):
        df = self.extract()
        df['purchase_date'] = pd.to_datetime(df['purchase_date'], format='%d/%m/%y')
        df.dropna(inplace=True)
        df.reset_index(drop=True, inplace=True)
        df['segment'] = df['amount_spent'].apply(self.segment_customer)

        return df


In [None]:
target_marketing = TargetedMarketingETL('marketing_data.csv')
target_marketing.transform()

Unnamed: 0,customer_id,purchase_date,product_category,amount_spent,segment
0,C001,2023-03-01,Electronics,250.0,Kelas B
1,C002,2023-03-02,Books,45.5,Kelas C
2,C003,2023-03-03,Home & Garden,150.75,Kelas C
3,C001,2023-03-04,Books,20.0,Kelas C
4,C002,2023-03-05,Electronics,525.0,Kelas A
5,C005,2023-03-07,Beauty,75.0,Kelas C


In [None]:
import pandas as pd

class MarketingDataETL:
    def __init__(self, file_path):
        self.file_path = 'marketing_data.csv'
        self.data = None

    def extract(self):
        try:
            # Membaca data dari file CSV
            self.data = pd.read_csv(self.file_path)
            print("Data berhasil diekstrak.")
        except FileNotFoundError:
            print("File tidak ditemukan.")
        except Exception as e:
            print(f"Terjadi kesalahan saat ekstraksi data: {str(e)}")

    def transform(self):
        if self.data is not None:
            try:
                # Melakukan transformasi sederhana jika diperlukan
                # Misalnya, mengubah format tanggal atau membersihkan nilai yang kosong
                # Di sini kita anggap tidak ada transformasi yang diperlukan pada contoh ini
                print("Transformasi data selesai.")
            except Exception as e:
                print(f"Terjadi kesalahan saat transformasi data: {str(e)}")
        else:
            print("Data belum diekstrak. Silakan ekstrak data terlebih dahulu.")

    def store(self):
        if self.data is not None:
            try:
                # Menyimpan data yang telah diekstrak ke dalam file CSV baru
                self.data.to_csv('cleaned_marketing_data.csv', index=False)
                print("Data berhasil disimpan.")
            except Exception as e:
                print(f"Terjadi kesalahan saat penyimpanan data: {str(e)}")
        else:
            print("Data belum diekstrak. Silakan ekstrak data terlebih dahulu.")

# Contoh penggunaan class MarketingDataETL
etl = MarketingDataETL('marketing_data.csv')
etl.extract()
etl.transform()
etl.store()

File tidak ditemukan.
Data belum diekstrak. Silakan ekstrak data terlebih dahulu.
Data belum diekstrak. Silakan ekstrak data terlebih dahulu.


In [None]:
import pandas as pd

class MarketingDataETL:
    def __init__(self, file_path):
        self.file_path = file_path
        self.data = None

    def extract(self):
        try:
            # Membaca data dari file CSV
            self.data = pd.read_csv(self.file_path)
            print("Data berhasil diekstrak.")
        except FileNotFoundError:
            print("File tidak ditemukan.")
        except Exception as e:
            print(f"Terjadi kesalahan saat ekstraksi data: {str(e)}")

    def transform(self):
        if self.data is not None:
            try:
                # Melakukan transformasi sederhana jika diperlukan
                # Misalnya, mengubah format tanggal atau membersihkan nilai yang kosong
                # Di sini kita anggap tidak ada transformasi yang diperlukan pada contoh ini
                print("Transformasi data selesai.")
            except Exception as e:
                print(f"Terjadi kesalahan saat transformasi data: {str(e)}")
        else:
            print("Data belum diekstrak. Silakan ekstrak data terlebih dahulu.")

    def store(self):
        if self.data is not None:
            try:
                # Menyimpan data yang telah diekstrak ke dalam file CSV baru
                self.data.to_csv('cleaned_marketing_data.csv', index=False)
                print("Data berhasil disimpan.")
            except Exception as e:
                print(f"Terjadi kesalahan saat penyimpanan data: {str(e)}")
        else:
            print("Data belum diekstrak. Silakan ekstrak data terlebih dahulu.")

class TargetedMarketingETL(MarketingDataETL):
    def __init__(self, file_path):
        super().__init__(file_path)

    def segment_customers(self, criteria):
        if self.data is not None:
            try:
                # Melakukan segmentasi pelanggan berdasarkan kriteria tertentu
                # Di sini kita anggap kriteria adalah kolom 'kategori_produk'
                segments = self.data.groupby(criteria)
                print("Pelanggan berhasil di-segmentasikan.")
                return segments
            except Exception as e:
                print(f"Terjadi kesalahan saat segmentasi pelanggan: {str(e)}")
        else:
            print("Data belum diekstrak. Silakan ekstrak data terlebih dahulu.")

    def transform(self):
        if self.data is not None:
            try:
                # Melakukan transformasi sederhana seperti yang dilakukan di class induk
                super().transform()

                # Melakukan segmentasi pelanggan (override)
                segments = self.segment_customers('kategori_produk')
                print("Data pelanggan berhasil di-segmentasikan.")
                return segments
            except Exception as e:
                print(f"Terjadi kesalahan saat transformasi data: {str(e)}")
        else:
            print("Data belum diekstrak. Silakan ekstrak data terlebih dahulu.")

# Contoh penggunaan class TargetedMarketingETL
etl = TargetedMarketingETL('marketing_data.csv')
etl.extract()
etl.transform()
etl.store()

File tidak ditemukan.
Data belum diekstrak. Silakan ekstrak data terlebih dahulu.
Data belum diekstrak. Silakan ekstrak data terlebih dahulu.
