In [1]:
!pip install kafka-python pandas



In [2]:
# Impor Library
import pandas as pd
from kafka import KafkaProducer
import json
import time
import logging

In [3]:
# Konfigurasi logging untuk melihat output
logging.basicConfig(level=logging.INFO)
log = logging.getLogger(__name__)

In [4]:
# Inisialisasi Kafka Producer
try:
    producer = KafkaProducer(
        bootstrap_servers='kafka:9092',
        value_serializer=lambda v: json.dumps(v).encode('utf-8'),
        api_version=(0, 10, 1)
    )
    log.info("Kafka Producer berhasil terhubung.")
except Exception as e:
    log.error(f"Gagal terhubung ke Kafka: {e}")
    producer = None

INFO:__main__:Kafka Producer berhasil terhubung.
INFO:kafka.conn:<BrokerConnection client_id=kafka-python-producer-1, node_id=bootstrap-0 host=kafka:9092 <connecting> [IPv4 ('172.18.0.8', 9092)]>: connecting to kafka:9092 [('172.18.0.8', 9092) IPv4]
INFO:kafka.conn:<BrokerConnection client_id=kafka-python-producer-1, node_id=bootstrap-0 host=kafka:9092 <connected> [IPv4 ('172.18.0.8', 9092)]>: Connection complete.


In [5]:
if producer:
    file_path = 'data/predictive_maintenance_dataset.csv'
    try:
        df = pd.read_csv(file_path)
        
        # --- PERBAIKAN: Membersihkan dan menyesuaikan nama kolom untuk menghindari error ---
        df.columns = df.columns.str.strip() # Menghapus spasi di awal/akhir nama kolom
        log.info(f"Dataset baru '{file_path}' berhasil dimuat.")
        log.info(f"Nama kolom yang terdeteksi: {df.columns.tolist()}")
        
        KAFKA_TOPIC = 'raw_sensor_data'

        for index, row in df.iterrows():
            message = row.to_dict()
            producer.send(KAFKA_TOPIC, value=message)
            
            # Menggunakan .get() untuk akses yang lebih aman dan menghindari KeyError
            machine_id = message.get('machine_id', 'N/A')
            event_time = message.get('timestamp', 'N/A')
            log.info(f"Mengirim data untuk machine_id {machine_id} pada waktu {event_time}")
            time.sleep(1)
            
        producer.flush()
        log.info("Semua data sensor berhasil dikirim.")
        
    except FileNotFoundError:
        log.error(f"File tidak ditemukan di path: {file_path}.")
    except Exception as e:
        # Memberikan pesan error yang lebih spesifik
        log.error(f"Terjadi error saat memproses data: {e}", exc_info=True)

INFO:__main__:Dataset baru 'data/predictive_maintenance_dataset.csv' berhasil dimuat.
INFO:__main__:Nama kolom yang terdeteksi: ['timestamp', 'machine_id', 'vibration', 'acoustic', 'temperature', 'current', 'IMF_1', 'IMF_2', 'IMF_3', 'label']
INFO:kafka.conn:<BrokerConnection client_id=kafka-python-producer-1, node_id=1 host=kafka:9092 <connecting> [IPv4 ('172.18.0.8', 9092)]>: connecting to kafka:9092 [('172.18.0.8', 9092) IPv4]
INFO:kafka.conn:<BrokerConnection client_id=kafka-python-producer-1, node_id=1 host=kafka:9092 <connected> [IPv4 ('172.18.0.8', 9092)]>: Connection complete.
INFO:kafka.conn:<BrokerConnection client_id=kafka-python-producer-1, node_id=bootstrap-0 host=kafka:9092 <connected> [IPv4 ('172.18.0.8', 9092)]>: Closing connection. 
INFO:__main__:Mengirim data untuk machine_id M01 pada waktu 2024-07-01 08:00:00
INFO:__main__:Mengirim data untuk machine_id M01 pada waktu 2024-07-01 08:01:00
INFO:__main__:Mengirim data untuk machine_id M01 pada waktu 2024-07-01 08:02:00
