# Business Understanding

Kota Bandung telah lama dikenal sebagai pusat pertumbuhan industri kuliner yang sangat dinamis dan kompetitif. Statusnya sebagai kota kreatif dengan denyut populasi muda yang tinggi secara konsisten mendorong lahirnya tren Food & Beverage (F&B) baru, menciptakan ekosistem bisnis yang menarik dan penuh peluang. Namun, di balik potensi besar ini, industri F&B di Bandung juga dihadapkan pada tingkat kegagalan usaha yang signifikan. Salah satu faktor krusial yang kerap menjadi penyebab kegagalan ini adalah pemilihan lokasi usaha yang kurang tepat. Saat ini, sebagian besar pelaku usaha F&B di Bandung masih cenderung mengandalkan intuisi, pengalaman pribadi, atau sekadar mengikuti arus tren yang sedang populer dalam menentukan lokasi. Pendekatan ini seringkali dilakukan tanpa dukungan data risiko yang mendalam dan analisis strategis yang komprehensif. Akibatnya, keputusan lokasi menjadi tidak optimal, meningkatkan eksposur terhadap berbagai risiko operasional dan finansial yang dapat berujung pada kegagalan usaha.

Melihat kesenjangan antara potensi pasar yang besar dan tingginya tingkat kegagalan akibat mislokasi, muncul kebutuhan mendesak akan pendekatan yang lebih berbasis data dan prediktif dalam proses pemilihan lokasi. Pelaku usaha memerlukan alat yang dapat memberikan pemahaman objektif mengenai tingkat risiko dan peluang di berbagai area, melampaui sekadar asumsi atau tren sesaat. Berdasarkan permasalahan ini, proyek ini bertujuan untuk mengembangkan sebuah solusi inovatif berbasis Artificial Intelligence (AI) yang spesifik untuk membantu pelaku usaha F&B di Kota Bandung. Tujuan utama dari solusi ini adalah menganalisis dan memetakan tingkat risiko guna memberikan visualisasi dan skor risiko yang jelas untuk berbagai potensi lokasi usaha F&B di Kota Bandung. Dengan demikian, proyek ini akan memberikan rekomendasi lokasi yang lebih strategis, memungkinkan pelaku usaha membuat keputusan pemilihan lokasi yang lebih terinformasi, didukung oleh data, dan meminimalkan risiko kegagalan, yang pada akhirnya diharapkan dapat meningkatkan peluang keberhasilan usaha F&B. Lingkup proyek ini akan berfokus pada pengembangan model AI yang mampu mengintegrasikan dan menganalisis berbagai parameter data relevan (misalnya: demografi, pola lalu lintas, keberadaan kompetitor, aksesibilitas, infrastruktur, dll.) di wilayah Kota Bandung untuk menghasilkan peta risiko dan rekomendasi lokasi. Output dari sistem ini diharapkan dapat menjadi panduan praktis bagi calon maupun existing pelaku usaha F&B.

# Data Understanding

In [5]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

#df = pd.read_csv('../uncleaned_datasets/data_fnb_bandung.csv')
df_fnb = pd.read_csv('../datasets/fnb_matched_with_kepadatan.csv')

df_fnb['type'] = 'restaurant'

df_fnb.to_csv('../datasets/data_fnb_bandung_with_kecamatan_api_cleaned.csv', index=False)

## cek kecamatan yang tidak ada di data_fnb_bandung dan print nama jalan dan restoran yang tidak memiliki kecamatan yang valid

# kecamatan_valid = df_fnb['kecamatan'].unique()
# kecamatan_valid = set(kecamatan_valid)
# kecamatan_invalid = df_fnb[df_fnb['kecamatan'].isnull() | (df_fnb['kecamatan'] == '')]
# print("Kecamatan yang tidak valid:")
# print(kecamatan_invalid[['nama_rumah_makan', 'nama_jalan']])


# #cek apakah ada nama usaha yang duplikat
# duplikat = df[df.duplicated(subset='nama_rumah_makan', keep=False)]
# print("Jumlah usaha yang duplikat:", duplikat['nama_rumah_makan'].nunique())

# #drop duplikat yang tahunnya paling lama
# df = df.sort_values(by='tahun', ascending=False)
# df = df.drop_duplicates(subset='nama_rumah_makan', keep='first')

# #cek apakah ada nama usaha yang duplikat lagi
# duplikat = df[df.duplicated(subset='nama_rumah_makan', keep=False)]
# print("Jumlah usaha yang duplikat setelah dihapus:", duplikat['nama_rumah_makan'].nunique())

# #cek apakah ada nama usaha yang duplikat di tahun yang sama
# duplikat_tahun = df[df.duplicated(subset=['nama_rumah_makan', 'tahun'], keep=False)]
# print("Jumlah usaha yang duplikat di tahun yang sama:", duplikat_tahun['nama_rumah_makan'].nunique())

#simpan dataset yang sudah dibersihkan
# df.to_csv('../datasets/cleaned_data_fnb_bandung_cleaned.csv', index=False)


FileNotFoundError: [Errno 2] No such file or directory: '../datasets/fnb_matched_with_kepadatan.csv'

In [None]:
# IMPORT LIBRARIES UNTUK GOOGLE MAPS GEOCODING
print("=== IMPORTING REQUIRED LIBRARIES ===")

# Import library yang sudah ada
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import time

# Import untuk Google Maps API
try:
    import googlemaps
    print("✅ googlemaps library tersedia")
except ImportError:
    print("❌ googlemaps tidak ditemukan. Install dengan: !pip install googlemaps")

# Import untuk progress bar
try:
    from tqdm import tqdm
    print("✅ tqdm library tersedia")
except ImportError:
    print("❌ tqdm tidak ditemukan. Install dengan: !pip install tqdm")

# Setup Google Maps API
API_KEY = 'AIzaSyAMu_PiVlP52Z99Vzzx2umpW4lASFGCYeU'

# Inisialisasi Google Maps client
gmaps = None
try:
    gmaps = googlemaps.Client(key=API_KEY)
    print("✅ Google Maps client berhasil diinisialisasi")
    print("💰 Kredit tersedia: 4.8 juta (≈960,000 requests)")
except Exception as e:
    print(f"❌ Error inisialisasi Google Maps: {e}")
    print("⚠️  Pastikan API key valid dan billing sudah diaktifkan")

print("\n📋 Status Import:")
print(f"   pandas: ✅")
print(f"   googlemaps: {'✅' if 'googlemaps' in globals() else '❌'}")
print(f"   tqdm: {'✅' if 'tqdm' in globals() else '❌'}")
print(f"   Google Maps Client: {'✅' if gmaps else '❌'}")

print("\n🚀 Siap untuk proses geocoding!")

=== IMPORTING REQUIRED LIBRARIES ===
✅ googlemaps library tersedia
✅ tqdm library tersedia
✅ Google Maps client berhasil diinisialisasi
💰 Kredit tersedia: 4.8 juta (≈960,000 requests)

📋 Status Import:
   pandas: ✅
   googlemaps: ✅
   tqdm: ✅
   Google Maps Client: ✅

🚀 Siap untuk proses geocoding!


In [None]:
# INSTALL REQUIRED LIBRARIES (Run this if libraries are missing)
print("=== INSTALLING REQUIRED LIBRARIES ===")
print("Jalankan cell ini jika ada library yang belum terinstall")

# Uncomment baris di bawah jika perlu install library
# !pip install googlemaps tqdm

# Alternatively, install via conda:
# !conda install -c conda-forge googlemaps tqdm

print("💡 Jika ada error 'library not found':")
print("   1. Uncomment baris install di atas")
print("   2. Restart kernel setelah install")
print("   3. Jalankan ulang cell import")

In [None]:
# CHECKLIST IMPORTS - TROUBLESHOOTING GUIDE
print("=== CHECKLIST IMPORTS UNTUK GEOCODING ===")

# Daftar semua library yang dibutuhkan
required_libraries = {
    'pandas': 'Data manipulation dan analysis',
    'numpy': 'Numerical computing',
    'matplotlib': 'Plotting dan visualisasi',
    'seaborn': 'Statistical visualization', 
    'googlemaps': 'Google Maps API client (WAJIB)',
    'tqdm': 'Progress bar untuk loop (WAJIB)',
    'time': 'Time-related functions (built-in Python)'
}

missing_libraries = []

for lib, desc in required_libraries.items():
    try:
        if lib == 'googlemaps':
            import googlemaps
        elif lib == 'tqdm':
            from tqdm import tqdm
        elif lib == 'pandas':
            import pandas as pd
        elif lib == 'numpy':
            import numpy as np
        elif lib == 'matplotlib':
            import matplotlib.pyplot as plt
        elif lib == 'seaborn':
            import seaborn as sns
        elif lib == 'time':
            import time
            
        print(f"✅ {lib:<12} - {desc}")
    except ImportError:
        print(f"❌ {lib:<12} - {desc} (MISSING)")
        missing_libraries.append(lib)

if missing_libraries:
    print(f"\n⚠️  LIBRARY YANG HILANG: {', '.join(missing_libraries)}")
    print(f"\n💡 CARA INSTALL:")
    print(f"   Pilih salah satu command berikut:")
    print(f"   • pip install {' '.join(missing_libraries)}")
    print(f"   • conda install -c conda-forge {' '.join(missing_libraries)}")
    print(f"\n🔄 Setelah install, restart kernel dan jalankan ulang cell import")
else:
    print(f"\n🎉 SEMUA LIBRARY TERSEDIA!")
    print(f"✅ Siap untuk proses geocoding dengan Google Maps API")

print(f"\n📋 NEXT STEPS:")
print(f"   1. Pastikan API key Google Maps valid")
print(f"   2. Pastikan billing diaktifkan di Google Cloud")
print(f"   3. Jalankan cell import untuk inisialisasi gmaps client")
print(f"   4. Test dengan sample data sebelum batch processing")

=== CHECKLIST IMPORTS UNTUK GEOCODING ===
✅ pandas       - Data manipulation dan analysis
✅ numpy        - Numerical computing
✅ matplotlib   - Plotting dan visualisasi
✅ seaborn      - Statistical visualization
✅ googlemaps   - Google Maps API client (WAJIB)
✅ tqdm         - Progress bar untuk loop (WAJIB)
✅ time         - Time-related functions (built-in Python)

🎉 SEMUA LIBRARY TERSEDIA!
✅ Siap untuk proses geocoding dengan Google Maps API

📋 NEXT STEPS:
   1. Pastikan API key Google Maps valid
   2. Pastikan billing diaktifkan di Google Cloud
   3. Jalankan cell import untuk inisialisasi gmaps client
   4. Test dengan sample data sebelum batch processing


In [None]:
# RESET DAN SETUP DATASET BARU UNTUK PENCARIAN KECAMATAN
print("=== RESET DATASET UNTUK PENCARIAN KECAMATAN ===")

# Reload dataset original untuk memulai fresh
df_original = pd.read_csv('../uncleaned_datasets/data_fnb_bandung.csv')
print(f"✅ Dataset original berhasil dimuat: {len(df_original)} records")

# Bersihkan duplikat seperti sebelumnya
df_clean = df_original.sort_values(by='tahun', ascending=False)
df_clean = df_clean.drop_duplicates(subset='nama_rumah_makan', keep='first')
print(f"✅ Setelah cleaning duplikat: {len(df_clean)} records")

# Tambahkan kolom kecamatan kosong
df_clean['kecamatan'] = 'Tidak Diketahui'
print("✅ Kolom kecamatan ditambahkan dengan default 'Tidak Diketahui'")

# Update dataset utama
df = df_clean.copy()
print(f"📊 Dataset siap untuk proses geocoding: {len(df)} records")
print(f"📍 Sample data:")
print(df[['nama_rumah_makan', 'alamat', 'kecamatan']].head(3))

=== RESET DATASET UNTUK PENCARIAN KECAMATAN ===
✅ Dataset original berhasil dimuat: 9121 records
✅ Setelah cleaning duplikat: 5286 records
✅ Kolom kecamatan ditambahkan dengan default 'Tidak Diketahui'
📊 Dataset siap untuk proses geocoding: 5286 records
📍 Sample data:
                            nama_rumah_makan                   alamat  \
9105              HOLLAND BAKERY UJUNGBERUNG  JL. A.H. NASUTION NO.63   
9120  TRADITIONAL DELICIOUS AND HEALTHY FOOD      SUKAGALIH ROAD 200A   
9104   SAMBALADO TASTE(DELIVERY MAKANAN HOT(                 3PR2+3XX   

            kecamatan  
9105  Tidak Diketahui  
9120  Tidak Diketahui  
9104  Tidak Diketahui  


In [None]:
# FUNGSI PENCARIAN KECAMATAN - GOOGLE MAPS API ONLY
def cari_kecamatan_api_only(row):
    """
    Mencari kecamatan berdasarkan nama usaha dan alamat menggunakan Google Maps API saja.
    Dengan kredit 4.8 juta, kita bisa memproses hampir 1 juta requests!
    """
    
    if not gmaps:
        return "API Tidak Tersedia"
    
    try:
        # Variasi query yang berbeda untuk meningkatkan akurasi
        queries = [
            f"{row['nama_rumah_makan']}, {row['alamat']}, Bandung, Indonesia",
            f"{row['alamat']}, Bandung, Jawa Barat, Indonesia", 
            f"{row['alamat']}, Kota Bandung, Indonesia",
            f"{row['nama_rumah_makan']}, {row['alamat']}, Bandung"
        ]
        
        for query in queries:
            try:
                geocode_result = gmaps.geocode(query)
                
                if geocode_result and len(geocode_result) > 0:
                    # Ambil hasil geocoding pertama
                    result = geocode_result[0]
                    
                    # Debug: print formatted address untuk sample data
                    if 'formatted_address' in result:
                        formatted_addr = result['formatted_address']
                    
                    # Cari kecamatan dalam address components
                    address_components = result.get('address_components', [])
                    
                    # Prioritas 1: administrative_area_level_3 (kecamatan)
                    for component in address_components:
                        if 'administrative_area_level_3' in component['types']:
                            return component['long_name']
                    
                    # Prioritas 2: sublocality_level_1 (kelurahan/area)
                    for component in address_components:
                        if 'sublocality_level_1' in component['types']:
                            sublocality = component['long_name']
                            # Skip jika sama dengan nama kota
                            if 'Bandung' not in sublocality and 'Kota' not in sublocality:
                                return sublocality
                    
                    # Prioritas 3: sublocality (umum)
                    for component in address_components:
                        if 'sublocality' in component['types']:
                            sublocality = component['long_name'] 
                            if 'Bandung' not in sublocality and 'Kota' not in sublocality:
                                return sublocality
                    
                    # Prioritas 4: locality (jika bukan Bandung)
                    for component in address_components:
                        if 'locality' in component['types']:
                            locality = component['long_name']
                            if locality != 'Bandung' and 'Kota Bandung' not in locality:
                                return locality
                    
                    # Jika menemukan hasil, keluar dari loop queries
                    if geocode_result:
                        break
                        
            except Exception as e:
                # Coba query berikutnya jika ada error
                continue
        
        # Jika tidak ditemukan setelah semua query
        return 'Tidak Ditemukan'
        
    except Exception as e:
        return f'Error: {str(e)[:50]}'  # Batasi panjang error message

print("✅ Fungsi pencarian kecamatan - Google Maps API Only")
print("💰 Kredit tersedia: 4.8 juta (≈960,000 requests)")
print("📍 Strategi pencarian:")
print("   1. Multiple query variations untuk akurasi maksimal")
print("   2. Prioritas: administrative_area_level_3 → sublocality_level_1 → sublocality → locality")
print("   3. Filter hasil untuk menghindari duplikasi nama kota")
print("   4. Fallback: 'Tidak Ditemukan' jika API tidak menemukan hasil")

✅ Fungsi pencarian kecamatan - Google Maps API Only
💰 Kredit tersedia: 4.8 juta (≈960,000 requests)
📍 Strategi pencarian:
   1. Multiple query variations untuk akurasi maksimal
   2. Prioritas: administrative_area_level_3 → sublocality_level_1 → sublocality → locality
   3. Filter hasil untuk menghindari duplikasi nama kota
   4. Fallback: 'Tidak Ditemukan' jika API tidak menemukan hasil


In [None]:
# TEST FUNGSI API-ONLY DENGAN SAMPLE DATA
print("=== TESTING FUNGSI GOOGLE MAPS API ONLY ===")

# Import time jika belum ada
try:
    import time
except ImportError:
    print("❌ time library tidak tersedia")

# Test dengan 5 sample data
sample_test = df.head(5).copy()
print("Testing dengan 5 sample data menggunakan Google Maps API:")

for idx, row in sample_test.iterrows():
    nama = row['nama_rumah_makan']
    alamat = row['alamat']
    
    print(f"\n{idx+1}. {nama}")
    print(f"   Alamat: {alamat}")
    
    # Test fungsi baru
    kecamatan_result = cari_kecamatan_api_only(row)
    print(f"   Kecamatan: {kecamatan_result}")
    
    # Simulasi delay untuk menghormati rate limit
    try:
        time.sleep(0.1)  # 100ms delay antar request
    except NameError:
        pass  # Skip delay jika time tidak tersedia

print(f"\n" + "="*60)
print("💡 Dengan kredit 4.8 juta, Anda dapat memproses dataset lengkap tanpa khawatir biaya!")

=== TESTING FUNGSI GOOGLE MAPS API ONLY ===
Testing dengan 5 sample data menggunakan Google Maps API:

9106. HOLLAND BAKERY UJUNGBERUNG
   Alamat: JL. A.H. NASUTION NO.63
   Kecamatan: Kecamatan Ujung Berung

9121. TRADITIONAL DELICIOUS AND HEALTHY FOOD
   Alamat: SUKAGALIH ROAD 200A
   Kecamatan: Kecamatan Ujung Berung

9121. TRADITIONAL DELICIOUS AND HEALTHY FOOD
   Alamat: SUKAGALIH ROAD 200A
   Kecamatan: Kecamatan Ujung Berung

9105. SAMBALADO TASTE(DELIVERY MAKANAN HOT(
   Alamat: 3PR2+3XX
   Kecamatan: Kecamatan Ujung Berung

9105. SAMBALADO TASTE(DELIVERY MAKANAN HOT(
   Alamat: 3PR2+3XX
   Kecamatan: Ujung Berung

9104. EMADO'S SHAWARMA UJUNGBERUNG
   Alamat: JL. A.H. NASUTION NO.111
   Kecamatan: Ujung Berung

9104. EMADO'S SHAWARMA UJUNGBERUNG
   Alamat: JL. A.H. NASUTION NO.111
   Kecamatan: Kecamatan Ujung Berung

9103. SWEET HEART II
   Alamat: LLRE MARTADINATA ST NO.140
   Kecamatan: Kecamatan Ujung Berung

9103. SWEET HEART II
   Alamat: LLRE MARTADINATA ST NO.140
   Ke

In [None]:
# PROSES BATCH DENGAN GOOGLE MAPS API - HIGH CREDIT LIMIT
def proses_kecamatan_api_batch(dataframe, max_requests=None):
    """
    Memproses dataset untuk mencari kecamatan menggunakan Google Maps API saja.
    Dengan kredit 4.8 juta, kita bisa memproses hampir semua data!
    
    Parameters:
    - dataframe: DataFrame yang akan diproses
    - max_requests: Maksimal request API (None = proses semua data)
    """
    
    # Import tqdm di dalam fungsi untuk memastikan tersedia
    try:
        from tqdm import tqdm
    except ImportError:
        print("❌ tqdm tidak tersedia. Install dengan: !pip install tqdm")
        return dataframe
    
    print(f"=== MEMPROSES DATASET DENGAN GOOGLE MAPS API ===")
    print(f"💰 Kredit tersedia: 4.8 juta (≈960,000 requests)")
    print(f"📊 Total data: {len(dataframe):,}")
    
    # Jika max_requests tidak ditentukan, proses semua data
    if max_requests is None:
        max_requests = len(dataframe)
        print(f"🚀 Mode: Proses SEMUA data ({max_requests:,} requests)")
    else:
        print(f"🔧 Mode: Batch terbatas ({max_requests:,} requests)")
    
    # Estimasi biaya (setelah 200 gratis per hari)
    if max_requests > 200:
        estimated_cost = ((max_requests - 200) / 1000) * 5
        print(f"💰 Estimasi penggunaan kredit: ${estimated_cost:.2f}")
        print(f"💰 Sisa kredit setelah proses: ${4800 - estimated_cost:.2f}")
        
        if estimated_cost > 1000:  # Warning jika lebih dari $1000
            proceed = input(f"⚠️  Proses akan menggunakan ${estimated_cost:.2f} kredit. Lanjutkan? (y/n): ")
            if proceed.lower() != 'y':
                print("❌ Proses dibatalkan")
                return dataframe
    else:
        print("💚 Dalam batas gratis harian (200 requests)")
    
    if not gmaps:
        print("❌ Google Maps client tidak tersedia")
        return dataframe
    
    # Salin dataframe untuk memproses
    df_processed = dataframe.copy()
    
    # Filter data yang belum diproses
    rows_to_process = df_processed[df_processed['kecamatan'] == 'Tidak Diketahui']
    
    if len(rows_to_process) == 0:
        print("✅ Semua data sudah memiliki kecamatan")
        return df_processed
    
    # Batasi sesuai max_requests
    batch_size = min(len(rows_to_process), max_requests)
    print(f"🔄 Memproses {batch_size:,} dari {len(rows_to_process):,} data yang belum diproses")
    
    # Ambil batch untuk diproses
    df_batch = rows_to_process.head(batch_size)
    
    # Setup progress bar
    tqdm.pandas(desc="🔍 Geocoding dengan Google Maps API")
    
    # Proses batch dengan API
    start_time = pd.Timestamp.now()
    df_processed.loc[df_batch.index, 'kecamatan'] = df_batch.progress_apply(cari_kecamatan_api_only, axis=1)
    end_time = pd.Timestamp.now()
    
    duration = (end_time - start_time).total_seconds()
    
    # Statistik hasil
    hasil_stats = df_processed['kecamatan'].value_counts()
    teridentifikasi = len(df_processed[df_processed['kecamatan'] != 'Tidak Diketahui'])
    tidak_ditemukan = len(df_processed[df_processed['kecamatan'] == 'Tidak Ditemukan'])
    error_count = len(df_processed[df_processed['kecamatan'].str.startswith('Error', na=False)])
    
    print(f"\n📊 HASIL PROCESSING:")
    print(f"⏱️  Waktu proses: {duration:.1f} detik")
    print(f"🚀 Rate: {batch_size/duration:.1f} requests/detik")
    print(f"✅ Berhasil teridentifikasi: {teridentifikasi:,}/{len(df_processed):,} ({(teridentifikasi/len(df_processed)*100):.1f}%)")
    print(f"❓ Tidak ditemukan: {tidak_ditemukan:,}")
    print(f"❌ Error: {error_count:,}")
    print(f"⏳ Belum diproses: {len(df_processed) - batch_size:,}")
    
    print(f"\n🏘️ TOP 15 KECAMATAN TERIDENTIFIKASI:")
    # Filter out status messages
    kecamatan_valid = hasil_stats[~hasil_stats.index.isin(['Tidak Diketahui', 'Tidak Ditemukan']) 
                                 & ~hasil_stats.index.str.startswith('Error', na=False)]
    print(kecamatan_valid.head(15))
    
    return df_processed

print("✅ Fungsi batch processing API-only siap digunakan")
print("💡 Gunakan: df_result = proses_kecamatan_api_batch(df)")
print("💡 Atau batasi: df_result = proses_kecamatan_api_batch(df, max_requests=1000)")

✅ Fungsi batch processing API-only siap digunakan
💡 Gunakan: df_result = proses_kecamatan_api_batch(df)
💡 Atau batasi: df_result = proses_kecamatan_api_batch(df, max_requests=1000)


In [None]:
# EKSEKUSI PROSES GOOGLE MAPS API - HIGH CREDIT
print("=== PILIH MODE PROCESSING DENGAN KREDIT 4.8 JUTA ===")
print("1. Test Small (100 requests) - AMAN")
print("2. Medium Batch (1,000 requests) - $4")  
print("3. Large Batch (5,000 requests) - $24")
print("4. FULL PROCESSING (Semua data) - Estimasi ~$26")

# Pilih mode sesuai kebutuhan
MODE = 4  # Ubah sesuai kebutuhan: 1=Test, 2=Medium, 3=Large, 4=Full

if MODE == 1:
    print("🧪 MODE: Test Small (100 requests)")
    df_with_kecamatan = proses_kecamatan_api_batch(df, max_requests=100)
    
elif MODE == 2:
    print("🔧 MODE: Medium Batch (1,000 requests)")
    df_with_kecamatan = proses_kecamatan_api_batch(df, max_requests=1000)
    
elif MODE == 3:
    print("⚡ MODE: Large Batch (5,000 requests)")
    df_with_kecamatan = proses_kecamatan_api_batch(df, max_requests=5000)
    
elif MODE == 4:
    print("🚀 MODE: FULL PROCESSING - Proses semua data!")
    df_with_kecamatan = proses_kecamatan_api_batch(df, max_requests=None)

# Simpan hasil ke file
output_filename = '../datasets/data_fnb_bandung_with_kecamatan_api.csv'
df_with_kecamatan.to_csv(output_filename, index=False)

print(f"\n💾 DATASET TERSIMPAN: {output_filename}")
print(f"📊 Total records: {len(df_with_kecamatan):,}")

# Sample hasil
hasil_valid = df_with_kecamatan[
    ~df_with_kecamatan['kecamatan'].isin(['Tidak Diketahui', 'Tidak Ditemukan']) &
    ~df_with_kecamatan['kecamatan'].str.startswith('Error', na=False)
]

print(f"📍 Sample hasil yang berhasil:")
if len(hasil_valid) > 0:
    print(hasil_valid[['nama_rumah_makan', 'alamat', 'kecamatan']].head())
else:
    print("Belum ada hasil yang berhasil diidentifikasi dalam batch ini.")

=== PILIH MODE PROCESSING DENGAN KREDIT 4.8 JUTA ===
1. Test Small (100 requests) - AMAN
2. Medium Batch (1,000 requests) - $4
3. Large Batch (5,000 requests) - $24
4. FULL PROCESSING (Semua data) - Estimasi ~$26
🚀 MODE: FULL PROCESSING - Proses semua data!
=== MEMPROSES DATASET DENGAN GOOGLE MAPS API ===
💰 Kredit tersedia: 4.8 juta (≈960,000 requests)
📊 Total data: 5,286
🚀 Mode: Proses SEMUA data (5,286 requests)
💰 Estimasi penggunaan kredit: $25.43
💰 Sisa kredit setelah proses: $4774.57
🔄 Memproses 5,286 dari 5,286 data yang belum diproses


🔍 Geocoding dengan Google Maps API: 100%|██████████| 5286/5286 [16:50<00:00,  5.23it/s]




📊 HASIL PROCESSING:
⏱️  Waktu proses: 1010.6 detik
🚀 Rate: 5.2 requests/detik
✅ Berhasil teridentifikasi: 5,286/5,286 (100.0%)
❓ Tidak ditemukan: 22
❌ Error: 0
⏳ Belum diproses: 0

🏘️ TOP 15 KECAMATAN TERIDENTIFIKASI:
kecamatan
Kecamatan Bandung Wetan       790
Kecamatan Sumur Bandung       565
Kecamatan Coblong             507
Kecamatan Lengkong            398
Kecamatan Sukajadi            365
Kecamatan Cicendo             274
Kecamatan Andir               174
Kecamatan Batununggal         173
Kecamatan Sukasari            167
Kecamatan Cibeunying Kaler    162
Kecamatan Cidadap             137
Kecamatan Regol               134
Kecamatan Cibeunying Kidul    123
Kecamatan Kiaracondong        102
Kecamatan Antapani             94
Name: count, dtype: int64

💾 DATASET TERSIMPAN: ../datasets/data_fnb_bandung_with_kecamatan_api.csv
📊 Total records: 5,286
📍 Sample hasil yang berhasil:
                            nama_rumah_makan                      alamat  \
9105              HOLLAND BAKERY

In [None]:
# ANALISIS FINAL DATASET - GOOGLE MAPS API RESULTS
print("=== ANALISIS FINAL DATASET GOOGLE MAPS API ===")

# Statistik lengkap
total_data = len(df_with_kecamatan)
dengan_kecamatan_valid = len(df_with_kecamatan[
    ~df_with_kecamatan['kecamatan'].isin(['Tidak Diketahui', 'Tidak Ditemukan']) &
    ~df_with_kecamatan['kecamatan'].str.startswith('Error', na=False)
])
tidak_ditemukan = len(df_with_kecamatan[df_with_kecamatan['kecamatan'] == 'Tidak Ditemukan'])
belum_diproses = len(df_with_kecamatan[df_with_kecamatan['kecamatan'] == 'Tidak Diketahui'])
error_count = len(df_with_kecamatan[df_with_kecamatan['kecamatan'].str.startswith('Error', na=False)])

print(f"📊 RINGKASAN DATASET:")
print(f"   💰 Kredit digunakan: 4.8 juta tersedia")
print(f"   📈 Total data: {total_data:,} records")
print(f"   ✅ Berhasil teridentifikasi: {dengan_kecamatan_valid:,} ({(dengan_kecamatan_valid/total_data*100):.1f}%)")
print(f"   ❓ API tidak menemukan: {tidak_ditemukan:,} ({(tidak_ditemukan/total_data*100):.1f}%)")
print(f"   ⏳ Belum diproses: {belum_diproses:,} ({(belum_diproses/total_data*100):.1f}%)")
print(f"   ❌ Error: {error_count:,} ({(error_count/total_data*100):.1f}%)")

if dengan_kecamatan_valid > 0:
    print(f"\n🏘️ DISTRIBUSI KECAMATAN YANG BERHASIL TERIDENTIFIKASI:")
    
    # Filter hanya kecamatan valid
    kecamatan_valid = df_with_kecamatan[
        ~df_with_kecamatan['kecamatan'].isin(['Tidak Diketahui', 'Tidak Ditemukan']) &
        ~df_with_kecamatan['kecamatan'].str.startswith('Error', na=False)
    ]
    
    kecamatan_counts = kecamatan_valid['kecamatan'].value_counts()
    print(kecamatan_counts.head(20))
    
    print(f"\n📈 ANALISIS COVERAGE PER TAHUN (Hanya yang berhasil):")
    coverage_per_tahun = kecamatan_valid.groupby('tahun').agg({
        'kecamatan': ['count']
    })
    coverage_per_tahun.columns = ['Teridentifikasi']
    
    # Tambahkan total per tahun
    total_per_tahun = df_with_kecamatan.groupby('tahun').size()
    coverage_per_tahun['Total'] = total_per_tahun
    coverage_per_tahun['Persentase'] = (coverage_per_tahun['Teridentifikasi'] / coverage_per_tahun['Total'] * 100).round(1)
    
    print(coverage_per_tahun)
else:
    print("\n⚠️ Belum ada data yang berhasil teridentifikasi dalam batch ini.")

# Export ke berbagai format
print(f"\n💾 MENYIMPAN DATASET KE BERBAGAI FORMAT:")

# CSV lengkap (semua hasil termasuk status)
csv_file = '../datasets/data_fnb_bandung_api_results_complete.csv'
df_with_kecamatan.to_csv(csv_file, index=False)
print(f"✅ CSV Lengkap: {csv_file}")

if dengan_kecamatan_valid > 0:
    # CSV hanya yang berhasil teridentifikasi
    csv_success = '../datasets/data_fnb_bandung_api_success_only.csv'
    df_success_only = df_with_kecamatan[
        ~df_with_kecamatan['kecamatan'].isin(['Tidak Diketahui', 'Tidak Ditemukan']) &
        ~df_with_kecamatan['kecamatan'].str.startswith('Error', na=False)
    ]
    df_success_only.to_csv(csv_success, index=False)
    print(f"✅ CSV Sukses: {csv_success} - {len(df_success_only):,} records")
    
    # CSV untuk proses lanjutan (yang belum diproses + error)
    csv_remaining = '../datasets/data_fnb_bandung_remaining_to_process.csv'
    df_remaining = df_with_kecamatan[
        df_with_kecamatan['kecamatan'].isin(['Tidak Diketahui', 'Tidak Ditemukan']) |
        df_with_kecamatan['kecamatan'].str.startswith('Error', na=False)
    ]
    df_remaining.to_csv(csv_remaining, index=False)
    print(f"✅ CSV Sisa: {csv_remaining} - {len(df_remaining):,} records")
    
    print(f"\n🎯 DATASET GOOGLE MAPS API SIAP UNTUK ANALISIS!")
    print(f"   📊 File sukses: {csv_success}")
    print(f"   📋 Variable 'df_with_kecamatan' berisi dataset lengkap")
    print(f"   🔄 Untuk melanjutkan batch berikutnya, gunakan file: {csv_remaining}")
    
    # Preview dataset sukses
    print(f"\n👀 PREVIEW DATASET SUKSES:")
    print(df_success_only[['nama_rumah_makan', 'alamat', 'tahun', 'kecamatan']].head(10))
else:
    print(f"\n💡 SARAN:")
    print(f"   - Coba jalankan ulang dengan batch lebih besar")
    print(f"   - Periksa koneksi internet dan API key")
    print(f"   - Beberapa alamat mungkin tidak dapat ditemukan oleh Google Maps")