In [None]:
# 1. आवश्यक लाइब्रेरीज़ आयात करें
import pandas as pd
import geopandas as gpd

# 2. फ़ाइल पथ परिभाषित करें (Shapefile का नाम 'Bihar.shp' है)
CSV_PATH = '../data/august.csv'
# पुराना Shapefile (जिसे आप अपडेट कर रहे हैं)
OLD_SHAPEFILE_PATH = '../Bihar.shp'
# नया Shapefile जिसे हम S. No. के साथ सेव करेंगे
NEW_SHAPEFILE_PATH = '../Bihar_with_SNo.shp'

# 3. डेटा लोड करें और साफ़ करें
df = pd.read_csv(CSV_PATH)
# 'DISTRICT NAME' को अपरकेस में साफ़ करना
df['DISTRICT NAME'] = df['DISTRICT NAME'].str.upper().str.strip()

# Shapefile लोड करें
try:
    gdf = gpd.read_file(OLD_SHAPEFILE_PATH)
    print("✅ Shapefile 'Bihar.shp' सफलतापूर्वक लोड हो गया।")
except Exception as e:
    print(f"❌ त्रुटि: Shapefile लोड नहीं हो सका। कृपया जांचें कि 'Bihar.shp', 'Bihar.shx', 'Bihar.dbf' आदि फाइलें प्रोजेक्ट फोल्डर में हैं। Error: {e}")
    exit()

# 4. डेटा को मर्ज करें (DISTRICT NAME और S. No. जोड़ें)
# Shapefile में जिले का नाम DTNAME कॉलम में है
SHAPEFILE_KEY_COLUMN = 'DTNAME' 

# केवल 'S. No.' कॉलम को जिला नाम के आधार पर GeoDataFrame में मर्ज करें
merged_gdf = gdf.merge(
    # CSV में केवल S. No. और DISTRICT NAME कॉलम का उपयोग करें
    df[['DISTRICT NAME', 'S. No.']], 
    left_on=SHAPEFILE_KEY_COLUMN,  
    right_on='DISTRICT NAME',      
    how='left'
)

# डुप्लीकेट 'DISTRICT NAME' कॉलम को हटा दें
if 'DISTRICT NAME' in merged_gdf.columns:
    merged_gdf = merged_gdf.drop(columns=['DISTRICT NAME'])

print("✅ 'S. No.' डेटा GeoDataFrame में सफलतापूर्वक मर्ज हो गया।")

# 5. नया Shapefile सेव करें
# यह कमांड आपके प्रोजेक्ट फ़ोल्डर में नया Shapefile सेट बनाएगी।
merged_gdf.to_file(NEW_SHAPEFILE_PATH)

print(f"\n✨ अपडेट सफलतापूर्वक पूरा हुआ! ✨")
print(f"नया Shapefile ({NEW_SHAPEFILE_PATH}) अब आपके फ़ोल्डर में उपलब्ध है।")
print(f"अब आप इस नए Shapefile का उपयोग मैप प्लॉट करने के लिए कर सकते हैं।")