In [1]:
import os
import pandas as pd

# 현재 Colab 내 CSV 파일 목록 출력 및 정보 확인
csv_files = [f for f in os.listdir("/content") if f.endswith(".csv")]
print("📂 Colab에 있는 CSV 파일 목록:")
for f in csv_files:
    print("-", f)

summary = []
for f in csv_files:
    try:
        df = pd.read_csv(f, nrows=5)
        summary.append({
            "파일명": f,
            "컬럼 수": len(df.columns),
            "컬럼명": df.columns.tolist()
        })
    except Exception as e:
        summary.append({
            "파일명": f,
            "오류": str(e)
        })

pd.DataFrame(summary)


📂 Colab에 있는 CSV 파일 목록:


In [2]:
import geopandas as gpd
import pandas as pd
import folium
from folium.plugins import MarkerCluster
import os

# ✅ 파일 경로
shapefiles = {
    "시도": "/content/ctprvn.shp",
    "시군구": "/content/sig_20230729.shp",
    "읍면동": "/content/emd_20230729.shp",
    "리단위": "/content/li_20230729.shp"
}

# ✅ SHP 파일 로드 및 좌표계 변환
gdfs = {}
for name, path in shapefiles.items():
    if os.path.exists(path):
        gdf = gpd.read_file(path, encoding='cp949')
        gdf = gdf.set_crs(epsg=5179, allow_override=True).to_crs(epsg=4326)
        gdfs[name] = gdf

# ✅ 고객 데이터 불러오기 (기존 파일 기준)
customer_path = "/content/통신판매업_위경도적용.csv"
df = pd.read_csv(customer_path)

# ✅ 지도 생성
m = folium.Map(location=[df['위도'].mean(), df['경도'].mean()], zoom_start=11)

# ✅ 행정경계 레이어 추가
for name, gdf in gdfs.items():
    folium.GeoJson(
        gdf,
        name=name,
        tooltip=folium.GeoJsonTooltip(fields=gdf.columns[:1].tolist(), aliases=[name])
    ).add_to(m)

# ✅ 고객 마커 추가
cluster = MarkerCluster(name="고객 위치").add_to(m)
for _, row in df.iterrows():
    popup = f"<b>{row.get('사업장명', '정보 없음')}</b><br>{row.get('사업장소재지', '')}"
    folium.CircleMarker(
        location=[row['위도'], row['경도']],
        radius=4,
        color='blue',
        fill=True,
        fill_color='blue',
        fill_opacity=0.6,
        popup=popup
    ).add_to(cluster)

# ✅ 레이어 컨트롤 추가 및 저장
folium.LayerControl().add_to(m)
map_path = "/content/고객_행정경계_시각화.html"
m.save(map_path)
map_path


FileNotFoundError: [Errno 2] No such file or directory: '/content/통신판매업_위경도적용.csv'

In [3]:
import os, zipfile

# 압축할 파일명 접두어 목록
prefixes = ['ctprvn', 'sig_20230729', 'emd_20230729', 'li_20230729']
extensions = ['shp', 'shx', 'dbf']

# 업로드한 파일 중 실제 존재하는 파일만 압축
files_to_zip = []
for prefix in prefixes:
    for ext in extensions:
        path = f"/content/{prefix}.{ext}"
        if os.path.exists(path):
            files_to_zip.append(path)

# 압축 경로
zip_path = "/content/행정경계_모음.zip"

# 압축 실행
with zipfile.ZipFile(zip_path, 'w') as zipf:
    for file in files_to_zip:
        zipf.write(file, arcname=os.path.basename(file))

print(f"✅ 압축 완료: {zip_path}")


✅ 압축 완료: /content/행정경계_모음.zip


In [4]:
from google.colab import drive
import shutil

drive.mount('/content/drive')

# Drive에 저장
drive_path = "/content/drive/MyDrive/행정경계_모음.zip"
shutil.copy("/content/행정경계_모음.zip", drive_path)

print("✅ 구글 드라이브 업로드 완료!")


Mounted at /content/drive
✅ 구글 드라이브 업로드 완료!


In [5]:
import os
import pandas as pd

# 현재 Colab 내 CSV 파일 목록 출력 및 정보 확인
csv_files = [f for f in os.listdir("/content") if f.endswith(".csv")]
print("📂 Colab에 있는 CSV 파일 목록:")
for f in csv_files:
    print("-", f)

summary = []
for f in csv_files:
    try:
        df = pd.read_csv(f, nrows=5)
        summary.append({
            "파일명": f,
            "컬럼 수": len(df.columns),
            "컬럼명": df.columns.tolist()
        })
    except Exception as e:
        summary.append({
            "파일명": f,
            "오류": str(e)
        })

pd.DataFrame(summary)


📂 Colab에 있는 CSV 파일 목록:


In [6]:
# ✅ 설치 필요 시
!pip install geopandas matplotlib shapely

# ✅ 라이브러리
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
from shapely.geometry import Point
import os

# ✅ 고객 데이터 CSV 자동 탐색
csv_candidates = [f for f in os.listdir("/content") if f.endswith(".csv")]
df = None
for file in csv_candidates:
    temp = pd.read_csv(f"/content/{file}")
    if all(col in temp.columns for col in ['시도', '시군구', '읍면동', '위도', '경도']):
        df = temp
        print(f"✅ 고객 CSV 탐지: {file}")
        break

if df is None:
    raise FileNotFoundError("❌ 시도/시군구/읍면동/위도/경도 컬럼을 포함한 CSV가 없습니다.")

# ✅ 위경도 정제
df['위도'] = pd.to_numeric(df['위도'], errors='coerce')
df['경도'] = pd.to_numeric(df['경도'], errors='coerce')
df = df.dropna(subset=['위도', '경도'])
df = df[df['시도'].str.contains('강원|서울|경기|인천|충북|충남|대전', na=False)]

# ✅ GeoDataFrame 변환
geometry = [Point(xy) for xy in zip(df['경도'], df['위도'])]
gdf_points = gpd.GeoDataFrame(df, geometry=geometry, crs='EPSG:4326')

# ✅ SHP 경로 확인
emd_path = "/content/emd_20230729.shp"
if not os.path.exists(emd_path):
    raise FileNotFoundError("❌ emd_20230729.shp 파일을 Colab에 업로드해주세요.")

# ✅ SHP 로드 및 좌표계 변환
gdf_emd = gpd.read_file(emd_path, encoding='cp949')
gdf_emd = gdf_emd.set_crs("EPSG:5179").to_crs("EPSG:4326")
gdf_emd = gdf_emd[gdf_emd['CTP_KOR_NM'].str.contains('강원|서울|경기|인천|충북|충남|대전', na=False)]

# ✅ 시각화
fig, ax = plt.subplots(figsize=(14, 16))
gdf_emd.plot(ax=ax, edgecolor='gray', color='white', linewidth=0.5, alpha=0.7)
gdf_points.plot(ax=ax, color='purple', markersize=20, alpha=0.6)

plt.title("📍 2025년 3월말 유지고객 분포 (시군구·읍면동 포함)", fontsize=16)
plt.axis('off')
plt.tight_layout()
plt.show()




FileNotFoundError: ❌ 시도/시군구/읍면동/위도/경도 컬럼을 포함한 CSV가 없습니다.

In [8]:
DataSourceError                           Traceback (most recent call last)
<ipython-input-9-3f944a565b69> in <cell line: 0>()
     37 # ✅ SHP 업로드된 emd_20230729.shp 사용
     38 emd_path = "/content/emd_20230729.shp"
---> 39 gdf_emd = gpd.read_file(emd_path, encoding='cp949')
     40 gdf_emd = gdf_emd.set_crs("EPSG:5179").to_crs("EPSG:4326")
     41 gdf_emd = gdf_emd[gdf_emd['CTP_KOR_NM'].str.contains('강원|서울|경기|인천|충북|충남|대전')]

3 frames
/usr/local/lib/python3.11/dist-packages/pyogrio/raw.py in read(path_or_buffer, layer, encoding, columns, read_geometry, force_2d, skip_features, max_features, where, bbox, mask, fids, sql, sql_dialect, return_fids, datetime_as_string, **kwargs)
    196     dataset_kwargs = _preprocess_options_key_value(kwargs) if kwargs else {}
    197
--> 198     return ogr_read(
    199         get_vsi_path_or_buffer(path_or_buffer),
    200         layer=layer,

pyogrio/_io.pyx in pyogrio._io.ogr_read()

pyogrio/_io.pyx in pyogrio._io.ogr_open()

DataSourceError: /content/emd_20230729.shp: No such file or directory
# ✅ 설치
!pip install geopandas gspread gspread_dataframe oauth2client

# ✅ 라이브러리
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
from shapely.geometry import Point
from oauth2client.service_account import ServiceAccountCredentials
import gspread
from gspread_dataframe import get_as_dataframe

# ✅ Google 인증 설정
json_keyfile_path = "/content/drive/MyDrive/Key/credentials.json"  # 인증 JSON을 여기에 업로드하세요
scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/drive"]
credentials = ServiceAccountCredentials.from_json_keyfile_name(json_keyfile_path, scope)
gc = gspread.authorize(credentials)

# ✅ 스프레드시트 열기
sheet_url = "https://docs.google.com/spreadsheets/d/1pjj0r5qmmGUtl9zA2ekT14xgqsOXuR0zFjSDitWhHmA/edit"
worksheet = gc.open_by_url(sheet_url).worksheet("3월마감 조건추출 위경도기초 선택컬럼_2403")
df = get_as_dataframe(worksheet).dropna(how='all', axis=1)

# ✅ 데이터 정제
df = df[['시도', '시군구', '읍면동', '위도', '경도']].dropna(subset=['위도', '경도'])
df['위도'] = pd.to_numeric(df['위도'], errors='coerce')
df['경도'] = pd.to_numeric(df['경도'], errors='coerce')
df = df.dropna(subset=['위도', '경도'])

# ✅ 필터 (원하는 시도만)
df = df[df['시도'].str.contains('강원|서울|경기|인천|충북|충남|대전', na=False)]

# ✅ 포인트 변환
geometry = [Point(xy) for xy in zip(df['경도'], df['위도'])]
gdf_points = gpd.GeoDataFrame(df, geometry=geometry, crs='EPSG:4326')

# ✅ SHP 업로드된 emd_20230729.shp 사용
emd_path = "/content/emd_20230729.shp"
gdf_emd = gpd.read_file(emd_path, encoding='cp949')
gdf_emd = gdf_emd.set_crs("EPSG:5179").to_crs("EPSG:4326")
gdf_emd = gdf_emd[gdf_emd['CTP_KOR_NM'].str.contains('강원|서울|경기|인천|충북|충남|대전')]

# ✅ 시각화
fig, ax = plt.subplots(figsize=(14, 16))
gdf_emd.plot(ax=ax, edgecolor='gray', color='white', linewidth=0.5, alpha=0.6)
gdf_points.plot(ax=ax, color='purple', markersize=30, alpha=0.7)

plt.title("2025년 3월말 유지고객 분포 (시군구·읍면동 경계 포함)", fontsize=16)
plt.axis('off')
plt.tight_layout()
plt.show()


SyntaxError: invalid decimal literal (<ipython-input-8-28f2cb8a0f72>, line 2)

In [9]:
import os
import pandas as pd

# 현재 Colab 내 CSV 파일 목록 출력 및 정보 확인
csv_files = [f for f in os.listdir("/content") if f.endswith(".csv")]
print("📂 Colab에 있는 CSV 파일 목록:")
for f in csv_files:
    print("-", f)

summary = []
for f in csv_files:
    try:
        df = pd.read_csv(f, nrows=5)
        summary.append({
            "파일명": f,
            "컬럼 수": len(df.columns),
            "컬럼명": df.columns.tolist()
        })
    except Exception as e:
        summary.append({
            "파일명": f,
            "오류": str(e)
        })

pd.DataFrame(summary)


📂 Colab에 있는 CSV 파일 목록:


In [11]:
import os
import pandas as pd

# 📂 Colab 내 CSV 파일 목록
csv_files = [f for f in os.listdir("/content") if f.endswith(".csv")]
print("📂 현재 Colab에 업로드된 CSV 파일 목록:")
for f in csv_files:
    print("-", f)

# 📊 각 파일별 컬럼 구조 미리 확인
summary = []
for f in csv_files:
    try:
        df = pd.read_csv(f"/content/{f}", nrows=5)
        summary.append({
            "파일명": f,
            "컬럼 수": len(df.columns),
            "컬럼명": df.columns.tolist()
        })
    except Exception as e:
        summary.append({
            "파일명": f,
            "오류": str(e)
        })

pd.DataFrame(summary)



📂 현재 Colab에 업로드된 CSV 파일 목록:


In [12]:
['시도', '시군구', '읍면동', '위도', '경도']


['시도', '시군구', '읍면동', '위도', '경도']

In [13]:
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
from shapely.geometry import Point
import os

# ✅ 고객 CSV 파일 선택 (자동 감지)
csv_file = None
for f in os.listdir("/content"):
    if f.endswith(".csv"):
        df_test = pd.read_csv(f, nrows=3)
        if all(col in df_test.columns for col in ['시도', '시군구', '읍면동', '위도', '경도']):
            csv_file = f
            break

if not csv_file:
    raise FileNotFoundError("❌ 필수 컬럼 포함된 고객 CSV 파일을 찾을 수 없습니다.")

print(f"📄 고객 데이터 파일: {csv_file}")

# ✅ 데이터 불러오기 및 정제
df = pd.read_csv(f"/content/{csv_file}")
df = df.dropna(subset=['위도', '경도'])
df['위도'] = pd.to_numeric(df['위도'], errors='coerce')
df['경도'] = pd.to_numeric(df['경도'], errors='coerce')
df = df.dropna(subset=['위도', '경도'])

# ✅ 고객 위치 → GeoDataFrame 변환
geometry = [Point(xy) for xy in zip(df['경도'], df['위도'])]
gdf_points = gpd.GeoDataFrame(df, geometry=geometry, crs='EPSG:4326')

# ✅ 읍면동 SHP 파일 불러오기
emd_path = "/content/emd_20230729.shp"
if not os.path.exists(emd_path):
    raise FileNotFoundError("❌ emd_20230729.shp 파일이 없습니다. Colab에 업로드해주세요.")

gdf_emd = gpd.read_file(emd_path, encoding='cp949')
gdf_emd = gdf_emd.set_crs("EPSG:5179").to_crs("EPSG:4326")

# ✅ 필터 (특정 지역만)
gdf_emd = gdf_emd[gdf_emd['CTP_KOR_NM'].str.contains('강원|서울|경기|인천|충북|충남|대전', na=False)]
gdf_points = gdf_points[gdf_points['시도'].str.contains('강원|서울|경기|인천|충북|충남|대전', na=False)]

# ✅ 시각화
fig, ax = plt.subplots(figsize=(14, 16))
gdf_emd.plot(ax=ax, edgecolor='gray', color='white', linewidth=0.5, alpha=0.6)
gdf_points.plot(ax=ax, color='purple', markersize=20, alpha=0.7)

plt.title("📍 유지고객 분포 (시도/시군구/읍면동 포함)", fontsize=16)
plt.axis('off')
plt.tight_layout()
plt.show()


FileNotFoundError: ❌ 필수 컬럼 포함된 고객 CSV 파일을 찾을 수 없습니다.

In [14]:
# ✅ 설치
!pip install geopandas gspread gspread_dataframe oauth2client

# ✅ 라이브러리
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
from shapely.geometry import Point
from oauth2client.service_account import ServiceAccountCredentials
import gspread
from gspread_dataframe import get_as_dataframe

# ✅ Google 인증 설정
json_keyfile_path = "/content/drive/MyDrive/Key/credentials.json"  # 인증 JSON을 여기에 업로드하세요
scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/drive"]
credentials = ServiceAccountCredentials.from_json_keyfile_name(json_keyfile_path, scope)
gc = gspread.authorize(credentials)

# ✅ 스프레드시트 열기
sheet_url = "https://docs.google.com/spreadsheets/d/1pjj0r5qmmGUtl9zA2ekT14xgqsOXuR0zFjSDitWhHmA/edit"
worksheet = gc.open_by_url(sheet_url).worksheet("3월마감 조건추출 위경도기초 선택컬럼_2403")
df = get_as_dataframe(worksheet).dropna(how='all', axis=1)

# ✅ 데이터 정제
df = df[['시도', '시군구', '읍면동', '위도', '경도']].dropna(subset=['위도', '경도'])
df['위도'] = pd.to_numeric(df['위도'], errors='coerce')
df['경도'] = pd.to_numeric(df['경도'], errors='coerce')
df = df.dropna(subset=['위도', '경도'])

# ✅ 필터 (원하는 시도만)
df = df[df['시도'].str.contains('강원|서울|경기|인천|충북|충남|대전', na=False)]

# ✅ 포인트 변환
geometry = [Point(xy) for xy in zip(df['경도'], df['위도'])]
gdf_points = gpd.GeoDataFrame(df, geometry=geometry, crs='EPSG:4326')

# ✅ SHP 업로드된 emd_20230729.shp 사용
emd_path = "/content/emd_20230729.shp"
gdf_emd = gpd.read_file(emd_path, encoding='cp949')
gdf_emd = gdf_emd.set_crs("EPSG:5179").to_crs("EPSG:4326")
gdf_emd = gdf_emd[gdf_emd['CTP_KOR_NM'].str.contains('강원|서울|경기|인천|충북|충남|대전')]

# ✅ 시각화
fig, ax = plt.subplots(figsize=(14, 16))
gdf_emd.plot(ax=ax, edgecolor='gray', color='white', linewidth=0.5, alpha=0.6)
gdf_points.plot(ax=ax, color='purple', markersize=30, alpha=0.7)

plt.title("2025년 3월말 유지고객 분포 (시군구·읍면동 경계 포함)", fontsize=16)
plt.axis('off')
plt.tight_layout()
plt.show()




DataSourceError: /content/emd_20230729.shp: No such file or directory