In [2]:
#— 필요한 라이브러리 설치 (주피터 셀에 한 번만 실행) —#
!pip install chardet


Collecting chardet
  Using cached chardet-5.2.0-py3-none-any.whl.metadata (3.4 kB)
Using cached chardet-5.2.0-py3-none-any.whl (199 kB)
Installing collected packages: chardet
Successfully installed chardet-5.2.0


In [3]:

#— 라이브러리 로드 —#
import os
import chardet
import pandas as pd
from IPython.display import display

#— 설정 —#
folder_path = "data"                    # CSV들이 있는 폴더
output_file = "merged_data.csv"         # 최종 저장 파일명

#— CSV 파일 목록 수집 —#
csv_files = [f for f in os.listdir(folder_path) if f.lower().endswith(".csv")]
print(f"검출된 CSV 파일: {csv_files}\n")

#— 파일별 인코딩 감지 → 읽기 → 확인 → 리스트에 저장 —#
df_list = []
for fname in csv_files:
    fpath = os.path.join(folder_path, fname)
    
    # 1) 인코딩 감지
    raw = open(fpath, "rb").read()
    result = chardet.detect(raw)
    enc = result["encoding"]
    conf = result["confidence"]
    print(f"[{fname}] 인코딩 감지: {enc} (신뢰도 {conf:.2f})")
    
    # 2) 감지된 인코딩으로 데이터프레임 로드
    df = pd.read_csv(fpath, encoding=enc)
    
    # 3) shape & head 확인
    print(f"→ {fname} shape: {df.shape}")
    display(df.head(2))
    
    df_list.append(df)
    print("-" * 50)

#— 병합 —#
merged_df = pd.concat(df_list, ignore_index=True)
print(f"\n병합 완료! 최종 shape: {merged_df.shape}")

#— 결과 저장 —#
merged_df.to_csv(output_file, index=False, encoding="utf-8-sig")
print(f"병합된 데이터가 '{output_file}'로 저장되었습니다.")

검출된 CSV 파일: ['전라북도_고창군_지역화폐가맹점_20230710.csv', '전라북도_완주군_지역화폐가맹점_20240215.csv', '전북특별자치도_군산시_지역화폐가맹점_20241105.csv', '전북특별자치도_무주군_지역화폐가맹점_20250120.csv', '전북특별자치도_익산시_지역화폐가맹점_20250610.csv', '전북특별자치도_진안군_지역화폐가맹점_20250128.csv']

[전라북도_고창군_지역화폐가맹점_20230710.csv] 인코딩 감지: EUC-KR (신뢰도 0.99)
→ 전라북도_고창군_지역화폐가맹점_20230710.csv shape: (1988, 10)


Unnamed: 0,가맹점명,사용가능지역화폐,시도명,시군구명,소재지도로명주소,소재지지번주소,업종명,주요상품,전화번호,데이터기준일자
0,스킨&바디,고창지역사랑상품권,전라북도,고창군,전라북도 고창군 고창읍 중앙로 317,,,,,2023-07-10
1,머리마을미용실,고창지역사랑상품권,전라북도,고창군,전라북도 고창군 고창읍 중앙로 198,,,,,2023-07-10


--------------------------------------------------
[전라북도_완주군_지역화폐가맹점_20240215.csv] 인코딩 감지: EUC-KR (신뢰도 0.99)
→ 전라북도_완주군_지역화폐가맹점_20240215.csv shape: (3081, 10)


Unnamed: 0,가맹점명,사용가능지역화폐,시도명,시군구명,소재지도로명주소,소재지지번주소,업종명,주요상품,전화번호,데이터기준일자
0,(유)농업회사법인 가림농산,완주사랑상품권,전북특별자치도,완주군,전북특별자치도 완주군 경천면 경가천길 300,,제조업,,,2024-02-15
1,참샘건강원,완주사랑상품권,전북특별자치도,완주군,전북특별자치도 완주군 경천면 경가천길 359,,개인서비스업,,,2024-02-15


--------------------------------------------------
[전북특별자치도_군산시_지역화폐가맹점_20241105.csv] 인코딩 감지: UTF-8-SIG (신뢰도 1.00)
→ 전북특별자치도_군산시_지역화폐가맹점_20241105.csv shape: (12570, 10)


Unnamed: 0,가맹점명,사용가능지역화폐,시도명,시군구명,소재지도로명주소,소재지지번주소,업종명,주요상품,전화번호,데이터기준일자
0,카페로더,군산사랑상품권,전북특별자치도,군산시,전북특별자치도 군산시 문화로 87(수송동),,음식점업,,,2024-11-05
1,워시존,군산사랑상품권,전북특별자치도,군산시,전북특별자치도 군산시 진포1길 3(수송동),,개인서비스업,,,2024-11-05


--------------------------------------------------
[전북특별자치도_무주군_지역화폐가맹점_20250120.csv] 인코딩 감지: UTF-8-SIG (신뢰도 1.00)
→ 전북특별자치도_무주군_지역화폐가맹점_20250120.csv shape: (1123, 10)


Unnamed: 0,가맹점명,사용가능지역화폐,시도명,시군구명,소재지도로명주소,소재지지번주소,업종명,주요상품,전화번호,데이터기준일자
0,비에이치씨 무주덕유산리조트점,무주사랑상품권,전북특별자치도,무주군,전북특별자치도 무주군 설천면 만선로 185 (무주리조트),,,,,2025-01-20
1,바다수산,무주사랑상품권,전북특별자치도,무주군,전북특별자치도 무주군 안성면 칠연로 38 (7호),,,,,2025-01-20


--------------------------------------------------
[전북특별자치도_익산시_지역화폐가맹점_20250610.csv] 인코딩 감지: UTF-8-SIG (신뢰도 1.00)
→ 전북특별자치도_익산시_지역화폐가맹점_20250610.csv shape: (14265, 10)


Unnamed: 0,가맹점명,사용가능지역화폐,시도명,시군구명,소재지도로명주소,소재지지번주소,업종명,주요상품,전화번호,데이터기준일자
0,미생맥주 부송점,익산다이로움카드,전북특별자치도,익산시,전북특별자치도 익산시 하나로10길 82 미생맥주,,음식점/식음료업,,,2025-06-10
1,씨유원광대 스타점,익산다이로움카드,전북특별자치도,익산시,전북특별자치도 익산시 익산대로68길 75 1층,,식자재/유통,,,2025-06-10


--------------------------------------------------
[전북특별자치도_진안군_지역화폐가맹점_20250128.csv] 인코딩 감지: UTF-8-SIG (신뢰도 1.00)
→ 전북특별자치도_진안군_지역화폐가맹점_20250128.csv shape: (777, 10)


Unnamed: 0,가맹점명,사용가능지역화폐,시도명,시군구명,소재지도로명주소,소재지지번주소,업종명,주요상품,전화번호,데이터기준일자
0,구구식당,진안고원행복상품권,전북특별자치도,진안군,전북특별자치도 진안군 진안읍 시장1길 16,,음식(한식),음식,,2025-01-28
1,농산표고,진안고원행복상품권,전북특별자치도,진안군,전북특별자치도 진안군 진안읍 시장1길 16,,소매(농산물),농산물,,2025-01-28


--------------------------------------------------

병합 완료! 최종 shape: (33804, 10)
병합된 데이터가 'merged_data.csv'로 저장되었습니다.
