In [36]:
import pandas as pd
from pathlib import Path


def print_csv_contents(directory=""):
    # 파일 이름과 인코딩 정보를 저장할 딕셔너리
    encoding_dict = {}

    # 현재 디렉토리 가져오기
    current_directory = Path.cwd()

    # 현재 디렉토리에서 모든 CSV 파일 경로를 찾는다
    csv_files = Path(directory).rglob("*.csv")  # 모든 하위 디렉토리에서 CSV 파일 찾기
    # print(list(csv_files))

    # 각 CSV 파일의 이름과 인코딩을 출력
    for file in csv_files:
        path_ = file.as_posix()
        try:
            # 파일을 읽으면서 인코딩을 자동으로 감지
            df = pd.read_csv(file, encoding="utf-8")
            print(f"File: {file.name}, Encoding: UTF-8")
            encoding_dict[path_] = "UTF-8"
        except UnicodeDecodeError:
            # UTF-8로 읽기 실패 시 다른 인코딩을 시도
            try:
                df = pd.read_csv(file, encoding="CP949")
                print(f"File: {file.name}, Encoding: CP949")
                encoding_dict[path_] = "CP949"
            except Exception as e:
                print(f"File: {file.name}, Encoding: Error - {str(e)}")
                continue

        print(f"Contents of {file}:")
        print(df.head())  # 상위 5개 행을 출력
        print("\n")

    print(encoding_dict)


# 사용 예시
print_csv_contents("../data/raw/개인통행실태조사(2021년기준)")


File: ①개인특성.csv, Encoding: CP949
Contents of ..\data\raw\개인통행실태조사(2021년기준)\①개인특성.csv:
     idx       SQ1_4       SQ1_5  SQ1_6 SQ1_7  SQ1_8  SQ2   SQ3  SQ3_1 Q1_1  \
0  10065  1111010900  1111051500  서울특별시   종로구  청운효자동    1  1969     52    0   
1  10066  4213010700  4213055000    강원도   원주시    단구동    1  1971     50    0   
2  10070  4137011300  4137055000    경기도   오산시    세마동    2  1988     33    0   
3  10079  1165010800  1165053000  서울특별시   서초구   서초3동    2  1997     24    0   
4  10085  2826010700  2826053000  인천광역시    서구    연희동    2  1973     48    0   

   ... D1 D1_2 D1_2_a D1_3 D1_3_1_4 D1_3_1_5 D1_3_1_6 D1_3_1_7 D1_3_1_8  DATE  
0  ...  1                                                                1021  
1  ...  1                                                                1021  
2  ...  1                                                                1021  
3  ...  1                                                                1021  
4  ...  1                              

In [38]:
import pandas as pd
from pathlib import Path


def print_excel_contents(directory=""):
    # 파일 이름과 시트 정보를 저장할 딕셔너리
    sheets_dict = {}

    # 현재 디렉토리 가져오기
    current_directory = Path.cwd()

    # 현재 디렉토리에서 모든 엑셀 파일 경로를 찾는다
    # 모든 하위 디렉토리에서 엑셀 파일 찾기
    excel_files = list(Path(directory).rglob("*.xls*"))

    for file in excel_files:
        path_ = file.as_posix()

        # Load the Excel file
        excel_file = pd.ExcelFile(file)

        # save the list of sheets
        sheets_dict[path_] = [(sheet, 0) for sheet in excel_file.sheet_names]

        # Iterate through each sheet in the Excel file
        for sheet_name in excel_file.sheet_names:
            # Read the sheet with the specified number of rows to skip
            df = pd.read_excel(file, sheet_name=sheet_name)
            print(f"Contents of {sheet_name} in {file}:")
            print(df.head())  # 상위 5개 행을 출력
            print("\n")

    print(sheets_dict)


# 사용 예시
print_excel_contents("../data/raw/개인통행실태조사(2021년기준)")

Contents of 기본data in ..\data\raw\개인통행실태조사(2021년기준)\Code book.xlsx:
  기본 data 변수정보     Unnamed: 1
0           변수            레이블
1          idx           조사ID
2        SQ1_4   거주지 주소-법정동코드
3        SQ1_5  거주지 주소-행정동 코드
4        SQ1_6      거주지 주소-시도


Contents of 이동data in ..\data\raw\개인통행실태조사(2021년기준)\Code book.xlsx:
  이동 data 변수정보 Unnamed: 1
0           변수        레이블
1          idx       조사ID
2          fid   통행 고유번호 
3       th_seq       통행 수
4         sTP1        출발지


Contents of Value in ..\data\raw\개인통행실태조사(2021년기준)\Code book.xlsx:
    변수값 Unnamed: 1 Unnamed: 2
0     값        NaN        레이블
1  CODE       FAMY      기타가구원
2   NaN      FAMY외      본인응답자
3   SQ2          1         남자
4   NaN          2         여자


Contents of 행정동 in ..\data\raw\개인통행실태조사(2021년기준)\행정동코드_20210726(말소코드포함).xlsx:
        행정동코드    시도명 시군구명 읍면동명       법정동코드    동리명      생성일자        말소일자
0  1100000000  서울특별시  NaN  NaN  1100000000  서울특별시  19880423         NaN
1  1111000000  서울특별시  종로구  NaN  1111000000    종로구  19