In [3]:
import os
import pandas as pd

# 設定資料夾路徑
csv_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/新增資料夾"
output_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/output"
if not os.path.exists(output_dir_path):
    os.makedirs(output_dir_path)

# 設定要匹配的特徵：地號開頭通常包含 "段"，但不包含 "區" 或 "路" 等
land_number_pattern = r'^.*段.*(?<!區)(?<!路)(?<!街)(?<!巷)'  # 地號以「段」開頭，但不包含「區」、「路」、「街」、「巷」等字樣
address_pattern = r'^.*區.*|.*路.*|.*街.*|.*巷.*'  # 地址包含「區」、「路」、「街」、「巷」等，視為門牌地址

# 讀取所有 CSV 檔案並分離出地號和門牌地址的資料，並針對每個檔案輸出
for csv_file in os.listdir(csv_dir_path):
    if csv_file.endswith('.csv'):
        csv_file_path = os.path.join(csv_dir_path, csv_file)
        
        try:
            # 讀取 CSV 檔案
            data = pd.read_csv(csv_file_path)

            # 確保存在 "土地位置建物門牌" 欄位
            if '土地位置建物門牌' in data.columns:
                # 使用正則表達式匹配來分離出地號資料 (以「段」開頭但不包含「區」、「路」、「街」)
                land_number_rows = data[data['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 使用正則表達式匹配來分離出門牌地址資料 (包含「區」、「路」、「街」等)
                address_rows = data[data['土地位置建物門牌'].str.contains(address_pattern, na=False)]

                # 生成輸出文件的名稱（基於原始文件名）
                base_filename = os.path.splitext(csv_file)[0]
                land_number_file = os.path.join(output_dir_path, f'{base_filename}_land_number.csv')
                address_file = os.path.join(output_dir_path, f'{base_filename}_address.csv')

                # 將分離出的地號資料保存為 CSV 文件
                land_number_rows.to_csv(land_number_file, index=False)
                print(f"包含地號的資料已保存至: {land_number_file}")

                # 將分離出的門牌地址資料保存為 CSV 文件
                address_rows.to_csv(address_file, index=False)
                print(f"包含門牌地址的資料已保存至: {address_file}")
        
        except Exception as e:
            print(f"處理檔案 {csv_file} 時發生錯誤: {e}")


  data = pd.read_csv(csv_file_path)


包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_address.csv


In [5]:
import os
import pandas as pd

# 設定資料夾路徑
csv_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/新增資料夾"
output_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/output"
if not os.path.exists(output_dir_path):
    os.makedirs(output_dir_path)

# 設定要匹配的特徵：門牌地址先檢查是否包含 "區"，地號則以 "段" 開頭
address_pattern = r'.*區.*|.*路.*|.*街.*|.*巷.*'  # 地址包含「區」、「路」、「街」、「巷」等
land_number_pattern = r'.*段.*'  # 地號包含「段」

# 讀取所有 CSV 檔案並分離出地號和門牌地址的資料，並針對每個檔案輸出
for csv_file in os.listdir(csv_dir_path):
    if csv_file.endswith('.csv'):
        csv_file_path = os.path.join(csv_dir_path, csv_file)
        
        try:
            # 讀取 CSV 檔案
            data = pd.read_csv(csv_file_path)

            # 確保存在 "土地位置建物門牌" 欄位
            if '土地位置建物門牌' in data.columns:
                # 先匹配出門牌地址資料 (優先處理包含 "區" 或 "路" 等的資料)
                address_rows = data[data['土地位置建物門牌'].str.contains(address_pattern, na=False)]

                # 匹配出地號資料 (包含 "段" 但不包含 "區" 或 "路" 等的資料)
                land_number_rows = data[~data['土地位置建物門牌'].str.contains(address_pattern, na=False) &
                                        data['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 生成輸出文件的名稱（基於原始文件名）
                base_filename = os.path.splitext(csv_file)[0]
                land_number_file = os.path.join(output_dir_path, f'{base_filename}_land_number.csv')
                address_file = os.path.join(output_dir_path, f'{base_filename}_address.csv')

                # 將分離出的地號資料保存為 CSV 文件
                land_number_rows.to_csv(land_number_file, index=False)
                print(f"包含地號的資料已保存至: {land_number_file}")

                # 將分離出的門牌地址資料保存為 CSV 文件
                address_rows.to_csv(address_file, index=False)
                print(f"包含門牌地址的資料已保存至: {address_file}")
        
        except Exception as e:
            print(f"處理檔案 {csv_file} 時發生錯誤: {e}")


  data = pd.read_csv(csv_file_path)


包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_address.csv


In [7]:
import os
import pandas as pd

# 設定資料夾路徑
csv_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/新增資料夾"
output_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/output"
if not os.path.exists(output_dir_path):
    os.makedirs(output_dir_path)

# 設定要匹配的特徵：門牌地址先檢查是否包含 "區"，地號則以 "段" 開頭
address_pattern = r'.*區.*|.*路.*|.*街.*|.*巷.*'  # 地址包含「區」、「路」、「街」、「巷」等
land_number_pattern = r'.*段.*'  # 地號包含「段」

# 讀取所有 CSV 檔案並分離出地號和門牌地址的資料，並針對每個檔案輸出
for csv_file in os.listdir(csv_dir_path):
    if csv_file.endswith('.csv'):
        csv_file_path = os.path.join(csv_dir_path, csv_file)
        
        try:
            # 讀取 CSV 檔案
            data = pd.read_csv(csv_file_path)

            # 確保存在 "土地位置建物門牌" 欄位
            if '土地位置建物門牌' in data.columns:
                # 只處理 "土地位置建物門牌" 欄位，並根據規則進行分類
                land_position_column = data[['土地位置建物門牌']]

                # 先匹配出門牌地址資料 (優先處理包含 "區" 或 "路" 等的資料)
                address_rows = land_position_column[land_position_column['土地位置建物門牌'].str.contains(address_pattern, na=False)]

                # 匹配出地號資料 (包含 "段" 但不包含 "區" 或 "路" 等的資料)
                land_number_rows = land_position_column[~land_position_column['土地位置建物門牌'].str.contains(address_pattern, na=False) &
                                                        land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 生成輸出文件的名稱（基於原始文件名）
                base_filename = os.path.splitext(csv_file)[0]
                land_number_file = os.path.join(output_dir_path, f'{base_filename}_land_number.csv')
                address_file = os.path.join(output_dir_path, f'{base_filename}_address.csv')

                # 將分離出的地號資料保存為 CSV 文件
                land_number_rows.to_csv(land_number_file, index=False)
                print(f"包含地號的資料已保存至: {land_number_file}")

                # 將分離出的門牌地址資料保存為 CSV 文件
                address_rows.to_csv(address_file, index=False)
                print(f"包含門牌地址的資料已保存至: {address_file}")
        
        except Exception as e:
            print(f"處理檔案 {csv_file} 時發生錯誤: {e}")


  data = pd.read_csv(csv_file_path)


包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_address.csv


In [8]:
import os
import pandas as pd

# 設定資料夾路徑
csv_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/新增資料夾"
output_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/output"
if not os.path.exists(output_dir_path):
    os.makedirs(output_dir_path)

# 設定要匹配的特徵：以 "地號" 結尾的是地號，其他則為門牌地址
land_number_pattern = r'.*地號$'  # 地號以「地號」結尾

# 讀取所有 CSV 檔案並分離出地號和門牌地址的資料，並針對每個檔案輸出
for csv_file in os.listdir(csv_dir_path):
    if csv_file.endswith('.csv'):
        csv_file_path = os.path.join(csv_dir_path, csv_file)
        
        try:
            # 讀取 CSV 檔案
            data = pd.read_csv(csv_file_path)

            # 確保存在 "土地位置建物門牌" 欄位
            if '土地位置建物門牌' in data.columns:
                # 只處理 "土地位置建物門牌" 欄位，並根據規則進行分類
                land_position_column = data[['土地位置建物門牌']]

                # 匹配出地號資料 (以「地號」結尾的資料)
                land_number_rows = land_position_column[land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 其餘的資料視為門牌地址
                address_rows = land_position_column[~land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 生成輸出文件的名稱（基於原始文件名）
                base_filename = os.path.splitext(csv_file)[0]
                land_number_file = os.path.join(output_dir_path, f'{base_filename}_land_number.csv')
                address_file = os.path.join(output_dir_path, f'{base_filename}_address.csv')

                # 將分離出的地號資料保存為 CSV 文件
                land_number_rows.to_csv(land_number_file, index=False)
                print(f"包含地號的資料已保存至: {land_number_file}")

                # 將分離出的門牌地址資料保存為 CSV 文件
                address_rows.to_csv(address_file, index=False)
                print(f"包含門牌地址的資料已保存至: {address_file}")
        
        except Exception as e:
            print(f"處理檔案 {csv_file} 時發生錯誤: {e}")


  data = pd.read_csv(csv_file_path)


包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_102.0_second_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_first_half_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/output\merged_data_103.0_second_half_address.csv


In [11]:
import os
import pandas as pd

# 設定資料夾路徑
csv_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/split_output"
output_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/split_output_split"
if not os.path.exists(output_dir_path):
    os.makedirs(output_dir_path)

# 設定要匹配的特徵：只要包含 "地號" 就視為地號
land_number_pattern = r'.*地號.*'  # 地號包含「地號」

# 讀取所有 CSV 檔案並分離出地號和門牌地址的資料，並針對每個檔案輸出
for csv_file in os.listdir(csv_dir_path):
    if csv_file.endswith('.csv'):
        csv_file_path = os.path.join(csv_dir_path, csv_file)
        
        try:
            # 讀取 CSV 檔案
            data = pd.read_csv(csv_file_path)

            # 確保存在 "土地位置建物門牌" 欄位
            if '土地位置建物門牌' in data.columns:
                # 只處理 "土地位置建物門牌" 欄位，並根據規則進行分類
                land_position_column = data[['土地位置建物門牌']]

                # 匹配出包含「地號」的資料
                land_number_rows = land_position_column[land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 其餘的資料視為門牌地址
                address_rows = land_position_column[~land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 生成輸出文件的名稱（基於原始文件名）
                base_filename = os.path.splitext(csv_file)[0]
                land_number_file = os.path.join(output_dir_path, f'{base_filename}_land_number.csv')
                address_file = os.path.join(output_dir_path, f'{base_filename}_address.csv')

                # 將分離出的地號資料保存為 CSV 文件
                land_number_rows.to_csv(land_number_file, index=False)
                print(f"包含地號的資料已保存至: {land_number_file}")

                # 將分離出的門牌地址資料保存為 CSV 文件
                address_rows.to_csv(address_file, index=False)
                print(f"包含門牌地址的資料已保存至: {address_file}")
        
        except Exception as e:
            print(f"處理檔案 {csv_file} 時發生錯誤: {e}")


包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part1_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part1_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part2_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part2_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part3_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part3_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part4_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part4_address.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part5_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102

In [1]:
import os
import pandas as pd

# 設定資料夾路徑
csv_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/split_output"
output_dir_path = r"C:/Users/jason/OneDrive/桌面/102-103/split_output_split"
if not os.path.exists(output_dir_path):
    os.makedirs(output_dir_path)

# 設定要匹配的特徵：只要包含 "地號" 就視為地號
land_number_pattern = r'.*地號.*'  # 地號包含「地號」
special_pattern = r'.*[及\?].*'  # 包含「及」或「?」的資料

# 讀取所有 CSV 檔案並分離出地號、門牌地址及特殊資料
for csv_file in os.listdir(csv_dir_path):
    if csv_file.endswith('.csv'):
        csv_file_path = os.path.join(csv_dir_path, csv_file)
        
        try:
            # 讀取 CSV 檔案
            data = pd.read_csv(csv_file_path)

            # 確保存在 "土地位置建物門牌" 欄位
            if '土地位置建物門牌' in data.columns:
                # 只處理 "土地位置建物門牌" 欄位，並根據規則進行分類
                land_position_column = data[['土地位置建物門牌']]

                # 1. 匹配出包含「地號」的資料
                land_number_rows = land_position_column[land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]

                # 2. 其餘的資料視為門牌地址
                address_rows = land_position_column[~land_position_column['土地位置建物門牌'].str.contains(land_number_pattern, na=False)]
                
                # 3. 從門牌地址中篩選出包含「及」或「?」的資料（特殊資料）
                special_rows = address_rows[address_rows['土地位置建物門牌'].str.contains(special_pattern, na=False)]
                
                # 4. 剩餘的門牌地址資料（不包含特殊資料）
                address_rows = address_rows[~address_rows['土地位置建物門牌'].str.contains(special_pattern, na=False)]

                # 生成輸出文件的名稱（基於原始文件名）
                base_filename = os.path.splitext(csv_file)[0]
                land_number_file = os.path.join(output_dir_path, f'{base_filename}_land_number.csv')
                address_file = os.path.join(output_dir_path, f'{base_filename}_address.csv')
                special_file = os.path.join(output_dir_path, f'{base_filename}_special.csv')

                # 將分離出的地號資料保存為 CSV 文件
                land_number_rows.to_csv(land_number_file, index=False)
                print(f"包含地號的資料已保存至: {land_number_file}")

                # 將分離出的門牌地址資料保存為 CSV 文件
                address_rows.to_csv(address_file, index=False)
                print(f"包含門牌地址的資料已保存至: {address_file}")

                # 將分離出的包含「及」或「?」的特殊資料保存為 CSV 文件
                special_rows.to_csv(special_file, index=False)
                print(f"包含「及」或「?」的資料已保存至: {special_file}")

        except Exception as e:
            print(f"處理檔案 {csv_file} 時發生錯誤: {e}")


包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part1_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part1_address.csv
包含「及」或「?」的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part1_special.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part2_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part2_address.csv
包含「及」或「?」的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part2_special.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part3_land_number.csv
包含門牌地址的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part3_address.csv
包含「及」或「?」的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\102_first_half_part3_special.csv
包含地號的資料已保存至: C:/Users/jason/OneDrive/桌面/102-103/split_output_split\