In [6]:
import pandas as pd
import numpy as np
import os
import re
from datetime import timedelta
import glob # 引入glob模块来查找文件

def preprocess_sensor_data(input_csv_path, output_dir):
    """
    根据指定规则预处理单个传感器数据CSV文件。
    修改：
    1. MET为空的行将被丢弃。
    2. 去除连续的 x, y, z 完全重复的行（保留首行）。
    3. 添加 magnitude 列 (sqrt(x^2+y^2+z^2) - 1)。
    4. 时间列在输出时只保留 HH:MM:SS.ffffff 部分。

    Args:
        input_csv_path (str): 输入CSV文件的路径。
        output_dir (str): 保存处理后CSV文件的目录。

    Returns:
        bool: 如果处理成功则返回 True，否则返回 False。
    """
    # --- 1. 设置: 定义路径 ---
    base_filename = os.path.basename(input_csv_path)
    output_csv_path = os.path.join(output_dir, base_filename)

    print(f"--- 开始预处理文件: {input_csv_path} ---")

    # --- 2. 读取CSV数据 ---
    try:
        df = pd.read_csv(input_csv_path, dtype={'time': str})
        print(f"成功从 {input_csv_path} 读取 {len(df)} 行数据")
    except FileNotFoundError:
        print(f"错误：输入文件未找到于 {input_csv_path}")
        return False
    except Exception as e:
        print(f"读取CSV文件 {input_csv_path} 时出错: {e}")
        return False

    # --- 3. 预处理 'time' 列 (Keep as datetime for processing) ---
    print("正在处理 'time' 列 (使用完整日期时间进行计算)...")
    # Convert to datetime objects for calculations
    df['time'] = pd.to_datetime(df['time'], format='%Y-%m-%d %H:%M:%S.%f', errors='coerce')

    # Handle potential NaT values from conversion errors before sorting
    initial_nat_count = df['time'].isnull().sum()
    if initial_nat_count > 0:
        print(f"警告：转换时发现 {initial_nat_count} 个无效的时间格式，将尝试填充或丢弃。")
        # Option 1: Drop rows with NaT right away if they can't be handled
        # df.dropna(subset=['time'], inplace=True)
        # Option 2: Try to fill later (as the original code does)

    # Sort by the full datetime
    df = df.sort_values(by='time').reset_index(drop=True)

    # --- Attempt to fill NaT gaps based on 10ms interval ---
    expected_time = df['time'].shift(1) + timedelta(milliseconds=10)
    # Mask for original NaT values *after* sorting
    original_nat_mask = df['time'].isna()
    # Try filling only the original NaT positions
    df.loc[original_nat_mask, 'time'] = expected_time[original_nat_mask]

    # --- Check for 10ms intervals and remaining NaNs ---
    time_diff = df['time'].diff()
    expected_diff = timedelta(milliseconds=10)
    # Rows to keep: the first row OR rows with the expected 10ms difference
    rows_to_keep_mask = (df.index == 0) | (time_diff == expected_diff)
    # Crucially, also ensure the time is not NaT after the potential filling attempt
    rows_to_keep_mask = rows_to_keep_mask & df['time'].notna()

    original_row_count_before_time = len(df)
    df = df[rows_to_keep_mask].reset_index(drop=True)
    rows_dropped_time = original_row_count_before_time - len(df)
    print(f"因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 {rows_dropped_time} 行数据。")

    if df.empty:
        print("错误：时间处理后没有剩余有效数据。跳过此文件。")
        return False

    # --- 4. 预处理 'x', 'y', 'z' 列 ---
    print("正在处理 'x', 'y', 'z' 列...")
    for col in ['x', 'y', 'z']:
        df[col] = pd.to_numeric(df[col], errors='coerce')

    nan_counts_xyz = df[['x', 'y', 'z']].isnull().sum()
    print(f"填充前 'x' 列的空值数量: {nan_counts_xyz['x']}")
    print(f"填充前 'y' 列的空值数量: {nan_counts_xyz['y']}")
    print(f"填充前 'z' 列的空值数量: {nan_counts_xyz['z']}")

    df[['x', 'y', 'z']] = df[['x', 'y', 'z']].interpolate(method='linear', limit_direction='both')

    if df[['x', 'y', 'z']].isnull().any().any():
        print("警告：插值后 x, y, 或 z 列仍存在 NaN。这些行可能无法计算幅值或影响去重。正在丢弃这些行。")
        df.dropna(subset=['x', 'y', 'z'], inplace=True) # Drop rows if interpolation failed

    if df.empty:
        print("错误：插值或丢弃NaN后没有剩余有效数据。跳过此文件。")
        return False

    # --- 5. 添加 'magnitude' 列 ---
    print("正在计算并添加 'magnitude' 列...")
    # Ensure calculation happens *after* NaNs in x, y, z are handled
    df['magnitude'] = np.sqrt(df['x']**2 + df['y']**2 + df['z']**2)
    mag_nan_count = df['magnitude'].isnull().sum()
    if mag_nan_count > 0:
       # This should ideally not happen if NaNs in x,y,z were dropped
       print(f"警告：有 {mag_nan_count} 行未能成功计算 'magnitude'。检查 x,y,z 处理。")


    # --- 6. 去除连续重复的 x, y, z 行 ---
    print("正在去除连续重复的 'x', 'y', 'z' 行...")
    # Ensure comparison happens on cleaned numeric data
    is_duplicate_xyz = (df['x'] == df['x'].shift()) & \
                       (df['y'] == df['y'].shift()) & \
                       (df['z'] == df['z'].shift())

    rows_before_dedup = len(df)
    df = df[~is_duplicate_xyz].reset_index(drop=True)
    rows_after_dedup = len(df)
    rows_dropped_dedup = rows_before_dedup - rows_after_dedup
    print(f"因 x, y, z 值与上一行连续相同，去除了 {rows_dropped_dedup} 行重复数据。")

    # --- 7. 预处理 'annotation' 列 (提取并丢弃空值行) ---
    print("正在处理 'annotation' 列...")
    if df.empty:
        print("错误：去重后没有剩余有效数据。跳过此文件。")
        return False

    # Ensure 'annotation' column exists before processing
    if 'annotation' not in df.columns:
        print("错误：CSV 文件中缺少 'annotation' 列。跳过此文件。")
        return False

    annotation_series = df['annotation'].astype(str)
    # Use regex to extract MET value
    met_values = annotation_series.str.extract(r'MET\s+(\d+\.?\d*)', expand=False)
    # Convert extracted values to numeric, forcing errors to NaN
    df['annotation'] = pd.to_numeric(met_values, errors='coerce')

    nan_met_count = df['annotation'].isnull().sum()
    print(f"将因'annotation'列为空或无法提取MET值而丢弃的行数: {nan_met_count}")

    original_row_count_before_met_drop = len(df)
    # Drop rows where 'annotation' is NaN (either originally empty or failed extraction/conversion)
    df.dropna(subset=['annotation'], inplace=True)
    rows_dropped_met = original_row_count_before_met_drop - len(df)

    # Recalculate nan_met_count based on the state *before* dropping for accurate comparison
    # This comparison might be less critical now, focus on the outcome.
    print(f"已丢弃 {rows_dropped_met} 行 'annotation' (MET) 为空或无效的数据。")


    if df.empty:
        print("错误：丢弃空/无效MET值后没有剩余有效数据。跳过此文件。")
        return False

    # --- 8. 格式化 'time' 列并保存 ---
    print("最终格式化 'time' 列为 HH:MM:SS.ffffff ...")
    # **** Modification: Format the 'time' column to string H:M:S.f before saving ****
    try:
        df['time'] = df['time'].dt.strftime('%H:%M:%S.%f')
    except AttributeError:
        print("错误：无法格式化'time'列。可能它不是预期的datetime类型。")
        return False # Or handle appropriately

    # --- Reorder columns if needed ---
    cols = df.columns.tolist()
    # Example desired order: time, x, y, z, magnitude, annotation
    desired_order = ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
    # Filter to keep only existing columns in the desired order
    final_cols = [col for col in desired_order if col in df.columns]
    # Add any other columns not in the desired list (though unlikely with this script)
    final_cols.extend([col for col in df.columns if col not in final_cols])
    df = df[final_cols] # Apply the final column order


    print(f"当前剩余有效数据行数: {len(df)}")
    print(f"最终数据列: {df.columns.tolist()}")
    print(f"正在将处理后的数据保存到: {output_csv_path}")
    try:
        # Save without date_format since 'time' is now a string
        df.to_csv(output_csv_path, index=False)
        print(f"--- 文件 {base_filename} 预处理完成。 ---")
        return True
    except Exception as e:
        print(f"保存处理后的文件到 {output_csv_path} 时出错: {e}")
        return False

# --- 主执行逻辑 ---
if __name__ == "__main__":
    # 定义输入目录（当前目录）和输出目录
    input_directory = '.' # 当前脚本所在的目录
    # Make sure the output directory is correct relative to where the script is RUN
    script_dir = os.path.dirname(__file__) if '__file__' in locals() else '.'
    output_directory = os.path.join(script_dir, '../TrainingSet') # 输出目录

    # --- 确保输出目录存在 ---
    try:
        os.makedirs(output_directory, exist_ok=True)
        print(f"确保输出目录 '{os.path.abspath(output_directory)}' 存在或已创建。")
    except OSError as e:
        print(f"创建输出目录 '{output_directory}' 时出错: {e}。脚本将退出。")
        exit() # 如果无法创建输出目录，则退出

    # --- 查找所有符合模式 'P###.csv' 的文件 ---
    # Use input_directory which is '.' unless changed
    file_pattern = os.path.join(input_directory, 'P[0-9][0-9][0-9].csv')
    # Use absolute path for glob if input_directory is relative for clarity
    abs_input_dir = os.path.abspath(input_directory)
    csv_files_to_process = glob.glob(os.path.join(abs_input_dir, 'P[0-9][0-9][0-9].csv'))


    # --- 对文件列表进行排序 ---
    # Sort based on the filename found by glob
    csv_files_to_process.sort()

    if not csv_files_to_process:
        print(f"在目录 '{abs_input_dir}' 中未找到符合 'P###.csv' 模式的文件。")
    else:
        print(f"在目录 '{abs_input_dir}' 中找到 {len(csv_files_to_process)} 个待处理的文件 (已排序):")
        # Print just the base filename for brevity
        for f_path in csv_files_to_process:
            print(f"  - {os.path.basename(f_path)}")
        print("-" * 40) # 分隔符

        success_count = 0
        failure_count = 0

        # --- 循环处理每个找到的文件 (现在是按顺序) ---
        for input_file_path in csv_files_to_process:
            print(f"\n>>> 开始处理文件: {os.path.basename(input_file_path)} <<<\n")
            try:
                # Pass the absolute path of the input file
                success = preprocess_sensor_data(input_file_path, output_directory)
                if success:
                    success_count += 1
                else:
                    failure_count += 1
            except Exception as e:
                print(f"!!! 处理文件 {os.path.basename(input_file_path)} 时发生严重意外错误: {e} !!!")
                # Optionally print traceback for debugging:
                # import traceback
                # traceback.print_exc()
                failure_count += 1
            print("-" * 40) # 每个文件处理后的分隔符

        # --- 打印总结信息 ---
        print("\n==================== 处理总结 ====================")
        print(f"总共尝试处理文件数量: {len(csv_files_to_process)}")
        print(f"成功处理文件数量: {success_count}")
        print(f"处理失败或跳过文件数量: {failure_count}")
        print(f"处理后的文件已保存至目录: {os.path.abspath(output_directory)}")
        print("==================================================")

确保输出目录 '/Users/annfengdeye/Desktop/4.19/B题-全部数据/TrainingSet' 存在或已创建。
在目录 '/Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1' 中找到 100 个待处理的文件 (已排序):
  - P001.csv
  - P002.csv
  - P003.csv
  - P004.csv
  - P005.csv
  - P006.csv
  - P007.csv
  - P008.csv
  - P009.csv
  - P010.csv
  - P011.csv
  - P012.csv
  - P013.csv
  - P014.csv
  - P015.csv
  - P016.csv
  - P017.csv
  - P018.csv
  - P019.csv
  - P020.csv
  - P021.csv
  - P022.csv
  - P023.csv
  - P024.csv
  - P025.csv
  - P026.csv
  - P027.csv
  - P028.csv
  - P029.csv
  - P030.csv
  - P031.csv
  - P032.csv
  - P033.csv
  - P034.csv
  - P035.csv
  - P036.csv
  - P037.csv
  - P038.csv
  - P039.csv
  - P040.csv
  - P041.csv
  - P042.csv
  - P043.csv
  - P044.csv
  - P045.csv
  - P046.csv
  - P047.csv
  - P048.csv
  - P049.csv
  - P050.csv
  - P051.csv
  - P052.csv
  - P053.csv
  - P054.csv
  - P055.csv
  - P056.csv
  - P057.csv
  - P058.csv
  - P059.csv
  - P060.csv
  - P061.csv
  - P062.csv
  - P063.csv
  - P064.csv
  - P065.csv
  - P066.csv


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P001.csv 读取 10680001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 4204691 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1025526
已丢弃 1025526 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5449784
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P001.csv
--- 文件 P001.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P002.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P002.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P002.csv 读取 9390001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3375347 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2397863
已丢弃 2397863 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3616791
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P002.csv
--- 文件 P002.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P003.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P003.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P003.csv 读取 9780001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2810370 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1499776
已丢弃 1499776 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5469855
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P003.csv
--- 文件 P003.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P004.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P004.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P004.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 1 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3780897 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1520895
已丢弃 1520895 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4418208
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P004.csv
--- 文件 P004.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P005.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P005.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P005.csv 读取 9000001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2710665 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1933368
已丢弃 1933368 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4355968
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P005.csv
--- 文件 P005.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P006.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P006.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P006.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2837972 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2327694
已丢弃 2327694 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4014335
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P006.csv
--- 文件 P006.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P007.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P007.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P007.csv 读取 10530001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3472475 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1986612
已丢弃 1986612 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5070914
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P007.csv
--- 文件 P007.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P008.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P008.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P008.csv 读取 10242001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3572654 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2369504
已丢弃 2369504 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4299843
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P008.csv
--- 文件 P008.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P009.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P009.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P009.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3875458 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 4076494
已丢弃 4076494 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 1768049
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P009.csv
--- 文件 P009.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P010.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P010.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P010.csv 读取 9540001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3242583 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1790418
已丢弃 1790418 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4507000
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P010.csv
--- 文件 P010.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P011.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P011.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P011.csv 读取 9900001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3628542 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3290352
已丢弃 3290352 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2981107
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P011.csv
--- 文件 P011.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P012.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P012.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P012.csv 读取 9360001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3133352 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2097511
已丢弃 2097511 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4129138
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P012.csv
--- 文件 P012.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P013.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P013.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P013.csv 读取 9540001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3878501 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1097535
已丢弃 1097535 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4563965
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P013.csv
--- 文件 P013.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P014.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P014.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P014.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3174077 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2546029
已丢弃 2546029 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3459895
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P014.csv
--- 文件 P014.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P015.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P015.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P015.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3622776 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1723792
已丢弃 1723792 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3833433
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P015.csv
--- 文件 P015.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P016.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P016.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P016.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2842695 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2621908
已丢弃 2621908 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4255398
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P016.csv
--- 文件 P016.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P017.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P017.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P017.csv 读取 10074001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3634206 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2299458
已丢弃 2299458 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4140337
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P017.csv
--- 文件 P017.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P018.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P018.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P018.csv 读取 8880001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2862654 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1722915
已丢弃 1722915 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4294432
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P018.csv
--- 文件 P018.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P019.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P019.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P019.csv 读取 9630001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3747676 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1642903
已丢弃 1642903 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4239422
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P019.csv
--- 文件 P019.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P020.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P020.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P020.csv 读取 9450001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3658590 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2311337
已丢弃 2311337 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3480074
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P020.csv
--- 文件 P020.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P021.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P021.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P021.csv 读取 9540001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3158803 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2197771
已丢弃 2197771 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4183427
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P021.csv
--- 文件 P021.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P022.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P022.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P022.csv 读取 9768001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3215698 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3676304
已丢弃 3676304 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2875999
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P022.csv
--- 文件 P022.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P023.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P023.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P023.csv 读取 9126441 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2594522 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2460566
已丢弃 2460566 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4071353
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P023.csv
--- 文件 P023.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P024.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P024.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P024.csv 读取 9000001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2843892 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1735326
已丢弃 1735326 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4420783
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P024.csv
--- 文件 P024.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P025.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P025.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P025.csv 读取 9282001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2541427 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1889024
已丢弃 1889024 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4851550
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P025.csv
--- 文件 P025.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P026.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P026.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P026.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2505527 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2684122
已丢弃 2684122 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3630352
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P026.csv
--- 文件 P026.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P027.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P027.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P027.csv 读取 9300001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3445316 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2016776
已丢弃 2016776 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3837909
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P027.csv
--- 文件 P027.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P028.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P028.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P028.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3748879 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1141316
已丢弃 1141316 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4829806
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P028.csv
--- 文件 P028.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P029.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P029.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P029.csv 读取 9900001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3816811 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2419990
已丢弃 2419990 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3663200
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P029.csv
--- 文件 P029.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P030.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P030.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P030.csv 读取 9000001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2869737 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3028974
已丢弃 3028974 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3101290
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P030.csv
--- 文件 P030.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P031.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P031.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P031.csv 读取 9060001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2782501 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1681801
已丢弃 1681801 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4595699
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P031.csv
--- 文件 P031.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P032.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P032.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P032.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3330643 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3540874
已丢弃 3540874 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2848484
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P032.csv
--- 文件 P032.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P033.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P033.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P033.csv 读取 9360001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3316166 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1154514
已丢弃 1154514 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4889321
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P033.csv
--- 文件 P033.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P034.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P034.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P034.csv 读取 8910001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3089358 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3244685
已丢弃 3244685 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2575958
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P034.csv
--- 文件 P034.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P035.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P035.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P035.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3525670 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2499120
已丢弃 2499120 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3695211
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P035.csv
--- 文件 P035.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P036.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P036.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P036.csv 读取 10080001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3330759 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1646555
已丢弃 1646555 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5102687
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P036.csv
--- 文件 P036.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P037.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P037.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P037.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3029861 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3279428
已丢弃 3279428 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2870712
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P037.csv
--- 文件 P037.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P038.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P038.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P038.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3215866 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2667136
已丢弃 2667136 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3296999
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P038.csv
--- 文件 P038.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P039.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P039.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P039.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3141326 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2225491
已丢弃 2225491 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4353184
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P039.csv
--- 文件 P039.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P040.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P040.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P040.csv 读取 9480001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3095476 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2557801
已丢弃 2557801 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3826724
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P040.csv
--- 文件 P040.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P041.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P041.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P041.csv 读取 9510001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2881165 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1173226
已丢弃 1173226 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5455610
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P041.csv
--- 文件 P041.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P042.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P042.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P042.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3422490 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2142119
已丢弃 2142119 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4155392
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P042.csv
--- 文件 P042.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P043.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P043.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P043.csv 读取 10440001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3089511 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1576486
已丢弃 1576486 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5774004
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P043.csv
--- 文件 P043.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P044.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P044.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P044.csv 读取 9360001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3414590 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2433576
已丢弃 2433576 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3511835
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P044.csv
--- 文件 P044.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P045.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P045.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P045.csv 读取 9540001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3804973 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1988137
已丢弃 1988137 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3746891
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P045.csv
--- 文件 P045.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P046.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P046.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P046.csv 读取 9510001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2797404 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1633840
已丢弃 1633840 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5078757
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P046.csv
--- 文件 P046.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P047.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P047.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P047.csv 读取 9360001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3090164 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3964760
已丢弃 3964760 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2305077
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P047.csv
--- 文件 P047.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P048.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P048.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P048.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2825853 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2607043
已丢弃 2607043 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3747105
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P048.csv
--- 文件 P048.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P049.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P049.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P049.csv 读取 9585588 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 1 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3996340 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1694404
已丢弃 1694404 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3894843
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P049.csv
--- 文件 P049.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P050.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P050.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P050.csv 读取 9660001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3486392 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3501932
已丢弃 3501932 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2671677
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P050.csv
--- 文件 P050.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P051.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P051.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P051.csv 读取 8910001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2613769 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1925853
已丢弃 1925853 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4370379
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P051.csv
--- 文件 P051.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P052.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P052.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P052.csv 读取 8827878 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2550137 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1727429
已丢弃 1727429 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4550312
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P052.csv
--- 文件 P052.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P053.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P053.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P053.csv 读取 9090001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2680353 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2800516
已丢弃 2800516 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3609132
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P053.csv
--- 文件 P053.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P054.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P054.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P054.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2793418 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1886779
已丢弃 1886779 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4139804
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P054.csv
--- 文件 P054.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P055.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P055.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P055.csv 读取 9900001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3195173 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1252505
已丢弃 1252505 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5452323
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P055.csv
--- 文件 P055.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P056.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P056.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P056.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3245159 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1301031
已丢弃 1301031 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4273811
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P056.csv
--- 文件 P056.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P057.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P057.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P057.csv 读取 9144258 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 1 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2935969 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2919139
已丢弃 2919139 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3289149
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P057.csv
--- 文件 P057.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P058.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P058.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P058.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2894697 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1676796
已丢弃 1676796 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4248508
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P058.csv
--- 文件 P058.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P059.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P059.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P059.csv 读取 9270001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3254697 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1308035
已丢弃 1308035 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4707269
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P059.csv
--- 文件 P059.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P060.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P060.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P060.csv 读取 9000001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3158870 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2753589
已丢弃 2753589 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3087542
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P060.csv
--- 文件 P060.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P061.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P061.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P061.csv 读取 9960001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3158680 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2093982
已丢弃 2093982 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4707339
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P061.csv
--- 文件 P061.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P062.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P062.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P062.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3460676 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2484431
已丢弃 2484431 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3774894
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P062.csv
--- 文件 P062.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P063.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P063.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P063.csv 读取 9540001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3743732 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2140052
已丢弃 2140052 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3656217
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P063.csv
--- 文件 P063.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P064.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P064.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P064.csv 读取 11430001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 4330463 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2221077
已丢弃 2221077 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4878461
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P064.csv
--- 文件 P064.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P065.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P065.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P065.csv 读取 9690001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3055281 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2642049
已丢弃 2642049 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3992671
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P065.csv
--- 文件 P065.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P066.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P066.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P066.csv 读取 9300001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3184060 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3856836
已丢弃 3856836 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 2259105
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P066.csv
--- 文件 P066.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P067.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P067.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P067.csv 读取 10620001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 4457469 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3150553
已丢弃 3150553 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3011979
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P067.csv
--- 文件 P067.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P068.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P068.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P068.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2996084 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1729140
已丢弃 1729140 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4994777
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P068.csv
--- 文件 P068.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P069.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P069.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P069.csv 读取 10080001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3274472 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3048349
已丢弃 3048349 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3757180
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P069.csv
--- 文件 P069.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P070.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P070.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P070.csv 读取 9900001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3823958 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1443021
已丢弃 1443021 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4633022
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P070.csv
--- 文件 P070.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P071.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P071.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P071.csv 读取 9060001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3003614 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2348965
已丢弃 2348965 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3707422
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P071.csv
--- 文件 P071.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P072.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P072.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P072.csv 读取 9810001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3236239 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1699940
已丢弃 1699940 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4873822
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P072.csv
--- 文件 P072.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P073.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P073.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P073.csv 读取 10180494 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 1 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3494177 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2168139
已丢弃 2168139 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4518177
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P073.csv
--- 文件 P073.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P074.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P074.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P074.csv 读取 9000556 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2215217 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1965645
已丢弃 1965645 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4819694
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P074.csv
--- 文件 P074.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P075.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P075.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P075.csv 读取 9570001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3156319 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1889002
已丢弃 1889002 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4524680
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P075.csv
--- 文件 P075.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P076.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P076.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P076.csv 读取 9660001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3574751 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1926897
已丢弃 1926897 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4158353
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P076.csv
--- 文件 P076.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P077.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P077.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P077.csv 读取 8874001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 1 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2269291 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2432672
已丢弃 2432672 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4172037
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P077.csv
--- 文件 P077.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P078.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P078.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P078.csv 读取 8640001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3239794 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1381190
已丢弃 1381190 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4019017
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P078.csv
--- 文件 P078.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P079.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P079.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P079.csv 读取 11160001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3535353 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2523261
已丢弃 2523261 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5101387
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P079.csv
--- 文件 P079.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P080.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P080.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P080.csv 读取 9270001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3284093 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2573201
已丢弃 2573201 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3412707
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P080.csv
--- 文件 P080.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P081.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P081.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P081.csv 读取 10296001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3688022 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1455888
已丢弃 1455888 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5152091
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P081.csv
--- 文件 P081.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P082.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P082.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P082.csv 读取 9624001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2925835 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1836188
已丢弃 1836188 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4861978
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P082.csv
--- 文件 P082.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P083.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P083.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P083.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2656319 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2199992
已丢弃 2199992 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3963690
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P083.csv
--- 文件 P083.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P084.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P084.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P084.csv 读取 10680001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 4467998 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1154925
已丢弃 1154925 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5057078
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P084.csv
--- 文件 P084.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P085.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P085.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P085.csv 读取 9270001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2907571 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1462084
已丢弃 1462084 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4900346
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P085.csv
--- 文件 P085.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P086.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P086.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P086.csv 读取 9990001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3550439 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1855947
已丢弃 1855947 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4583615
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P086.csv
--- 文件 P086.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P087.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P087.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P087.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3845209 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2725736
已丢弃 2725736 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3149056
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P087.csv
--- 文件 P087.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P088.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P088.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P088.csv 读取 10080001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3717418 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2574590
已丢弃 2574590 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3787993
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P088.csv
--- 文件 P088.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P089.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P089.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P089.csv 读取 9450001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3328469 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1664692
已丢弃 1664692 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4456840
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P089.csv
--- 文件 P089.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P090.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P090.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P090.csv 读取 9540001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3354442 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 989384
已丢弃 989384 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5196175
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P090.csv
--- 文件 P090.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P091.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P091.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P091.csv 读取 9048001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2790189 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2178746
已丢弃 2178746 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4079066
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P091.csv
--- 文件 P091.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P092.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P092.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P092.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2542329 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2124380
已丢弃 2124380 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4153292
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P092.csv
--- 文件 P092.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P093.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P093.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P093.csv 读取 9360001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3300755 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1467032
已丢弃 1467032 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4592214
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P093.csv
--- 文件 P093.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P094.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P094.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P094.csv 读取 9060001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2779660 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1919990
已丢弃 1919990 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4360351
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P094.csv
--- 文件 P094.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P095.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P095.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P095.csv 读取 9360001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3014192 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1166533
已丢弃 1166533 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 5179276
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P095.csv
--- 文件 P095.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P096.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P096.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P096.csv 读取 9180001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3134122 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2009157
已丢弃 2009157 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4036722
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P096.csv
--- 文件 P096.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P097.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P097.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P097.csv 读取 9900001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3658912 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 1429064
已丢弃 1429064 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4812025
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P097.csv
--- 文件 P097.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P098.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P098.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P098.csv 读取 8820001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 2548202 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2680456
已丢弃 2680456 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3591343
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P098.csv
--- 文件 P098.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P099.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P099.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P099.csv 读取 9720001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3005148 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 3104888
已丢弃 3104888 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 3609965
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P099.csv
--- 文件 P099.csv 预处理完成。 ---
----------------------------------------

>>> 开始处理文件: P100.csv <<<

--- 开始预处理文件: /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P100.csv ---


  df = pd.read_csv(input_csv_path, dtype={'time': str})


成功从 /Users/annfengdeye/Desktop/4.19/B题-全部数据/附件1/P100.csv 读取 9510001 行数据
正在处理 'time' 列 (使用完整日期时间进行计算)...
因时间间隔不一致、格式错误或无法填充的间隙，丢弃了 0 行数据。
正在处理 'x', 'y', 'z' 列...
填充前 'x' 列的空值数量: 0
填充前 'y' 列的空值数量: 0
填充前 'z' 列的空值数量: 0
正在计算并添加 'magnitude' 列...
正在去除连续重复的 'x', 'y', 'z' 行...
因 x, y, z 值与上一行连续相同，去除了 3081182 行重复数据。
正在处理 'annotation' 列...
将因'annotation'列为空或无法提取MET值而丢弃的行数: 2315793
已丢弃 2315793 行 'annotation' (MET) 为空或无效的数据。
最终格式化 'time' 列为 HH:MM:SS.ffffff ...
当前剩余有效数据行数: 4113026
最终数据列: ['time', 'x', 'y', 'z', 'magnitude', 'annotation']
正在将处理后的数据保存到: ./../TrainingSet/P100.csv
--- 文件 P100.csv 预处理完成。 ---
----------------------------------------

总共尝试处理文件数量: 100
成功处理文件数量: 100
处理失败或跳过文件数量: 0
处理后的文件已保存至目录: /Users/annfengdeye/Desktop/4.19/B题-全部数据/TrainingSet
