In [11]:
import os

os.chdir("/work")

# %% 準備
import pandas as pd
from utils.logger import app_logger
from utils.config_loader import get_template_config
from logic.manage.utils.csv_loader import load_all_filtered_dataframes
from logic.manage.utils.load_template import load_master_and_template
from IPython.display import display
import re
from logic.manage.factory_report import process
from logic.manage.utils.excel_tools import create_label_rows_generic, sort_by_cell_row

In [12]:
from logic.manage.processors.factory_report_yuuka import process_yuuka

In [13]:
# 表示ラベルマップ（処理対象名として使う）
csv_label_map = {"yard": "ヤード一覧", "shipping": "出荷一覧", "receive": "受入一覧"}

debug_shipping = "/work/data/output/debug_shipping.parquet"
debug_yard = "/work/data/output/debug_yard.parquet"

dfs = {
    "shipping": pd.read_parquet(debug_shipping),
    "yard": pd.read_parquet(debug_yard),
}  # テスト用CSV
# dfs
df_shipping = dfs["shipping"]
df_yard = dfs["yard"]

## マスターCSV（有価）の取得

In [14]:
def process_yuuka(df_yard, df_shipping) -> pd.DataFrame:
    logger = app_logger()

    # マスターCSVの読込
    master_path = get_template_config()["factory_report"]["master_csv_path"]["yuuka"]
    master_csv = load_master_and_template(master_path)

    # 各処理を実行
    # updated_master_csv = apply_shipping(master_csv, df_shipping)

    # display(master_csv)
    return master_csv


master_csv1 = process_yuuka(df_yard, df_shipping)

## 有価の処理

In [15]:
import pandas as pd


def merge_safely_with_keys(
    master_df: pd.DataFrame,
    data_df: pd.DataFrame,
    key_cols: list[str],
    how: str = "left",
) -> pd.DataFrame:
    """
    指定した複数のキー列を使って、安全にマージする関数。
    マスター側のキー列に欠損値（NaN）がある行はマージ対象から除外される。

    Parameters
    ----------
    master_df : pd.DataFrame
        マージ元（テンプレート）
    data_df : pd.DataFrame
        マージ対象のデータ
    key_cols : list[str]
        結合に使用するキー列（1〜3列想定）
    how : str
        マージ方法（デフォルト: "left"）

    Returns
    -------
    pd.DataFrame
        マージ済みのDataFrame（未マージ行も含まれる）
    """

    # ① キーに空欄がある行を除外してマージ
    master_valid = master_df.dropna(subset=key_cols)
    data_valid = data_df.dropna(subset=key_cols)

    merged = pd.merge(master_valid, data_valid, on=key_cols, how=how)

    # ② キーが不完全（NaN含む）な行を保持して復元
    master_skipped = master_df[master_df[key_cols].isna().any(axis=1)]

    # ③ マージしたものと未マージのものを結合して返す
    final_df = pd.concat([merged, master_skipped], ignore_index=True)

    return final_df

In [16]:
def update_column_if_present(df, source_col: str, target_col: str) -> pd.DataFrame:
    mask = df[source_col].notna()
    df.loc[mask, target_col] = df.loc[mask, source_col]
    return df

In [17]:
def apply_summary_by_sheetname(
    master_csv: pd.DataFrame,
    data_df: pd.DataFrame,
    sheet_name: str,
    key_cols: list[str],
    source_col: str = "正味重量",
    target_col: str = "値",
) -> pd.DataFrame:
    """
    マスターCSVの特定シート部分に対して、外部データをgroupby集計してマージし、値を書き込む汎用関数。

    Parameters
    ----------
    master_csv : pd.DataFrame
        全体のテンプレートCSV（複数シートを含む）
    data_df : pd.DataFrame
        処理対象のデータ（例：df_shipping）
    sheet_name : str
        処理対象とする "CSVシート名"（例："出荷"）
    key_cols : list[str]
        groupbyキー ＝ マージキー（例：["品名"], ["業者名", "品名"]）
    source_col : str
        集計対象の列（例："正味重量"）
    target_col : str
        書き込み先の列（例："値"）

    Returns
    -------
    pd.DataFrame
        処理済みのマスターCSV（"CSVシート名"以外も含む）
    """
    logger = app_logger()
    logger.info(
        f"▶️ 処理対象シート: {sheet_name}, キー: {key_cols}, 集計列: {source_col}"
    )

    # ① 該当シート部分を取り出す
    target_df = master_csv[master_csv["CSVシート名"] == sheet_name].copy()

    # ② groupbyで合計
    agg_df = data_df.groupby(key_cols, as_index=False)[[source_col]].sum()

    # ③ 安全にマージ
    merged_df = merge_safely_with_keys(
        master_df=target_df, data_df=agg_df, key_cols=key_cols
    )

    # ④ 値を書き込み（NaN以外）
    merged_df = update_column_if_present(merged_df, source_col, target_col)

    # ⑤ 不要列を削除
    merged_df.drop(columns=[source_col], inplace=True)

    # ⑥ 元に戻す：シート以外はそのまま
    master_others = master_csv[master_csv["CSVシート名"] != sheet_name]
    final_df = pd.concat([master_others, merged_df], ignore_index=True)

    return final_df

In [18]:
df_map = {"ヤード": df_yard, "出荷": df_shipping}

sheet_key_pairs = [
    ("ヤード", ["品名"]),
    ("出荷", ["品名"]),
    ("出荷", ["業者名", "品名"]),
    ("出荷", ["現場名", "運搬業者名", "品名"]),
]

master_csv_updated = master_csv1.copy()

for sheet_name, key_cols in sheet_key_pairs:
    data_df = df_map[sheet_name]

    master_csv_updated = apply_summary_by_sheetname(
        master_csv=master_csv_updated,
        data_df=data_df,
        sheet_name=sheet_name,
        key_cols=key_cols,
    )
master_csv_updated

2025-04-24 15:04:57,576 [INFO] (3211554866.py:33) [fb6959af9847/root] ▶️ 処理対象シート: ヤード, キー: ['品名'], 集計列: 正味重量
2025-04-24 15:04:57,592 [INFO] (3211554866.py:33) [fb6959af9847/root] ▶️ 処理対象シート: 出荷, キー: ['品名'], 集計列: 正味重量
2025-04-24 15:04:57,607 [INFO] (3211554866.py:33) [fb6959af9847/root] ▶️ 処理対象シート: 出荷, キー: ['業者名', '品名'], 集計列: 正味重量
2025-04-24 15:04:57,625 [INFO] (3211554866.py:33) [fb6959af9847/root] ▶️ 処理対象シート: 出荷, キー: ['現場名', '運搬業者名', '品名'], 集計列: 正味重量


Unnamed: 0,有価名,CSVシート名,業者名,現場名,運搬業者名,品名,セル,値
0,合計_有価,,,,,,O21,
1,スクラップ,ヤード,,,,GAH鋼･鉄筋等,C20,
2,スクラップ,ヤード,,,,GC軽鉄･ｽﾁｰﾙ類,C20,
3,スクラップ,ヤード,,,,GC軽鉄・ｽﾁｰﾙ類,C20,
4,スクラップ,ヤード,,,,GD,C20,110.0
5,アルミ類,ヤード,,,,ｱﾙﾐ類,L20,
6,ステンレス,ヤード,,,,ｽﾃﾝﾚｽ,C22,
7,トランス,ヤード,,,,ﾄﾗﾝｽ,F22,
8,モーター,ヤード,,,,ﾓｰﾀｰ,I22,
9,ラジエター,ヤード,,,,ﾗｼﾞｴﾀｰ,L22,


In [None]:
def summarize_value_by_cell_with_label(
    df: pd.DataFrame,
    value_col: str = "値",
    cell_col: str = "セル",
    label_col: str = "有価名",
) -> pd.DataFrame:
    """
    セル単位で値を集計し、対応するラベル列（例：有価名）を付加した集計結果を返す。

    Parameters
    ----------
    df : pd.DataFrame
        元のデータフレーム（テンプレート含む）
    value_col : str
        数値に変換して合計する列名（例: "値"）
    cell_col : str
        セル位置を示す列名（例: "セル"）
    label_col : str
        ラベル（名前）を示す列名（例: "有価名"）

    Returns
    -------
    pd.DataFrame
        集計された「セル + 値 + ラベル」形式のDataFrame
    """
    # ① 数値変換（混在対応）
    df[value_col] = pd.to_numeric(df[value_col], errors="coerce")

    # ② セル単位で合計
    grouped = df.groupby(cell_col, as_index=False)[value_col].sum()

    # ③ セルとラベルの対応表を作成（重複除外）
    cell_to_label = df[[cell_col, label_col]].drop_duplicates()

    # ④ マージ
    grouped_named = pd.merge(grouped, cell_to_label, on=cell_col, how="left")

    return grouped_named

Unnamed: 0,セル,値,有価名
0,C20,670.0,スクラップ
1,C22,0.0,ステンレス
2,C24,0.0,雑線
3,C26,0.0,銅
4,C28,0.0,Cﾌﾟﾚｽ
5,F20,250.0,紙、ダンボール
6,F22,0.0,トランス
7,F24,60.0,アルミ缶
8,F26,2270.0,配線
9,F28,0.0,給湯器


In [None]:
grouped_named = grouped_named[~grouped_named["有価名"].str.contains("合計", na=False)]
after_master_csv = add_label_rows(grouped_named, "有価名", offset=-1)
after_master_csv

Unnamed: 0,セル,値,有価名
0,F19,紙、ダンボール,
1,I19,ペットボトル,
2,C19,スクラップ,
3,L19,アルミ類,
4,L20,450.0,アルミ類
5,F20,250.0,紙、ダンボール
6,I20,190.0,ペットボトル
7,C20,670.0,スクラップ
8,I21,モーター,
9,F21,トランス,
