# 13. col1.txtとcol2.txtをマージ

col1.txtとcol2.txtを結合し，元のファイルの1列目と2列目をタブ区切りで並べたテキストファイルを作成せよ．確認にはpasteコマンドを用いよ．

In [None]:
# 問題13: col1.txtとcol2.txtをマージ

# Pythonで列をマージ
def merge_columns(col1_path, col2_path, output_path):
    """2つのファイルの内容をマージしてタブ区切りのファイルを作成する関数
    
    Args:
        col1_path: 1列目のファイルのパス
        col2_path: 2列目のファイルのパス
        output_path: 出力ファイルのパス
        
    Returns:
        処理した行数
    """
    count = 0
    with open(col1_path, 'r', encoding='utf-8') as f_col1, \
         open(col2_path, 'r', encoding='utf-8') as f_col2, \
         open(output_path, 'w', encoding='utf-8') as f_out:
        for line1, line2 in zip(f_col1, f_col2):
            count += 1
            # 改行文字を削除して結合
            merged_line = line1.strip() + '\t' + line2.strip() + '\n'
            f_out.write(merged_line)
    return count

# サンプルファイルのパス（実際の環境に合わせて変更してください）
col1_path = '../data/col1.txt'
col2_path = '../data/col2.txt'
output_path = '../data/merged.txt'

# 列をマージ
try:
    processed_lines = merge_columns(col1_path, col2_path, output_path)
    print(f"Pythonで処理: {processed_lines}行をマージしました")
    print(f"マージ結果を {output_path} に保存しました")
except FileNotFoundError as e:
    print(f"ファイルが見つかりません: {e}")
    print("このノートブックを実行する前に、問題12を実行して必要なファイルを作成してください。")

In [None]:
# UNIXコマンドでの確認（Jupyter上で実行）
# pasteコマンドを使用して列をマージ
!paste ../data/col1.txt ../data/col2.txt > /tmp/unix_merged.txt 2>/dev/null && echo "pasteコマンドでマージ完了" || echo "pasteコマンドでのマージに失敗しました"

In [None]:
# 結果の確認（最初の5行を表示）
print("Pythonでマージした結果（最初の5行）:")
!head -n 5 ../data/merged.txt 2>/dev/null || echo "ファイルが見つかりません"

print("\nUNIXコマンドでマージした結果（最初の5行）:")
!head -n 5 /tmp/unix_merged.txt 2>/dev/null || echo "ファイルが見つかりません"

## 解説

この問題では、2つのファイルの内容を1行ずつ読み込み、それらをタブ区切りで結合して新しいファイルに書き込む方法を学びます。

### Pythonでの実装

Pythonで2つのファイルをマージするには、以下の手順を実行します：

1. 2つの入力ファイルと1つの出力ファイルを開きます。
2. `zip`関数を使用して、2つのファイルから1行ずつ同時に読み込みます。
3. 各行の末尾の改行文字を削除し、タブ文字で結合して新しい行を作成します。
4. 結合した行を出力ファイルに書き込みます。

### UNIXコマンドでの確認

UNIXの`paste`コマンドを使用して、複数のファイルを列方向に結合できます：

```bash
paste col1.txt col2.txt > merged.txt
```

`paste`コマンドは、デフォルトでタブ区切りを使用して、指定された複数のファイルの各行を結合します。

### 注意点

- ファイルが存在しない場合のエラー処理を行っています。
- `zip`関数は、最も短いイテラブルが終了した時点で停止するため、2つのファイルの行数が異なる場合は、短い方に合わせて処理されます。
- 文字エンコーディングを指定して、異なる言語や文字セットのファイルも正しく処理できるようにしています。