<a href="https://colab.research.google.com/github/KenichiroArai/Google-Colab/blob/main/%E3%83%84%E3%83%BC%E3%83%AB/CSV%E7%B5%90%E5%90%88_%E5%80%8B%E5%88%A5%E6%8C%87%E5%AE%9A_%E3%83%84%E3%83%BC%E3%83%AB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 0 概要

本ファイルは、CSVファイルを一つのファイルに結合するためのツールです。

本プログラムは、個別指定です。

正規表現に指定したい場合は別ファイル（「CSV結合_正規表現指定_ツール.ipynb」）をご参照ください。

入力、共通（定義）、実行の3セクションに大別されています。

入力セクションで実行したい情報を入力して実行して下さい。

実行するセクションが実行されるまで、出力されません。


# 1 入力

入力情報の1行ごとに結合するファイル名を入力してください。




In [1]:
# 出力パス
output_path = 'drive/MyDrive/test/出力'

# 出力ファイル名
output_file_name = 'output_sample.csv'

# 読み込み情報
## read_path: 読み込み対象のパス
## read_file_name: 読み込みファイル名
read_infos = [
    { 'read_path': 'drive/MyDrive/test/入力', 'read_file_name': 'data1.csv' },
    { 'read_path': 'drive/MyDrive/test/入力', 'read_file_name': 'data2.csv' },
    { 'read_path': 'drive/MyDrive/test/入力', 'read_file_name': 'data3.csv' },
]


# 2 共通

## (1) 準備

## ア 事前処理

In [2]:
# ドライブの使用
from google.colab import drive
drive.mount('/content/drive')


Mounted at /content/drive


## イ インポート

In [3]:
import csv
import os
import re

import chardet
import pandas as pd


# 3 実行

## (1) CSV結合の出力

In [4]:
%%time

# 開始
print('---------- CSV結合を出力：開始 ----------')

# 出力先のフルパス
output_full_path = os.path.join(output_path, output_file_name)

# すべてのCSVを1つのDataFrameにまとめる
combined_csv_df = pd.DataFrame()

# 読み込み情報リストごとに、CSVを出力する
print('----- CSVの読み込みを開始します。 -----')
for index, read_info in enumerate(read_infos):

    # 読み込み情報から各データを取得
    read_path = read_info['read_path']
    read_file_name = read_info['read_file_name']

    # 読み込み先のフルパス
    read_full_path = os.path.join(read_path, read_file_name)

    # エンコーディングを自動判定
    with open(read_full_path, 'rb') as f:
        rawdata = f.read()
        result_dict = chardet.detect(rawdata)
    encoding = result_dict['encoding']

    # CSVを読み込む
    print(f'{index + 1}/{len(read_infos)}:{read_full_path} (Encoding: {encoding})')
    df = pd.read_csv(read_full_path, encoding=encoding)

    # 結合する
    combined_csv_df = pd.concat([combined_csv_df, df], ignore_index=True, sort=False)
print('----- CSVの読み込みを終了します。 -----')

# 結果をCSVとしてエクスポート
print('----- CSV結合の出力を開始します。 -----')
print(f'出力先：{output_full_path}')
combined_csv_df.to_csv(output_full_path, index=False)
print('----- CSV結合の出力を終了します。 -----')

# 終了
print('---------- CSV結合を出力：終了 ----------')


---------- CSV結合を出力：開始 ----------
----- CSVの読み込みを開始します。 -----
1/3:drive/MyDrive/test/入力/data1.csv (Encoding: ascii)
2/3:drive/MyDrive/test/入力/data2.csv (Encoding: SHIFT_JIS)
3/3:drive/MyDrive/test/入力/data3.csv (Encoding: ascii)
----- CSVの読み込みを終了します。 -----
----- CSV結合の出力を開始します。 -----
出力先：drive/MyDrive/test/出力/output_sample.csv
----- CSV結合の出力を終了します。 -----
---------- CSV結合を出力：終了 ----------
CPU times: user 41.1 ms, sys: 5.86 ms, total: 47 ms
Wall time: 1.68 s
