# スライシングの実践

このノートブックでは、Pythonのスライシング機能を活用した効率的なデータ処理方法を学びます。


In [None]:
# 基本的なスライシング操作

# リストのスライス
numbers = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
print(f"元のリスト: {numbers}")
print(f"最初の3つ: {numbers[:3]}")
print(f"最後の3つ: {numbers[-3:]}")
print(f"中間部分 (2-7): {numbers[2:7]}")
print(f"逆順: {numbers[::-1]}")
print(f"2つおき: {numbers[::2]}")
print(f"逆順で2つおき: {numbers[::-2]}")

# 文字列のスライス
text = "Python Programming"
print(f"\n元の文字列: {text}")
print(f"最初の6文字: {text[:6]}")
print(f"最後の11文字: {text[-11:]}")
print(f"逆順: {text[::-1]}")
print(f"2文字おき: {text[::2]}")

# タプルのスライス
coordinates = (10, 20, 30, 40, 50)
print(f"\n元のタプル: {coordinates}")
print(f"最初の2つ: {coordinates[:2]}")
print(f"最後の2つ: {coordinates[-2:]}")
print(f"中間部分: {coordinates[1:4]}")


In [None]:
# データ処理でのスライシング活用

def process_data(data):
    """データを処理"""
    # 最初と最後の要素を除外
    middle_data = data[1:-1]
    print(f"中間データ: {middle_data}")
    
    # 偶数インデックスの要素
    even_indices = data[::2]
    print(f"偶数インデックス: {even_indices}")
    
    # 奇数インデックスの要素
    odd_indices = data[1::2]
    print(f"奇数インデックス: {odd_indices}")
    
    return {
        'middle': middle_data,
        'even': even_indices,
        'odd': odd_indices
    }

# 使用例
data = list(range(10))
print(f"元データ: {data}")
result = process_data(data)

# ファイル処理でのスライシング
class FileProcessor:
    """ファイル処理クラス"""
    
    def get_header_and_data(self, lines):
        """ヘッダーとデータを分離"""
        if len(lines) < 2:
            return None, lines
        
        # 最初の行をヘッダー、残りをデータとする
        header = lines[0]
        data = lines[1:]
        return header, data
    
    def get_chunks(self, data, chunk_size):
        """データをチャンクに分割"""
        chunks = []
        for i in range(0, len(data), chunk_size):
            chunk = data[i:i + chunk_size]
            chunks.append(chunk)
        return chunks
    
    def get_last_n_lines(self, lines, n):
        """最後のn行を取得"""
        return lines[-n:] if len(lines) >= n else lines

# 使用例
processor = FileProcessor()
lines = ["header1,header2,header3", "data1,data2,data3", "data4,data5,data6", "data7,data8,data9"]
header, data = processor.get_header_and_data(lines)
print(f"\nヘッダー: {header}")
print(f"データ: {data}")

chunks = processor.get_chunks(data, 2)
print(f"チャンク (サイズ2): {chunks}")

last_lines = processor.get_last_n_lines(lines, 2)
print(f"最後の2行: {last_lines}")


In [None]:
# アンパックとスライシングの比較

# アンパックの活用
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
first, second, *rest = data
print(f"最初: {first}, 2番目: {second}, 残り: {rest}")

# 最後の要素も取得
*rest, last = data
print(f"残り: {rest}, 最後: {last}")

# 最初と最後を除く
first, *middle, last = data
print(f"最初: {first}, 中間: {middle}, 最後: {last}")

# データベースクエリ結果の処理
class QueryProcessor:
    """クエリ処理クラス"""
    
    def process_query_results(self, results):
        """クエリ結果を処理"""
        processed_data = []
        for row in results:
            # アンパックで各フィールドを取得
            id, name, email, created_at = row
            processed_data.append({
                'id': id,
                'name': name,
                'email': email,
                'created_at': created_at
            })
        return processed_data
    
    def process_flexible_results(self, results):
        """柔軟な結果処理"""
        processed_data = []
        for row in results:
            if len(row) >= 3:
                first, second, *rest = row
                processed_data.append({
                    'first': first,
                    'second': second,
                    'additional': rest
                })
        return processed_data

# 使用例
query_results = [
    (1, 'Alice', 'alice@example.com', '2023-01-01'),
    (2, 'Bob', 'bob@example.com', '2023-01-02'),
    (3, 'Charlie', 'charlie@example.com', '2023-01-03')
]

processor = QueryProcessor()
processed = processor.process_query_results(query_results)
print("\n処理されたデータ:")
for item in processed:
    print(f"  {item}")

# 時系列データの処理
class TimeSeriesProcessor:
    """時系列データ処理クラス"""
    
    def get_trend_data(self, values, window_size):
        """トレンドデータを取得"""
        if len(values) < window_size:
            return values
        
        # 移動平均を計算
        trend = []
        for i in range(len(values) - window_size + 1):
            window = values[i:i + window_size]
            average = sum(window) / len(window)
            trend.append(average)
        
        return trend
    
    def get_sampled_data(self, data, sample_rate):
        """データをサンプリング"""
        return data[::sample_rate]

# 使用例
processor = TimeSeriesProcessor()
time_series = list(range(20))
moving_avg = processor.get_trend_data(time_series, 3)
sampled = processor.get_sampled_data(time_series, 2)
print(f"\n元データ: {time_series}")
print(f"移動平均 (ウィンドウ3): {moving_avg}")
print(f"サンプリング (2つおき): {sampled}")
