# リスト内包表記とジェネレータ

このノートブックでは、リスト内包表記とジェネレータのベストプラクティスを学びます。


In [None]:
# リスト内包表記でmapとfilterを置き換える

# 悪い例（mapとfilterを使用）
def process_numbers_bad(numbers):
    """数値を処理（mapとfilterを使用）"""
    # 偶数を2倍にする
    even_numbers = list(filter(lambda x: x % 2 == 0, numbers))
    doubled_numbers = list(map(lambda x: x * 2, even_numbers))
    return doubled_numbers

# 良い例（リスト内包表記を使用）
def process_numbers_good(numbers):
    """数値を処理（リスト内包表記を使用）"""
    # 偶数を2倍にする
    return [x * 2 for x in numbers if x % 2 == 0]

# 使用例
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print("=== 数値処理 ===")
print(f"元の数値: {numbers}")
print(f"悪い例の結果: {process_numbers_bad(numbers)}")
print(f"良い例の結果: {process_numbers_good(numbers)}")

# 文字列処理
words = ['hello', 'world', 'python', 'programming', 'data', 'science']

# 悪い例（mapとfilterを使用）
def process_words_bad(words):
    """単語を処理（mapとfilterを使用）"""
    long_words = list(filter(lambda x: len(x) > 5, words))
    upper_words = list(map(lambda x: x.upper(), long_words))
    return upper_words

# 良い例（リスト内包表記を使用）
def process_words_good(words):
    """単語を処理（リスト内包表記を使用）"""
    return [word.upper() for word in words if len(word) > 5]

print("\n=== 単語処理 ===")
print(f"元の単語: {words}")
print(f"悪い例の結果: {process_words_bad(words)}")
print(f"良い例の結果: {process_words_good(words)}")

# 複雑な変換でのリスト内包表記
def process_user_data(users):
    """ユーザーデータを処理"""
    # アクティブなユーザーのメールアドレスを大文字に変換
    return [
        user['email'].upper() 
        for user in users 
        if user.get('active', False) and 'email' in user
    ]

# 使用例
users = [
    {'name': 'Alice', 'email': 'alice@example.com', 'active': True},
    {'name': 'Bob', 'email': 'bob@example.com', 'active': False},
    {'name': 'Charlie', 'email': 'charlie@example.com', 'active': True},
    {'name': 'David', 'active': True},  # メールアドレスなし
    {'name': 'Eve', 'email': 'eve@example.com', 'active': True}
]

print("\n=== ユーザーデータ処理 ===")
print(f"元のユーザー: {users}")
processed_emails = process_user_data(users)
print(f"処理されたメールアドレス: {processed_emails}")

# ネストしたリスト内包表記
def flatten_and_process(matrix):
    """行列を平坦化して処理"""
    return [x * 2 for row in matrix for x in row if x > 0]

# 使用例
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
print(f"\n=== 行列処理 ===")
print(f"元の行列: {matrix}")
flattened = flatten_and_process(matrix)
print(f"平坦化・処理結果: {flattened}")


In [None]:
# 大きな内包表記ではジェネレータ式を好む

# 悪い例（リスト内包表記）
def process_large_data_bad(data):
    """大きなデータを処理（リスト内包表記）"""
    # メモリを大量に消費
    processed = [x * 2 for x in data if x > 0]
    return processed

# 良い例（ジェネレータ式）
def process_large_data_good(data):
    """大きなデータを処理（ジェネレータ式）"""
    # メモリ効率的
    return (x * 2 for x in data if x > 0)

# 使用例
import sys

# 大きなデータセットを作成
large_data = list(range(1000000))

print("=== メモリ使用量の比較 ===")

# リスト内包表記
processed_list = [x * 2 for x in large_data if x > 0]
print(f"リスト内包表記のメモリ使用量: {sys.getsizeof(processed_list)} bytes")

# ジェネレータ式
processed_gen = (x * 2 for x in large_data if x > 0)
print(f"ジェネレータ式のメモリ使用量: {sys.getsizeof(processed_gen)} bytes")

# ジェネレータ式の使用
print("\n=== ジェネレータ式の使用 ===")
gen = process_large_data_good(range(10))
for i, value in enumerate(gen):
    print(f"値: {value}")
    if i >= 4:  # 最初の5つのみ表示
        break

# ファイル処理でのジェネレータ式
def process_file_lines(filename):
    """ファイルの行を処理"""
    with open(filename, 'r') as f:
        # ジェネレータ式でメモリ効率的に処理
        return (line.strip().upper() for line in f if line.strip())

def count_words_in_file(filename):
    """ファイル内の単語数をカウント"""
    with open(filename, 'r') as f:
        # ジェネレータ式で単語をカウント
        word_count = sum(
            len(line.split()) 
            for line in f 
            if line.strip()
        )
        return word_count

# 使用例（実際のファイルがない場合のシミュレート）
def simulate_file_processing():
    """ファイル処理をシミュレート"""
    lines = ['hello world', 'python programming', 'data science', 'machine learning']
    
    # ジェネレータ式で処理
    processed_lines = (line.upper() for line in lines if line.strip())
    
    print("=== ファイル処理シミュレート ===")
    for line in processed_lines:
        print(f"処理された行: {line}")
    
    # 単語数カウント
    word_count = sum(len(line.split()) for line in lines if line.strip())
    print(f"総単語数: {word_count}")

simulate_file_processing()
