# 基本編1: 文字列処理

## 11. 文字列を含む文字の抽出
この[テキストファイル(wws2025cfp.txt)](https://ds4se100.github.io/basic/1.string-manipulation/data/wws2025cfp.txt)について，任意の文字列を指定し、その文字列が含まれる行を出力するプログラムを作りなさい．

In [1]:
# !wget https://ds4se100.github.io/basic/1.string-manipulation/data/wws2025cfp.txt

`ex11.py`:

```py
import argparse
import colorama
from colorama import Fore, Style

colorama.init(autoreset=True)

def parse_args():
    parser = argparse.ArgumentParser(description="Search for lines containing a target string in a file.")
    parser.add_argument("--file", type=str, help="Path to the input file.")
    parser.add_argument("--tgt", type=str, help="Target string to search for in the file.")
    return parser.parse_args()
    
def grep(file, tgt):
    flag = False
    with open(file, 'r', encoding='utf-8') as f:
        for i, line in enumerate(f, start=1):
            if tgt in line:
                flag = True
                highlighted = line.replace(tgt, f"{Fore.RED}{tgt}{Style.RESET_ALL}")
                print(f"Line {i}: {highlighted}", end='')
                
    if not flag:
        raise ValueError(f"Error: '{tgt}' was not found in '{file}'.")

def main():
    args = parse_args()
    grep(args.file, args.tgt)
    
if __name__ == "__main__":
    main()
```

In [2]:
# !pip install colorama

In [3]:
!python3 ex11.py --file wws2025cfp.txt --tgt ソフトウェア工学

Line 4: [31mソフトウェア工学[0m分野でもこれらを活用した研究や取り組みは多く，多岐に渡る．
[0m[0mLine 7: 本セッションでは[31mソフトウェア工学[0m分野におけるデータの分析や活用に関する基礎技術を学ぶための教材として
[0m[0mLine 8: 「[31mソフトウェア工学[0mのためのデータサイエンス 100 本ノック（仮称）」 を構築する共同作業の場を提供したい．
[0m[0m[0m

## 12. 文字の変換・置換
この[テキストファイル(wws2025cfp.txt)](https://ds4se100.github.io/basic/1.string-manipulation/data/wws2025cfp.txt)について，変更前の文字列と変更後の文字列を指定し、置換した結果を表示するプログラムを作りなさい．

`ex12.py`:

```py
import argparse
import colorama
from colorama import Fore, Style

colorama.init(autoreset=True)

def parse_args():
    parser = argparse.ArgumentParser(description="Search for lines containing a target string and replace it with another string.")
    parser.add_argument("--file", type=str, help="Path to the input file.")
    parser.add_argument("--before", type=str, help="String to be replaced.")
    parser.add_argument("--after", type=str, help="String to replace with.")
    return parser.parse_args()

def diff(file, before, after):
    flag = False
    with open(file, 'r', encoding='utf-8') as f:
        for i, line in enumerate(f, start=1):
            print(line, end='')
            if before in line:
                flag = True
                before_hl = line.replace(before, f"{Fore.RED}{before}{Style.RESET_ALL}")
                after_hl = line.replace(before, f"{Fore.GREEN}{after}{Style.RESET_ALL}")
                print(f"{Fore.RED}-{Style.RESET_ALL} {before_hl}", end='')
                print(f"{Fore.GREEN}+{Style.RESET_ALL} {after_hl}", end='')
                
    if not flag:
        raise ValueError(f"Error: '{before}' was not found in '{file}'.")
    else:
        print()

def main():
    args = parse_args()
    diff(args.file, args.before, args.after)

if __name__ == "__main__":
    main()
```

In [4]:
!python3 ex12.py --file wws2025cfp.txt --before ソフトウェア工学 --after 自然言語処理

近年，産業界・学界を問わず「データサイエンス」が注目を集めている．
[0m[0mもともとは統計分析とデータマイニングを基盤として発展した分野であるが，
[0m[0m最近では機械学習や AI 技術も活用したより高度なものになってきている．
[0m[0mソフトウェア工学分野でもこれらを活用した研究や取り組みは多く，多岐に渡る．
[0m[0m[31m-[0m [31mソフトウェア工学[0m分野でもこれらを活用した研究や取り組みは多く，多岐に渡る．
[0m[0m[32m+[0m [32m自然言語処理[0m分野でもこれらを活用した研究や取り組みは多く，多岐に渡る．
[0m[0mこれに関連して，研究者や技術者が学ぶべき内容も多様化してきており， 適切な教材に対するニーズは高まっている．
[0m[0m
[0m[0m本セッションではソフトウェア工学分野におけるデータの分析や活用に関する基礎技術を学ぶための教材として
[0m[0m[31m-[0m 本セッションでは[31mソフトウェア工学[0m分野におけるデータの分析や活用に関する基礎技術を学ぶための教材として
[0m[0m[32m+[0m 本セッションでは[32m自然言語処理[0m分野におけるデータの分析や活用に関する基礎技術を学ぶための教材として
[0m[0m「ソフトウェア工学のためのデータサイエンス 100 本ノック（仮称）」 を構築する共同作業の場を提供したい．
[0m[0m[31m-[0m 「[31mソフトウェア工学[0mのためのデータサイエンス 100 本ノック（仮称）」 を構築する共同作業の場を提供したい．
[0m[0m[32m+[0m 「[32m自然言語処理[0mのためのデータサイエンス 100 本ノック（仮称）」 を構築する共同作業の場を提供したい．
[0m[0m
[0m[0m教材の主なテーマとしては，バグ予測，品質評価・改善，見積り，リポジトリマイニング，
[0m[0mその他データサイエンス・AIのソフトウェア開発・保守への応用などを想定しているがこれらに限定されるものではない．
[0m[0mワークショップでは教材の提案や共同開発，並びに内容のレビューに協力 いただけ