# Chapter 04-03
## 文字列型を活用する

### 文字列の置換と削除

In [None]:
orig_str = "いっぱい"          # 置換前の文字列を定義
orig_str.replace("い", "お")  # 文字列の「い」を「お」に置換、結果を表示

In [None]:
# ちなみに，replace()メソッドは置換数を指定できる
orig_str.replace("い", "お", 1)

In [None]:
# カンマ付き文字列の削除と数値への変換
str_num = "1,000,000"                # カンマの入った整数相当の文字列
num = int(str_num.replace(",", ""))  # カンマを取り除きint()で数値にする
num

In [None]:
# オマケ 文字 -> モールス信号への変換

m_sos = "SOS"                # 文字列を定義
# 文字列をモールス信号に置き換える
m_sos = m_sos.replace("S", "...")
m_sos = m_sos.replace("O", "---")
m_sos

### split(),join()メソッド

In [None]:
# splitメソッドの使用例
%matplotlib inline
import matplotlib.pyplot as plt

str_speeds = "38 42 20 40 39"       # 戦車のスピード(km/h)
str_armor = "80 50 17 50 51"        # 戦車の装甲厚(mm)
speeds = str_speeds.split(" ")      # 速度をスペースで分割
armors = str_armor.split(" ")       # 装甲厚をスペースで分割
markers = ["o", "v", "^", "<", ">"]

for idx in range(len(speeds)):      # リストの長さ分ループ
    x = int(speeds[idx])            # 文字列を数値に変換
    y = int(armors[idx])
    # 散布図を描く
    plt.scatter(x, y, marker=markers[idx])    


    #IV号戦車(o) LT-38(v) 八九式中戦車(^) III号突撃砲(<) M3中戦車(>)

In [None]:
# split()した文字列をjoin()で連結
str_speeds = "38 42 20 40 39"  # 空白で区切られた数値
speeds = str_speeds.split()    # 空白で分割
csep_speeds = ",".join(speeds) # コンマで連結
print(csep_speeds)             # 結果を表示

In [None]:
# replace()メソッドを使うと，余分な空白も置換される
str_speeds2 = " 38  42 20 40 39 "    # 余分な空白が入った文字列
print(str_speeds2.replace(" ", ",")) # replace()を使った結果を表示

In [None]:
# split()とjoin()を組み合わせれば，余分な空白が除去される
str_speeds2 = " 38  42 20 40 39 "    # 余分な空白が入った文字列
speeds2 = str_speeds2.split()
csep_speeds2 = ",".join(speeds2)     # split(), join()を使って置換
print(csep_speeds2)                  # 結果を表示

### エスケープシーケンス

In [None]:
def func():                     # 関数の定義
    # 改行を含む文字列を変数にするとインデントがずれる
    words = """ゆく河の流れは絶えずして
しかももとの水にあらず"""
    print(words)

func()

In [None]:
# エスケープシーケンスを使って改行文字を入れるとすっきりする
def func():
    words = "ゆく河の流れは絶えずして\nしかももとの水にあらず"
    print(words)

func()

In [None]:
# なお，インデントを崩さずに長い文字列を定義するには
# 以下のような方法もあります
#
# ※ただし，改行のエスケープシーケンスは明示する必要があることに注意

def func():
    words = ("ゆく河の流れは絶えずして\n"
             "しかももとの水にあらず")
    print(words)

func()

### raw文字列

In [None]:
# raw文字列を使うとエスケープシーケンスも文字列として扱われる
# Windowsのファイルへのパスを扱うときなどに便利
raw = r"C:\path\to\file"
raw

In [None]:
# raw文字列でない場合と結果を比較
non_raw = "C:\path\to\file"
non_raw

### 文字列メソッドを活用する

In [None]:
# endswith(), startswith()メソッド
# 文字列の末尾，または先頭に特定の文字列があるかどうかを調べるために使います
# メソッド名に「三単現のS」がついていることに注意
# スライスやインデクシングを駆使して同様の処理が可能ですが
# メソッドを使った方が簡単です

fn = "funny_picture.jpg"
if fn.endswith(".jpg"):
    print("JPEG画像のようです")

# c.f.
# if fn[-4:] == ".jpg":
#     print("JPEG画像のようです")

In [None]:
# strip()メソッド
# 主に文字列の前後にある空白を除去するために使います

orig_str = " HAM SPAM "
stripped_str = orig_str.strip()
stripped_str

In [None]:
# upper(), lower()メソッドを組み合わせると，英字の大/小文字を無視して
# 文字列の比較ができます

upper_str = "I like SPAM and egg."
if "spam" in upper_str.lower():
    print("本当にSPAMが好きなんですね")

## 文字列のフォーマット

In [None]:
# 要素の埋め込み
"{} loves Python !".format('Guido')

In [None]:
# 複数要素の埋め込み
linkstr = '<a href="{}">{}</a>'
for i in ['http://python.org',
          'http://pypy.org',
          'http://http://cython.org/']:
    print(linkstr.format(i, i.replace('http://', '')))

In [None]:
# 引数の順番を指定
"{0} {1} {0}".format('Spam', 'Ham')

In [None]:
# キーで位置を指定
"{food1} {food2} {food1}".format(food1="Spam",
                                 food2="Ham")

In [None]:
# ディクショナリによる置換
d = {'name': 'Guido', 'birthyear': 1964}
"{0[birthyear]} is {0[name]}'s birthyear".format(d)

In [None]:
# アトリビュートを指定して置換
import sys
# sys.versionを表示
"Python version: {0.version}".format(sys)

### 埋め込む文字列のフォーマットを指定する

In [None]:
# 寄せを指定して差し込む
# 1つ目の要素を左寄せ，2つ目の要素を右寄せで置換
tmpl = "{0:10} {1:>8}"
tmpl.format('Spam', 300)

In [None]:
tmpl.format('Ham', 200)

In [None]:
# 表記を指定した差し込み
# 小数点以下2桁ま
"{:.2%}".format(6260/12776)

In [None]:
"{:,}".format(10000)

In [None]:
# Python 3.6移行では，f文字列という機能が追加されます
# name = "君"                 # 置換する要素を変数で定義
# f"まずは{name}が落ち着け"      # {name}の部分が変数の内容に置き換わる

# 'まずは君がおちつけ'