# 文字列

文字列はリストの特別な形式と考えることもできる。リストが持つメソッドのほとんどは文字列でも使える。

一方、文字列固有のメソッドも多数ある。

## 文字列に対してよく使われるメソッド、演算子

- 検索系
  - find()
  - startswith() / endswith() / in
  - replace()
  - count()


- 変換系
  - upper() / lower()
  - strip() / lstrip() / rstrip()
  - split() / join()


- その他
  - fomat()


In [1]:
# 検索
str1 = 'Hello world'
# 最初に見つかったインデクスを返す
print(str1.find('el'))

1


In [2]:
# 第2引数を指定すると検索開始位置を変えられる。
print(str1.find('o', 5))   # 2番目の 'o' を探す

7


In [3]:
# 最初、最後の文字列
str1 = 'Hello world'

print(str1.startswith('He'))
print(str1.endswith('d'))

# どこかに入っていればよい
print('world' in str1)

True
True
True


In [4]:
# 置換
str1 = 'Hello world'
str2 = str1.replace('Hello', 'Thank you')

print(str2)
print(str1) # str1 は変わらない

Thank you world
Hello world


In [5]:
# 見つかった個数を返す
str1 = 'Hello world'

print(str1.count('o'))

2


In [6]:
# 大文字、小文字変換
str1 = 'hello'
print(str1.upper())

str2 = 'WORLD'
print(str1.lower())

HELLO
hello


In [7]:
# 空白文字(改行、全角スペース、タブなど）を取り除く
#  (引数を指定すれば、その文字列を取り除く)
str1 = '\tHello world\n'
str2 = str1.strip()
str3 = str1.lstrip()
str4 = str1.rstrip()

for s in [str1, str2, str3, str4]:
    print('--' + s + '--')
    print('**********************')
print('==' + str1 + '==') # str1 は変わらない

--	Hello world
--
**********************
--Hello world--
**********************
--Hello world
--
**********************
--	Hello world--
**********************
==	Hello world
==


In [8]:
# 文字列 <=> リスト
str1 = 'I have a pen'
list1 = str1.split()  # 引数を指定すれば、その文字列で分割
print(list1)

['I', 'have', 'a', 'pen']


In [9]:
# str1 = ['睦月', '如月', '弥生']
str1 = '睦月 如月 弥生'
list1 = str1.split()
print(list1)

['睦月', '如月', '弥生']


In [10]:
str2 = '_'.join(list1)
print(str2)

睦月_如月_弥生


In [11]:
# format
name = 'Taro'
age = 18

print('{} is {} years old'.format(name, age))
# {n} で引数の順序指定可
print('{1} is {0} years old'.format(age, name))
# 複雑な書式設定も可
print('{1:10s} is {0:04} years old'.format(age, name))
# Python ver 3.6 以降
print(f'{name:10s} is {age:04} years old')

Taro is 18 years old
Taro is 18 years old
Taro       is 0018 years old
Taro       is 0018 years old


## 不変値としての文字列

文字列とリストの違いは、文字列が不変値(immutable)であること。

In [12]:
# リストも文字列も、[]で要素を参照できる。

list1 = ['h', 'e', 'l', 'l', 'o']
str1 = 'hello'

print(list1[-1])
print(str1[-1])

o
o


In [13]:
# リストは要素を直接更新できる。
list1[0] = 'H'
print(list1)

['H', 'e', 'l', 'l', 'o']


 同じことを文字列で行うと、エラー



```python
str1[0] = 'H'
print(str1)
```

In [14]:
# リストへの要素追加
print(id(list1))    # id()はオブジェクトのID(アドレスのようなもの)を返す
list1.append('a')
print(list1)
print(id(list1))    # 追加前とIDは変わらない

140542801970752
['H', 'e', 'l', 'l', 'o', 'a']
140542801970752


In [15]:
# 文字列への追加
print(id(str1))
# str1.append('a')   # Error: 文字列クラスに append()メソッドは無い。
str1 = str1 + 'a'
print(str1)
print(id(str1))      # IDは変わる。(何回も追加すると、変わらなくなることもある)

140542801988592
helloa
140542802042608


In [16]:
# 補足：リスト同士も加算は可能
list1 = list1 + ['bb']
print(list1)

['H', 'e', 'l', 'l', 'o', 'a', 'bb']


## is 演算子

In [17]:
a = [1, 2, 3]
b = a
c = a[:]   # c = a.copy() でもよい

b[0] = 4
print('b=', b)
print('a=', a)
c[0] = 4
print('c=', c)
print('a=', a)

if a is b:
    print('a == b')

if a is c:
    print('a == c')
    
if b is c:
    print('b == c')

print('id(a)=', id(a))
print('id(b)=', id(b))
print('id(c)=', id(c))
    

b= [4, 2, 3]
a= [4, 2, 3]
c= [4, 2, 3]
a= [4, 2, 3]
a == b
id(a)= 140542801983744
id(b)= 140542801983744
id(c)= 140542801965952


In [18]:
a is None
a is not None
a is True
a is not False


True