# 文字列

## 長さ

In [1]:
"リプサム".length
"リプサム".size # 同じ

4

In [2]:
"リプサム".bytesize

12

In [3]:
"リプサム".empty?

false

In [4]:
"".empty?

true

---
## 文字列の結合

In [5]:
"L" + "ipsum"

"Lipsum"

In [6]:
s="L"
s << "ipsum" # s.concat("ipsum")
s

"Lipsum"

---
## 文字列の比較

In [7]:
"Lorem" == "Ipsum"
"Lorem".eql?("Ipsum") # 同じ (但し,こちらは "Ipsum" の部分は必ず文字列でなければならない)
# 大文字•小文字の違いを無視するなら "Lorem".casecmp?("Ipsum")

false

In [8]:
"Lorem" != "Ipsum"

true

In [9]:
"Lorem" < "Ipsum" # 辞書順で "Lorem" < "Ipsum"

false

In [10]:
"Lorem" <= "Ipsum" # 辞書順で "Lorem" ≤ "Ipsum"

false

In [11]:
"Lorem" > "Ipsum" # 辞書順で "Lorem" > "Ipsum"

true

In [12]:
"Lorem" >= "Ipsum" # 辞書順で "Lorem" ≥ "Ipsum"

true

In [13]:
"Lorem" <=> "Ipsum" # 辞書順で "Lorem" <=> "Ipsum" を演算
# 大文字•小文字の違いを無視するなら "Lorem".casecmp("Ipsum")

1

---
## 文字列の繰り返し

In [14]:
"Lorem" * 3

"LoremLoremLorem"

---
## 部分文字列

In [15]:
"LOREM IPSUM dolor sit amet"[2]
"LOREM IPSUM dolor sit amet".slice(2) # 同じ

"R"

In [16]:
"LOREM IPSUM dolor sit amet"[2...5] # 2≦x<5 を取り出し
"LOREM IPSUM dolor sit amet".slice(2...5) # 同じ

"REM"

In [17]:
"LOREM IPSUM dolor sit amet"[2,3] # 2文字目から3文字取り出し
"LOREM IPSUM dolor sit amet".slice(2,3) # 同じ

"REM"

---
## 検索

### 文字列の検索

In [18]:
"LOREM IPSUM dolor sit amet".include?("dolor")

true

In [19]:
"LOREM IPSUM dolor sit amet".index("M") # "M"が初めて現れる位置

4

In [20]:
"LOREM IPSUM dolor sit amet".rindex("M") # "M"が最後に現れる位置

10

In [21]:
"LOREM IPSUM dolor sit amet".start_with?("Lorem")

false

In [22]:
"LOREM IPSUM dolor sit amet".end_with?("amet")

true

In [23]:
"LOREM IPSUM dolor sit amet".count("M")

2

### 正規表現での検索

In [24]:
"LOREM IPSUM dolor sit amet".match?(/[a-z]*([a-z]m)/i) # マッチの確認

true

In [25]:
"LOREM IPSUM dolor sit amet" =~ /[a-z]*([a-z]m)/i # マッチの確認
# マッチしていたら何かが返ってくる

0

In [26]:
"LOREM IPSUM dolor sit amet" !~ /[a-z]*([a-z]m)/i # マッチの確認 (否定)

false

In [27]:
"LOREM IPSUM dolor sit amet".scan(/[a-z]*([a-z]m)/i)

[["EM"], ["UM"], ["am"]]

`scan` は正規表現中にグループが含まれているかどうかで返す値の形式が異なる

* グループがない場合の例
```Ruby
"<b></b><i></i><u></u><s></s>".scan(/<[a-z]>/)
→ ["<b>","<i>","<u>","<s>"]
```


* グループがある場合の例  
	グループが含まれている場合,全体を得ることができない。全体も必要であれば,全体も括弧で括っておく。
```Ruby
'<b title="bold"><i title="italic"><u title="underline"><s title="strike">'.scan(/<([a-z]) title="([a-z]+)">/)
→ [["b","bold"],["i","italic"],["u","underline"],["s","strike"]]
```

In [28]:
"LOREM IPSUM dolor sit amet".slice(/[a-z]*([a-z]m)/i,1) # 1 … グループの指定

"EM"

In [29]:
"LOREM IPSUM dolor sit amet".index(/[a-z]*([a-z]m)/i) # 初めてマッチする位置

0

In [30]:
"LOREM IPSUM dolor sit amet".rindex(/[a-z]*([a-z]m)/i) # 最後にマッチする位置

22

---
## 置換

### 正規表現を使わない置換

In [31]:
"LOREM IPSUM dolor sit amet".sub("M","ℳ")

"LOREℳ IPSUM dolor sit amet"

In [32]:
"LOREM IPSUM dolor sit amet".gsub("M","ℳ")
"LOREM IPSUM dolor sit amet".tr("M","ℳ") # 同じ

"LOREℳ IPSUℳ dolor sit amet"

### 正規表現を使う置換

In [33]:
"LOREM IPSUM dolor sit amet".sub(/(\w)(m)/i,'\2\1') # swapping

"LORME IPSUM dolor sit amet"

In [34]:
"LOREM IPSUM dolor sit amet".gsub(/(\w)(m)/i,'\2\1') # swapping
# 文字列の場合と違って tr は使えない

"LORME IPSMU dolor sit maet"

---
## 分割と結合

### 正規表現を使わない分割

In [35]:
"LOREM IPSUM dolor sit amet".partition(" ")

["LOREM", " ", "IPSUM dolor sit amet"]

In [36]:
"LOREM IPSUM dolor sit amet".rpartition(" ")

["LOREM IPSUM dolor sit", " ", "amet"]

In [37]:
"LOREM IPSUM dolor sit amet".split(" ")

["LOREM", "IPSUM", "dolor", "sit", "amet"]

### 正規表現を使う分割

In [38]:
"LOREM IPSUM dolor sit amet".split(/\ [\w\ ]+\ /i)

["LOREM", "amet"]

### 結合

In [39]:
["L","I","D","S","A"] * "_"
["L","I","D","S","A"].join("_") # 同じ

"L_I_D_S_A"

---
## 文字列の反転

In [40]:
"LOREM IPSUM dolor sit amet".reverse

"tema tis rolod MUSPI MEROL"

---
## フォーマット

In [41]:
sprintf("LOREM %s dolor sit amet","IPSUM")

"LOREM IPSUM dolor sit amet"

In [42]:
"LOREM %s dolor sit amet" % "IPSUM"

"LOREM IPSUM dolor sit amet"

詳しくは Format の項で

---
## 大文字/小文字の切替

In [43]:
"LOREM IPSUM dolor sit amet".upcase()

"LOREM IPSUM DOLOR SIT AMET"

In [44]:
"LOREM IPSUM dolor sit amet".downcase()

"lorem ipsum dolor sit amet"

In [45]:
"LOREM IPSUM dolor sit amet".capitalize()

"Lorem ipsum dolor sit amet"

In [46]:
"LOREM IPSUM dolor sit amet".swapcase()

"lorem ipsum DOLOR SIT AMET"

---
## 前後の空白の除去

In [47]:
"   redundant   ".strip()

"redundant"

In [48]:
"   redundant   ".lstrip()

"redundant   "

In [49]:
"   redundant   ".rstrip()

"   redundant"

---
## 文字列の挿入

In [50]:
s="ええ すごいわ ええ"
s.insert(7,"ね")
s

"ええ すごいわね ええ"

In [51]:
s="IPSUM dolor sit amet"
s.prepend("LOREM ")
s

"LOREM IPSUM dolor sit amet"

---
## 文字列の削除

In [52]:
"ええ すごいわ ええ".delete(" え") # 指定した文字を全て取り除く

"すごいわ"

In [53]:
"ええ すごいわ ええ".delete_prefix("ええ ") # 左端の指定した文字列を取り除く

"すごいわ ええ"

In [54]:
"ええ すごいわ ええ".delete_suffix(" ええ") # 右端の指定した文字列を取り除く

"ええ すごいわ"

In [55]:
"ええ すごいわ ええ".chop() # 末尾の1文字を取り除く
# 本来は末尾の改行文字などを取り除くのに使われることが多い

"ええ すごいわ え"

---
## 文字列を揃える

In [56]:
"align".ljust(11,"-") # -で埋める左端揃え

"align------"

In [57]:
"align".rjust(11,"-") # -で埋める右端揃え

"------align"

In [58]:
"align".center(11,"-") # -で埋める中央揃え

"---align---"

---
## 連続する文字を短縮

In [59]:
"breeze".squeeze("e")

"breze"

---
## エスケープ文字を表示

In [60]:
"a	b	c".dump()

"\"a\\tb\\tc\""

---
## 文字列 ⇄ 文字配列

In [61]:
"LOREM".chars

["L", "O", "R", "E", "M"]

In [62]:
"LOREM".codepoints
"LOREM".unpack("U*") # 同じ

[76, 79, 82, 69, 77]

In [63]:
[76,79,82,69,77].pack("U*")

"LOREM"

---
## 文字 ⇄ コードポイント

In [64]:
82.chr

"R"

In [65]:
"R".ord

82

---
## ハッシュ値

In [66]:
"LOREM".hash

0

---
## 正規表現について

### Ruby 特有の正規表現

* Ruby では正規表現中の `^` や `$` は文字列の先頭や末尾ではなく,文字列中の改行文字で区切られた行頭や行末にマッチする。  
	→ 文字列の先頭にマッチさせるには `^` の代わりに `\A` を使用する。  
	→ 文字列の末尾にマッチさせるには `$` の代わりに `\z` を使用する。


* 変数展開できる
	```Ruby
	x="m"
	/#{x}/i
	```


* パターンを記号で囲んで, `%r` を前に付加するなら,囲む文字は `/` に限らず様々な記号が使える。  
	→ スラッシュをエスケープする必要がなくなる。
	```Ruby
	%r{pattern with /slash}i
	```

### im以外のフラグ
- `x`: 正規表現中の空白/改行を無視
- `u`: Unicode
- `o`: 式展開を1回限りにする