# 文字列

## 長さ

In [1]:
"リプサム".length

4

---
## 文字列の結合

In [2]:
"L" + "ipsum";
"L".concat("ipsum"); // 同じ

'Lipsum'

---
## 文字列の比較

In [3]:
"Lorem" == "Ipsum"

false

In [4]:
"Lorem" != "Ipsum"

true

In [5]:
"Lorem" < "Ipsum" // 辞書順で "Lorem" < "Ipsum"

false

In [6]:
"Lorem" <= "Ipsum" // 辞書順で "Lorem" ≤ "Ipsum"

false

In [7]:
"Lorem" > "Ipsum" // 辞書順で "Lorem" > "Ipsum"

true

In [8]:
"Lorem" >= "Ipsum" // 辞書順で "Lorem" ≥ "Ipsum"

true

---
## 文字列の繰り返し

In [9]:
"Lorem".repeat(3)

'LoremLoremLorem'

---
## 部分文字列

In [10]:
"LOREM IPSUM dolor sit amet"[2];
"LOREM IPSUM dolor sit amet".charAt(2); // 同じ

'R'

In [11]:
"LOREM IPSUM dolor sit amet".substring(2,5); // 2≦x<5 を取り出し
"LOREM IPSUM dolor sit amet".slice(2,5); // 同じ

'REM'

---
## 検索

### 文字列の検索

In [12]:
"LOREM IPSUM dolor sit amet".includes("dolor")

true

In [13]:
"LOREM IPSUM dolor sit amet".startsWith("L")

true

In [14]:
"LOREM IPSUM dolor sit amet".endsWith("t")

true

In [15]:
"LOREM IPSUM dolor sit amet".indexOf("M") // "M"が初めて現れる位置

4

In [16]:
"LOREM IPSUM dolor sit amet".lastIndexOf("M") // "M"が最後に現れる位置

10

### 正規表現での検索

In [17]:
"LOREM IPSUM dolor sit amet".search(/[a-z]*([a-z]m)/gi); // マッチの確認
/[a-z]*([a-z]m)/i.test("LOREM IPSUM dolor sit amet"); // 同じ

true

In [18]:
"LOREM IPSUM dolor sit amet".match(/[a-z]*([a-z]m)/i)

[
  'LOREM',
  'EM',
  index: 0,
  input: 'LOREM IPSUM dolor sit amet',
  groups: undefined
]

In [19]:
"LOREM IPSUM dolor sit amet".match(/[a-z]*([a-z]m)/gi)

[ 'LOREM', 'IPSUM', 'am' ]

`match` は正規表現中に`g`フラグが含まれているかどうかで返す値の形式が異なる

* `g`フラグがない場合の例  
	1つの検索結果に対してグループをまとめて取り出す。
```JavaScript
'<b title="bold"><i title="italic"><u title="underline"><s title="strike">'.match(/<([a-z]) title="([a-z]+)">/)
→ ["b","bold"]
```


* `g`フラグがある場合の例  
	全ての検索結果をグループを含まずに取り出す。
```JavaScript
'<b title="bold"><i title="italic"><u title="underline"><s title="strike">'.scan(/<([a-z]) title="([a-z]+)">/)
→ ['<b title="bold">','<i title="italic">','<u title="underline">','<s title="strike">']
```

In [20]:
let itr="LOREM IPSUM dolor sit amet".matchAll(/[a-z]*([a-z]m)/gi);
Array.from(itr)

[
  [
    'LOREM',
    'EM',
    index: 0,
    input: 'LOREM IPSUM dolor sit amet',
    groups: undefined
  ],
  [
    'IPSUM',
    'UM',
    index: 6,
    input: 'LOREM IPSUM dolor sit amet',
    groups: undefined
  ],
  [
    'am',
    'am',
    index: 22,
    input: 'LOREM IPSUM dolor sit amet',
    groups: undefined
  ]
]

`matchAll` は `match` とは違い、`g`フラグとグループを含む正規表現に対しても適切に機能する  
イテレータオブジェクトを返すので、`for (result of itr) ;` としたり、 `Array.from(itr)` で2次元配列として受け取ることも可能である。

---
## 置換

### 正規表現を使わない置換

In [21]:
"LOREM IPSUM dolor sit amet".replace("M","ℳ")

'LOREℳ IPSUM dolor sit amet'

### 正規表現を使う置換

In [22]:
"LOREM IPSUM dolor sit amet".replace(/(\w)(m)/i,"$2$1") // swapping

'LORME IPSUM dolor sit amet'

In [23]:
"LOREM IPSUM dolor sit amet".replace(/(\w)(m)/gi,"$2$1") // swapping

'LORME IPSMU dolor sit maet'

---
## 分割と結合

### 正規表現を使わない分割

In [24]:
"LOREM IPSUM dolor sit amet".split(" ")

[ 'LOREM', 'IPSUM', 'dolor', 'sit', 'amet' ]

### 正規表現を使う分割

In [25]:
"LOREM IPSUM dolor sit amet".split(/\ [\w\ ]+\ /i)

[ 'LOREM', 'amet' ]

### 結合

In [26]:
["L","I","D","S","A"].join("_")

'L_I_D_S_A'

---
## 大文字/小文字の切替

In [27]:
"LOREM IPSUM dolor sit amet".toUpperCase()

'LOREM IPSUM DOLOR SIT AMET'

In [28]:
"LOREM IPSUM dolor sit amet".toLowerCase()

'lorem ipsum dolor sit amet'

---
## 前後の空白の除去

In [29]:
"   redundant   ".trim()

'redundant'

In [30]:
"   redundant   ".trimStart()

'redundant   '

In [31]:
"   redundant   ".trimEnd()

'   redundant'

---
## 文字列を揃える

In [32]:
"align".padStart(11,"-") // -で埋める左端揃え

'------align'

In [33]:
"align".padEnd(11,"-") // -で埋める右端揃え

'align------'

---
## 文字列 ⇄ コードポイント列

In [34]:
String.fromCharCode(76,79,82,69,77);
String.fromCodePoint(76,79,82,69,77); // 同じ

'LOREM'

* `String.fromCharCode` は `0xFFFF` 以上の文字には対応しておらず,そのような値は切り捨てられる。
* `String.fromCodePoint` は `0xFFFF` 以上にも対応している

In [35]:
"LOREM".charCodeAt(1);
"LOREM".codePointAt(1) // 同じ

79

* どちらも1文字のUnicodeコードポイントを得ることしかできない (文字配列に変換して `map` を使って変換するという手がある)
* `charCodeAt` は `0xFFFF` までしか対応していないおらず,それ以上は擬似文字に分割される。
* `codePointAt` は `0xFFFF` 以上の文字にも対応している