# 文字列

Javaの文字列には書き換えできない `String` クラスと,可変な `StringBuffer`, `StringBuilder` クラスがある。  
それぞれについて記す  
尚, `String` は `"Lorem"` のような文字列リテラルで生成できるし, `new String` でも生成できるが, `StringBuffer`, `StringBuilder` は `new StringBuffer`, `new StringBuilder` で生成するしかない  
`StringBuffer` と `StringBuilder` の違いは,前者がスレッドセーフなのに対し,後者はスレッドセーフではない点。しかし,後者の方が処理は高速である。

## 長さ

In [1]:
"リプサム".length() // StringBuilder も同じ

4

In [2]:
"リプサム".isEmpty() // = .length()==0

false

In [3]:
"リプサム".isBlank() // 空白のみの場合も true

false

In [4]:
new StringBuffer("リプサム").capacity()

20

---
## 文字列の結合

In [5]:
"L" + "ipsum"; // .toString() が定義されているオブジェクトであれば何でも結合可能
"L".concat("ipsum"); // String同士の結合に限る

Lipsum

In [6]:
StringBuffer sb=new StringBuffer("L"); // StringBuilder も同じ
sb.append("ipsum");
sb;

Lipsum

---
## 文字列の比較

In [7]:
"Lorem".equals("Ipsum")
// 大文字•小文字の違いを無視するなら "Lorem".equalsIgnoreCase("Ipsum")

false

等価性を判定するにあたって
```Java
"Lorem" == "Ipsum"
```
は使うべきではない。  
`==` はオブジェクトの等価性を判定するものであるから,内容の同一性については保証されない。  
例えば,
```Java
"Lorem" == "Lorem"
```
は `true` になる。なぜなら,文字列リテラルの内容が同じだとみなせば,Java側が過去に生成された `String` を引っ張り出してくるからである。しかし, `new String` でコピーが発生する次の場合は `false` になってしまう。
```Java
"Lorem" == new String("Lorem")
```

In [8]:
"Lorem".compareTo("Ipsum") // 辞書順で "Lorem", "Ipsum" を比較
// 大文字•小文字の違いを無視するなら "Lorem".compareToIgnoreCase("Ipsum")

3

---
## 文字列の繰り返し

In [9]:
"Lorem".repeat(3)

LoremLoremLorem

---
## 部分文字列

In [10]:
"LOREM IPSUM dolor sit amet".charAt(2)
// StringBuffer でも同じ

R

In [11]:
StringBuffer sb=new StringBuffer("LOREM IPSUM dolor sit amet"); // StringBuilder も同じ
sb.setCharAt(4,'ℳ');
sb;

LOREℳ IPSUM dolor sit amet

In [12]:
"LOREM IPSUM dolor sit amet".substring(2,5); // 2≦x<5 を取り出し
"LOREM IPSUM dolor sit amet".subSequence(2,5); // 同じ
// StringBuffer でも同じ (新しいStringを返す)

REM

In [13]:
"LOREM IPSUM dolor sit amet".substring(6) // 6≦x を取り出し
// StringBuffer でも同じ (新しいStringを返す)

IPSUM dolor sit amet

---
## 検索

### 文字列の検索

In [14]:
"LOREM IPSUM dolor sit amet".contains("dolor")

true

In [15]:
"LOREM IPSUM dolor sit amet".indexOf("M") // "M"が初めて現れる位置
// StringBuffer でも同じ

4

In [16]:
"LOREM IPSUM dolor sit amet".lastIndexOf("M") // "M"が最後に現れる位置
// StringBuffer でも同じ

10

### 正規表現での検索

In [17]:
"LOREM IPSUM dolor sit amet".matches("(?i).*[a-z]*([a-z]m).*"); // マッチの確認

import java.util.regex.*;
Pattern.matches("(?i).*[a-z]*([a-z]m).*","LOREM IPSUM dolor sit amet"); // 同じ
Pattern.compile("(?i)[a-z]*([a-z]m).*").matcher("LOREM IPSUM dolor sit amet").matches(); // 同じ

true

* `matches` は完全一致であることに注意  
	前後に `.*` を付加して部分一致にする
* 同じ正規表現を複数回使うのであれば, `Pattern.compile` で生成した `Pattern` オブジェクトを使い回す方が効率的で高速である。

In [18]:
import java.util.regex.*;
Pattern.matches("(?i).*[a-z]*([a-z]m).*","LOREM IPSUM dolor sit amet")

true

In [19]:
Matcher m=Pattern.compile("(?i)[a-z]*([a-z]m)").matcher("LOREM IPSUM dolor sit amet");
m.find(0); // 使い勝手が悪いので注意
System.out.println(m.group(0));
System.out.println(m.group(1));

LOREM
EM


In [20]:
"LOREM IPSUM dolor sit amet".startsWith("Lorem")

false

In [21]:
"LOREM IPSUM dolor sit amet".endsWith("amet")

true

---
## 置換

### 正規表現を使わない置換

In [22]:
"LOREM IPSUM dolor sit amet".replace("M","ℳ")

LOREℳ IPSUℳ dolor sit amet

In [23]:
StringBuffer sb=new StringBuffer("LOREM IPSUM dolor sit amet");
sb.replace(12,17,"$");
sb;

LOREM IPSUM $ sit amet

### 正規表現を使う置換

In [24]:
"LOREM IPSUM dolor sit amet".replaceFirst("(?i)(\\w)(m)","$2$1") // swapping

LORME IPSUM dolor sit amet

In [25]:
"LOREM IPSUM dolor sit amet".replaceAll("(?i)(\\w)(m)","$2$1") // swapping

LORME IPSMU dolor sit maet

---
## 分割と結合

### 正規表現を使う分割

In [26]:
String[] list="LOREM IPSUM dolor sit amet".split("(?i) [\\w ]+ ");
"[\""+String.join("\",\"",list)+"\"]";

["LOREM","amet"]

### 結合

In [27]:
String.join("_",Arrays.asList("L","I","D","S","A"))

L_I_D_S_A

---
## 文字列の反転

In [28]:
StringBuffer sb=new StringBuffer("LOREM IPSUM dolor sit amet");
sb.reverse();
sb;

tema tis rolod MUSPI MEROL

---
## フォーマット

In [29]:
String.format("LOREM %s dolor sit amet","IPSUM")

LOREM IPSUM dolor sit amet

詳しくは Format の項で

---
## 大文字/小文字の切替

In [30]:
"LOREM IPSUM dolor sit amet".toUpperCase()

LOREM IPSUM DOLOR SIT AMET

In [31]:
"LOREM IPSUM dolor sit amet".toLowerCase()

lorem ipsum dolor sit amet

---
## 前後の空白の除去

In [32]:
"   redundant   ".strip();
"   redundant   ".trim(); // ほぼ同じ

redundant

In [33]:
"   redundant   ".stripLeading()

redundant   

In [34]:
"   redundant   ".stripTrailing()

   redundant

In [35]:
"   redundant   ".trim()

redundant

---
## 文字列の挿入

In [36]:
StringBuilder sb=new StringBuilder("ええ すごいわ ええ");
sb.insert(7,"ね");
sb;

ええ すごいわね ええ

In [37]:
StringBuffer sb=new StringBuffer("LOREM IPSUM dolor sit amet");
sb.delete(6,12);
sb;

LOREM dolor sit amet

---
## 文字列 ⇄ 文字配列,バイト

In [38]:
"LOREM".toCharArray()

[C@cb1cbb7

In [39]:
char[] c={'L','O','R','E','M'};
new String(c);

LOREM

In [40]:
"LOREM".getBytes()

[B@5f61b249

In [41]:
byte[] b={76,79,82,69,77};
new String(b);

LOREM

---
## 文字 ⇄ コードポイント

In [42]:
Character.toChars(74)[0] // int → char[]

J

In [43]:
Character.toString(74) // int → String

J

In [44]:
Character.hashCode('R')

82

---
## ハッシュ値

In [45]:
"LOREM IPSUM dolor sit amet".hashCode()

-330337794