# 文字列

In [1]:
using System.Text.RegularExpressions;

## 長さ

In [2]:
"リプサム".Length

4

In [3]:
String.IsNullOrEmpty("リプサム")

False

In [4]:
String.IsNullOrWhiteSpace("リプサム")

False

---
## 文字列の結合

In [5]:
"L" + "ipsum"

Lipsum

In [6]:
String.Concat("L","ipsum") // 同じ

Lipsum

`String.Concat` には最大4つまで `string` 型の引数を与えられる。  
`string[]` を1つだけ与えてもよい。

---
## 文字列の比較

In [7]:
"Lorem"=="Ipsum"

False

In [8]:
String.Equals("Lorem","Ipsum")

False

In [9]:
"Lorem"!="Ipsum"

True

In [10]:
String.Compare("Lorem","Ipsum")

1

In [11]:
"Lorem".CompareTo("Ipsum")

1

---
## 部分文字列

In [12]:
"LOREM IPSUM dolor sit amet"[2]

R

In [13]:
"LOREM IPSUM dolor sit amet".Substring(2,3) // 2文字目から3文字取り出し
// 第2引数を省略すれば末尾までになる

REM

---
## 検索

### 文字列の検索

In [14]:
"LOREM IPSUM dolor sit amet".Contains("dolor")

True

In [15]:
"LOREM IPSUM dolor sit amet".IndexOf('M') // 指定した char 又は string が初めて現れる位置

4

In [16]:
"LOREM IPSUM dolor sit amet".IndexOfAny(new char[]{'P','M','o'}) // 指定した何れかの文字が初めて現れる位置

4

In [17]:
"LOREM IPSUM dolor sit amet".LastIndexOf('M') // 指定した char 又は string が最後に現れる位置

10

In [18]:
"LOREM IPSUM dolor sit amet".LastIndexOfAny(new char[]{'P','M','o'}) // 指定した何れかの文字が最後に現れる位置

15

* `IndexOf`, `IndexOfAny`, `LastIndexOf`, `LastIndexOfAny` は第2引数で検索開始位置を指定でき,さらに第3引数で検索終了位置を指定できる
* 見つからなかったら -1 を返す

In [19]:
"LOREM IPSUM dolor sit amet".StartsWith("Lorem")

False

In [20]:
"LOREM IPSUM dolor sit amet".EndsWith("amet")

True

### 正規表現での検索

In [21]:
var r=new Regex("(?i)[a-z]*([a-z]m)",RegexOptions.IgnoreCase|RegexOptions.Compiled);

In [22]:
r.IsMatch("LOREM IPSUM dolor sit amet") // マッチの確認
// Regex.IsMatch("LOREM IPSUM dolor sit amet","[a-z]*([a-z]m)",RegexOptions.IgnoreCase) : 同じ

True

In [23]:
var m=r.Match("LOREM IPSUM dolor sit amet");
// Regex.Match("LOREM IPSUM dolor sit amet","[a-z]*([a-z]m)",RegexOptions.IgnoreCase) : 同じ

Console.WriteLine(m.Value+"\t"+m.Groups[1].Value);

var m2=m.NextMatch();
Console.WriteLine(m2.Value+"\t"+m2.Groups[1].Value);

LOREM	EM
IPSUM	UM


*　全体の値と0番目のグループの値は同じ

```C#
m.Groups[0].Value == m.Value
```

In [24]:
var mc=r.Matches("LOREM IPSUM dolor sit amet");
// Regex.Matches("LOREM IPSUM dolor sit amet","[a-z]*([a-z]m)",RegexOptions.IgnoreCase) : 同じ

foreach (Match m in mc) Console.WriteLine(m.Value+"\t"+m.Groups[1].Value);

LOREM	EM
IPSUM	UM
am	am


* `new Regex` の第2引数や `Regex.IsMatch`, `Regex.Match`, `Regex.Matches`, `Regex.Replace`, `Regex.Split` の第3引数でオプションを指定することができる

| 値 | 内容 |
|:-|:-|
| `RegexOptions.None` | 何も指定しない |
| `RegexOptions.Compiled` | コンパイルして使用する |
| `RegexOptions.ExplicitCapture` | 名前付きの `()` 以外はキャプチャしない |
| `RegexOptions.IgnoreCase` | 大文字•小文字を区別しない |
| `RegexOptions.IgnorePatternWhitespace` | パターン中のエスケープしていない空白を無視する |
| `RegexOptions.Multiline` | `^` と `$` を全ての行の先頭と末尾に一致させる |
| `RegexOptions.Singleline` | `.` を改行文字 `\n` にも一致させる |
| `RegexOptions.RightToLeft` | 右から左に走査する |

---
## 置換

### 正規表現を使わない置換

In [25]:
"LOREM IPSUM dolor sit amet".Replace("M","ℳ")

LOREℳ IPSUℳ dolor sit amet

### 正規表現を使う置換

In [26]:
var r=new Regex("(\\w)(m)",RegexOptions.IgnoreCase);

In [27]:
r.Replace("LOREM IPSUM dolor sit amet","$2$1") // swapping
// Regex.Replace("LOREM IPSUM dolor sit amet","(\w)(m)","$2$1",RegexOptions.IgnoreCase) : 同じ

LORME IPSMU dolor sit maet

演算もできる置換

In [28]:
string modify(Match m) {
	return m.Groups[2].Value.ToLower()+m.Groups[1].Value.ToUpper();
}

r.Replace("LOREM IPSUM dolor sit amet",new MatchEvaluator(modify)) // swapping & case fixed (upper+lower)

LORmE IPSmU dolor sit mAet

---
## 分割と結合

### 正規表現を使わない分割

In [29]:
"LOREM IPSUM dolor sit amet".Split(" ")

index,value
0,LOREM
1,IPSUM
2,dolor
3,sit
4,amet


### 正規表現を使う分割

In [30]:
var r=new Regex("\\ [\\w\\ ]+\\ ",RegexOptions.IgnoreCase);
r.Split("LOREM IPSUM dolor sit amet")

// Regex.Split("LOREM IPSUM dolor sit amet","\\ [\\w\\ ]+\\ ") : 同じ

index,value
0,LOREM
1,amet


### 結合

In [31]:
String.Join('_',new string[]{"L","I","D","S","A"}) // 文字又は文字列で結合

L_I_D_S_A

---
## 大文字/小文字の切替

In [32]:
"LOREM IPSUM dolor sit amet".ToUpper()

LOREM IPSUM DOLOR SIT AMET

In [33]:
"LOREM IPSUM dolor sit amet".ToLower()

lorem ipsum dolor sit amet

---
## 前後の文字の除去

前後の空白の除去

In [34]:
"   redundant   ".Trim()

redundant

In [35]:
"   redundant   ".TrimStart()

redundant   

In [36]:
"   redundant   ".TrimEnd()

   redundant

指定した文字を前後から除去

In [37]:
"ええ すごいわ ええ".Trim(new char[]{' ','え'})

すごいわ

In [38]:
"ええ すごいわ ええ".TrimStart(new char[]{' ','え'})

すごいわ ええ

In [39]:
"ええ すごいわ ええ".TrimEnd(new char[]{' ','え'})

ええ すごいわ

* 指定する文字が1つだけなら配列である必要はなく,次のように文字を指定することもできる

```C#
"ええ すごいわ ええ".Trim('え')
```

---
## 文字列の挿入

In [40]:
"ええ すごいわ ええ".Insert(7,"ね")

ええ すごいわね ええ

---
## 文字列の削除

In [41]:
"ええ すごいわ ええ".Remove(6,1) // 6文字目から1文字分取り除く

ええ すごい ええ

* 第2引数を指定しなければ末尾まで削除される

---
## 文字列を揃える

In [42]:
"align".PadLeft(11,'-') // -で埋める左端揃え

------align

In [43]:
"align".PadRight(11,'-') // -で埋める右端揃え

align------

* 第2引数を省略すれば空白で埋める

---
## 文字列 ⇄ 文字配列

In [44]:
"LOREM".ToCharArray()

index,value
0,L
1,O
2,R
3,E
4,M


In [45]:
new String(new char[]{'L','O','R','E','M'})

LOREM

---
## ハッシュ値

In [46]:
"LOREM".GetHashCode()

0