# 文字列

In [1]:
import "strings"
import "regexp"
import "unicode/utf8"
import "fmt"

var sa []string
var saa [][]string
var ia []int
var iaa [][]int

## 長さ

In [2]:
utf8.RuneCountInString("リプサム")

4

In [3]:
len("リプサム")

12

---
## 文字列の結合

In [4]:
"L" + "ipsum"

Lipsum

---
## 文字列の比較

In [5]:
"Lorem" == "Ipsum"
// 大文字•小文字の違いを無視するなら strings.EqualFold("Lorem","Ipsum")

false

In [6]:
"Lorem" != "Ipsum"

true

In [7]:
"Lorem" < "Ipsum" // 辞書順で "Lorem" < "Ipsum"

false

In [8]:
"Lorem" <= "Ipsum" // 辞書順で "Lorem" ≤ "Ipsum"

false

In [9]:
"Lorem" > "Ipsum" // 辞書順で "Lorem" > "Ipsum"

true

In [10]:
"Lorem" >= "Ipsum" // 辞書順で "Lorem" ≥ "Ipsum"

true

In [11]:
strings.Compare("Lorem","Ipsum")

1

---
## 文字列の繰り返し

In [12]:
strings.Repeat("Lorem",3)

LoremLoremLorem

---
## 検索

### 文字列の検索

In [13]:
strings.Contains("LOREM IPSUM dolor sit amet","dolor")

true

In [14]:
strings.Index("LOREM IPSUM dolor sit amet","M") // "M"が初めて現れる位置

4

In [15]:
strings.LastIndex("LOREM IPSUM dolor sit amet","M") // "M"が最後に現れる位置

10

In [16]:
strings.Count("LOREM IPSUM dolor sit amet","M")

2

In [17]:
strings.HasPrefix("LOREM IPSUM dolor sit amet","Lorem")

false

In [18]:
strings.HasSuffix("LOREM IPSUM dolor sit amet","amet")

true

### 正規表現での検索

In [19]:
m,e := regexp.MatchString(`(?i)[a-z]*([a-z]m)`,"LOREM IPSUM dolor sit amet") // マッチの確認
fmt.Println(e) // 通常は e == nil であるが,正規表現などにエラーがあれば e にエラーメッセージが入る (この時は m==false)
m

<nil>


true

In [20]:
r:=regexp.MustCompile(`(?i)[a-z]*([a-z]m)`)
r.MatchString("LOREM IPSUM dolor sit amet") // マッチの確認

true

In [21]:
r.FindString("LOREM IPSUM dolor sit amet")

LOREM

In [22]:
ia=r.FindStringIndex("LOREM IPSUM dolor sit amet")
fmt.Sprintf("%#v",ia)

[]int{0, 5}

In [23]:
sa=r.FindStringSubmatch("LOREM IPSUM dolor sit amet")
fmt.Sprintf("%#v",sa)

[]string{"LOREM", "EM"}

In [24]:
ia=r.FindStringSubmatchIndex("LOREM IPSUM dolor sit amet")
fmt.Sprintf("%#v",ia)

[]int{0, 5, 3, 5}

In [25]:
sa=r.FindAllString("LOREM IPSUM dolor sit amet",-1) // 第2引数はマッチする個数を制限するが, -1 で無制限になる
fmt.Sprintf("%#v",sa)

[]string{"LOREM", "IPSUM", "am"}

In [26]:
iaa=r.FindAllStringIndex("LOREM IPSUM dolor sit amet",-1)
fmt.Sprintf("%#v",iaa)

[][]int{[]int{0, 5}, []int{6, 11}, []int{22, 24}}

In [27]:
saa=r.FindAllStringSubmatch("LOREM IPSUM dolor sit amet",-1)
fmt.Sprintf("%#v",saa)

[][]string{[]string{"LOREM", "EM"}, []string{"IPSUM", "UM"}, []string{"am", "am"}}

In [28]:
iaa=r.FindAllStringSubmatchIndex("LOREM IPSUM dolor sit amet",-1)
fmt.Sprintf("%#v",iaa)

[][]int{[]int{0, 5, 3, 5}, []int{6, 11, 9, 11}, []int{22, 24, 22, 24}}

---
## 置換

### 正規表現を使わない置換

In [29]:
strings.Replace("LOREM IPSUM dolor sit amet","M","ℳ",1)
// 第4引数で置換する回数を指定できる

LOREℳ IPSUM dolor sit amet

In [30]:
strings.Replace("LOREM IPSUM dolor sit amet","M","ℳ",-1) // -1 は全て置換
// strings.ReplaceAll("LOREM IPSUM dolor sit amet","M","ℳ")

LOREℳ IPSUℳ dolor sit amet

### 正規表現を使う置換

In [31]:
r:=regexp.MustCompile("(?i)(\\w)(m)")
r.ReplaceAllString("LOREM IPSUM dolor sit amet","$2$1")

LORME IPSMU dolor sit maet

In [32]:
r.ReplaceAllLiteralString("LOREM IPSUM dolor sit amet","$2$1")

LOR$2$1 IPS$2$1 dolor sit $2$1et

---
## 分割と結合

### 正規表現を使わない分割

In [33]:
sa=strings.Fields("LOREM IPSUM dolor sit amet") // 空白文字で区切る
fmt.Sprintf("%#v",sa)

[]string{"LOREM", "IPSUM", "dolor", "sit", "amet"}

In [34]:
sa=strings.Split("LOREM IPSUM dolor sit amet"," ")
fmt.Sprintf("%#v",sa)

[]string{"LOREM", "IPSUM", "dolor", "sit", "amet"}

In [35]:
sa=strings.SplitAfter("LOREM IPSUM dolor sit amet"," ") // 区切り文字列そのものも含む (区切りの直後で区切る)
fmt.Sprintf("%#v",sa)

[]string{"LOREM ", "IPSUM ", "dolor ", "sit ", "amet"}

In [36]:
sa=strings.SplitN("LOREM IPSUM dolor sit amet"," ",2)
fmt.Sprintf("%#v",sa)

[]string{"LOREM", "IPSUM dolor sit amet"}

### 正規表現を使う分割

In [37]:
r:=regexp.MustCompile("(?i) [\\w ]+ ")
sa=r.Split("LOREM IPSUM dolor sit amet",-1)
fmt.Sprintf("%#v",sa)

[]string{"LOREM", "amet"}

### 結合

In [38]:
strings.Join([]string{"L","I","D","S","A"},"_")

L_I_D_S_A

---
## 大文字/小文字の切替

In [39]:
strings.ToUpper("LOREM IPSUM dolor sit amet")
strings.ToTitle("LOREM IPSUM dolor sit amet") // 同じ

LOREM IPSUM DOLOR SIT AMET

In [40]:
strings.ToLower("LOREM IPSUM dolor sit amet")

lorem ipsum dolor sit amet

In [41]:
strings.Title("LOREM IPSUM dolor sit amet")

LOREM IPSUM Dolor Sit Amet

---
## 文字列の削除

### 文字列単位の削除

In [42]:
strings.TrimPrefix("ええ すごいわ ええ","ええ ") // 左端から取り除く

すごいわ ええ

In [43]:
strings.TrimRight("ええ すごいわ ええ"," ええ") // 右端から取り除く

ええ すごいわ

### 文字単位の削除

In [44]:
strings.Trim("ええ すごいわ ええ"," え") // 指定した文字を全て取り除く

すごいわ

In [45]:
strings.TrimLeft("ええ すごいわ ええ"," え") // 左端から指定した文字を全て取り除く

すごいわ ええ

In [46]:
strings.TrimRight("ええ すごいわ ええ"," え") // 左端から指定した文字を全て取り除く

ええ すごいわ

### 前後の空白の除去

In [47]:
strings.TrimSpace("   redundant   ")

redundant

---
## 文字列 ⇄ バイト,文字
`rune` 型は`int32` であるから`byte` 型と違い,マルチバイト文字も1つの数値で表せる

In [48]:
[]byte("リプサム")

[227 131 170 227 131 151 227 130 181 227 131 160]

In [49]:
[]rune("リプサム")

[12522 12503 12469 12512]

In [50]:
string([]byte{227,131,170,227,131,151,227,130,181,227,131,160})

リプサム

In [51]:
string([]rune{'リ','プ','サ','ム'})

リプサム

---
## 正規表現について

### コンパイル

次のようにエラーう受け取るコンパイルの仕方もある
```Go
r,e := regexp.Compile(`(?i)[a-z]*([a-z]m)`)
```
通常は` e == nil` であるが,正規表現などにエラーがあれば `e` にエラーメッセージが入る (この時は `m==nil`)