# 文字列

## 長さ

In [1]:
text="リプサム"
echo "${#text}"

4


---
## 文字列の結合
Bash では特別な結合演算子はない。文字列を並べればよい

In [2]:
echo "L""ipsum"

Lipsum


---
## 文字列の比較

In [3]:
echo $(( "Lorem" == "Ipsum" ))

1


In [4]:
echo $(( "Lorem" != "Ipsum" ))

0


In [5]:
echo $(( "Lorem" < "Ipsum" )) # 辞書順で "Lorem" < "Ipsum"

0


In [6]:
echo $(( "Lorem" <= "Ipsum" )) # 辞書順で "Lorem" ≤ "Ipsum"

1


In [7]:
echo $(( "Lorem" > "Ipsum" )) # 辞書順で "Lorem" > "Ipsum"

0


In [8]:
echo $(( "Lorem" >= "Ipsum" )) # 辞書順で "Lorem" ≥ "Ipsum"

1


---
## 部分文字列

In [9]:
$text="LOREM IPSUM dolor sit amet"
echo ${text:2:3} # 2番目から3文字抽出

bash: リプサム=LOREM IPSUM dolor sit amet: command not found
サム


`${text:2:3}` で部分列を取り出す際, `${text:3-1:18/6}` などと計算式を埋め込んでも構わない

---
## 検索

### 文字列の検索

In [10]:
text="LOREM IPSUM dolor sit amet"

shopt -s nocasematch # ignorecase をオンにする設定
if [[ $text =~ "dolor" ]]; then
	echo "dolor included"
else
	echo "dolor not included"
fi
shopt -u nocasematch # ignorecase をオフにする設定

dolor included


### 正規表現での検索

In [11]:
text="LOREM IPSUM dolor sit amet"
shopt -s nocasematch
echo "$text" | grep -oE "[a-z]*([a-z]m)"

am


---
## 置換

### 正規表現を使わない置換

In [12]:
text="abracadabra"

In [13]:
echo "${text#*br}" # 先頭から最短で *br にマッチする部分を削除

acadabra


In [14]:
echo "${text##*br}" # 先頭から最長で *br にマッチする部分を削除

a


In [15]:
echo "${text%br*}" # 末尾から最短で br* にマッチする部分を削除

abracada


In [16]:
echo "${text%%br*}" # 末尾から最長で br* にマッチする部分を削除

a


In [17]:
text="LOREM IPSUM dolor sit amet"

In [18]:
echo "${text/M/ℳ}"

LOREℳ IPSUM dolor sit amet


In [19]:
echo "${text//M/ℳ}"

LOREℳ IPSUℳ dolor sit aℳet


### 正規表現を使う置換

In [20]:
echo "lorem ipsum dolor sit amet" | sed -Ee "s/([a-z])(m)/\2\1/" # swapping

lorme ipsum dolor sit amet


In [21]:
echo "lorem ipsum dolor sit amet" | sed -Ee "s/([a-z])(m)/\2\1/g" # swapping

lorme ipsmu dolor sit maet


* GNU版の `sed` コマンドとかは正規表現の `i` フラグにも対応しているようだ
* 2つ以上連続で置換を行う場合は, `sed -e s///g -e s///g ...` とする
* `s/before/after/g` の型だけでなく,スラッシュ以外の記号でもよいみたいで,例えば `s@before@after@g` の型でもよい

`sed` コマンド自体は Stream EDitor の略なので、テキスト編集に特化したコマンドである。
* `sed -i "s/before/after/g" filename` とすることでファイルを直接編集できる (`-i`フラグ)

---
## 分割と結合

### 正規表現を使わない分割

In [22]:
text="LOREM IPSUM dolor sit amet"
IFS=" " # 区切りを定めるグローバル変数
splited=($text)
echo "${splited[0]}"
echo "${splited[1]}"
echo "${splited[2]}"
echo "${splited[3]}"
echo "${splited[4]}"

LOREM
IPSUM
dolor
sit
amet


In [23]:
array=("L" "I" "D" "S" "A")
IFS="_"
joined="${array[*]}"
echo "$joined"

L_I_D_S_A
