# 文字列型（String）

### OsString、OsStr、CString、CStr

- [std::ffi::CString - Rust](https://doc.rust-lang.org/std/ffi/struct.CString.html), [std::ffi::CStr - Rust](https://doc.rust-lang.org/std/ffi/struct.CStr.html)
    - RustのCStringはCと同様にヌル終端された文字列型で、主にffiによるCの関数呼び出し時に使う
    - Cと文字列をやり取りするときは、strやStringは使えない
    - Rustの文字列はNULL終端せずに長さの情報を参照あるいはデータ型内に持つのに対して、Cの文字列は長さ情報を持たにNULL終端しているため
    - Rustのstd::ffiモジュールにはstrのNULL終端版とStringのNULL終端版のCStringが用意されている
    - RustからCにNULL終端文字列を渡すときは、CString::newでRustの文字列などからNULL終端文字列が作れる
    - [rustbook/cffi_readline.rs at master · ghmagazine/rustbook](https://github.com/ghmagazine/rustbook/blob/master/ch12/cffi_readline.rs)


- [std::ffi::OsString - Rust](https://doc.rust-lang.org/std/ffi/struct.OsString.html), [std::ffi::OsStr - Rust](https://doc.rust-lang.org/std/ffi/struct.OsStr.html)
    - OSネイティブの文字列
    - [RustとWindowsのワイド文字列（LPCWSTR / LPWSTR） | d.sunnyone.org](http://d.sunnyone.org/2015/06/rustwindowslpcwstr-lpwstr.html)

## 新規に文字列を作成する


In [None]:
let mut s = String::new();

In [None]:
let data = "initial contents";

// to_stringメソッドを使用して文字列リテラルからStringを生成する
let s = data.to_string();

// the method also works on a literal directly:
let s = "initial contents".to_string();
s

In [None]:
// 文字列リテラルからStringを生成する
let s = String::from("initial contents");
s

In [None]:
let hello = String::from("안녕하세요");
hello

## 文字列を更新する

### ``push_str``と``push``で文字列を追加する

#### push_str

In [None]:
let mut s = String::from("foo");

// push_strで文字列を追加。引数は文字列スライス（&str）
s.push_str("bar");
s

In [None]:
let mut s1 = String::from("foo");
let s2 = "bar";
s1.push_str(s2);

// push_strはs2の所有権を奪わない
println!("s2 is {}", s2);

#### push

In [None]:
// pushメソッドは、1文字を引数として取り、Stringに追加する
let mut s = String::from("lo");
s.push('l');
s

``+``演算子、または``format!``マクロで連結

In [None]:
let s1 = String::from("Hello, ");
let s2 = String::from("world!");
// s1 + s2の参照
let s3 = s1 + &s2; // s1はムーブされ、もう使用できないことに注意
// s1 + &s2;
s1

``+``演算子では以下のようなaddメソッドが呼ばれる
``` rust
fn add(self, s: &str) -> String {}
```
- 最初の文字列に2番目の文字列の参照（&str）を追加する（Stringには&strを追加することしかできない）
- add呼び出しでは、コンパイラが&String引数を&strに型強制してくれる。ここでは、 &s2を&s2[..]に変えている
- addはselfの所有権をもらう（&selfではない）
- s1はadd呼び出しにムーブされ、その後は有効ではなくなる
- s3 = s1 + &s2;は両文字列をコピーして新しいものを作るように見えるが、実際にはs1の所有権を奪い、s2の中身のコピーを追記し、結果の所有権を返す

### format!

In [None]:
let s1 = String::from("tic");
let s2 = String::from("tac");
let s3 = String::from("toe");

let s = format!("{}-{}-{}", s1, s2, s3);
s

## 文字列に添え字でアクセスする（Rustではサポートされていない）

In [None]:
let s1 = String::from("hello");
let h = s1[0];

### 内部表現

In [None]:
// 文字列 "Hola"を保持するベクタの長さが 4バイトであることを意味する
// これらの各文字は、UTF-8でエンコードすると、1バイトになる
let len = String::from("Hola").len();
len

In [None]:
// “Здравствуйте”をUTF-8でエンコードすると 24バイトになる（各Unicodeスカラー値は、2バイトの領域を取る）
// 文字列のバイトの添え字は、必ずしも有効なUnicodeのスカラー値とは相互に関係しない
let len = String::from("Здравствуйте").len();
len

In [None]:
let hello = "Здравствуйте";
let bytes: &[u8] = hello.as_bytes();
bytes

In [None]:
"hello".as_bytes()

### バイトとスカラー値と書記素クラスタ

In [None]:
"नमस्ते".as_bytes()

In [None]:
// Unicodeスカラー値（Rustのchar型）
"नमस्ते".chars()

4番目と6番目は文字ではない：単独では意味をなさないダイアクリティック

In [None]:
println!("{:x}", 'の' as u32);

In [None]:
let st = "👨‍👩‍👦‍👦";

for cp in st.chars().map(|ch| ch as u32) {
    println!("{:x}", cp);
}

## 文字列をスライスする

In [None]:
// 字列添え字処理の戻り値の型が明瞭ではない。戻り値はバイト値、文字、書記素クラスタ、あるいは文字列スライスになる
// 文字列スライスを得るには、[]で1つの数値により添え字アクセスするのではなく、範囲とともに[]を使って特定のバイトを含む文字列スライスを作る
let hello = "Здравствуйте";

let s = &hello[0..1];
s

## 文字列を走査するメソッド群

In [2]:
for c in "नमस्ते".chars() {
    println!("{}", c);
}

न
म
स
्
त
े


()

In [3]:
for b in "नमस्ते".bytes() {
    println!("{}", b);
}

224
164
168
224
164
174
224
164
184
224
165
141
224
164
164
224
165
135


()