## 1. 문자 

- 는 일단 u8 => char로 처리

In [2]:
let s : u8 = 65 ;

In [3]:
println!("{s}");

65


### as 연산자는 프리미티브 타입만 가능

- u8 타입 일 경우만 가능 

In [4]:
let c = s as char;

In [5]:
println!("{c}");

A


In [21]:
fn main() { 
    let ch = std::char::from_u32(65);

    match ch {
        Some(c) => println!("char value is {}", c),
        None => println!("couldn't convert to char"),
    }
    
    
    let ch = std::char::from_u32(0x10FFFF);

    match ch {
        Some(c) => println!("char value is {}", c),
        None => println!("couldn't convert to char"),
    }
}

In [22]:
main();

char value is A
char value is 􏿿


## 한글 처리 

- 한글은 3바이트 기준으로 처리 : bytes 메서드로 변환하면 3 바이트로 생성
- 그중에 take 메서도르 처리하면 특정 위치를 가져옴
- collect 메서드로 처리하면 앞에 메서드 까지 처리한 결과를 가져옴 

In [26]:
fn main() {
    let a = "가".bytes();
    println!(" a bytes = {:?}", a);
    
    let a = "가".bytes().take(1); 
    println!(" a bytes take = {:?}", a);
    
    let a = "가".bytes().take(1).collect::<Vec<u8>>();
    println!(" a= {:?}", a);
    
}

In [27]:
main();

 a bytes = Bytes(Copied { it: Iter([234, 176, 128]) })
 a bytes take = Take { iter: Bytes(Copied { it: Iter([234, 176, 128]) }), n: 1 }
 a= [234]


## 그래서 숫자를 u8로 변환 후에 char로 변환

- 정수를 u8로 변환 후 다시  char로 변환해야 char 로 처리 

In [9]:
fn main() { // main() is where Rust programs start to run. Code goes inside {} (curly brackets)

    let my_number = 100;        // 정수 할당 

    println!("{}", my_number as u8 as char ); // ⚠️
}

In [6]:
main()

d


()

## 유니코드로 처리할 때는 u32로 처리 

- 그래서 u32 숫자형은 별도의 연관함수인 from_u32를 제공한다.
- 반환값은 Option으로 처리됨 출력할 때는 :? 로 처리 

In [41]:
fn main() { 
    
    let my_number = 54620 ;                       // 숫자 입력 

    println!("{:?}", char::from_u32(my_number) ); // 문자로 변환후에 출력 
}

In [42]:
main()

Some('한')


()

## 유니코드 처리 

In [43]:
let a =  '\u{D55C}';

In [44]:
a

'한'

In [48]:
let b : u32 = 0xD55C;

In [50]:
char::from_u32(b)

Some('한')

## 메모리의 길이 확인 

In [28]:
fn main() {
    println!("Size of a char: {}", 
        std::mem::size_of::<char>());
    println!("Size of a u8: {}", 
        std::mem::size_of::<u8>());
}

In [29]:
main()

Size of a char: 4
Size of a u8: 1


()

In [55]:
fn main() {
    println!("Size of a char: {}", std::mem::size_of::<char>()); // 4 bytes
    println!("Size of string containing 'a': {}", "a".len()); // .len() gives the size of the string in bytes
    println!("Size of string containing 'ß': {}", "ß".len());
    println!("Size of string containing '国': {}", "国".len());
    println!("Size of string containing '𓅱': {}", "𓅱".len());
    println!("Size of string containing '한': {}", "한".len());
}

In [56]:
main()

Size of a char: 4
Size of string containing 'a': 1
Size of string containing 'ß': 2
Size of string containing '国': 3
Size of string containing '𓅱': 4
Size of string containing '한': 3


()

## 메서드 

- is_digit(): 문자가 10진수 숫자인지 여부를 확인합니다.
- is_alphanumeric(): 문자가 영숫자 문자인지 여부를 확인합니다.
- is_ascii(): 문자가 ASCII 문자인지 여부를 확인합니다.
- is_lowercase(): 문자가 소문자인지 여부를 확인합니다.
- is_uppercase(): 문자가 대문자인지 여부를 확인합니다.
- to_lowercase(): 문자의 소문자 버전을 반환합니다.
- to_uppercase(): 문자의 대문자 버전을 반환합니다.
- escape_unicode(): 유니코드 이스케이프 시퀀스(\u{})를 사용하여 문자를 이스케이프합니다.
- len_utf8(): 문자의 UTF-8 인코딩 된 길이를 반환합니다.
- len_utf16(): 문자의 UTF-16 인코딩 된 길이를 반환합니다.
- encode_utf8(): 문자의 UTF-8 인코딩 된 시퀀스를 반환합니다.
- encode_utf16(): 문자의 UTF-16 인코딩 된 시퀀스를 반환합니다.

In [31]:
fn main() {
    let ch = 'A';

    // 문자가 10진수 숫자인지 확인하기
    println!("is_digit: {}", ch.is_digit(10));

    // 문자가 영숫자 문자인지 확인하기
    println!("is_alphanumeric: {}", ch.is_alphanumeric());

    // 문자가 ASCII 문자인지 확인하기
    println!("is_ascii: {}", ch.is_ascii());

    // 문자가 소문자인지 확인하기
    println!("is_lowercase: {}", ch.is_lowercase());

    // 문자가 대문자인지 확인하기
    println!("is_uppercase: {}", ch.is_uppercase());

    // 문자의 소문자 버전 가져오기
    println!("to_lowercase: {}", ch.to_lowercase());

    // 문자의 대문자 버전 가져오기
    println!("to_uppercase: {}", ch.to_uppercase());

    // 유니코드 이스케이프 시퀀스를 사용하여 이스케이핑하기
    println!("escape_unicode: {}", ch.escape_unicode());

    // UTF-8로 인코딩된 문자의 길이 가져오기
    println!("len_utf8: {}", ch.len_utf8());

    // UTF-16으로 인코딩된 문자의 길이 가져오기
    println!("len_utf16: {}", ch.len_utf16());
}

In [32]:
main();

is_digit: false
is_alphanumeric: true
is_ascii: true
is_uppercase: true
is_lowercase: false
to_lowercase: a
to_uppercase: A
escape_unicode: \u{41}
len_utf8: 1
len_utf16: 1


In [41]:
fn main() {
    let mut b = [0; 2];

    let result = 'ß'.encode_utf8(&mut b);

    assert_eq!(result, "ß");

    assert_eq!(result.len(), 2);
}

In [42]:
main();

In [57]:
fn main() {
    let ch = '😊'; // 이모지 문자

    // 문자를 UTF-8 인코딩된 시퀀스로 변환하여 출력하기
    let mut b = [0; 4];
   
    println!("{:?} ", ch.encode_utf8(&mut b));

}

In [58]:
main();

"😊" 


In [48]:

fn main() {
    
    let mut ch = 'A';
    let mut b = [0; 2];
    let cc = ch.encode_utf8(&mut b);
    
    println!("encode_utf8: {:?}", cc);

    // UTF-16으로 인코딩된 문자의 시퀀스 가져오기
    let mut bc = [0; 2];
    let ccc = ch.encode_utf8(&mut bc);
    println!("encode_utf16: {:?}", ccc);
}

In [49]:
main();

encode_utf8: "A"
encode_utf16: "A"
