# 2 Working with Strings

In [None]:
#include <iostream>
#include <cstring>

## 2.1 Dynamic Strings

### 2.1.1 C-Style Strings

In [None]:
char* copyString(const char* str) 
{
    // 확인을 위해서 ryan code
    std::cout << strlen(str) << std::endl;
    char* result = new char[strlen(str)]; // 버그! 크기 1만큼 부족!
    strcpy(result, str);

    return result;
}

In [None]:
char* retValue = copyString("Hello"); // 5
    
std::cout << strlen(retValue) << std::endl;
std::cout << retValue << std::endl;

In [None]:
char* copyString2(const char* str) 
{
    // 확인을 위해서 ryan code
    std::cout << strlen(str) << std::endl;
    char* result = new char[strlen(str) + 1];
    strcpy(result, str);

    return result;
}

In [None]:
char* retValue2 = copyString2("Hello"); // 5
    
std::cout << strlen(retValue2) << std::endl;
std::cout << retValue2 << std::endl;

In [None]:
char* appendStrings(const char* str1, const char* str2, const char* str3)
{
    char* result = new char[strlen(str1) + strlen(str2) + strlen(str3)];
    strcpy(result, str1);
    strcat(result, str2);
    strcat(result, str3);
    
    return result;
}

In [None]:
char* appendValue = appendStrings("test1", "test2", "test3");

std::cout << strlen(appendValue) << std::endl;
std::cout << appendValue << std::endl;

#### 문자열 크기 확인

In [None]:
char text1[] = "abcdef";
size_t s1 = sizeof(text1);
size_t s2 = strlen(text1);

std::cout << s1 << std::endl;
std::cout << s2 << std::endl;

In [None]:
const char* text2 = "abcdef";
size_t s3 = sizeof(text2);
size_t s4 = strlen(text2);

std::cout << s3 << std::endl;
std::cout << s4 << std::endl;

* Visual Studio의 C 스타일에서는 strcpy() 를 사용하면 경고 메시지가 나옴
* 따라서 strcpy_s() 함수를 사용한 됨
* _s 는 secure C library(ISO/IEC TR 24731) 표준에 의해 제공되는 보안 허점 개선 버전
* **하지만 가장 좋은 것은 C++ string 클래스를 사용하는 것임**

### 2.1.2 String Literals

In [None]:
// hello 를 문자열 리터럴이라고 함
std::cout << "hello" << std::endl;

* 문자열은 읽기 전용 메모리에 위치
* 물론, 변수에 대입될 수 있지만 매우 위험한 상태임
* C++ 에서는 공식적으로 문자열 리터럴을 크기 n의 const char 배열 타입으로 정의
  * const 개념이 없는 환경에서 작성된 오래된 코드들이 존재하기 때문에 하위 호환성 문제로 컴파일러 강제하지 않음
  * 문자열 리터럴 변수 할당할 때는 const char* 로 할 수 있지만 char* 타입변수 무방
* 문자열 리터럴 변경은 변경할 때 어떤 일이 일어나는지 아무도 알 수 없음. 
  * 따라서 const 타입의 변수 사용하는 안전함

In [None]:
char* ptr1 = "hello";
ptr1[1] = 'a';

// warning 메시지 발생
std::cout << ptr1 << std::endl;

In [None]:
const char* ptr2 = "hello";
ptr2[1] = 'a';

// 컴파일러 에러 발생;  읽기 전용 메모리에 쓰기 시도(const)
std::cout << ptr2 << std::endl;

In [None]:
// 컴파일러가 자동으로 문자열 배열 크기에 맞게 메모리 할당 함
char arr[] = "hello";
arr[1] = 'a';

std::cout << arr << std::endl;
std::cout << sizeof(arr) << std::endl;
std::cout << strlen(arr) << std::endl;

### 2.1.3 The C++ string class

* C++ 의 std::string 클래스는 <cstring> 에서 제공하는 문자열 처리 대부분을 지원 함
* 제대로 사용한다면 메모리 할당 부분까지 대신 관리
* string 클래스는 <string> 헤더 파일에 정의 되어 있음

#### C 스타일의 문자열의 문제점

* 장점
  * 단순하다. 기본 문자 타입과 배열 구조만 사용
  * 가볍다. 제대로 사용한다면 꼭 필요한 메모리 공간만 점유
  * 저수준이다. 로우 메모리상에서 쉽게 조작하거나 복제할 수 있음
  * C 프로그래머에게 매우 익숙하여 새로 배울 필요가 없음
  
* 단점
  * 범용 문자열 데이터 타입으로 고급 작업을 하기에는 너무 많은 노력이 추가 필요
  * 잘못된 메모리 작업에 민감하고 해당 버그를 찾기 어려움
  * C++의 객체지향 개념을 활용하지 못함
  * 프로그래머가 문자열의 내부 동작 방식을 이애해야 한다.

In [None]:
#include <iostream>
#include <string>

In [None]:
std::string A("12");
std::string B("34");

std::string c = A + B;
std::cout << c << std::endl;

In [None]:
std::cout << A << std::endl;
A += B;
std::cout << A << std::endl;

In [None]:
// C 스타일의 문제점
// 문자열을 비교하기 어려움
char* a = "12";
char b[] = "12";

if (a == b) {
    std::cout << "True" << std::endl;
} else {
    std::cout << "False" << std::endl;
}

In [None]:
// 이렇게 변경해 줘야 함
if (strcmp(a, b) == 0) {
    std::cout << "True" << std::endl;
} else {
    std::cout << "False" << std::endl;
}

In [None]:
// string 클래스는 자체적으로 메모리 관리 함
std::string myString = "hello";
myString += ", there";
std::string myOtherString = myString;

if (myString == myOtherString) {
    myOtherString[0] = 'H';
}

std::cout << myString << std::endl;
std::cout << myOtherString << std::endl;

In [None]:
auto string1 = "Hello World"; // string1 타입은 const char* 이며,
// auto string2 = "Hello World"s; // string2 타입은 std::string 타입이다.

std::cout << string1 << std::endl;
// std::cout << string2 << std::endl;

#### 수치변환

In [None]:
#include <typeinfo>  //for 'typeid' to work  


int i = -7;
unsigned us = 5U;
long l = -7L;
long long ll = 14LL;
unsigned long ul = 5400UL;
unsigned long long ull = 140ULL;
float f = 7.2f;
double d = 7.2;
long double ld = 16.98L;

std::string s_i = std::to_string(i);
std::string s_us = std::to_string(us);
std::string s_l = std::to_string(l);
std::string s_ll = std::to_string(ll);
std::string s_ul = std::to_string(ul);
std::string s_ull = std::to_string(ull);
std::string s_f = std::to_string(f);
std::string s_d = std::to_string(d);
std::string s_ld = std::to_string(ld);

std::cout << "int i => " << s_i << ": " << typeid(s_i).name() << std::endl;
std::cout << "unsigned us => " << s_us  << ": " << typeid(s_us).name() << std::endl;
std::cout << "long l => " << s_l  << ": " << typeid(s_l).name() << std::endl;
std::cout << "long long ll => " << s_ll  << ": " << typeid(s_ll).name() << std::endl;
std::cout << "unsigned long ul =>" << s_ul  << ": " << typeid(s_ul).name() << std::endl;
std::cout << "float f => " << s_f  << ": " << typeid(s_f).name() << std::endl;
std::cout << "double d => " << s_d  << ": " << typeid(s_d).name() << std::endl;
std::cout << "long double d => " << s_ld  << ": " << typeid(s_ld).name() << std::endl;



In [None]:
std::cout << "s_i: " << s_i << ", convert to => " << stoi(s_i) << ", type: " << typeid((stoi(s_l))).name()<< std::endl;

In [None]:
const std::string s = "1234";
int i = stoi(s);
std::cout << i << std::endl;

## 2.2 Raw String Literals

In [None]:
std::string str = R"(Hello "World"!)";
std::cout << str << std::endl;

In [None]:
std::string str2 = R"(Line 1
Line2 with \t)";

std::cout << str2 << std::endl;

In [None]:
# AVOID

std::string str3 = R"(Th characters )" are embedded in this string)";
std::cout << str3 << std::endl;

In [None]:
std::string str3 = R"-(Th characters )" are embedded in this string)-";
std::cout << str3 << std::endl;

## 2.3 Nonstandard Strings

* C++ 개발자들이 string 타입을 사용하지 않는 이유
  * string 타입이 존재하는 것을 모르기 때문
  * 상황에 따라서 적합하지 않기 때문
  * 개발프레임워크가 제공해주는 문자열을 사용하기 때문