# 문자열(string)

수학 시간에 배우는 **수의 열**(a seqence of numbers)인 **수열**과 유사하게 **문자의 열**(a sequence of characters)을 **문자열**이라고 한다.
컴퓨터는 문자를 이진수로 변환하여 저장하고, 저장된 이진수를 다시 문자로 변환하여 화면에 나타낸다.
문자를 이진수로 변환하는 것을 **암호화**(encoding)라고 하고 이진수를 다시 문자로 변환하는 것을 **복호화**(decoding)라고 한다.
암호화하고 복호화하는 여러 가지 표준적인 방법이 있는데 가장 자주 사용하는 방법은 **아스키**(American Standard Code for Information Interchange, ASCII)와 **유니코드**(Unicode)이다.
파이썬은 기본적으로 유니코드를 사용하기 때문에 **파이썬에서 문자열은 유니코드의 열**이다.
그렇다고 다른 코드 체계를 다룰 수 없는 것은 아니다.

# 텍스트 파일

파일은 **이진 파일**(binary file)과 **텍스트 파일**(text file)로 구분된다.
**텍스트 파일은 문자열이 저장된 파일**을 가리키는 용어이다.
**텍스트 파일은 문자열과 인코딩에 관한 정보만 가지고 있으며** **서식(굵게 또는 기울임 등과 같은)이 없는 단순 문서 편집기**를 통해 확인하고 생성하고 수정할 수 있다.

**자료를 저장하고 공유하는 가장 기본적인 파일 형식이 텍스트 파일**이다.
텍스트 파일이지만 `.txt`, `.html`, `csv`, `.py`, `.cpp` 등과 같은 다양한 확장자로 저장된 정보의 종류나 용도 또는 형식을 나타내기 위해 나타내는 것이 관례이다.

## 문자열의 생성

파이썬에서 문자열은 문자들의 열을 **작은따옴표**(single quote) 또는 **큰따옴표**(double quote)로 감싸서 생성한다.
여러 줄에 걸친 문자열은 세 번 연속된 작은따옴표나 큰따옴표로 감싸서 생성할 수 있다.

In [0]:
student_name = '심청'
father_name = "심학규"
address = """
옹진군
경기도 12345
대한민국"""
print(father_name)
print(address)

심학규

옹진군
경기도 12345
대한민국


문자열의 자료형은 `str`이다.

In [0]:
print(type(address))

<class 'str'>


**문자열은 여러 개의 문자를 순서대로 저장하는 일종의 자료구조**이다.
따라서 리스트와 같이 인덱스와 `[]` 연산자를 이용하여 특정 문자에 접근할 수 있으며 슬라이싱으로 부분 문자열을 추출할 수도 있다.
`in` 연산자 뿐만 아니라 내장함수 `len()`, `enumerate()` 등도 사용할 수 있다.

Note: 문자(character)와 문자열(string)을 구별하여 사용해야 한다.

In [0]:
for ch in father_name:
    print(ch)

심
학
규


In [0]:
for idx, ch in enumerate(father_name):
    print(idx, ': ', ch)

0 :  심
1 :  학
2 :  규


In [0]:
for idx in range(len(father_name)):
    print(idx, ': ', father_name[idx])

0 :  심
1 :  학
2 :  규


**리스트와 다른 점이라면 문자열은 `immutable`하다.**
따라서 문자열 자료구조에 저장된 값을 변경하는 다음과 같은 코드는 `TypeError` 오류를 발생한다.

In [0]:
student_name[1] = '수'

TypeError: 'str' object does not support item assignment

## 이스케이프 시퀀스(escape sequence)

문자열에 엔터키(`enter key`, 줄의 끝을 나타내는 문자)나 탭키(`tab key`, 미리 설정된 위치로 이동하라는 표식의 문자) 또는 따옴표를 포함하고 싶을 때 사용하는 특별한 문자열을 이스케이프 시퀀스라고 한다.
이스케이프 시퀀스는 역 슬래시(backslash) `\`로 시작한다.
자주 사용하는 이스케이프 시퀀스는 `\n`, `\t`, `\"`, `\'`, `\\` 등인데 순서대로 엔터키, 탭키, 큰따옴표, 작은따옴표, 역슬래시이다.

In [0]:
words = '선생님께서 \"너 지금 뭐 하는거야?\" 하고 물으셨다.'
print(words)

선생님께서 "너 지금 뭐 하는거야?" 하고 물으셨다.


문자열을 **`raw string`**으로 지정하면 문자열 내에 있는 모든 이스케이프 시퀀스를 이스케이프 시퀀스로 해석하지 않고 있는 그대로 처리한다.
문자열을 `raw string`으로 지정하려면 문자열을 생성할 때 문자열 앞에 `r`을 덧붙인다.

In [0]:
msg = 'This is Brown\'s car'
print(msg)
msg = r'This is Brown\'s car'
print(msg)

This is Brown's car
This is Brown\'s car


여러 줄에 걸친 문자열을 생성할 때는 세개의 따옴표(triple quotes)로 문자열을 시작하고 끝내면 된다.
세개의 따옴표로 감싼 문자열을 입력할 때는 엔터키나 탭키 등을 이스케이프 시퀀스로 입력하지 않아도 자동적으로 이스케이프 시퀀스로 변환된다.

In [0]:
msg = """Title: Pyhton String
    파이썬 문자열을 특징은 ...
    다음과 같다."""
print(msg)
msg

Title: Pyhton String
    파이썬 문자열을 특징은 ...
    다음과 같다.


'Title: Pyhton String\n    파이썬 문자열을 특징은 ...\n    다음과 같다.'

In [1]:
msg = "Title: Pyhton String\n파이썬 문자열을 특징은 ...\n다음과 같다."
print(msg)
msg

Title: Pyhton String
파이썬 문자열을 특징은 ...
다음과 같다.


'Title: Pyhton String\n파이썬 문자열을 특징은 ...\n다음과 같다.'

## `in` 연산자

`in` 연산자를 사용하면 문자열 내에 특정 문자열이 포함되어 있는지 검사할 수 있다.

In [0]:
test1 = 'Hello' in 'Hello World'
print(test1)
test2 = 'cats' not in 'cats and dogs'
print(test2)

True
False


## 파이썬 문자열의 메소드

최근에는 텍스트 자료를 처리하는 일이 중요해지고 있다.
인터넷에서 수집하는 많은 자료가 텍스트 자료이며 이들을 주제에 따라 분류하거나 다른 언어로 번역하는 것을 예로 들 수 있다.
파이썬 문자열은 텍스트 자료를 처리하는데 필요한 다양한 메소드를 제공한다.
이들 메소드는 [docs.python.org](https://docs.python.org/3/library/string.html)나 [www.programiz.com](https://www.programiz.com/python-programming/methods/string) 사이트를 참고하여 익힐 필요가 있다.

파이썬 문자열의 메소드는 다음과 같이 알아 볼 수있다.

In [0]:
', '.join(dir(msg)[33:])

'capitalize, casefold, center, count, encode, endswith, expandtabs, find, format, format_map, index, isalnum, isalpha, isdecimal, isdigit, isidentifier, islower, isnumeric, isprintable, isspace, istitle, isupper, join, ljust, lower, lstrip, maketrans, partition, replace, rfind, rindex, rjust, rpartition, rsplit, rstrip, split, splitlines, startswith, strip, swapcase, title, translate, upper, zfill'

## 대소문자와 관련한 메소드: `capitalize()`, `upper()`, `lower()`,  `title()`, `swapcase()`, `isupper()`, `islower()`, `istitle()`


`capitalize()` 메소드는 문자열의 첫 문자를 대문자로 변경한 새로운 문자열을 생성해준다.
대소문자가 없는 한글과 숫자로만 이루어진 문자열은 그대로 반환한다.
`swapcase()` 메소드는 대문자는 소문자로 소문자는 대문자로 변환한 문자열을 반환한다.
`upper()`, `lower()` 메소드는 문자열의 모든 문자를 대문자 또는 소문자로 변경한 새로운 문자열을 만들어 준다.
하지만 **대소문자를 구별하지 않는 문자**(한글, 숫자, 특수문자 등)는 그대로 반환한다.
`isupper()`, `islower()` 메소드는 문자열에 대소문자를 구별하는 문자가 하나 이상 있을 때 그 문자들이 전부 소문자인지 또는 전부 대문자인지 검사한 결과를 논리값으로 준다.
대소문자를 구별하는 문자가 하나도 없으면 `False`를 반환하고, 대소문자를 구별하는 문자가 하나 이상 포함되어 있으면 대소문자를 구별하지 않는 문자는 무시하고 판정한다.
`istitle()` 메소드는 문자열에서 각 단어의 첫 글자가 대문자이고 그 외는 소문자인지 검사한다. 

In [0]:
string = "python is awesome."
capitalized_string = string.capitalize()
print('Old String: ', string)
print('Capitalized String:', capitalized_string)

Old String:  python is awesome.
Capitalized String: Python is awesome.


In [0]:
book = 'introductory statistics for information age'
book = book.upper()
print(book)
book = book.lower()
print(book)
book = book.capitalize()
print(book)
book = book.title()
print(book)

INTRODUCTORY STATISTICS FOR INFORMATION AGE
introductory statistics for information age
Introductory statistics for information age
Introductory Statistics For Information Age


In [2]:
book_kr = '통계 프로그래밍 abc'
print(book_kr.title())
print(book_kr.upper())

통계 프로그래밍 Abc
통계 프로그래밍 ABC


In [0]:
print(book.isupper())
print(book.islower())
print(book.istitle())

False
False
True


### 문자열 정렬과 관련한 메소드: `center()`, `ljust()`, `rjust()`

`center()`는 지정한 길이에서 문자열이 가운데 오도록 앞 뒤에 지정한 문자를 덧붙여 주는 메소드이다.
`ljust()`는 지정한 길이에서 문자열이 왼쪽에 정렬되도록 뒤에 지정한 문자를 덧붙여 주는 메소드이다.
`rjust()`는 지정한 길이에서 문자열이 오른쪽에 정렬되도록 앞에 지정한 문자를 덧붙여 주는 메소드이다.
**앞 또는 뒤에 덧붙일 디폴트 문자는 빈 칸**이다.

In [0]:
cstring1 = string.center(50)
cstring2 = string.center(50, '*')
print("Centered String: ", cstring1)
print("Centered String: ", cstring2)

Centered String:                  python is awesome.                
Centered String:  ****************python is awesome.****************


### 특정 문자열을 제거하기 위한 메소드: `lstrip()`, `rstrip()`, `strip()`

이 메소드들은 문자열 앞과 뒤 또는 양쪽에 나타나는 특정 문자들을 제거한 새로운 문자열을 만들어 준다.
제거할 문자 여러 개를 문자열로 주면 이들 중 어떤 문자라도 나타나면 제거한다.
제거할 문자가 여러 번 나타나면 모두 제거한다.
제거할 문자를 지정하지 않으면 공백문자를 제거한다.

In [0]:
lst_string1 = cstring1.lstrip()
lst_string2 = cstring2.lstrip('*')
print(lst_string1)
print(lst_string2)

python is awesome.                
python is awesome.****************


In [0]:
st_string1 = lst_string1.rstrip()
st_string2 = lst_string2.rstrip('*')
print(st_string1)
print(st_string2)

python is awesome.
python is awesome.


In [0]:
print(cstring1.strip())
print(cstring2.strip('*'))

python is awesome.
python is awesome.


In [11]:
website = 'https://github.com/joongyang/'
print(website.lstrip('htps:/.'))

github.com/joongyang/


In [9]:
str_ws = "\n\t  \tIt\'s now or never.\n  \t  \t   \n"
print("\'", str_ws, "\'", sep="")
print("\'", str_ws.lstrip(), "\'", sep="")
print("\'", str_ws.strip(), "\'", sep="")

'
	  	It's now or never.
  	  	   
'
'It's now or never.
  	  	   
'
'It's now or never.'


### 문자열 검사를 위한 메소드: `isalpha()`, `isalnum()`, `isdecimal()`, `isdigit()`, `ismumeric()`, `isspace()`, `isprintable()`

| 메소드 | 설명|
|---------|--------|
| `isalpha()` | 문자열을 구성하는 모든 문자가 글자인지 검사한다. 한글도 글자로 보며, 빈칸과 숫자는 글자가 아니다. |
| `isalnum()` | 문자열을 구성하는 모든 문자가 글자 또는 숫자인지 검사한다. |
| `isspace()` | 문자열을 구성하는 모든 문자가 **공백문자**(white space, 빈칸, \t, \  n)인지 검사한다. |

In [0]:
string = '이건 한글 문자와 빈칸 그리고 마침표가 있는 문자열이댜.'
print(string.isalpha())
string = '이건한글문자만있는문자열이댜'
print(string.isalpha())
string = '이건한글문자와3이란숫자가있는문자열이댜'
print(string.isalpha())
print(string.isalnum())

False
True
False
True


`isdecimal()`, `isdigit()`, `isnumeric()` 메소드는 문자열의 모든 문자가 숫자이면 `True` 그렇지 않으면 `False`를 반환하는 메소드들이다.
`isdecimal()`은 `\u`로 시작하는 유니코드로 나타낸 숫자는 숫자로 취급하지 않지만 `isdigit()`와`isnumeric()`는 숫자로 취급한다.
대부분의 경우 이 세 메소드의 차이는 거의 없다.

In [0]:
height = '1234.56789'
print(height.isdecimal())
print(height.isnumeric())
print(height.isdigit())
print(height.isalnum())
height = '123456789'
print(height.isdecimal())
print(height.isnumeric())
print(height.isdigit())
print(height.isalnum())

False
False
False
False
True
True
True
True


윗 첨자 2의 유니코드는 "\u00B2"이다.

In [0]:
string = "123\u00B2456"
print(string.isdecimal())
print(string.isdigit())
print(string.isnumeric())

False
True
True


&frac12;, &frac14; 등을 나타내는 유니코드 문자가 있다.
윗첨자 2의 유니코드는 "\u00B2"이고, &frac14;의 유니코드는 "\u00BC"이다.
`isnumeric()`은 이런 유니코드도 숫자로 취급한다.

In [0]:
string = "123\u00B2456\u00BC"
print(string)
print(string.isdecimal())
print(string.isdigit())
print(string.isnumeric())

123²456¼
False
False
True


명령창에서 `charmap` 명령을 실행하면 문자표가 나타나고 여기서 각 문자에 대한 유니코드를 알 수 있다.

In [0]:
string= "\u2460\u2461\u2463"
print(string)
print(string.isdecimal())
print(string.isdigit())
print(string.isnumeric())

①②④
False
True
True


In [0]:
string = "12345①②③④⑤"
print(string)
print(string.isdecimal())
print(string.isdigit())
print(string.isnumeric())


12345①②③④⑤
False
True
True


`isdigit()` 메소드와 `isnumeric()` 메소드의 차이는 숫자로 사용하는 로마문자에 대한 처리에서 나타난다.
숫자로 사용하는 로마문자는 digit은 아니지만 numeric이다.
숫자로 사용하는 로마문자의 유니코드는 `2160`부터 `2179`까지로 Ⅰ, Ⅱ, ..., Ⅹ,ⅰ, ⅱ, ..., ⅹ이다.

In [0]:
string = "ⅠⅡⅣⅨⅩ\u2166\u2176"
print(string)
print(string.isdecimal())
print(string.isdigit())
print(string.isnumeric())

ⅠⅡⅣⅨⅩⅦⅶ
False
False
True


## 검색과 관련한 메소드: `count()`, `find()`, `rfind()`, `index()`, `rindex()`

```python
string.find(검색문자열, start=검색시작위치 end=검색종료할위치 )
string.count(검색문자열, start=검색시작위치 end=검색종료할위치)
string.index(검색문자열, start=검색시작위치 end=검색종료할위치 )
string.rfind(검색문자열, start=검색시작위치 end=검색종료할위치 )
string.rindex(검색문자열, start=검색시작위치 end=검색종료할위치 )
```

`find()`메소드는 문자열에서 `start`와 `end` 사이를 검색하여 특정 문자열이 처음으로 나타나는 위치의 인덱스를 반환한다.
만약 검색 문자열이 문자열 내에 없으면 -1을 반환한다.
검색을 시작할 위치 `start`와 종료할 위치 `end`는 인덱스로 지정하며, 만약 이들을 지정하지 않으면 처음부터 마지막까지 모두 검색한다.
`rfind()` 메소드는 검색 문자열이 마지막으로 나타나는 곳의 인덱스를 반환하며, `count()` 메소드는 검색 문자열이 나타나는 횟수를 반환하고, `index()`메소드는 `find()` 메소드와 같이 검색 문자열이 처음 나타나는 위치를 인덱스로 반환하지만 검색 문자열이 없으면 오류를 발생시킨다.
`rindex()`메소드와 `rfind()` 메소드의 관계도 이와 같다.

In [0]:
quote = 'Let it be, let it be, let it be'
key = 'let it'
idx = quote.find(key)
print(idx)
print(quote[idx:(idx+len(key))])

idx = quote.find('small')
print(idx)

key = 'be, '
if (quote.find('be,') != -1):
  print("Contains " + key)
else:
  print("Doesn't contain " + key)

11
let it
-1
Contains be, 


In [0]:
string = "Python is awesome, isn't it?"
search_string = "is"
count = string.count(search_string)
print(count)
count = string.count(search_string, 10)
print(count)

2
1


### 문자열 결합과 분리를 위한 메소드: `join()`, `split()`, `rsplit()`

```python
연결문자열.join(자료구조)
문자열.split(구분문자열)
```

`join()` 메소드는 자료구조에 저장된 문자열을 연결하여 하나의 문자열을 만들어 준다.
이때 각 문자열 사이에 구분 문자열을 삽입해준다.
`split()` 메소드는 문자열에 구분 문자열이 나타날 때마다 잘라서 만든 부분 문자열의 리스트를 반환한다.

In [0]:
news = """23일(현지 시각) 아랍에미리트(UAE) 수도 아부다비의 한 교민은
"바라카 원전에 대해서 할 말은 많은데 할 수가 없다"고 했다.
그는 "UAE 교민 대부분이 공기업인 한국전력공사가 수주한 원전과 연계된 사업을 하고 있어
대사관 눈치를 보지 않을 수 없다"면서 서둘러 전화를 끊었다.
두바이 거주 한 교민은 이날 본지 전화 통화에서
"며칠 전 교민 사회에 '기자가 UAE에 취재하러 왔으니 입조심하라'는
말이 카카오톡 등을 통해 확 퍼졌다"면서
"다른 교민에게 전화해도 별 얘기는 못 들을 것"이라고 했다.
"""
sep = '\n'
lines = news.split(sep)
print(lines)

blank = '***'
text = blank.join(lines)
print(text)

['23일(현지 시각) 아랍에미리트(UAE) 수도 아부다비의 한 교민은', '"바라카 원전에 대해서 할 말은 많은데 할 수가 없다"고 했다.', '그는 "UAE 교민 대부분이 공기업인 한국전력공사가 수주한 원전과 연계된 사업을 하고 있어', '대사관 눈치를 보지 않을 수 없다"면서 서둘러 전화를 끊었다.', '두바이 거주 한 교민은 이날 본지 전화 통화에서', '"며칠 전 교민 사회에 \'기자가 UAE에 취재하러 왔으니 입조심하라\'는', '말이 카카오톡 등을 통해 확 퍼졌다"면서', '"다른 교민에게 전화해도 별 얘기는 못 들을 것"이라고 했다.', '']
23일(현지 시각) 아랍에미리트(UAE) 수도 아부다비의 한 교민은***"바라카 원전에 대해서 할 말은 많은데 할 수가 없다"고 했다.***그는 "UAE 교민 대부분이 공기업인 한국전력공사가 수주한 원전과 연계된 사업을 하고 있어***대사관 눈치를 보지 않을 수 없다"면서 서둘러 전화를 끊었다.***두바이 거주 한 교민은 이날 본지 전화 통화에서***"며칠 전 교민 사회에 '기자가 UAE에 취재하러 왔으니 입조심하라'는***말이 카카오톡 등을 통해 확 퍼졌다"면서***"다른 교민에게 전화해도 별 얘기는 못 들을 것"이라고 했다.***


문자열을 연결하는 연산은 `+` 연산자로도 수행할 수 있다.

In [0]:
first_name = 'Charles'
last_name = "Darwin"
name = first_name + " " + last_name
print(name)

Charles Darwin


## 클립보드

프로그램 사이에 데이터를 주고 받으려면 두 프로그램이 공동으로 사용할 수 있는 메모리가 필요하다.
이런 용도로 운영체제가 제공하는 것이 **클립보드**(clipboard)이다.
한 프로그램이 데이터를 클립보드에 저장하면, 다른 프로그램이 클립보드에 저장된 데이터를 읽어가는 방법으로 두 프로그램이 통신할 수 있다.

파이썬 프로그램이 클립보드와 통신하려면 이를 지원하는 `pyperclip` 모듈을 설치해야 한다.

```python
C:\Users\joongyang> conda install -c conda-forge pyperclip
```

이 모듈에 정의된 `copy()` 함수는 클리보드에서 데이터를 읽어 올 때 사용하고, `paste()` 함수는 클립보드에 데이터를 보낼 때 사용한다.

In [0]:
import pyperclip
pyperclip.copy('여기는 파이썬, 응답하라.')
msg = pyperclip.paste()
print(msg)

여기는 파이썬, 응답하라.


## `string` 모듈

`string` 모듈에는 자주 사용하는 문자열 상수가 정의되어 있다.
다음은 이들 상수를 보여주는 예제 프로그램이다.

In [0]:
import string
print(string.ascii_lowercase)
print(string.ascii_uppercase)
print(string.ascii_letters)
print(string.digits)
print(string.hexdigits)
print(string.octdigits)
print(string.punctuation)
print(string.whitespace) # invisible
print(string.printable) # digits + ascii_letter + punctuation + whitespace

abcdefghijklmnopqrstuvwxyz
ABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
0123456789
0123456789abcdefABCDEF
01234567
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
 	

0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~ 	



## 연습문제

1. 이스케이프 시퀀스는 무엇인가?
2. 문자열에 들어 있는 \를 그대로 출력하려면 어떻게 해야 하는가?
3. 표현식` 'Hello world!'[1]`, `'Hello world!'[0:5]`, `'Hello world!'[:5]`, `'Hello world!'[3:]`의 결과는 무엇인가?
4. 표현식 `'Hello'.upper()`, `'Hello'.upper().isupper()`, `'Hello'.upper().lower()`의 결과는 무엇인가?
5. 표현식 `'Remember, remember, the fifth of November.'.split()`, `'-'.join('There can be only one.'.split())`의 결과는 무엇인가?
6. 문자열 'spam and egg'에서 'spam egg'를 만들어보시오.
7. 문자열 'first line\nsecond line\nthird line'에서 문자열 'first line:second line:third line'을 만들어보시오.
8. 문자열 'first line\nsecond line\nthird line'에서 두 번째 줄 첫 번째 단어를 추출하시오.
9. 문자열의 `replace()` 메소드에 대해서 알아보시오.
10. 문자열 'somewhere on the rainbow'에서 'somewhere over the rainbow'를 만드시오.
11. 문자열 'sometimes, I feel like a motherless child.'에서 마침표를 제거한 문자열을 구하시오.
12. 주어진 문자열에 포함된 줄바꿈문자(\n)의 개수를 구하시오.
13. 문자열 '/usr/local/bin/python/hello.py'는 리눅스 운영체제에서 `hello.py` 파일의 절대경로이다. 디렉토리에 대한 경로와 파일으로 분리해보시오.
14. `rsplit()` 메소드와 `maxsplit` 인자에 대해 알아보시오. 앞 문제를 다시 푸시오.
15. 웹 브라우저에서 신문기사 일부를 클립보드에 복사하고, 파이썬 프로그램에서 신문기사를 읽어 들여 변수 news에 저장하시오. 그리고 news에 저장된 신문기사에 \r\n이 이 있는지 검사하고 있으면 전부 \n으로  대체하시오.
16. `format()` 메소드에 대해서 알아보시오.
17. 문자열 `s="Hello World!"`에서 "!World Hello"를 만들어 보시오.
18. 웹 문서도 기본적으로 텍스트 파일이다.
다음은 `requests` 모듈을 이용해서 웹 문서를 읽어오는 예이다.
`requests` 모듈의 `get()` 함수로 웹 문서를 읽어오면 `Response` 자료형의 객체가 생성된다.
`Response` 객체의 `text` 속성에 웹 문서의 문서가 저장되어 있다.
`Response` 객체의 여러 메소드를 이용하여 웹 문서에서 필요한 정보만 추출할 수 있다. 
```python
import requets
html = requets.get('https://www.python.org/')
print(type(html))
print(html.text)
```