### 1. 파이썬 문자열은 유니코드
파이썬 3부터 유니코드 규약에 따른다.

#### 1-1. 파이썬 내장함수 
- ord() : 해당 문자에 대응하는 유니코드 숫자를 반환합니다.
- chr() : 해당 유니코드 숫자에 대응하는 문자를 반환합니다.

#### 1-2. 이스케이프 문자
- $\'$ : 홑따옴표 '
- $\"$ : 겹따옴표 "
- \t : 탭
- \n : 줄바꿈
- \\ : 백슬래시 \


**원시 문자열**
- 이스케이프 문자 무시하고 싶을 때: r'문자열'

In [1]:
#- 예제 코드2
print('Please don\'t touch it')
print(r'Please don\'t touch it')

Please don't touch it
Please don\'t touch it


#### 1-3. startswith, endswith

In [2]:
EmployeeID = ['OB94382', 'OW34723', 'OB32308', 'OB83461', 
                                  'OB74830', 'OW37402', 'OW11235', 'OB82345'] 
Production_Employee = [P for P in EmployeeID if P.startswith('OB')]   # 'OB'로 시작하는 직원 ID를 다 찾아봅니다
Production_Employee

['OB94382', 'OB32308', 'OB83461', 'OB74830', 'OB82345']

In [3]:
import os
image_dir_path = os.getenv("HOME") + "/Pictures"   
#- 각자의 사진이 보관된 디렉토리를 골라 주세요.
photo = os.listdir(image_dir_path )
png = [png for png in photo if png.endswith('.png')]
print(png)

['스크린샷, 2020-07-31 16-06-51.png', '스크린샷, 2020-07-31 16-01-32.png', '스크린샷, 2020-07-31 15-55-33.png', '스크린샷, 2020-07-31 16-10-00.png', '스크린샷, 2020-07-31 16-15-42.png', '스크린샷, 2020-07-31 16-06-28.png', '스크린샷, 2020-07-31 16-07-06.png', '스크린샷, 2020-07-24 09-58-26.png', '스크린샷, 2020-07-31 16-07-00.png', '스크린샷, 2020-07-27 15-44-57.png', '스크린샷, 2020-07-29 17-37-25.png']


#### 1-4. 공백 문자 처리: trimming
- $\r$ : 커서를 맨 앞으로 이동시키는 것

In [4]:
print("사회적 거리두기")
print('--------------------------')
print("사회적\t거리두기")
print('--------------------------')
print("사회적\n거리두기")
print('--------------------------')
print("사회적\r거리두기")

사회적 거리두기
--------------------------
사회적	거리두기
--------------------------
사회적
거리두기
--------------------------
사회적거리두기


#### 1-5. 공백 문자 제거

In [5]:
#txt = "      공백 문자를 제거해 보아요.      "
txt = "      Strip white spaces.      "
print('[{}]'.format(txt))
print('--------------------------')

#- 양쪽 공백 제거 : strip()
print('[{}]'.format(txt.strip()))
print('--------------------------')

#- 왼쪽 공백 제거 : lstrip()
print('[{}]'.format(txt.lstrip()))
print('--------------------------')

#- 오른쪽 공백 제거 : rstrip()
print('[{}]'.format(txt.rstrip()))

[      Strip white spaces.      ]
--------------------------
[Strip white spaces.]
--------------------------
[Strip white spaces.      ]
--------------------------
[      Strip white spaces.]


#### 1-6. 대소문자
- upper() : 모든 문자를 대문자로 변환합니다.
- lower() : 모든 문자를 소문자로 변환합니다.
- capitalize() : 첫 글자만 대문자로 변환합니다.

#### 1-7. isX
- isupper() : 문자열이 모두 대문자로만 되어 있으면 True, 그렇지 않으면 False를 반환
- islower() : 문자열이 모두 소문자로만 되어 있으면 True, 그렇지 않으면 False를 반환
- istitle(): 문자열의 첫 글자만 대문자로 되어 있으면 True, 그렇지 않으면 False를 반환
- isalpha(): 문자열이 모두 알파벳 문자로만 되어 있으면 True, 그렇지 않으면 False를 반환
- isalnum(): 문자열이 모두 알파벳 문자와 숫자로만 되어 있으면 True, 그렇지 않으면 False를 반환
- isdecimal(): 문자열이 모두 숫자로만 되어 있으면 True, 그렇지 않으면 False를 반환

#### 1-8. join() & split()
- join()은 인자로 반복가능한 객체 받는 메소드. 각각의 원소를 모아 하나의 문자열로 합쳐준다.

In [7]:
#- join()
stages = ['fundamentals', 'exploration', 'goingdeeper']
",".join(stages)

'fundamentals,exploration,goingdeeper'

- split()은 하나의 문자열을 구분자를 기준으로 나눈다. split()은 리스트를 반환하고 joint()은 문자열 반환

In [9]:
#- split()
'fundamentals,exploration,goingdeeper'.split(',')

['fundamentals', 'exploration', 'goingdeeper']

### 2. 정규표현식
- 텍스트 데이터를 문자열로 저장
- 찾고자 하는 문자열 패턴을 정의하고 기존 문자열과 일치하는지를 비교

In [10]:
import re
sent = 'I can do it!'
pattern = re.sub("I", "You", sent)
pattern

'You can do it!'

#### 2-1. Compile()
정규 표현식:

1) 찾고자 하는 문자열의 패턴을 정의 - 컴파일

2) 정의된 패턴과 매칭되는 경우를 찾아 다양한 처리

In [11]:
#1단계 :  "the"라는 패턴을 컴파일한 후 패턴 객체를 리턴합니다.
pattern = re.compile("the")    

# 2단계 : 컴파일된 패턴 객체를 활용하여 다른 텍스트에서 검색을 수행합니다.
pattern.findall('of the people, for the people, by the people')

['the', 'the', 'the']

#### 2-2. 메소드
- search() : 일치하는 패턴 찾기 * 일치 패턴이 있으면 MatchObject를 반환합니다.
- match() : search()와 비슷하지만, 패턴이 검색대상에 처음부터 일치해야 합니다.
- findall() : 일치하는 모든 패턴 찾기 * 모든 일치 패턴을 리스트에 담아서 반환합니다.
- split() : 패턴으로 나누기
- sub() : 일치하는 패턴으로 대체하기
- group() : 실제 결과에 해당하는 문자열을 반환합니다.

In [15]:
src = "My name is..."
regex = re.match("My", src)
if regex:
    print(regex.group())
else:
    print("No!")

My


#### 2-3. 패턴

- $[ ]$ : 문자
- $-$ : 범위
- . : 하나의 문자
- ? : 0회 또는 1회 반복
- * : 0회 이상 반복
- + : 1회 이상 반복
- {m, n} : m ~ n
- \d : 숫자
- \D : 비숫자
- \w : 알파벳 문자
- \W : 비알파벳 문자
- \s : 공백 문자
- \S : 비공백 문자
- \b : 단어 경계
- \B : 비 단어 경계

### 3. 파일
#### 3-1. write & read

In [17]:
# write

f = open("hello.txt","w") 
#- open(파일명, 파일모드)
#- 파일을 열고 파일 객체를 반환합니다. 
for i in range(10):
    f.write("안녕")
    #- write() 메소드로 '안녕'을 10번 씁니다.
f.close()
#- 작업이 끝나면 close() 메소드로 닫아줍니다. *필수!

In [19]:
# read

with open("hello.txt", "r") as f:   # with를 통해 open된 객체는 with문이 종료될 때 자동으로 close
  print(f.read())

안녕안녕안녕안녕안녕안녕안녕안녕안녕안녕


#### 3-2. 파일 관련 메소드
f.read() : 파일을 읽는다.
    
f.readline() : 파일을 한 줄씩 읽는다.
    
f.readlines() : 파일 안의 모든 줄을 읽어 그 값을 리스트로 반환한다.
    
f.write(str) : 파일에 쓴다. 문자열 타입을 인자로 받는다.
    
f.writelines(str) : 파일에 인자를 한 줄씩 쓴다.
    
f.close() : 파일을 닫는다.
    
f.seek(offset) : 새 파일의 위치를 찾는다.

### 4. 모듈, 패키지

In [21]:
#- 현재 실행되고 있는 파이썬 실행 파일의 디렉토리를 반환합니다.
import sys
sys.executable

'/home/aiffel0047/anaconda3/envs/aiffel/bin/python'

In [22]:
#- 임포트할 때 불러 오는 모듈들이 위치한 경로입니다.
sys.path

['/home/aiffel0047/workplace/aiffel/Fundamentals',
 '/home/aiffel0047/anaconda3/envs/aiffel/lib/python37.zip',
 '/home/aiffel0047/anaconda3/envs/aiffel/lib/python3.7',
 '/home/aiffel0047/anaconda3/envs/aiffel/lib/python3.7/lib-dynload',
 '',
 '/home/aiffel0047/anaconda3/envs/aiffel/lib/python3.7/site-packages',
 '/home/aiffel0047/anaconda3/envs/aiffel/lib/python3.7/site-packages/IPython/extensions',
 '/home/aiffel0047/.ipython']