# 텍스트 파일 쓰기(write)/읽기(read)

1. 파일 열기(open)
2. 파일 내용 쓰기(write) / 읽기(read)
3. 파일 닫기(close)

In [1]:
# open(file, mode='r', ...): 파일 열기
#  file: 디렉토리 경로를 포함한 파일 이름(str)
#  mode: r(read: 읽기), w(write: 쓰기), a(append: 추가), t(text: 텍스트), b(binary: 이진) 

# 1) 파일 열기
f = open(file='hello.txt', mode='w')   # mode = 'wt
print(f)

# 2) 파일에 내용 쓰기
f.write('Hello\n')  # '\n': 줄바꿈(new line)
f.write('안녕하세요\n') 

# 3) 파일 닫기 
f.close()

<_io.TextIOWrapper name='hello.txt' mode='w' encoding='UTF-8'>


In [2]:
/content/hello.txt

SyntaxError: ignored

In [None]:
# with ... as 구문: with 에서 open된 객체의 close() 메서드를 자동으로 호출
with open(file='test.txt', mode='wt') as f:
    f.write('파일 쓰기 테스트\n')
    f.write('오늘 수업도 이제 끝나갑니다...\n')
# 파일 쓰기가 모두 끝났을 때, f.close()를 명식적으로 호출할 필요가 없음!
# with ... as ~ 구문이 자동으로 close()를 호출해 줌

* 파일 경로(path) 
    * 상대 경로(relative path) 
        * 현재 작업 디렉토리(current working directory)에서부터 상대적으로 파일의 경로를 표시하는 방법
        * hello.txt
        * sample_data/anscombe.json
        * temp\hello.txt
    * 절대 경로(absolute path)
        * 하드 디스크 root 디렉토리에서부터 파일의 전체 경로를 표시하는 방법        
        * /content/hello.txt
        * /content/sample_data/anscomebe.json
        * C:\Users\hello.txt

In [6]:
with open(file='hello.txt', mode='rt') as f:
    # file='hello.txt': 상대 경로 
    # mode='rt': read text - open() 함수에서 mode의 기본값은 'rt' 이기 때문에 생략 가능
    line = f.readline()
    print(line) 
    line = f.readline()
    print(line)

Hello

안녕하세요



In [21]:
with open(file='hello.txt', mode='rt') as f:
    while True:  # 무한 루프 시작
    # 파일에서 한 줄(line)을 읽음
        line = f.readline()
        if line:    # 숫자 타입이 오면 0 이면 False 그 외 True, 
                    # 문자열 경우 비어 있으면 False, 한글자라도 있으면 True 
            # 읽은 내용이 있으면 출력하고, 루프를 반복
            print(line)
        else:
            # 읽은 내용이 없으면 무한 루프를 종료
            break

Hello

안녕하세요



for ... in ~ 구문에서 파일 객체 사용하기 

In [23]:
with open(file='hello.txt', mode='r') as f:
    for line in f:
        # 파일의 첫번째 줄부터 마지막 줄까지(파일 끝가지) f.readline()을 자동으로 호출
        # 파일의 끝에 도달해서 readline()이 읽은 내용이 없으면 반복을 종료 
        # print(line, end='')
        print(line.strip())

Hello
안녕하세요


## Google Drive에서 파일 쓰기/읽기

    * Colab에서 저장한 파일은 가상 머신 연결(할당)이 끊어지면 자동으로 삭제됨
    * Colab에서는 개인 계정의 Google Drive를 mount

In [24]:
dir_path = '/content/drive/MyDrive/lab_python'
file_name = 'emails.txt'
file_path = dir_path + '/' + file_name
print(file_path)
#> Linux, Unix, MacOS 에서의 절대 경로 표기법

/content/drive/MyDrive/lab_python/emails.txt


In [30]:
dir_path = 'C:\\Users\\STU\\My Documents'
file_name = 'emails.txt'
# file_path = dir_path + '/' + file_name
file_path = dir_path + '\\' + file_name
print(file_path)
#> Windows에서의 절대 경로 표기법

C:\Users\STU\My Documents\emails.txt


Windows OS와 다른 OS에서 파일 구분자(file separator)가 서로 다르기 때문에 위의
두 셀의 코드는 특정 OS에섬나 사용될 수 있는 코드 

-> 권장하지 않음 

-> OS의 종류에 상관없이 실행될 수 있는 코드를 작성하는 것이 좋음

In [31]:
import os

In [38]:
dir_path = '/content/drive/MyDrive/lab_python'
file_name = 'emails.txt'
file_path = os.path.join(dir_path, file_name)
print(file_path)

/content/drive/MyDrive/lab_python/emails.txt


In [56]:
with open(file=file_path, mode='w') as f:
    # mode='w' : write text 모드(텍스트 파일이 기본이기 때문에, mode='wt'와 동일)
    f.write('hgd@gmail.com\n')
    f.write('gildong.hong@naver.com\n')
    f.write('gildong@daum.net\n')

In [65]:
# 구글 드라이브에 저장된 emails.txt 파일을 읽기 모드로 open
# 파일의 내용을 한 줄씩 읽음
# 빈리스트에 이메일의 도메인 주소만 저장
# 리스트를 출력

print(file_path)
with open(file=file_path, mode='r') as f:
    domains = []
    for line in f:
        # print(line)  # 각 줄의 끝에는 줄바꿈('\n)이 있음
        line = line.strip()  # 문자열의 시작과 끝에 있는 공백을 제거
        # print(line)
        data = line.split(sep='@')  # 각 줄을 '@'를 구분자로 쪼갬
        # print(data)  # data: list, data[0]:id, data[1]:domain
        domains.append(data[1])

print(domains)

/content/drive/MyDrive/lab_python/emails.txt
['gmail.com', 'naver.com', 'daum.net']


In [70]:
# 짧은 코딩 버전
with open(file=file_path, mode='r') as f:
    # domains = []
    # for line in f:
    #     domains.append(line.strip().split(sep='@')[1])
    domains = [line.strip().split(sep='@')[1]
               for line in f]

print(domains)

['gmail.com', 'naver.com', 'daum.net']
