파일 입출력의 개념

파일 입출력은 프로그램이 외부 파일과 데이터를 주고받는 과정을 말합니다.
이는 데이터를 영구적으로 저장하거나 다른 프로그램과 데이터를 공유할 때 매우 중요합
니다.


파일 입출력의 기본 단계:
1. 파일 열기
2. 파일 읽기 또는 쓰기
3. 파일 닫기

파일 열기와 닫기
파일을 열 때는 open() 함수를 사용하고, 닫을 때는 close() 메소드를 사용합니다.

# 파일 열기
file = open('example.txt', 'r') # 'r'은 읽기 모드를 의미합니다.
# 파일 작업 수행
# ...
# 파일 닫기
file.close()

주요 파일 열기 모드:
r : 읽기 모드 (기본값)
w : 쓰기 모드 (기존 내용 삭제)
a : 추가 모드 (기존 내용 끝에 추가)
r+ : 읽기와 쓰기 모드

with 문을 이용한 파일 처리
with 문은 파일을 자동으로 닫아주므로 실수로 파일을 열어둔 채로 두는 것을 방지할
수 있습니다

with 문을 사용하면 파일 사용이 끝난 후 자동으로 close() 가 호출되므로, 명시적으
로 close() 를 호출할 필요가 없습니다.


# with 문 사용 예제
with open('example.txt', 'r') as file:
 # 파일 작업 수행
 # ...
# 이 지점에서 파일은 자동으로 닫힙니다.

파일 쓰기 메소드
파일에 쓰는 주요 메소드는 다음과 같습니다:
1. write() : 문자열을 파일에 씁니다.
2. writelines() : 문자열 리스트를 파일에 씁니다.


with 문
with 문은 파일을 자동으로 닫아주므로 close() 를 명시적으로 호출할 필요가
없습니다

In [None]:
# write() 사용
with open('output.txt', 'w') as file:
    file.write('안녕하세요.\n')
    file.write('파이썬 파일 쓰기 예제입니다.')
print('파일 쓰기가 완료되었습니다.')

In [None]:
# writelines() 사용
lines = ['첫 번째 줄\n', '두 번째 줄\n', '세 번째 줄\n']
with open('output_lines.txt', 'w') as file:
    file.writelines(lines)
print('파일 쓰기가 완료되었습니다.')

이 예제에서 w 모드로 파일을 열면 기존 내용이 모두 삭제되고 새로운 내용이 쓰입니다.
기존 내용을 유지하면서 끝에 새 내용을 추가하려면 a 모드를 사용해야 합니다.


파일 읽기 메소드

파일을 읽는 주요 메소드는 다음과 같습니다:
1. read() : 파일 전체 내용을 문자열로 읽습니다.
2. readline() : 한 줄씩 읽습니다.
3. readlines() : 모든 줄을 읽어 리스트로 반환합니다.

In [None]:
# 전체 내용 읽기
with open('output.txt', 'r') as file:
  content = file.read()
print(content)

In [None]:
# 한 줄씩 읽기
with open('output_lines.txt', 'r') as file:
  while True:
    line = file.readline()
    print(line.strip())
    if not line: # 빈 문자열 반환할 경우 loop 탈출!
        break

In [None]:
# 모든 줄을 리스트로 읽기
with open('output_lines.txt', 'r') as file:
    lines = file.readlines()
for line in lines:
    print(line.strip())

데이터 분석과 인공지능에서의 활용
파일 입출력은 데이터 분석과 인공지능 분야에서 매우 중요한 역할을 합니다.
대부분의 데이터는 파일 형태로 저장되어 있으며, 이를 읽고 처리하는 것이 데이터 분석
의 첫 단계입니다

예) 텍스트 분석 및 결과 저장
이 예제에서는 collections 모듈의 Counter 와 defaultdict 를 사용하여 텍
스트를 분석하고, 그 결과를 파일로 저장한 후 다시 읽어오는 과정을 보여줍니다.
이를 통해 효율적인 텍스트 처리 방법과 파일 입출력 작업을 배울 수 있습니다.

In [None]:
from collections import Counter, defaultdict

In [None]:
# 분석할 텍스트 준비
text = '''
To be or not to be, that is the question.
Ask not what your country can do for you, ask what you can do for your country.
I have a dream that one day this nation will rise up.
'''
print(text)


In [None]:
# 단어를 소문자로 변환하고 쉼표와 마침표를 제거한 후 단어 리스트 생성
words = text.lower().replace(',', '').replace('.', '').split()
words

In [None]:
# 총 단어 수 계산
total_words = len(words)
total_words

In [None]:
# 고유 단어 수 계산
unique_words = len(set(words))
unique_words

In [None]:
# Counter를 사용한 단어 빈도수 계산
word_freq = Counter(words)
word_freq

In [None]:
# 가장 많이 사용된 단어 찾기
word_freq.most_common(1)

In [None]:
word_freq.most_common(1)[0]

In [None]:
most_common, frequency = word_freq.most_common(1)[0]
most_common, frequency

In [None]:
print(f'총 단어 수: {total_words}')
print(f'고유 단어 수: {unique_words}')
print(f'가장 많이 사용된 단어: {most_common} (빈도수: {frequency})')

In [None]:
# 분석 결과를 파일에 저장
filename = 'text_analysis_result.txt'
with open(filename, 'w') as file:
  file.write(f'총 단어 수: {total_words}\n')
  file.write(f'고유 단어 수: {unique_words}\n')
  file.write(f'가장 많이 사용된 단어: {most_common} (빈도수: {frequency})')
print(f'분석 결과가 {filename} 파일에 저장되었습니다.')

In [None]:
# 저장된 분석 결과 읽기
filename = 'text_analysis_result.txt'
with open(filename, 'r') as file:
  print(file.read())