이번 유닛에서는 CSV 와 JSON 형식의 파일을 읽고 쓰는 방법에 대해 학습합니다

CSV 파일 다루기
CSV(Comma-Separated Values) 파일은 쉼표로 구분된 데이터를 저장하는 간단한 형
식입니다.
파이썬의 csv 모듈을 사용하면 이러한 파일을 쉽게 다룰 수 있습니다.

In [None]:
import csv

In [None]:
data = [
    ['Name', 'Age', 'City'],
    ['Alice', 25, 'New York'],
    ['Bob', 30, 'San Francisco'],
    ['Charlie', 35, 'London']
]
data

newline = '' 파라미터
CSV 파일을 쓸 때 newline = '' 를 사용하는 이유는 운영 체제 간의 줄 바꿈 문
자 차이를 방지하기 위해서입니다.
newline = '' 를 설정하면 파이썬이 자동으로 적절한 줄 바꿈 문자를 사용하여
CSV 파일을 올바르게 작성합니다.


In [None]:
with open('people.csv', 'w', newline = '') as file:
    writer = csv.writer(file)
    writer.writerows(data)
print('CSV 파일이 생성되었습니다.')

In [None]:
with open('people.csv', 'r') as file:
  reader = csv.reader(file)
  for row in reader:
    print(row)

JSON 파일 다루기
JSON(JavaScript Object Notation) 은 데이터를 구조화된 형식으로 저장하는 데
사용되는 경량 데이터 교환 형식입니다.
파이썬의 json 모듈을 사용하여 JSON 파일을 쉽게 다룰 수 있습니다.

In [None]:
import json

In [None]:
data = {
    'name': 'Alice',
    'age': 25,
    'city': 'New York',
    'hobbies': ['reading', 'hiking', 'cooking']
}
data

In [None]:
with open('person.json', 'w') as file:
    json.dump(data, file)
print('JSON 파일이 생성되었습니다.')

json.load() 함수는 JSON 데이터를 파이썬의 해당 데이터 타입(딕셔너리, 리스트,
문자열, 숫자 등)으로 자동 변환합니다.

In [None]:
with open('person.json', 'r') as file:
    loaded_data = json.load(file)
loaded_data

In [None]:
data == loaded_data

데이터 분석과 인공지능에서의 활용
이러한 파일 처리 기술은 데이터 분석과 인공지능 프로젝트에서 다양하게 활용될 수 있
습니다.

예) 텍스트 감정 분석
이 예제는 실제 자연어 처리와 감정 분석의 매우 기초적인 형태를 보여줍니다.

실제 데이터 분석과 인공지능 분야에서는 이보다 훨씬 복잡하고 정교한 방법을 사용
하지만, 이 예제를 통해 기본적인 개념을 이해할 수 있습니다.

In [None]:
# 텍스트 파일 생성
sentences = [
    'I love this beautiful day',
    'The movie was terrible and boring',
    'I feel happy and excited about the party',
    'This is a sad and disappointing news',
    'The food at the restaurant was delicious'
]
sentences

In [None]:
# 문장 저장
with open('sentences.txt', 'w') as file:
  for sentence in sentences:
    file.write(sentence + '\n')
print('문장들이 sentences.txt 파일에 저장되었습니다.')

In [None]:
# 텍스트 파일 읽기
with open('sentences.txt', 'r') as file:
    loaded_sentences = file.readlines()
loaded_sentence

In [None]:
# 줄바꿈 문자 제거
loaded_sentences = [sentence.rstrip() for sentence in loaded_sentences]
loaded_sentences

In [None]:
sentences == loaded_sentences

In [None]:
# 간단한 감정 분석
positive_words = ['love', 'beautiful', 'happy', 'excited', 'delicious']
negative_words = ['terrible', 'boring', 'sad', 'disappointing']
for sentence in loaded_sentences:
    words = sentence.lower().split()
    positive_score = sum(word in positive_words for word in words)
    negative_score = sum(word in negative_words for word in words)
    if positive_score > negative_score:
    sentiment = '긍정적'
    elif negative_score > positive_score:
    sentiment = '부정적'
    else:
    sentiment = '중립적'
    print(f'문장: {sentence}')
    print(f'감정: {sentiment}')
    print(f'긍정 점수: {positive_score}, 부정 점수: {negative_score}')
    print()