json 모듈: JSON 데이터 처리

json 모듈은 JSON(JavaScript Object Notation) 형식의 데이터를 처리합니다.

JSON 은 데이터를 저장하거나 전송할 때 자주 사용되는 경량의 데이터 교환 형식입니다.

In [None]:
 import json

In [None]:
data = {'name': 'Alice', 'age': 30, 'city': 'New York'}

json.dumps(obj)
데이터를 JSON 형식의 문자열로 변환합니다

In [None]:
json_string = json.dumps(data) # 딕셔너리를 JSON 문자열로 변환
json_string

In [None]:
type(json_string)

json.loads(str)
JSON 형식의 문자열을 데이터로 변환합니다.

In [None]:
decoded_data = json.loads(json_string) # JSON 문자열을 딕셔너리로 변환
decoded_data


In [None]:
type(decoded_data)


In [None]:
with open('data.json', 'w') as f: # JSON 파일 쓰기
     json.dump(data, f)

json.load(file)
JSON 파일을 읽어 데이터로 변환합니다

In [None]:
with open('data.json', 'r') as f: # JSON 파일 읽기
     loaded_data = json.load(f)

In [None]:
loaded_data

In [None]:
type(loaded_data)

여러 데이터를 JSON 파일로 저장할 수 있습니다.

In [None]:
multiple_data = [
    {'name': 'Alice', 'age': 30, 'city': 'New York'},
    {'name': 'Bob', 'age': 25, 'city': 'Los Angeles'},
    {'name': 'Charlie', 'age': 35, 'city': 'Chicago'}
]

In [None]:
with open('data.json', 'w') as f:
    json.dump(multiple_data, f)

In [None]:
with open('data.json', 'r') as f:
    loaded_data = json.load(f)

In [None]:
loaded_data

In [None]:
type(loaded_data)

collections 모듈: 특수 데이터 구조

collections 모듈은 파이썬의 일반 내장 데이터 구조( dict , list , set , tuple )
를 확장하는 특수한 데이터 구조를 제공합니다.

In [None]:
from collections import Counter, defaultdict

Counter : 반복 가능한 데이터 구조의 원소 개수를 세어 딕셔너리 형태로 저장합니다.
most_common(n) : 가장 흔한 n 개의 원소를 반환합니다.


In [None]:
words = ['apple', 'banana', 'apple', 'cherry', 'banana', 'apple']
word_counts = Counter(words)
word_counts # 단어 빈도

In [None]:
word_counts.most_common()

In [None]:
word_counts.most_common(1)


defaultdict
기본 딕셔너리와 유사하지만, 존재하지 않는 키에 접근할 때 에러 대신 기본값을 반
환합니다.
생성 시 기본값을 생성하는 함수를 인자로 받습니다. (예: list , int 등)

In [None]:
fruit_colors = defaultdict(list)
fruit_colors['apple'].append('red')
fruit_colors['apple'].append('green')
fruit_colors['banana'].append('yellow')
fruit_colors

데이터 분석과 인공지능에서의 활용
내장 모듈들은 데이터 분석과 인공지능 분야에서 다양하게 활용됩니다.
예) 텍스트 데이터 빈도 분석
이 예제는 collections 와 json 모듈을 사용하여 텍스트의 단어 빈도를 분석합
니다.
Counter 를 사용해 각 단어의 출현 빈도를 계산합니다.
결과를 json 모듈을 사용하여 JSON 파일로 저장합니다

In [None]:
from collections import Counter
import json
# 텍스트 데이터
text = '''
Python is amazing. Python is versatile. Python is used for web development,
data analysis, artificial intelligence, and more. Python is easy to learn.
'''

In [None]:
# 단어 빈도 분석
words = text.lower().split()
word_counts = Counter(words)
word_counts


In [None]:
# 가장 흔한 단어 5개 추출
top_words = word_counts.most_common(5)
top_words

In [None]:
# 결과를 JSON 파일로 저장
with open('word_frequencies.json', 'w') as f:
json.dump(dict(top_words), f)

In [None]:
with open('word_frequencies.json', 'r') as f:
loaded_words = json.load(f)

In [None]:
loaded_words