# 데이터 파일 불러오기 (2)

* 인제 좀 익숙하지 않은 형식의 파일도 불러와보자.
* 많은 데이터들이 정형화된 구조에서 반정형, 비정형 구조로 가고 있다. 이것 역시 익숙해질 필요가 있다.
* 여기서는 반정형 구조인 XML, JSON 형식의 파일과 데이터베이스의 파일을 불러오는 연습을 해보자

## 1. XML 파일 불러오기
- XML 파일은 계층 구조를 가진 데이터 파일 형식이다.
- 키와 값으로 구성된 트리 형태를 가지고 있다고 보면 된다.

In [1]:
# xml.etree.ElementTree를 사용하여 XML 파일 불러오기
import xml.etree.ElementTree as ET

# 예시 XML 파일 경로
xml_file_path = 'example.xml'

# XML 파일 파싱
tree = ET.parse(xml_file_path)
root = tree.getroot()

# XML 데이터 확인
for child in root:
    print(child.tag, child.attrib)

## 2. JSON 파일 불러오기
- JSON 파일은 자바스크립트 객체 표기법을 사용한 데이터 파일 형식으로, 역시 xml과 마찬가지로 트리구조이다.
- 점점 더 많은 파일들이 JSON 형식을 띄고 있다.

In [2]:
# json 모듈을 사용하여 JSON 파일 불러오기
import json

# 예시 JSON 파일 경로
json_file_path = 'example.json'

# JSON 파일 읽기
with open(json_file_path, 'r') as f:
    data_json = json.load(f)

# JSON 데이터 확인
print(json.dumps(data_json, indent=4))

## 3. SQL 데이터베이스 불러오기
SQL 데이터베이스는 관계형 데이터베이스로, `sqlite3` 모듈을 사용하여 SQL 데이터베이스에 접근할 수 있다.

In [3]:
# sqlite3 모듈을 사용하여 SQL 데이터베이스 불러오기
import sqlite3

# 예시 SQLite 데이터베이스 파일 경로
sql_file_path = 'example.db'

# SQLite 데이터베이스 연결
conn = sqlite3.connect(sql_file_path)
cursor = conn.cursor()

# 테이블 목록 확인
cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
tables = cursor.fetchall()
print("Tables: ", tables)

# 특정 테이블의 데이터 조회
table_name = 'your_table_name'
cursor.execute(f"SELECT * FROM {table_name}")
rows = cursor.fetchall()
for row in rows:
    print(row)

# 연결 종료
conn.close()

## 4. NoSQL 데이터베이스 불러오기
NoSQL 데이터베이스는 비관계형 데이터베이스로, `pymongo` 모듈을 사용하여 MongoDB에 접근할 수 있다.

In [4]:
# pymongo 모듈을 사용하여 NoSQL 데이터베이스 (MongoDB) 불러오기
import pymongo

# MongoDB에 연결
client = pymongo.MongoClient("mongodb://localhost:27017/")
db = client['your_database_name']
collection = db['your_collection_name']

# 컬렉션의 데이터 확인
for document in collection.find():
    print(document)

# 연결 종료
client.close()