In [None]:
## API ## 
# 대규모 크롤링을 하면 서버에 요청이 많아져서 느려지고, 과부하가 걸린다.(법적문제가 걸릴수도 있다.) 
# 그렇기 때문에 규모가 있는 각 회사에서 애초에 정리된 정보를 주는 기능이다.(개발자한테 사용료를 받기도 한다.)

# OpenWeatherMap의 API접속 사용
# 서울, 도쿄, 뉴욕 날씨 알아와 출력하기

In [11]:
import requests
import json

# APIKey 지정..
api_key = "ad2358b286052d56139916f91283065a"

# 날씨를 확인할 도시 지정
cities = ["Seoul,KR","Tokyo,JP","New York,US"] 
api = "http://api.openweathermap.org/data/2.5/weather?q={City}&APPID={key}"

# 켈빈 온도를 섭씨로 변환 
k2c = lambda k:k - 273.15

# 각 도시의 정보 추출 
for name in cities:

    # API요청 URL구성
    url = api.format(City=name,key=api_key)

    # API 요청
    re = requests.get(url)

    # 요청 결과를 json으로
    data = json.loads(re.text)

    # 출력 결과 보기
    print("+ 도시 = ",data['name'])
    print("| 날씨 = ",data['weather'][0]["description"]) 
    print("| 최저 기온 = ",round(k2c(data['main']["temp_min"]),1))
    print("| 최고 기온 = ",round(k2c(data['main']["temp_max"]),1)) 
    print("| 습도 = ",data['main']["humidity"])
    print("| 기압 = ",data['main']["pressure"])
    print("| 풍향 = ",data['wind']["deg"])
    print("| 풍속 = ",round(data['wind']["speed"],1)) 
    print("*"*40) 


## API 들
# https://apistore.co.kr/api/apiList.do 
# https://developers.naver.com/main/ - 네이버 개발자 센터 
# https://developers.kakao.com/ - 다음카카오 개발자 센터


+ 도시 =  Seoul
| 날씨 =  clear sky
| 최저 기온 =  18.7
| 최고 기온 =  22.7
| 습도 =  35
| 기압 =  1011
| 풍향 =  210
| 풍속 =  3.6
****************************************
+ 도시 =  Tokyo
| 날씨 =  light rain
| 최저 기온 =  13.9
| 최고 기온 =  15.8
| 습도 =  92
| 기압 =  1012
| 풍향 =  20
| 풍속 =  4.6
****************************************
+ 도시 =  New York
| 날씨 =  overcast clouds
| 최저 기온 =  15.0
| 최고 기온 =  22.3
| 습도 =  81
| 기압 =  1010
| 풍향 =  40
| 풍속 =  3.6
****************************************


In [28]:
### 다양한 데이터 형식 
# 1. XML(Extensible Markup Language)
# : 범용적 데이터 형식으로 W3c 에서 만듦
#   계층구조로 데이터를 표현할수 있다는 특징
#   기본구조 : < 요소 속성 = "속성값"> 내용 </요소>

# ex) <products type = "전자제품" > 
#       <product id = "s0001" price="450000">SD카드 128G</product>
#       <product id = "s0002" price="32000">마우스 </product>
#     </products>  

from bs4 import BeautifulSoup
import urllib.request as req
import os.path

# xml다운로드 
url = "http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnId=108" 
savename = "forecast.xml"
if not os.path.exists("data/" + savename):
    req.urlretrieve(url,"data/"+savename)

# BeautifulSoup으로 분석 
xml = open("data/"+savename,"r",encoding="utf8")
soup = BeautifulSoup(xml,"html.parser")

# 각 지역별 정보 확인
info = {} ## 지역 정보를 저장할 공간 
for location in soup.find_all("location"):
    name = location.find("city").string
    weather = location.find('wf').string

    if not (weather in info):
        info[weather] = []
    info[weather].append(name)

# 각 지역별 날씨를 구분해서 출력
for weather in info.keys():
    print("+", weather)
    for name in info[weather]:
        print("| - ",name) 


+ 구름많음
| -  서울
| -  인천
| -  수원
| -  파주
| -  이천
| -  평택
| -  춘천
| -  원주
| -  대전
| -  세종
| -  홍성
| -  청주
| -  충주
| -  영동
| -  광주
| -  목포
| -  여수
| -  순천
| -  광양
| -  나주
| -  전주
| -  군산
| -  정읍
| -  남원
| -  고창
| -  무주
| -  부산
| -  울산
| -  창원
| -  진주
| -  거창
| -  통영
| -  제주
| -  서귀포
+ 맑음
| -  강릉
| -  대구
| -  안동
| -  포항
| -  경주
| -  울진
| -  울릉도


In [None]:
### json구조 
# https://www.json.org/json-en.html 


In [None]:
### YAML 분석
# : 들여쓰기를 사용해서 계증 구조를 표현하는 것이 특징인 데이터 형식
# XML보다 간단하고, 거의 JSON과 비슷하다. 
# 파이썬에서 YAML을 다루기 위해서는 pyYAML모듈을 설치해야한다. 



In [30]:
pip install PyYAML


Collecting PyYAML
  Downloading PyYAML-6.0-cp310-cp310-macosx_11_0_arm64.whl (173 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m174.0/174.0 KB[0m [31m3.8 MB/s[0m eta [36m0:00:00[0ma [36m0:00:01[0m
[?25hInstalling collected packages: PyYAML
Successfully installed PyYAML-6.0
Note: you may need to restart the kernel to use updated packages.


In [9]:
## YAML사용하기 예제
import yaml 
# YAML 예제
yaml_str = """
Date : 2022-05-16

PriceList:
    -
        item_id: 1000
        name: Bananna
        color: yellow
        price: 1000
    -
        item_id: 1001
        name: Orange
        color: orange
        price: 1400
    -
        item_id: 1002
        name: Apple
        color: red
        price: 2000
"""
# yaml 분석
data1 = yaml.full_load(yaml_str) 
data2 = yaml.safe_load(yaml_str) ## load()는 보안상이유로 safe_load()로 불러와야한다.
data2  

# 이름 가격 출력
for item in data2['PriceList']:
    print(item['name'],item['price']) 
print(data2['Date'])

Bananna 1000
Orange 1400
Apple 2000
2022-05-16


In [18]:
import yaml
# 파이썬 데이터를 yaml데이터 출력 
customer = [
    {'name':"ByeongHak","age":"29","gender":"men"},
    {'name':"YunBeen","age":"28","gender":"women"},
    {'name':"JungKook","age":"26","gender":"men"},
    {'name':"JiMin","age":"28","gender":"men"},
]

# yaml데이터로 변환
yaml_str1 = yaml.dump(customer)
print(yaml_str1) 

# yaml데이터를 파이썬 데이터로 변환
data = yaml.safe_load(yaml_str1) 
for name in data:
    print(name['name'])


- age: '29'
  gender: men
  name: ByeongHak
- age: '28'
  gender: women
  name: YunBeen
- age: '26'
  gender: men
  name: JungKook
- age: '28'
  gender: men
  name: JiMin

ByeongHak
YunBeen
JungKook
JiMin


In [20]:
### yaml의 기본은 배열, 해시, 스칼라(문자열, 숫자, 블리언)
### 배열을 나타낼때는 각 행의 앞에 하이픈 (-)을 붙인다. 하이픈 뒤에는 공백이 필요하다.

## 배열 예시)
# - banana 
# - kiwi
# - mango 

## 중첩 배열 예시) 들여쓰기 다음에 바로 빈 요소를 사용한다. 
# - Yellow
# -
#  - Banana
#  - Orange
# - Red
# -
#  - Apple
#  - Strawberry 

## 해시표현("<키>:<값>"), 해시표현시에도 들였기를 사용하여 계층 구조를 표현 
# name: Gurum
# age: 4
# color: brown

## YAML의 주석은 "#" 

## YAM에서 여러줄 문자열을 지정하는 방법
# multi-line: |
#     I like Banana
#     I like Mango
#     I like Orange

## YAML은 앵커와 별칭 기능을 제공
# "&<이름>"형태로 변수를 선언,"*<이름>"형태로 참조 

# 색 정의
# color_define:
#     - &color1 "#FF0000"
#     - &color2 "#00FF00"
#     - &color3 "#00FFFF"

# # 색 설정
# frame_color:
#     title: *color1
#     logo: *color2
# article_color:
#     title: *color2
#     back: *color3

import yaml 

# 문자열로 yaml을 정의
yaml_str = """
color_def:
    - &color1 "#FF0000"
    - &color2 "#00FF00"
    - &color3 "#00FFFF"
color:
    title: *color1
    body: *color2
    link: *color3

"""

# Yaml 데이터로 분석
data = yaml.safe_load(yaml_str)

# 별칭 확인 테스트
print("title =",data["color"]["title"])
print("body =",data["color"]["body"])
print("link =",data["color"]["link"])



title = #FF0000
body = #00FF00
link = #00FFFF


In [34]:
### Excel 데이터 읽기

import openpyxl 

filename = "stat_100701.xlsx"
book = openpyxl.load_workbook("data/"+filename) 

# 맨 앞의 시트 추출
sheet = book.worksheets[0]

# sheet의 각행을 순서대로 추출
data = []
for row in sheet.rows:
    data.append([
        row[0].value,
        row[7].value
    ])

# 필요없는 줄(헤더, 연도, 계) 제거하기
del data[0:5]
del data[-4:]

# 인구 수대로 정렬 
data = sorted(data,key=lambda x:int(x[1].replace(',','')))
data 

# 하위 5위까지 출력
for i,a in enumerate(data):
    if(i >= 5): break
    print(i+1,a[0], int(a[1].replace(',',''))) 

1 세종 349
2 제주 670
3 울산 1140
4 광주 1488
5 대전 1500


In [None]:
# import pandas 
# data_test = pandas.read_excel("data/"+filename,"sheet0")
# data_test 


In [39]:
### excel 데이터 쓰기

import openpyxl 

# 엑셀 파일 열기
filename = "stat_100701.xlsx"
book = openpyxl.load_workbook("data/"+filename) 

# 활성화된 시트 추출
sheet = book.active                                        
print(sheet) 
# 쓰기

# for i in range(0,4):
#     total = int(sheet[str(chr(1+66))+"5"].value)    
#     seoul = int(sheet[str(chr(1+66))+"6"].value)    
#     output = total - seoul

#     print("서울 제외 인구 =",output)

#     # 쓰기
#     sheet[str(chr(i+66))+"24"] = output
#     cell = sheet[str(chr(i+66))+"24"]

#     # 폰트 색상 변경
#     cell.font = openpyxl.styles.Font(size=14,color="FF0000")
#     cell.number_format = cell.number_format

# sheet[str(chr(65))+"24"]="서울제외인구"

# # 엑셀 파일 저장하기 
# filename - "population.xlsx"
# book.save("data/"+filename) 

<Worksheet "Sheet0">
