## 영화 데이터 API 받아오기

내가 원하는 데이터가 웹 상에 존재할 때!
1. API 형태 제공하는 경우가 있음
    -> JSON (JSON 패키지)
    -> XML (bs4 -> BeautifulSoup) : tag
2. 그냥 웹 사이트에 있을 때도 있음.
    2-1) 정적인 사이트로 주소가 내가 원하는 변경이 가능한 경우
        + 내가 원하는 정보가 주소에 반영되어 있을 때,
        (그 주소에 대한 힌트를 찾아야 함)
    2-2) 내가 원하는 정보의 사이트 주소가 없거나, 안되거나..
    -> 숨겨진 주소를 찾아내거나
    -> 동적으로 움직이는 사이트들 셀레니움
        (코드를 통해서 웹브라우저 컨트롤을 해서 정보) 속도는 많이 느림. 대신 사람인 것처럼 위장!
-> 안 되는 것도 있음.


실습 api : 영화진흥위원회 api
개인적으로 받은 key 사용 : 68195af132b8cc46b7dc02955585c26f
실습 목적 : 영화진흥위원회에 있는 정보 중 api 이용해서 최신 영화 관련 코드, 영화 제목, 영화 영문 제목, 장르, 개봉일에 대한 정보 조회

1. 내가 원하는 정보가 어디에 있는지 체크!
    -> kobis api에 있고, 영화목록조회 api페이지
2. 내가 좀 더 구체적으로 요청할 수 있는 사항들을 파악!
    -> 지금 시점의 최신의 영화목록은 맞는데 10개는 너무 작음
    -> 40개 정도 요청할 수 없을까? 메뉴얼 상 itemPerPage?
   <!-- http://kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json?key=f5eef3421c602c6cb7ea224104795888&itemPerPage=40 -->
3. 통신 관련된 묘율 http: urllib(), request(), etc...
4. 요청할 양식을 주소에 기록 : json
   -> json 패키지로 요청해서 받은 정보를 변환시켜 키/정수 인덱스로 편히 접근!
5. pandas의 DataFrame에 잘 담아 두자!


In [1]:
# 필요한 패키지들
import pandas as pd
import urllib.request #<-http통신으로 요청을 하려고 함.
import json           #<- 요청한 json 양식을 처리 편의를 위한 방법

In [3]:
# step1) 내가 필요한 정보들을 요청할 주소를 생성해야 함
# 기본 주소
url_p1 = "http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json"

# 필수 항목 
key = "68195af132b8cc46b7dc02955585c26f"

# 부가적인 요청 사항 : itemPerPage -> 개수를 40개 정도 요청
url_p2 = "40"

# -> 위의 정보들을 바탕으로 요청하는 url 완성!
url = url_p1 + "?key=" + key+ "&itemPerPage="+url_p2
url

'http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json?key=68195af132b8cc46b7dc02955585c26f&itemPerPage=40'

In [4]:
# 참고) 내가 40개 요청한다고 꼭 40개가 오는 것은 아님! 
    # -> 꼭 받은 데이터의 수 체크!

In [10]:
# step2) 완성된 주소를 바탕으로 http통신으로 요청을 하려고 함.
# == urllib, requests etc
movie_page = urllib.request.urlopen(url)
movie_data = json.loads(movie_page.read().decode("utf-8")) #파이썬에 있는 딕셔너리 형식으로 바뀜!
movie_data

{'movieListResult': {'totCnt': 100996,
  'source': '영화진흥위원회',
  'movieList': [{'movieCd': '20249554',
    'movieNm': '스픽 노 이블',
    'movieNmEn': 'Speak No Evil',
    'prdtYear': '2024',
    'openDt': '',
    'typeNm': '장편',
    'prdtStatNm': '개봉준비',
    'nationAlt': '영국,미국',
    'genreAlt': '공포(호러)',
    'repNationNm': '영국',
    'repGenreNm': '공포(호러)',
    'directors': [{'peopleNm': '제임스 왓킨스'}],
    'companys': []},
   {'movieCd': '20249519',
    'movieNm': '야소',
    'movieNmEn': 'JESUS',
    'prdtYear': '2024',
    'openDt': '',
    'typeNm': '단편',
    'prdtStatNm': '개봉예정',
    'nationAlt': '한국',
    'genreAlt': '사극,애니메이션,드라마',
    'repNationNm': '한국',
    'repGenreNm': '사극',
    'directors': [],
    'companys': []},
   {'movieCd': '20249517',
    'movieNm': '애비게일',
    'movieNmEn': 'Abigail',
    'prdtYear': '2024',
    'openDt': '',
    'typeNm': '장편',
    'prdtStatNm': '개봉예정',
    'nationAlt': '미국',
    'genreAlt': '공포(호러)',
    'repNationNm': '미국',
    'repGenreNm': '공포(호러)',
    

In [11]:
type(movie_data)

dict

In [12]:
movie_data.keys()

dict_keys(['movieListResult'])

In [None]:
#step3) 일단 받은 정보들에 대한 접근 방식 체크!
#     -> 정말로 받은 영화 정보가 40개가 맞나?

In [15]:
movie_data["movieListResult"]

{'totCnt': 100996,
 'source': '영화진흥위원회',
 'movieList': [{'movieCd': '20249554',
   'movieNm': '스픽 노 이블',
   'movieNmEn': 'Speak No Evil',
   'prdtYear': '2024',
   'openDt': '',
   'typeNm': '장편',
   'prdtStatNm': '개봉준비',
   'nationAlt': '영국,미국',
   'genreAlt': '공포(호러)',
   'repNationNm': '영국',
   'repGenreNm': '공포(호러)',
   'directors': [{'peopleNm': '제임스 왓킨스'}],
   'companys': []},
  {'movieCd': '20249519',
   'movieNm': '야소',
   'movieNmEn': 'JESUS',
   'prdtYear': '2024',
   'openDt': '',
   'typeNm': '단편',
   'prdtStatNm': '개봉예정',
   'nationAlt': '한국',
   'genreAlt': '사극,애니메이션,드라마',
   'repNationNm': '한국',
   'repGenreNm': '사극',
   'directors': [],
   'companys': []},
  {'movieCd': '20249517',
   'movieNm': '애비게일',
   'movieNmEn': 'Abigail',
   'prdtYear': '2024',
   'openDt': '',
   'typeNm': '장편',
   'prdtStatNm': '개봉예정',
   'nationAlt': '미국',
   'genreAlt': '공포(호러)',
   'repNationNm': '미국',
   'repGenreNm': '공포(호러)',
   'directors': [{'peopleNm': '맷 베티넬리-올핀'}],
   'companys': []

In [17]:
len(movie_data["movieListResult"]["movieList"]) ##정보가 다 들어온 것을 확인했음

40

In [26]:
# Q1) 본인이 요청한 결과에 대해 1번 영화에 정보를 덩어리로 출력해보세요!
movie_data["movieListResult"]["movieList"][0]

{'movieCd': '20249554',
 'movieNm': '스픽 노 이블',
 'movieNmEn': 'Speak No Evil',
 'prdtYear': '2024',
 'openDt': '',
 'typeNm': '장편',
 'prdtStatNm': '개봉준비',
 'nationAlt': '영국,미국',
 'genreAlt': '공포(호러)',
 'repNationNm': '영국',
 'repGenreNm': '공포(호러)',
 'directors': [{'peopleNm': '제임스 왓킨스'}],
 'companys': []}

In [27]:
# Q2) 1번 영화으 영화 코드값을 출력해보세요.
movie_data["movieListResult"]["movieList"][0]["movieCd"]

'20249554'

In [28]:
# Q3) 1번 영화의 영화제목을 출력해보세요!
movie_data["movieListResult"]["movieList"][0]["movieNm"]

'스픽 노 이블'

In [29]:
# Q4) 1번 영화의 영문 제목을 출력하세요.
movie_data["movieListResult"]["movieList"][0]["movieNmEn"]

'Speak No Evil'

In [34]:
# Q5) 1번 영화에 감독의 정보가 있다면 1번째 감독의 이름을 출력해보세요.
movie_data["movieListResult"]["movieList"][0]["directors"][0]["peopleNm"]

'제임스 왓킨스'

In [24]:
# 내가 요청한 결과repNationCd="+url_p3
url_p3 = "영국"
url_my = url+"&repNationCd="+url_p3
url_my

'http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json?key=68195af132b8cc46b7dc02955585c26f&itemPerPage=40&repNationCd=영국'