## 영화 데이터 API 받아오기

내가 원하는 데이터가 웹 상에 존재할 때!
1. API 형태 제공하는 경우가 있음
    -> JSON (JSON 패키지)
    -> XML (bs4 -> BeautifulSoup) : tag
2. 그냥 웹 사이트에 있을 때도 있음.
    2-1) 정적인 사이트로 주소가 내가 원하는 변경이 가능한 경우
        + 내가 원하는 정보가 주소에 반영되어 있을 때,
        (그 주소에 대한 힌트를 찾아야 함)
    2-2) 내가 원하는 정보의 사이트 주소가 없거나, 안되거나..
    -> 숨겨진 주소를 찾아내거나
    -> 동적으로 움직이는 사이트들 셀레니움
        (코드를 통해서 웹브라우저 컨트롤을 해서 정보) 속도는 많이 느림. 대신 사람인 것처럼 위장!
-> 안 되는 것도 있음.


실습 api : 영화진흥위원회 api
개인적으로 받은 key 사용 : 68195af132b8cc46b7dc02955585c26f
실습 목적 : 영화진흥위원회에 있는 정보 중 api 이용해서 최신 영화 관련 코드, 영화 제목, 영화 영문 제목, 장르, 개봉일에 대한 정보 조회

1. 내가 원하는 정보가 어디에 있는지 체크!
    -> kobis api에 있고, 영화목록조회 api페이지
2. 내가 좀 더 구체적으로 요청할 수 있는 사항들을 파악!
    -> 지금 시점의 최신의 영화목록은 맞는데 10개는 너무 작음
    -> 40개 정도 요청할 수 없을까? 메뉴얼 상 itemPerPage?
   <!-- http://kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json?key=f5eef3421c602c6cb7ea224104795888&itemPerPage=40 -->
3. 통신 관련된 묘율 http: urllib(), request(), etc...
4. 요청할 양식을 주소에 기록 : json
   -> json 패키지로 요청해서 받은 정보를 변환시켜 키/정수 인덱스로 편히 접근!
5. pandas의 DataFrame에 잘 담아 두자!


In [1]:
# 필요한 패키지들
import pandas as pd
import urllib.request #<-http통신으로 요청을 하려고 함.
import json           #<- 요청한 json 양식을 처리 편의를 위한 방법

In [2]:
# 메늉ㄹ 상에서 주소요청을 GET방식으로 하고 있음.
# 요청할 사항들에 대해서 주소로 직접 작성해서 요청. URL?요청할값=요청할 내용&...



# step1) 내가 필요한 정보들을 요청할 주소를 생성해야 함
# 기본 주소
url_p1 = "http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json"

# 필수 항목 
key = "68195af132b8cc46b7dc02955585c26f"

# 부가적인 요청 사항 : itemPerPage -> 개수를 40개 정도 요청
url_p2 = "40"

# -> 위의 정보들을 바탕으로 요청하는 url 완성!
url = url_p1 + "?key=" + key+ "&itemPerPage="+url_p2
url

'http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json?key=68195af132b8cc46b7dc02955585c26f&itemPerPage=40'

In [4]:
# 참고) 내가 40개 요청한다고 꼭 40개가 오는 것은 아님! 
    # -> 꼭 받은 데이터의 수 체크!

In [3]:
# ==> urllib, request etc
# 경우에 따라서 꼭 utf-8만은 아님!
# 뭔가 데이터를 x ~숫자 데이터가 있는데 문자들이 안 보일 때,
# 어떤 규약으로 문자들을 표현했는지 인코딩 확인하기


# step2) 완성된 주소를 바탕으로 http통신으로 요청을 하려고 함.
# == urllib, requests etc
movie_page = urllib.request.urlopen(url)
movie_data = json.loads(movie_page.read().decode("utf-8")) #파이썬에 있는 딕셔너리 형식으로 바뀜!
movie_data

{'movieListResult': {'totCnt': 101004,
  'source': '영화진흥위원회',
  'movieList': [{'movieCd': '20111613',
    'movieNm': '햄버거의 습격',
    'movieNmEn': 'Hambuster',
    'prdtYear': '2010',
    'openDt': '',
    'typeNm': '단편',
    'prdtStatNm': '기타',
    'nationAlt': '프랑스',
    'genreAlt': '애니메이션',
    'repNationNm': '프랑스',
    'repGenreNm': '애니메이션',
    'directors': [],
    'companys': []},
   {'movieCd': '20124724',
    'movieNm': '햄릿',
    'movieNmEn': 'Hamlet',
    'prdtYear': '1996',
    'openDt': '',
    'typeNm': '장편',
    'prdtStatNm': '기타',
    'nationAlt': '영국,미국',
    'genreAlt': '범죄,드라마,멜로/로맨스,스릴러',
    'repNationNm': '영국',
    'repGenreNm': '범죄',
    'directors': [{'peopleNm': '케네스 브래너'}],
    'companys': []},
   {'movieCd': '20141994',
    'movieNm': '햄릿',
    'movieNmEn': 'Hamlet',
    'prdtYear': '1969',
    'openDt': '',
    'typeNm': '장편',
    'prdtStatNm': '기타',
    'nationAlt': '영국',
    'genreAlt': '드라마',
    'repNationNm': '영국',
    'repGenreNm': '드라마',
    'directors': 

In [7]:
type(movie_data)

dict

In [8]:
movie_data.keys()

dict_keys(['movieListResult'])

In [9]:
#step3) 일단 받은 정보들에 대한 접근 방식 체크!
#     -> 정말로 받은 영화 정보가 40개가 맞나?

In [10]:
movie_data["movieListResult"]

{'totCnt': 100999,
 'source': '영화진흥위원회',
 'movieList': [{'movieCd': '20249593',
   'movieNm': '발정난 고향 유부녀와 MZ 남',
   'movieNmEn': '',
   'prdtYear': '2022',
   'openDt': '',
   'typeNm': '장편',
   'prdtStatNm': '기타',
   'nationAlt': '일본',
   'genreAlt': '성인물(에로)',
   'repNationNm': '일본',
   'repGenreNm': '성인물(에로)',
   'directors': [],
   'companys': []},
  {'movieCd': '20249573',
   'movieNm': '친구 엄마 빤스 벗겨 결혼까지',
   'movieNmEn': '',
   'prdtYear': '2022',
   'openDt': '',
   'typeNm': '장편',
   'prdtStatNm': '기타',
   'nationAlt': '일본',
   'genreAlt': '성인물(에로)',
   'repNationNm': '일본',
   'repGenreNm': '성인물(에로)',
   'directors': [],
   'companys': []},
  {'movieCd': '2024A905',
   'movieNm': '쓰리 와이프',
   'movieNmEn': 'Demise',
   'prdtYear': '2023',
   'openDt': '',
   'typeNm': '장편',
   'prdtStatNm': '기타',
   'nationAlt': '미국',
   'genreAlt': '드라마',
   'repNationNm': '미국',
   'repGenreNm': '드라마',
   'directors': [],
   'companys': []},
  {'movieCd': '20248222',
   'movieNm': '기동전사 건담 시드 

In [28]:
len(movie_data["movieListResult"]["movieList"]) ##정보가 다 들어온 것을 확인했음

40

In [33]:
print(movie_data["movieListResult"]["movieList"][3]["directors"][0])

{'peopleNm': '후쿠다 미츠오'}


In [36]:
for i in range(40):
    if movie_data["movieListResult"]["movieList"][i]["directors"] !=[]:
        print(movie_data["movieListResult"]["movieList"][i]["directors"][0]["peopleNm"])
    else :
        print("감독 정보 없음")

감독 정보 없음
감독 정보 없음
감독 정보 없음
후쿠다 미츠오
데이비드 에이어
야쿠와 신노스케
오인천
허명행
최정한
김세휘
제임스 왓킨스
감독 정보 없음
맷 베티넬리-올핀
감독 정보 없음
미츠나카 스스무
감독 정보 없음
신표
신표
사이러스 노라스테
키릴 세레브렌니코프
감독 정보 없음
정다운
윤철형
김진아
김한결
카를로스 라스카노
소피아 차벨라
칼 피어슨
감독 정보 없음
홍서연
패트릭 리드
블레이크 에드워즈
왕소수
감독 정보 없음
김은경
김인수
최영철 
조 다마토
마틴 룬드
팻 베두치


In [None]:
#  -> 위의 에러가 발생한 데이터에 대해서 보면서 직접 확인)


In [26]:
# Q1) 본인이 요청한 결과에 대해 1번 영화에 정보를 덩어리로 출력해보세요!
movie_data["movieListResult"]["movieList"][0]

{'movieCd': '20249554',
 'movieNm': '스픽 노 이블',
 'movieNmEn': 'Speak No Evil',
 'prdtYear': '2024',
 'openDt': '',
 'typeNm': '장편',
 'prdtStatNm': '개봉준비',
 'nationAlt': '영국,미국',
 'genreAlt': '공포(호러)',
 'repNationNm': '영국',
 'repGenreNm': '공포(호러)',
 'directors': [{'peopleNm': '제임스 왓킨스'}],
 'companys': []}

In [27]:
# Q2) 1번 영화으 영화 코드값을 출력해보세요.
movie_data["movieListResult"]["movieList"][0]["movieCd"]

'20249554'

In [28]:
# Q3) 1번 영화의 영화제목을 출력해보세요!
movie_data["movieListResult"]["movieList"][0]["movieNm"]

'스픽 노 이블'

In [29]:
# Q4) 1번 영화의 영문 제목을 출력하세요.
movie_data["movieListResult"]["movieList"][0]["movieNmEn"]

'Speak No Evil'

In [34]:
# Q5) 1번 영화에 감독의 정보가 있다면 1번째 감독의 이름을 출력해보세요.
movie_data["movieListResult"]["movieList"][0]["directors"][0]["peopleNm"]

'제임스 왓킨스'

In [24]:
# 내가 요청한 결과repNationCd="+url_p3
url_p3 = "영국"
url_my = url+"&repNationCd="+url_p3
url_my

'http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieList.json?key=68195af132b8cc46b7dc02955585c26f&itemPerPage=40&repNationCd=영국'

In [42]:
tot_cnt = len(movie_data["movieListResult"]["movieList"])

for i in range(3,tot_cnt):
    # i번째 개별 영화정보에 대한 내용
    temp = movie_data["movieListResult"]["movieList"][i]
    
    print(temp["movieCd"])
    print(temp["movieNm"])
    print(temp["movieNmEn"])
    
    if temp["openDt"] !="":
        print(temp["openDt"])
    else : 
        print("@@@개봉일 정보 없음!!!")
        
    if temp["directors"]!=[]:
        print(temp["directors"][0]["peopleNm"])
    else :
        print("@@@감독정보 없음!!!")
    print("*"*100)

20248222
기동전사 건담 시드 프리덤
Mobile Suit Gundam SEED FREEDOM
20240403
후쿠다 미츠오
****************************************************************************************************
20247780
비키퍼
The Beekeeper
20240403
데이비드 에이어
****************************************************************************************************
20248617
창가의 토토
Totto-Chan The Little Girl at the Window
@@@개봉일 정보 없음!!!
야쿠와 신노스케
****************************************************************************************************
20247784
8인의 용의자들
8 Suspects
@@@개봉일 정보 없음!!!
오인천
****************************************************************************************************
20228797
범죄도시4
THE ROUNDUP : PUNISHMENT
20240424
허명행
****************************************************************************************************
20236181
은하수
Galaxies
20240410
최정한
****************************************************************************************************
20203557
그녀가 죽었다
Following
@@@개봉일 정보 없음!!!
김세휘
**********

In [43]:
# => 개별 정보들에 대한 접근은 ok
#     이 정보들을 df에 어떻게 담아서 재가공을 할 것인가!
#     현실적으로는 list/deque +dict
#     DF으로 해도는 되나, 많이 무거워서 느림

In [4]:
# 할 일 : 위의 정보들을 df 에 담아보자! 
#     -> 방법1) list 계열을 활용(deque)


# movie_data["movieListResult"]["movieList"]
# -> type : 리스트!
# -> 우리가 필요한 정보 : 리스트의 원소
# 인덱스로 돌리지 않고 값 자체로 돌림!

tot_data=[]
for idx, data in enumerate(movie_data["movieListResult"]["movieList"]): 
    # i번째 개별 영화정보에 대한 내용
    i_CD = data["movieCd"]
    i_KN = data["movieNm"]
    i_EN = data["movieNmEn"]
    
    if data["openDt"] !="":
        i_Dt = data["openDt"]
    else : 
        i_Dt = ""
    if data["directors"]!=[]:
        i_DN = data["directors"][0]["peopleNm"]
    else :
        i_DN = ""
    
    tot_data.append([i_CD, i_KN, i_EN, i_Dt, i_DN])

tot_data

[['20111613', '햄버거의 습격', 'Hambuster', '', ''],
 ['20124724', '햄릿', 'Hamlet', '', '케네스 브래너'],
 ['20141994', '햄릿', 'Hamlet', '', '토니 리차드슨'],
 ['20060663', '핼멧', 'The Helmet', '', ''],
 ['20110405', '핵의 귀환', 'The Nuclear Comeback', '', ''],
 ['20111594', '해피버스데이', 'Happy Birthday', '', '이승민'],
 ['20128018', '해피 보기즈', 'Happy Bogeys', '', ''],
 ['20112530', '해적 소굴 잠입기', 'The Pirate Tapes', '', '록 바이즈나우쓰'],
 ['19548004', '해저 2만리', '20,000 Leagues Under the Sea', '', '리차드 플레이셔'],
 ['20110491', '해변가 욕망의 소리', 'Zyuhassaino Usugi', '', ''],
 ['20128034', '해밀턴 매트리스', 'Hamilton Mattress', '', '배리 퍼브스'],
 ['20108907', '해리의 소동', 'The Trouble With Harry', '', '알프레드 히치콕'],
 ['19768195', '해뜰날', 'The Day of Success', '', '서윤모'],
 ['20116167', '해가 지는 아침', 'Sunset in the morning', '', '조슬예'],
 ['20111366', '해 질 무렵', 'Dusk', '', '한로 스미츠만'],
 ['20111459', '항구이야기 - 파일럿 영상', 'Harbor Tale Pilot Movie', '', '이토 유이치'],
 ['20127991', '항구 이야기', 'Harbor Tale', '', '이토 유이치'],
 ['20127804', '핫 콘', 'Hot Corn', '', ''],

In [6]:
movie_df = pd.DataFrame(
    data = tot_data,
    columns = ["movieCd","movieTitle","movieETitle", "openDate","DirName" ]
)
movie_df

Unnamed: 0,movieCd,movieTitle,movieETitle,openDate,DirName
0,20111613,햄버거의 습격,Hambuster,,
1,20124724,햄릿,Hamlet,,케네스 브래너
2,20141994,햄릿,Hamlet,,토니 리차드슨
3,20060663,핼멧,The Helmet,,
4,20110405,핵의 귀환,The Nuclear Comeback,,
5,20111594,해피버스데이,Happy Birthday,,이승민
6,20128018,해피 보기즈,Happy Bogeys,,
7,20112530,해적 소굴 잠입기,The Pirate Tapes,,록 바이즈나우쓰
8,19548004,해저 2만리,"20,000 Leagues Under the Sea",,리차드 플레이셔
9,20110491,해변가 욕망의 소리,Zyuhassaino Usugi,,


In [7]:
# 할 일!
# 1. 개봉일에 대해서 년도, 월, 일 컬럼 추가!
# openDay의 컬럼의 값을 기준으로 년, 월, 일에 대한 정보

# movie_df["year"] = pd.Series([i[3][:4] for i in tot_data])

movie_df["year"] = movie_df.loc[:,"openDate"].apply(lambda x:x[:4])
movie_df["month"] = movie_df.loc[:,"openDate"].apply(lambda x:x[4:6])
movie_df["day"] = movie_df.loc[:,"openDate"].apply(lambda x:x[6:])
movie_df


Unnamed: 0,movieCd,movieTitle,movieETitle,openDate,DirName,year,month,day
0,20111613,햄버거의 습격,Hambuster,,,,,
1,20124724,햄릿,Hamlet,,케네스 브래너,,,
2,20141994,햄릿,Hamlet,,토니 리차드슨,,,
3,20060663,핼멧,The Helmet,,,,,
4,20110405,핵의 귀환,The Nuclear Comeback,,,,,
5,20111594,해피버스데이,Happy Birthday,,이승민,,,
6,20128018,해피 보기즈,Happy Bogeys,,,,,
7,20112530,해적 소굴 잠입기,The Pirate Tapes,,록 바이즈나우쓰,,,
8,19548004,해저 2만리,"20,000 Leagues Under the Sea",,리차드 플레이셔,,,
9,20110491,해변가 욕망의 소리,Zyuhassaino Usugi,,,,,


In [72]:
# 2. movieCd의 컬럼의 값이 메뉴얼상 코드값인 거 같음!
# -> 코드 값이니 40개에서 대해서 유니크한지 체크
# -> 기존의 컬럼을 가로줄 인덱스 : set_index

len(movie_df.loc[:,"movieCd"]) #단순 개수
len(movie_df.loc[:,"movieCd"].unique()) #유니크한 값 개수
len(movie_df.loc[:,"movieCd"]) ==len(movie_df.loc[:,"movieCd"].unique())

True

In [8]:
# movieCd 의 고유성이 체크가 되어서
# 영화 코드값으로 개별 영화를 접근하고 싶다!
# DF의 가로줄의 index 에 영화코드값을 내가 부여하고 싶다!

movie_df.set_index("movieCd") #인덱스화 됨.
movie_df.set_index("movieCd", inplace = True)
# -> 기존의 DF를 변경을 하는 것이기에 바로 변경 x
# -> inplace = T에서 여러번 실행하면 에러가 발생
#     이유는 이미 컬럼에서 제가 되어서 index로 보낼 수 없어서

In [83]:
movie_df

Unnamed: 0_level_0,movieTitle,movieETitle,openDate,DirName,year,month,day
movieCd,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
20249593,발정난 고향 유부녀와 MZ 남,,,,,,
20249573,친구 엄마 빤스 벗겨 결혼까지,,,,,,
2024A905,쓰리 와이프,Demise,,,,,
20248222,기동전사 건담 시드 프리덤,Mobile Suit Gundam SEED FREEDOM,20240403.0,후쿠다 미츠오,2024.0,4.0,3.0
20247780,비키퍼,The Beekeeper,20240403.0,데이비드 에이어,2024.0,4.0,3.0
20248617,창가의 토토,Totto-Chan The Little Girl at the Window,,야쿠와 신노스케,,,
20247784,8인의 용의자들,8 Suspects,,오인천,,,
20228797,범죄도시4,THE ROUNDUP : PUNISHMENT,20240424.0,허명행,2024.0,4.0,24.0
20236181,은하수,Galaxies,20240410.0,최정한,2024.0,4.0,10.0
20203557,그녀가 죽었다,Following,,김세휘,,,


In [90]:
movie_df.loc["19618009"]

movieTitle                  티파니에서 아침을
movieETitle    Breakfast at Tiffany's
openDate                             
DirName                     블레이크 에드워즈
year                                 
month                                
day                                  
Name: 19618009, dtype: object

In [115]:
# 내가 수집한 정보들을 다른 사람과 공유 & 중간 백업
# -> 파일로 저장을 하려고 함
# csv(값, 구분자) = > json {[etc]}
# excel(값, 양식/꾸밈) => xml/html tag

# 참고 : 저는 지금 colab에서 경로가 조금 달라짐
# -> 한글 데이터 같은 경우 인코딩을 신경써서 해야 함.

movie_df.to_csv("C:/Users/NT551XCJ/Documents/suyoungkim/05.DataHandling/test_movie_data_api2.csv", sep="," ,encoding="cp949")

In [116]:
# 참고: csv 파일을 df로 불러올 때
temp_df = pd.read_csv("C:/Users/NT551XCJ/Documents/suyoungkim/05.DataHandling/test_movie_data_api.csv", sep=",")
temp_df.head()

Unnamed: 0,movieCd,movieTitle,movieETitle,openDate,DirName,year,month,day
0,20249593,발정난 고향 유부녀와 MZ 남,,,,,,
1,20249573,친구 엄마 빤스 벗겨 결혼까지,,,,,,
2,2024A905,쓰리 와이프,Demise,,,,,
3,20248222,기동전사 건담 시드 프리덤,Mobile Suit Gundam SEED FREEDOM,20240403.0,후쿠다 미츠오,2024.0,4.0,3.0
4,20247780,비키퍼,The Beekeeper,20240403.0,데이비드 에이어,2024.0,4.0,3.0


## 이미 있는 정보의 새로운 컬럼 request 하기

In [None]:
목적: 

앞에서 수집한 40개의 영화 간략한 정보들에 대해서
보다 상세한 영화 정보들을 추가하려고 함.
df에서 옆으로 속성 확장(컬럼 확장)
1) 장르 (1번 장르만 하겠음. 없으면 빈 문자열)
2) 출연한 배우의 수를 기록. 없으면 0
3) 출연한 배우 중에서 1번 배우에 대한 배역 이름, 배우 

In [9]:
#  test 광해http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieInfo.xml"

# 광해 코드 : 20124079

url_base = "http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieInfo.json"

# key 는 위에 작성한 변수에서 사용
movie_code = "20124079"
url = url_base +"?key="+key + "&movieCd="+movie_code
url

'http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieInfo.json?key=68195af132b8cc46b7dc02955585c26f&movieCd=20124079'

In [10]:
# -> 위의 주소를 직접 통신으로 요청을 해야함

res = urllib.request.urlopen(url)
temp_data = json.loads(res.read().decode("utf-8"))
temp_data

{'movieInfoResult': {'movieInfo': {'movieCd': '20124079',
   'movieNm': '광해, 왕이 된 남자',
   'movieNmEn': 'Masquerade',
   'movieNmOg': '',
   'showTm': '131',
   'prdtYear': '2012',
   'openDt': '20120913',
   'prdtStatNm': '개봉',
   'typeNm': '장편',
   'nations': [{'nationNm': '한국'}],
   'genres': [{'genreNm': '사극'}, {'genreNm': '드라마'}],
   'directors': [{'peopleNm': '추창민', 'peopleNmEn': 'CHOO Chang-min'}],
   'actors': [{'peopleNm': '이병헌',
     'peopleNmEn': 'LEE Byung-hun',
     'cast': '광해/하선',
     'castEn': ''},
    {'peopleNm': '류승룡',
     'peopleNmEn': 'RYU Seung-ryong',
     'cast': '허균',
     'castEn': ''},
    {'peopleNm': '한효주',
     'peopleNmEn': 'HAN Hyo-joo',
     'cast': '중전',
     'castEn': ''},
    {'peopleNm': '장광',
     'peopleNmEn': 'JANG Kwang',
     'cast': '조내관',
     'castEn': ''},
    {'peopleNm': '김인권',
     'peopleNmEn': 'KIM In-kwon',
     'cast': '도부장',
     'castEn': ''},
    {'peopleNm': '심은경',
     'peopleNmEn': 'SHIM Eun-kyoung',
     'cast': '사월이',
     '

In [27]:
temp_data["movieInfoResult"]["movieInfo"]["genres"][0]["genreNm"]

'애니메이션'

In [None]:
# Q)  광해 영화 사세 정보들에 대해서 장르에 대한 정보를 출력하세요 genere
temp_data["movieInfoResult"]["movieInfo"]["genres"]

# Q) 출연한 배우의 수를 출력하세요.
len(temp_data["movieInfoResult"]["movieInfo"]["actors"])

# Q) 1번 배우의 이름을 출력하세요
temp_data["movieInfoResult"]["movieInfo"]["actors"][0]["peopleNm"]

# Q) 1번 배우의 배역 이름을 출력하세요.
temp_data["movieInfoResult"]["movieInfo"]["actors"][0]["cast"]

In [11]:
# 영화 부가 정보를 추가할 컬럼 생성

movie_df["Genre"] = ""
movie_df["ActNum"] = ""
movie_df["ActName"] = ""
movie_df["ActCast"] = ""
movie_df.head()

Unnamed: 0_level_0,movieTitle,movieETitle,openDate,DirName,year,month,day,Genre,ActNum,ActName,ActCast
movieCd,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
20111613,햄버거의 습격,Hambuster,,,,,,,,,
20124724,햄릿,Hamlet,,케네스 브래너,,,,,,,
20141994,햄릿,Hamlet,,토니 리차드슨,,,,,,,
20060663,핼멧,The Helmet,,,,,,,,,
20110405,핵의 귀환,The Nuclear Comeback,,,,,,,,,


In [43]:
# step1 지금 개인별로 수집한 영화 df에서 40개 정도의
# -> 이 영화들에 대해 

url_base = "http://www.kobis.or.kr/kobisopenapi/webservice/rest/movie/searchMovieInfo.json"

for i in movie_df.index:
    url = url_base +"?key="+key+"&movieCd="+i
    res = urllib.request.urlopen(url)
    temp_data = json.loads(res.read().decode("utf-8"))

    
    temp = temp_data["movieInfoResult"]["movieInfo"]

    
    if i== temp["movieCd"]:
        if temp["genres"] != []: #장르 확인
            movie_df.loc[i,"Genre"] = temp["genres"][0]["genreNm"]
        else :
            movie_df.loc[i,"Genre"] =""
        
        if temp["actors"] !=[]:        
            movie_df.loc[i,"ActName"] = temp["actors"][0]["peopleNm"]
            movie_df.loc[i,"ActNum"] = len(temp["actors"])
        
        else :
            movie_df.loc[i,"ActName"] =""
            movie_df.loc[i,"ActNum"] = 0
        
            
        if temp_data["movieInfoResult"]["movieInfo"]["actors"] !=[]:        
            movie_df.loc[i,"ActCast"] = temp_data["movieInfoResult"]["movieInfo"]["actors"][0]["cast"]
        else :
            movie_df.loc[i,"ActCast"] = ""



Unnamed: 0_level_0,movieTitle,movieETitle,openDate,DirName,year,month,day,Genre,ActNum,ActName,ActCast
movieCd,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
20111613,햄버거의 습격,Hambuster,,,,,,애니메이션,0,,
20124724,햄릿,Hamlet,,케네스 브래너,,,,범죄,2,케네스 브래너,햄릿
20141994,햄릿,Hamlet,,토니 리차드슨,,,,드라마,2,니콜 윌리엄슨,
20060663,핼멧,The Helmet,,,,,,,0,,
20110405,핵의 귀환,The Nuclear Comeback,,,,,,다큐멘터리,0,,
20111594,해피버스데이,Happy Birthday,,이승민,,,,애니메이션,0,,
20128018,해피 보기즈,Happy Bogeys,,,,,,애니메이션,0,,
20112530,해적 소굴 잠입기,The Pirate Tapes,,록 바이즈나우쓰,,,,다큐멘터리,0,,
19548004,해저 2만리,"20,000 Leagues Under the Sea",,리차드 플레이셔,,,,SF,2,커크 더글라스,
20110491,해변가 욕망의 소리,Zyuhassaino Usugi,,,,,,성인물(에로),0,,
