## 1. mongodb 문법 실습

* cine21 배우 랭킹 사이트 크롤링
  - 사이트 주소: http://www.cine21.com/rank/person/
  - 요청 방식 확인 방법: 크롬 개발자 모드로 들어가서, Network -> content 페이지의 요청 방식 확인
    - Request URL: http://www.cine21.com/rank/person/content
    - Request Method: POST
    - Form data
      - section = 'actor'
      - period_start = '2018-08'
      - gender = 'all'
      - page = 3 

#### 배우 랭킹 및 상세 정보 크롤링 및 mongodb 저장 (full source)

In [None]:
from bs4 import BeautifulSoup
import requests
import pymongo
import re

conn = pymongo.MongoClient()
actor_db = conn.cine21
actor_collection = actor_db.actor_collection

actors_info_list = list()

cine21_url = 'http://www.cine21.com/rank/person/content'
post_data = dict()
post_data['section'] = 'actor'
post_data['period_start'] = '2018-08'
post_data['gender'] = 'all'

for index in range(1, 21):
    post_data['page'] = index

    res = requests.post(cine21_url, data=post_data)
    soup = BeautifulSoup(res.content, 'html.parser')

    actors = soup.select('li.people_li div.name')
    hits = soup.select('ul.num_info > li > strong')
    movies = soup.select('ul.mov_list')
    rankings = soup.select('li.people_li > span.grade')
    
    for index, actor in enumerate(actors):
        actor_name = re.sub('\(\w*\)', '', actor.text)
        actor_hits = int(hits[index].text.replace(',', ''))
        movie_titles = movies[index].select('li a span')
        movie_title_list = list()
        for movie_title in movie_titles:
            movie_title_list.append(movie_title.text)
        actor_info_dict = dict()
        actor_info_dict['배우이름'] = actor_name
        actor_info_dict['흥행지수'] = actor_hits
        actor_info_dict['출연영화'] = movie_title_list
        actor_info_dict['랭킹'] = rankings[index].text

        actor_link = 'http://www.cine21.com' + actor.select_one('a').attrs['href']
        response_actor = requests.get(actor_link)
        soup_actor = BeautifulSoup(response_actor.content, 'html.parser')
        default_info = soup_actor.select_one('ul.default_info')
        actor_details = default_info.select('li')

        for actor_item in actor_details:
            actor_item_field = actor_item.select_one('span.tit').text
            actor_item_value = re.sub('<span.*?>.*?</span>', '', str(actor_item))
            actor_item_value = re.sub('<.*?>', '', actor_item_value)
            actor_info_dict[actor_item_field] = actor_item_value
        actors_info_list.append(actor_info_dict)
        
actor_collection.insert_many(actors_info_list)

#### mongodb 접속 기본 코드

In [3]:
from bs4 import BeautifulSoup
import requests
import pymongo
import re

conn = pymongo.MongoClient()
actor_db = conn.cine21
actor_collection = actor_db.actor_collection

actor_collection.find_one({})
docs = actor_collection.find({}).limit(3)
for doc in docs:
    print (doc)
actor = actor_collection

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d1b'), '직업': '배우', '성별': '남', '홈페이지': '\nhttp://www.artistcompany.co.kr/portfolio-item/lee-jung-jae/\n', '소속사': '아티스트컴퍼니', '배우이름': '이정재', '흥행지수': 52049, '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들'], '랭킹': 2}
{'_id': ObjectId('6019112ffd9a8148c2183d1c'), '다른 이름': '엄홍식', '직업': '배우', '생년월일': '1986-10-06', '성별': '남', '홈페이지': '\nhttps://www.instagram.com/hongsick/\nhttps://twitter.com/seeksik\n', '신장/체중': '178cm, 60kg', '학교': '단국대학교 연극', '취미': '피아노 연주, 인터넷 게임, 영화, 음악감상', '특기': '스노우보드, 수영', '배우이름': '유아인', '흥행지수': 42530, '출연영화': ['#살아있다', '소리도 없이', '버닝', '사도'], '랭킹': 3}


### 1.1. 컬럼명 변경 
* 저장되 있는 mongodb 데이터의 컬럼명을 변경하는 방법
* update_one()/update_many() 함수 활용

In [5]:
actor_collection.update_many ({}, { '$rename': {'다른 이름': '다른이름'} })

<pymongo.results.UpdateResult at 0x7fe9895f3fc0>

In [6]:
docs = actor_collection.find({}).limit(3)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d1b'), '직업': '배우', '성별': '남', '홈페이지': '\nhttp://www.artistcompany.co.kr/portfolio-item/lee-jung-jae/\n', '소속사': '아티스트컴퍼니', '배우이름': '이정재', '흥행지수': 52049, '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들'], '랭킹': 2}
{'_id': ObjectId('6019112ffd9a8148c2183d1c'), '직업': '배우', '생년월일': '1986-10-06', '성별': '남', '홈페이지': '\nhttps://www.instagram.com/hongsick/\nhttps://twitter.com/seeksik\n', '신장/체중': '178cm, 60kg', '학교': '단국대학교 연극', '취미': '피아노 연주, 인터넷 게임, 영화, 음악감상', '특기': '스노우보드, 수영', '배우이름': '유아인', '흥행지수': 42530, '출연영화': ['#살아있다', '소리도 없이', '버닝', '사도'], '랭킹': 3, '다른이름': '엄홍식'}


#### 참고: collection 변수명 변경

In [7]:
actor = actor_collection

### 1.2 find의 다양한 문법 - sort

In [11]:
docs = actor_collection.find({}).sort('생년월일', pymongo.DESCENDING).limit(10)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d3e'), '직업': '배우', '생년월일': '2012-03-12', '성별': '여', '배우이름': '박소이', '흥행지수': 6047, '출연영화': ['담보', '호텔 레이크'], '랭킹': 37}
{'_id': ObjectId('6019112ffd9a8148c2183d98'), '직업': '배우', '생년월일': '2011-11-08', '성별': '남', '배우이름': '정현준', '흥행지수': 1285, '출연영화': ['기생충', '이웃사촌'], '랭킹': 127}
{'_id': ObjectId('6019112ffd9a8148c218412c'), '직업': '배우', '생년월일': '2011-10-11', '성별': '여', '배우이름': '주예림', '흥행지수': 1, '출연영화': ['우리집'], '랭킹': 1043}
{'_id': ObjectId('6019112ffd9a8148c218412f'), '직업': '배우', '생년월일': '2011-10-11', '성별': '여', '배우이름': '주예림', '흥행지수': 1, '출연영화': ['우리집'], '랭킹': 1046}
{'_id': ObjectId('6019112ffd9a8148c2183e69'), '직업': '배우', '생년월일': '2011-02-21', '성별': '남', '배우이름': '이린하', '흥행지수': 81, '출연영화': ['나는보리'], '랭킹': 336}
{'_id': ObjectId('6019112ffd9a8148c2183eec'), '직업': '배우', '생년월일': '2010-10-01', '성별': '여', '배우이름': '김보민', '흥행지수': 24, '출연영화': ['담쟁이', '생일'], '랭킹': 467}
{'_id': ObjectId('6019112ffd9a8148c2183da9'), '직업': '배우', '생년월일': '2010-09-29', '성별': '남', '배우이름'

### 1.3 find의 다양한 문법 - exists

In [14]:
docs = actor.find({'특기': {'$exists':True}}).sort('흥행지수').limit(5)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c218421b'), '직업': '배우', '생년월일': '1974-04-05', '성별': '남', '홈페이지': '\nhttps://twitter.com/zhao74\nhttps://instagram.com/taewoong74\n', '신장/체중': '181cm, 70kg', '학교': '국민대학교 공연예술학부 재학', '취미': '여행, 드라이브', '특기': '수영, 스킨스쿠버, 승마', '소속사': '키이스트', '배우이름': '엄태웅', '흥행지수': 0, '출연영화': ['건축학개론', '시라노; 연애조작단'], '랭킹': 1282}
{'_id': ObjectId('6019112ffd9a8148c218423c'), '직업': '배우', '생년월일': '1957-10-01', '성별': '남', '홈페이지': '\nhttps://instagram.com/river_stone_rain/\n', '신장/체중': '176cm, 75kg', '학교': '동국대학교 연극영화학', '취미': '음악감상', '특기': '축구', '배우이름': '강석우', '흥행지수': 0, '출연영화': ['장마'], '랭킹': 1315, '다른이름': '강만홍'}
{'_id': ObjectId('6019112ffd9a8148c2184233'), '직업': '배우', '생년월일': '1944-06-10', '성별': '남', '신장/체중': '176cm, 82kg', '학교': '명지대학교 영문학', '취미': '낚시,골프', '특기': '다이빙', '배우이름': '백일섭', '흥행지수': 0, '출연영화': ['별들의 고향', '삼포가는 길'], '랭킹': 1306}
{'_id': ObjectId('6019112ffd9a8148c21841ee'), '직업': '가수', '생년월일': '1987-02-24', '성별': '남', '신장/체중': '181cm, 65kg', '학교': '백제예술대학 실용음악과', '취미'

<div class="alert alert-block alert-warning">
<font color="blue" size="4em">실습</font><br>
생년월일이 없는 doc의 actor_name 만 출력하기
</div>

In [26]:
docs = actor.find({'생년월일': {'$exists':False}}, {'배우이름':1, '_id':0})
for doc in docs:
    print (doc)

{'배우이름': '이정재'}
{'배우이름': '정우성'}
{'배우이름': '고아성'}
{'배우이름': '이솜'}
{'배우이름': '장동주'}
{'배우이름': '신정근'}
{'배우이름': '염정아'}
{'배우이름': '정만식'}
{'배우이름': '김소진'}
{'배우이름': '배성우'}
{'배우이름': '문승아'}
{'배우이름': '오혜원'}
{'배우이름': '이유영'}
{'배우이름': '한이진'}
{'배우이름': '신용우'}
{'배우이름': '이진주'}
{'배우이름': '남도형'}
{'배우이름': '문남숙'}
{'배우이름': '김경희'}
{'배우이름': '장민혁'}
{'배우이름': '조현정'}
{'배우이름': '이소영'}
{'배우이름': '최승훈'}
{'배우이름': '홍진욱'}
{'배우이름': '이중옥'}
{'배우이름': '조경이'}
{'배우이름': '전태열'}
{'배우이름': '소연'}
{'배우이름': '강시현'}
{'배우이름': '양흥주'}
{'배우이름': '이봉근'}
{'배우이름': '이창민'}
{'배우이름': '정무성'}
{'배우이름': '김서영'}
{'배우이름': '김은아'}
{'배우이름': '이용규'}
{'배우이름': '김순규'}
{'배우이름': '박현영'}
{'배우이름': '정재헌'}
{'배우이름': '하성용'}
{'배우이름': '이봉련'}
{'배우이름': '정유정'}
{'배우이름': '오인실'}
{'배우이름': '김현수'}
{'배우이름': '최정운'}
{'배우이름': '김율'}
{'배우이름': '김의성'}
{'배우이름': '김정은'}
{'배우이름': '김유림'}
{'배우이름': '배상우'}
{'배우이름': '허성재'}
{'배우이름': '박리나'}
{'배우이름': '이명호'}
{'배우이름': '김하연'}
{'배우이름': '문창길'}
{'배우이름': '강은애'}
{'배우이름': '박승준'}
{'배우이름': '이지예'}
{'배우이름': '박윤진'}
{'배우이름': '한경화'}
{'배우이름': '박재한'}
{'배우이름': '박영재'}
{'배우이름': '김

### 1.4 find의 다양한 문법 - 필드값 범위로 검색

In [33]:
docs = actor.find({'흥행지수': {'$gte': 10000}, '출연영화':'신세계'}, {'배우이름':1, '출연영화':1, '_id':0}).sort('배우이름').limit(3)
for doc in docs:
    print(doc)

{'배우이름': '박성웅', '출연영화': ['오케이 마담', '신세계', '하이힐']}
{'배우이름': '이정재', '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들']}
{'배우이름': '황정민', '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라']}


### find의 다양한 문법 - or

In [37]:
docs = actor.find({'$or': [{'출연영화':'신세계'}, {'출연영화':'반도'}] }, {'배우이름':1, '출연영화':1, '_id':0})
for doc in docs:
    print(doc)

{'배우이름': '황정민', '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라']}
{'배우이름': '이정재', '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들']}
{'배우이름': '강동원', '출연영화': ['반도', '1987']}
{'배우이름': '이정현', '출연영화': ['죽지않는 인간들의 밤', '반도', '명량']}
{'배우이름': '이레', '출연영화': ['너의 이름은.', '반도', '소원', '개를 훔치는 완벽한 방법', '증인']}
{'배우이름': '권해효', '출연영화': ['도망친 여자', '후쿠오카', '반도', '사이비', '메기', '배심원들']}
{'배우이름': '구교환', '출연영화': ['메기', '반도']}
{'배우이름': '박성웅', '출연영화': ['오케이 마담', '신세계', '하이힐']}
{'배우이름': '김민재', '출연영화': ['국제시장', '반도', '비밀은 없다', '뷰티 인사이드']}
{'배우이름': '김도윤', '출연영화': ['럭키 몬스터 ', '반도']}
{'배우이름': '송지효', '출연영화': ['신세계', '침입자']}
{'배우이름': '장광', '출연영화': ['강철비2: 정상회담', '가나의 혼인잔치: 언약', '매지컬 : 공주를 웃겨라', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연']}
{'배우이름': '최민식', '출연영화': ['천문: 하늘에 묻는다', '신세계', '올드보이', '범죄와의 전쟁 : 나쁜 놈들 전성시대', '친절한 금자씨', '명량']}
{'배우이름': '김홍파', '출연영화': ['천문: 하늘에 묻는다', '신세계', '배심원들', '내부자들']}
{'배우이름': '이경영', '출연영화': ['백두산', '신세계', '신과 함께-죄와 벌', '블랙머니', '불한당: 나쁜 놈들의 세상', '부러진 화살']}
{'배우이름': '류승범'

In [52]:
docs = actor.find({ '흥행지수': {'$gte': 10000}, '$or': [{'출연영화':'신세계'}, {'출연영화':'반도'}] }, {'배우이름':1, '출연영화':1, '_id':0})
for doc in docs:
    print(doc)

{'배우이름': '황정민', '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라']}
{'배우이름': '이정재', '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들']}
{'배우이름': '강동원', '출연영화': ['반도', '1987']}
{'배우이름': '이정현', '출연영화': ['죽지않는 인간들의 밤', '반도', '명량']}
{'배우이름': '이레', '출연영화': ['너의 이름은.', '반도', '소원', '개를 훔치는 완벽한 방법', '증인']}
{'배우이름': '권해효', '출연영화': ['도망친 여자', '후쿠오카', '반도', '사이비', '메기', '배심원들']}
{'배우이름': '구교환', '출연영화': ['메기', '반도']}
{'배우이름': '박성웅', '출연영화': ['오케이 마담', '신세계', '하이힐']}
{'배우이름': '김민재', '출연영화': ['국제시장', '반도', '비밀은 없다', '뷰티 인사이드']}


### find의 다양한 문법 - nor
* not or

In [40]:
docs = actor.find({'$nor': [{'흥행지수': { '$gte': 10000}}, {'흥행지수': { '$lte': 2000}}]}, {'배우이름':1, '흥행지수':1, '_id':0}).limit(3)
for doc in docs:
    print (doc)

{'배우이름': '정우성', '흥행지수': 9796}
{'배우이름': '이상윤', '흥행지수': 8796}
{'배우이름': '라미란', '흥행지수': 8317}


### find의 다양한 문법 - in, nin
* in: 들어가 있다.
* nin: not in - 들어가 있지 않다.

In [44]:
docs = actor.find({'흥행지수': { '$in': [9796, 8317]}}, {'배우이름':1, '흥행지수':1, '_id':0})
for doc in docs:
    print (doc)

{'배우이름': '정우성', '흥행지수': 9796}
{'배우이름': '라미란', '흥행지수': 8317}


In [45]:
docs = actor.find({'흥행지수': { '$nin': [9796, 8317]}}, {'배우이름':1, '흥행지수':1, '_id':0}).limit(3)
for doc in docs:
    print (doc)

{'배우이름': '황정민', '흥행지수': 78066}
{'배우이름': '이정재', '흥행지수': 52049}
{'배우이름': '유아인', '흥행지수': 42530}


<div class="alert alert-block alert-warning">
<font color="blue" size="4em">실습</font><br>
흥행지수 가 9796, 8317이 아니고, 10000 이하인 데이터를 3개만 검색하세요. (nor, in, gt 활용, 배우이름과 흥행지수만 출력)
</div>

In [51]:
docs = actor.find({ '$nor': [{'흥행지수': { '$in': [9796, 8317] } }, {'흥행지수': {'$gt': 10000} }] }, {'배우이름': 1, '흥행지수': 1, '_id': 0}).limit(3)
for doc in docs:
    print(doc)

{'배우이름': '이상윤', '흥행지수': 8796}
{'배우이름': '허율', '흥행지수': 7543}
{'배우이름': '김도윤', '흥행지수': 7345}


### find의 다양한 문법 - skip, limit
* skip(n): 검색 결과 n개만큼 건너뜀
* limit(n): 검색 결과 n개만 표시

In [53]:
docs = actor.find({'흥행지수': {'$gte': 10000}}).limit(3)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d1b'), '직업': '배우', '성별': '남', '홈페이지': '\nhttp://www.artistcompany.co.kr/portfolio-item/lee-jung-jae/\n', '소속사': '아티스트컴퍼니', '배우이름': '이정재', '흥행지수': 52049, '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들'], '랭킹': 2}
{'_id': ObjectId('6019112ffd9a8148c2183d1c'), '직업': '배우', '생년월일': '1986-10-06', '성별': '남', '홈페이지': '\nhttps://www.instagram.com/hongsick/\nhttps://twitter.com/seeksik\n', '신장/체중': '178cm, 60kg', '학교': '단국대학교 연극', '취미': '피아노 연주, 인터넷 게임, 영화, 음악감상', '특기': '스노우보드, 수영', '배우이름': '유아인', '흥행지수': 42530, '출연영화': ['#살아있다', '소리도 없이', '버닝', '사도'], '랭킹': 3, '다른이름': '엄홍식'}


In [54]:
docs = actor.find({'흥행지수': {'$gte': 10000}}).skip(3)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1d'), '직업': '배우', '생년월일': '1981-01-18', '성별': '남', '홈페이지': '\nhttp://www.gangdongwon.com\n', '신장/체중': '186cm, 68kg', '학교': '한양대 - 상명대학교대학원 연극영화 (석사과정 재학)', '취미': '음악감상, 웹서핑, 운동, 신발 모으기', '특기': '축구', '배우이름': '강동원', '흥행지수': 29187, '출연영화': ['반도', '1987'], '랭킹': 4}
{'_id': ObjectId('6019112ffd9a8148c2183d1e'), '직업': '배우', '생년월일': '1980-02-07', '성별': '여', '홈페이지': '\nhttps://www.instagram.com/mermaidleejh/\nhttps://twitter.com/mermaidjh\n', '신장/체중': '158cm, 38kg', '학교': '중앙대학교 연극영화', '취미': '바비 인형 수집, 피아노 연주', '특기': '별관찰, 시나리오 쓰기', '소속사': '에이바 앤 엔터테인먼트', '배우이름': '이정현', '흥행지수': 26559, '출연영화': ['죽지않는 인간들의 밤', '반도', '명량'], '랭킹': 5}
{'_id': ObjectId('6019112ffd9a8148c2183d1f'), '직업': '배우', '생년월일': '1987-02-25', '성별': '남', '신장/체중': '178cm, 63kg', '학교': '한국예술종합학교 영상원 연극원 연기과', '배우이름': '박정민', '흥행지수': 26048, '출연영화': ['다만 악에서 구하소서', '시동', '사냥의 시간', '들개', '동주', '사바하'], '랭킹': 6}
{'_id': ObjectId('6019112ffd9a8148c2183d20'), '직업': '배우', '생년월일': '1967-04-27', '성별': 

In [55]:
docs = actor.find({'흥행지수': {'$gte': 10000}}).skip(3).limit(3)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1d'), '직업': '배우', '생년월일': '1981-01-18', '성별': '남', '홈페이지': '\nhttp://www.gangdongwon.com\n', '신장/체중': '186cm, 68kg', '학교': '한양대 - 상명대학교대학원 연극영화 (석사과정 재학)', '취미': '음악감상, 웹서핑, 운동, 신발 모으기', '특기': '축구', '배우이름': '강동원', '흥행지수': 29187, '출연영화': ['반도', '1987'], '랭킹': 4}
{'_id': ObjectId('6019112ffd9a8148c2183d1e'), '직업': '배우', '생년월일': '1980-02-07', '성별': '여', '홈페이지': '\nhttps://www.instagram.com/mermaidleejh/\nhttps://twitter.com/mermaidjh\n', '신장/체중': '158cm, 38kg', '학교': '중앙대학교 연극영화', '취미': '바비 인형 수집, 피아노 연주', '특기': '별관찰, 시나리오 쓰기', '소속사': '에이바 앤 엔터테인먼트', '배우이름': '이정현', '흥행지수': 26559, '출연영화': ['죽지않는 인간들의 밤', '반도', '명량'], '랭킹': 5}
{'_id': ObjectId('6019112ffd9a8148c2183d1f'), '직업': '배우', '생년월일': '1987-02-25', '성별': '남', '신장/체중': '178cm, 63kg', '학교': '한국예술종합학교 영상원 연극원 연기과', '배우이름': '박정민', '흥행지수': 26048, '출연영화': ['다만 악에서 구하소서', '시동', '사냥의 시간', '들개', '동주', '사바하'], '랭킹': 6}


### find의 다양한 문법 - list 검색

In [56]:
docs = actor.find({'출연영화': '신세계'})
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d1b'), '직업': '배우', '성별': '남', '홈페이지': '\nhttp://www.artistcompany.co.kr/portfolio-item/lee-jung-jae/\n', '소속사': '아티스트컴퍼니', '배우이름': '이정재', '흥행지수': 52049, '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들'], '랭킹': 2}
{'_id': ObjectId('6019112ffd9a8148c2183d2f'), '직업': '배우', '생년월일': '1973-01-09', '성별': '남', '홈페이지': '\nhttps://www.facebook.com/cjessungwoong\n', '신장/체중': '187cm, 79kg', '학교': '한국외국어대학교 법학', '배우이름': '박성웅', '흥행지수': 11740, '출연영화': ['오케이 마담', '신세계', '하이힐'], '랭킹': 22}
{'_id': ObjectId('6019112ffd9a8148c2183d40'), '직업': '배우', '생년월일': '1981-08-15', '성별': '여', '홈페이지': '\nhttps://www.instagram.com/my_songjihyo/\nhttps://www.facebook.com/MYOFFICIALSONGJIHYO\n', 

In [58]:
docs = actor.find({'$or': [{'출연영화': '신세계'}, {'출연영화': '국제시장'}]})
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d1b'), '직업': '배우', '성별': '남', '홈페이지': '\nhttp://www.artistcompany.co.kr/portfolio-item/lee-jung-jae/\n', '소속사': '아티스트컴퍼니', '배우이름': '이정재', '흥행지수': 52049, '출연영화': ['다만 악에서 구하소서', '신세계', '신과 함께-죄와 벌', '신과 함께-인과 연', '사바하', '도둑들'], '랭킹': 2}
{'_id': ObjectId('6019112ffd9a8148c2183d2f'), '직업': '배우', '생년월일': '1973-01-09', '성별': '남', '홈페이지': '\nhttps://www.facebook.com/cjessungwoong\n', '신장/체중': '187cm, 79kg', '학교': '한국외국어대학교 법학', '배우이름': '박성웅', '흥행지수': 11740, '출연영화': ['오케이 마담', '신세계', '하이힐'], '랭킹': 22}
{'_id': ObjectId('6019112ffd9a8148c2183d31'), '직업': '배우', '생년월일': '1979-03-20', '성별': '남', '홈페이지': '\nhttps://www.facebook.com/cjesminjae\n', '학교': '한국예술종합학교', '배우이름': '김민재', '흥행지수': 10946, '출

### find의 다양한 문법 - list 검색 (all)

In [59]:
docs = actor.find({'출연영화': { '$all': ['신세계', '국제시장']}})
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}


### find의 다양한 문법 - list 검색 (리스트 index 번호로 검색하기)

In [71]:
docs = actor.find({'출연영화.0': '국제시장'})
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d31'), '직업': '배우', '생년월일': '1979-03-20', '성별': '남', '홈페이지': '\nhttps://www.facebook.com/cjesminjae\n', '학교': '한국예술종합학교', '배우이름': '김민재', '흥행지수': 10946, '출연영화': ['국제시장', '반도', '비밀은 없다', '뷰티 인사이드'], '랭킹': 24}
{'_id': ObjectId('6019112ffd9a8148c21840d1'), '원어명': '장영남', '직업': '배우', '생년월일': '1973-11-25', '성별': '여', '소속사': '멘토엔터테인먼트', '배우이름': '장영남', '흥행지수': 2, '출연영화': ['국제시장', '서복', '증인', '협상', '김종욱 찾기'], '랭킹': 952}
{'_id': ObjectId('6019112ffd9a8148c2184123'), '직업': '배우', '생년월일': '1973-11-07', '성별': '여', '홈페이지': '\nhttps://www.yunjinkim.co.kr:9023/profile/\n', '신장/체중': '168cm, 48kg', '학교': '보스턴대학교 공연예술학', '취미': '음악감상, 여행', '특기': '발레, 재즈무용', '소속사': '자이온 이엔티(주)', '배우이름': '김윤진', '흥행지수': 1, '출연영화': ['국제시장'], '랭킹': 1034, '다른이름': 'Kim Yun Jin; Kim Yun-Jin'}
{'_id': ObjectId('6019112ffd9a8148c2184126'), '직업': '배우', '생년월일': '1973-11-07', '성별': '여', '홈페이지': '\nhttps://www.yunjinkim.co.kr:9023/profile/\n', '신장/체중': '168cm, 48kg', '학교': '보스턴대학교 공연예술학', '취미': '음악감상

### find의 다양한 문법 - list 검색 (리스트 사이즈로 검색하기)

In [72]:
docs = actor.find({'출연영화': {'$size': 5}})
for doc in docs:
    print(doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d22'), '직업': '배우', '생년월일': '2006-03-12', '성별': '여', '홈페이지': '\nhttps://www.facebook.com/leere.vv/\n', '배우이름': '이레', '흥행지수': 22004, '출연영화': ['너의 이름은.', '반도', '소원', '개를 훔치는 완벽한 방법', '증인'], '랭킹': 9}
{'_id': ObjectId('6019112ffd9a8148c2183d23'), '직업': '배우', '생년월일': '1984-07-04', '성별': '남', '홈페이지': '\nhttps://www.facebook.com/saram.leejehoon\n', '신장/체중': '176cm', '학교': '한국예술종합학교 연극원 연기과', '특기': '댄스, 노래, 무술', '소속사': '㈜사람엔터테인먼트', '배우이름': '이제훈', '흥행지수': 21982, '출연영화': ['도굴', '사냥의 시간', '파수꾼', '박열', '건축학개론'], '랭킹': 10}
{'_id': ObjectId('6019112ffd9a8148c2183d34'), '직업': '배우', '생년월일': '1975-03-06', '성별': '여', '홈페이지': '\nhttps://www.facebook.com/cjesmiran\n', '배우이름': '라미란', '흥행지수': 8317, '출연영화':

### find의 다양한 문법 (elemMatch)
* 적어도 한 개 이상의 리스트 요소가 복수 개의 조건을 동시에 만족하는 경우

In [73]:
from bs4 import BeautifulSoup
import requests
import pymongo
import re

conn = pymongo.MongoClient()
actor_db = conn.cine21
elemmatch_sample = actor_db.sample

In [74]:
elemmatch_sample.insert_many([
    {'results': [82, 85, 88]},
    {'results': [75, 88, 91]}
])

<pymongo.results.InsertManyResult at 0x7fe989beaf80>

In [75]:
docs = elemmatch_sample.find({'results': {'$gte': 90, '$lt':85}})
for doc in docs:
    print (doc)

{'_id': ObjectId('60192bc8b07f196e1bbe7220'), 'results': [75, 88, 91]}


In [76]:
docs = elemmatch_sample.find({'results': {'$elemMatch': {'$gte':75, '$lt':80}}})
for doc in docs:
    print (doc)

{'_id': ObjectId('60192bc8b07f196e1bbe7220'), 'results': [75, 88, 91]}


<div class="alert alert-block alert-warning">
<font color="blue" size="4em">실습</font><br>
직업이 가수인 배우 중, 흥행지수가 가장 높은 배우순으로 10명을 출력하세요
</div>

In [78]:
docs = actor.find({'직업':'가수'}).sort('흥행지수', pymongo.DESCENDING).limit(10)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d60'), '직업': '가수', '생년월일': '1991-10-02', '성별': '남', '홈페이지': '\nhttps://www.instagram.com/hojoongng/\n', '배우이름': '김호중', '흥행지수': 3332, '출연영화': ['그대, 고맙소 : 김호중 생애 첫 팬미팅 무비'], '랭킹': 71}
{'_id': ObjectId('6019112ffd9a8148c2183d8b'), '직업': '가수', '생년월일': '1991-06-16', '성별': '남', '홈페이지': '\nhttps://www.instagram.com/im_hero____\n', '배우이름': '임영웅', '흥행지수': 1471, '출연영화': ['미스터트롯: 더 무비'], '랭킹': 114}
{'_id': ObjectId('6019112ffd9a8148c2183d9d'), '원어명': '박영탁', '직업': '가수', '생년월일': '1983-05-13', '성별': '남', '홈페이지': '\nhttps://www.instagram.com/zerotak2\n', '신장/체중': '179cm / 64kg', '배우이름': '영탁', '흥행지수': 1226, '출연영화': ['미스터트롯: 더 무비'], '랭킹': 132}
{'_id': ObjectId('6019112ffd9a8148c2183d9e'), '직업': '가수', '생년월일': '1994-09-12', '성별': '남', '배우이름': 'RM', '흥행지수': 1148, '출연영화': ['브레이크 더 사일런스: 더 무비', '브링 더 소울 : 더 무비'], '랭킹': 133, '다른이름': '김남준; 방탄소년단; RM'}
{'_id': ObjectId('6019112ffd9a8148c2183da4'), '직업': '가수', '생년월일': '1992-12-04', '성별': '남', '배우이름': '진', '흥행지수': 984, '출연영

<div class="alert alert-block alert-warning">
<font color="blue" size="4em">실습</font><br>
국제시장에 출연한 배우를 흥행지수가 높은 순으로 10명 출력하세요 
</div>

In [89]:
docs = actor.find({'출연영화':'국제시장'}).sort('흥행지수', pymongo.DESCENDING).limit(10)
for doc in docs:
    print (doc)

{'_id': ObjectId('6019112ffd9a8148c2183d1a'), '직업': '배우', '생년월일': '1970-09-01', '성별': '남', '신장/체중': '180cm, 75kg', '학교': '서울예술대학 연극과 졸업', '특기': '농구, 악기연주', '소속사': '예당엔터테인먼트', '배우이름': '황정민', '흥행지수': 78066, '출연영화': ['다만 악에서 구하소서', '신세계', '부당거래', '국제시장', '아수라'], '랭킹': 1}
{'_id': ObjectId('6019112ffd9a8148c2183d31'), '직업': '배우', '생년월일': '1979-03-20', '성별': '남', '홈페이지': '\nhttps://www.facebook.com/cjesminjae\n', '학교': '한국예술종합학교', '배우이름': '김민재', '흥행지수': 10946, '출연영화': ['국제시장', '반도', '비밀은 없다', '뷰티 인사이드'], '랭킹': 24}
{'_id': ObjectId('6019112ffd9a8148c2183d34'), '직업': '배우', '생년월일': '1975-03-06', '성별': '여', '홈페이지': '\nhttps://www.facebook.com/cjesmiran\n', '배우이름': '라미란', '흥행지수': 8317, '출연영화': ['정직한 후보', '국제시장', '친절한 금자씨', '소원', '나의 사랑 나의 신부'], '랭킹': 27}
{'_id': ObjectId('6019112ffd9a8148c2183d86'), '직업': '배우', '생년월일': '1968-06-15', '성별': '남', '신장/체중': '176cm, 68kg', '학교': '동의대학교 공업디자인 (중퇴)', '소속사': '빌리지엔터테인먼트', '배우이름': '오달수', '흥행지수': 1603, '출연영화': ['이웃사촌', '신과 함께-죄와 벌', '7번방의 선물', '국제시장', '올드보이'