In [1]:
from scrapy import Spider
from scrapy.crawler import CrawlerProcess

In [2]:
import logging
import os

In [3]:
def try_remove (filename):
    try:
        os.remove(filename)
    except OSError:
        pass

In [4]:
class BookingComOPinions(Spider):
    name = 'BookingComOpinionsSpider' #nazwa obowiazkowa
    
    custom_settings = {
        'FEED_URI': '%(json_file)s',
        'FEED_FORMAT': 'json', #sposob formatowania rezultatow
        'DOWNLOAD_DELAY': 3, #czas, zbyt maly moze nas zbanowac
        'LOG_LEVEL': logging.DEBUG,
        'EXTENSIONS': {
            'scrapy.extensions.closespider.CloseSpider':1 #klasa pozwala wykorzystac specjalny rodzaj wyjatku ktory powinien 
            #zatrzymac pająka; przydatne gdy dostaniemy bana i nie ma sensu dalej scrapowac
        },
        'CLOSESPIDER_ITEMCOUNT': 10 #system zacznie sie zatrzymywac po pobraniu 10 hotelow
    }
    
    def parse (self, response):
        hotels = response.css('div.sr_item')
        for hotel in hotels:
            hotel_name = hotel.css('span.sr-hotel__name::text').get().strip() #strip obcina biale znaki z tekstu
            hotel_link = hotel.css('.hotel_name_link.url').pop()
            yield response.follow(hotel_link, self.parse_hotel,
                                 meta={'hotel': hotel_name})
        
        for link in response.css('a[data-page-next]'): #pop() nie moze tu byc bo na ostatniej stronie brak elementu
            #zamiast tego petla ktora jest instrukcja warunkowa jesli element jest to wykonaj, a jak nie to nie wykonaj
            yield response.follow(link)
            
    def parse_hotel (self, response):
        hotel_name = response.meta['hotel']
        for reviews_link in response.css('a.show_all_reviews_btn'): #link do wszystkich recenzji
            yield response.follow(reviews_link, self.parse_reviews,
                                 meta={'hotel': hotel_name})
        
    def parse_reviews (self, response):
        hotel_name = response.meta['hotel']
        items = response.css('li.review_item')
        for item in items:
            publish_date = item.css('meta[itemprop="datePublished"]'
                                   '::attr(content)').get('')
            reviewer = item.css('div.review_item_reviewer')
            rev_count = reviewer.css('div.'
                                    'review_item_user_review_count::text').get('')
            ...
            
            review = item.css('div.review_item_review')
            rating = item.css('meta[itemprop="ratingValue"]'
                                   '::attr(content)').get('')
            raw_tags = review.css('li.review_info_tag::text').getall()
            tags= list(filter(None, map(str.strip, raw_tags)))
            ...
            
            
            yield{
                'hotel': hotel_name,
                'publish_date': publish_date,
                'rev_count': rev_count,
                'rating': rating,
                'tags': tags
            }
        
        for next_page in response.css('a#review_next_page_link'):
            yield response.follow(next_page, self.parse_reviews,
                                 meta=response.meta)

In [5]:
ENTRY_URL = 'https://www.booking.com/searchresults.pl.html?city=-273837'

In [6]:
json_file = 'Oslo.json'
#try_remove(json_file)

In [7]:
process = CrawlerProcess()
process.crawl(BookingComOPinions, start_urls = [ENTRY_URL],
             json_file = json_file)

2019-04-05 18:23:37 [scrapy.utils.log] INFO: Scrapy 1.6.0 started (bot: scrapybot)
2019-04-05 18:23:37 [scrapy.utils.log] INFO: Versions: lxml 4.2.5.0, libxml2 2.9.8, cssselect 1.0.3, parsel 1.5.1, w3lib 1.20.0, Twisted 18.9.0, Python 3.7.1 (default, Dec 10 2018, 22:54:23) [MSC v.1915 64 bit (AMD64)], pyOpenSSL 18.0.0 (OpenSSL 1.1.1a  20 Nov 2018), cryptography 2.4.2, Platform Windows-7-6.1.7601-SP1
2019-04-05 18:23:37 [scrapy.crawler] INFO: Overridden settings: {'CLOSESPIDER_ITEMCOUNT': 10, 'DOWNLOAD_DELAY': 3, 'FEED_FORMAT': 'json', 'FEED_URI': '%(json_file)s', 'LOG_LEVEL': 10}
2019-04-05 18:23:37 [scrapy.extensions.telnet] INFO: Telnet Password: 7efd53bea0e92ce6
2019-04-05 18:23:37 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.feedexport.FeedExporter',
 'scrapy.extensions.logstats.LogStats',
 'scrapy.extensions.closespider.CloseSpider']
2019-04-05 18:23:37 [scrapy.middleware] INF

<Deferred at 0x815dd68>

In [8]:
#process.start()

2019-04-05 18:23:38 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.booking.com/searchresults.pl.html?city=-501414> (referer: None)
2019-04-05 18:23:40 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.booking.com/hotel/pl/gdynia-centrum-gdynia1234.pl.html> from <GET https://www.booking.com/hotel/pl/gdynia-centrum-gdynia1234.pl.html?from=searchresults%0A#hotelTmpl>
2019-04-05 18:23:44 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.booking.com/hotel/pl/apartament-z-balkonem.pl.html> from <GET https://www.booking.com/hotel/pl/apartament-z-balkonem.pl.html?from=searchresults%0A#hotelTmpl>
2019-04-05 18:23:47 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.booking.com/hotel/pl/gdynia_nadmorski.pl.html> from <GET https://www.booking.com/hotel/pl/gdynia_nadmorski.pl.html?from=searchresults%0A#hotelTmpl>
2019-04-05 18:23:51 [scrapy.downloadermiddlewares.redirect] DEBUG: Red

2019-04-05 18:25:38 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html> (referer: https://www.booking.com/hotel/pl/gdynia-centrum-gdynia1234.pl.html)
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-03-31', 'rev_count': '\n8 opinii\n', 'rating': '7.9', 'tags': ['W parze', 'Pokój trzyosobowy typu Standard', '1 nocleg']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-03-25', 'rev_count': '\n7 opinii\n', 'rating': '8.8', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Deluxe (2 osoby dorosłe + 1 dziecko)', '2 noclegi']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl

2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-02-18', 'rev_count': '\n5 opinii\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'Podróżujący w pojedynkę', 'Pokój Dwuosobowy typu Standard', '2 noclegi']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-02-18', 'rev_count': '\n1 opinia\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-02-18', 'rev_count': '\n22 opinie\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'Ro

2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-01-01', 'rev_count': '\n27 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard', '2 noclegi']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2019-01-01', 'rev_count': '\n13 opinii\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2018-12-17', 'rev_count': '\n1 opinia\n', 'rating': '10', 'tags': ['W parze', 'Pokój Dwuosobowy typu Stan

2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2018-09-28', 'rev_count': '\n1 opinia\n', 'rating': '6.3', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Deluxe z wanną', '2 noclegi']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2018-09-26', 'rev_count': '\n1 opinia\n', 'rating': '8.8', 'tags': ['Podróżujący w pojedynkę', 'Pokój Dwuosobowy typu Standard', '2 noclegi']}
2019-04-05 18:25:38 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia-centrum-gdynia1234.pl.html>
{'hotel': 'Gdynia Centrum', 'publish_date': '2018-09-24', 'rev_count': '\n6 opinii\n', 'rating': '3.8', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój rodzinny typu Super

2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2019-02-03', 'rev_count': '\n1 opinia\n', 'rating': '6.7', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój Dwuosobowy', '3 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2019-01-28', 'rev_count': '\n31 opinii\n', 'rating': '9.2', 'tags': ['Podróżujący w pojedynkę', 'Pokój Dwuosobowy', '2 noclegi']}
2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2019-01-21', 'rev_count': '\n35 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój jednoosobowy', '2 nocle

2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2018-09-19', 'rev_count': '\n5 opinii\n', 'rating': '6.3', 'tags': ['Wyjazd wakacyjny', 'Podróżujący ze znajomymi', 'Pokój Dwuosobowy', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2018-09-18', 'rev_count': '\n12 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'W parze', 'Pokój Dwuosobowy typu Business', '4 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2018-09-17', 'rev_count': '\n18 opinii\n', 'rating': '7.1', 'tags': ['Wyjazd służbowy', 'Podr

2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2018-07-16', 'rev_count': '\n3 opinie\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój Dwuosobowy', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2018-07-11', 'rev_count': '\n1 opinia\n', 'rating': '6.3', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy', '2 noclegi']}
2019-04-05 18:25:45 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/gdynia_nadmorski.pl.html>
{'hotel': 'Hotel Nadmorski', 'publish_date': '2018-07-01', 'rev_count': '\n8 opinii\n', 'rating': '8.3', 'tags': ['Wyjazd wakacyjny', 'Podróżujący ze znajomymi', 'Pokój Dwuosobowy', '1 noc

2019-04-05 18:25:52 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html> (referer: https://www.booking.com/hotel/pl/courtyard-gdynia-waterfront.pl.html)
2019-04-05 18:25:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2019-03-21', 'rev_count': '\n5 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'Podróżujący w pojedynkę', 'Pokój dwuosobowy typu Standard z 1 lub 2 łóżkami i widokiem na miasto', '1 nocleg']}
2019-04-05 18:25:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2019-03-18', 'rev_count': '\n11 opinii\n', 'rating': '6.7', 'tags': ['W parze', 'Pokój dwuosobowy typu Premium z 1 lub 2 łóżkami i widokiem na mo

2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2019-01-02', 'rev_count': '\n1 opinia\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój dwuosobowy typu Premium z 1 lub 2 łóżkami i widokiem na morze', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2019-01-01', 'rev_count': '\n19 opinii\n', 'rating': '7.9', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój dwuosobowy typu Standard z 1 lub 2 łóżkami i widokiem na miasto', '3 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-wat

2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2018-10-22', 'rev_count': '\n10 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój dwuosobowy typu Standard z 1 lub 2 łóżkami i widokiem na miasto', '3 noclegi']}
2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2018-10-22', 'rev_count': '\n1 opinia\n', 'rating': '8.8', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój dwuosobowy typu Standard z 1 lub 2 łóżkami i widokiem na miasto', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courty

2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2018-08-21', 'rev_count': '\n5 opinii\n', 'rating': '8.8', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój dwuosobowy typu Premium z 1 lub 2 łóżkami i widokiem na morze', '8 noclegów', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/courtyard-gdynia-waterfront.pl.html>
{'hotel': 'Courtyard by Marriott Gdynia Waterfront', 'publish_date': '2018-08-21', 'rev_count': '\n1 opinia\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'Podróżujący ze znajomymi', 'Pokój dwuosobowy typu Premium z 1 lub 2 łóżkami i widokiem na morze', '9 noclegów', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:25:53 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/revi

2019-04-05 18:25:59 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/apartment-zaglami.pl.html>
{'hotel': 'Sea Towers Apartament pod Żaglami', 'publish_date': '2019-03-20', 'rev_count': '\n6 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Apartament z widokiem na morze', '2 noclegi']}
2019-04-05 18:25:59 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/apartment-zaglami.pl.html>
{'hotel': 'Sea Towers Apartament pod Żaglami', 'publish_date': '2017-06-19', 'rev_count': '\n7 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'W parze', 'Apartament z widokiem na morze', '1 nocleg']}
2019-04-05 18:25:59 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/apartment-zaglami.pl.html>
{'hotel': 'Sea Towers Apartament pod Żaglami', 'publish_date': '2017-06-15', 'rev_count': '\n6 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 

2019-04-05 18:26:03 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-wczasowy-u-sowy.pl.html>
{'hotel': 'Dom Wczasowy u Sowy', 'publish_date': '2017-09-09', 'rev_count': '\n4 opinie\n', 'rating': '6.3', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Apartament z prysznicem', '3 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:03 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-wczasowy-u-sowy.pl.html>
{'hotel': 'Dom Wczasowy u Sowy', 'publish_date': '2017-09-04', 'rev_count': '\n3 opinie\n', 'rating': '2.9', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Duży pokój dwuosobowy', '1 nocleg']}
2019-04-05 18:26:03 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-wczasowy-u-sowy.pl.html>
{'hotel': 'Dom Wczasowy u Sowy', 'publish_date': '2017-08-06', 'rev_count': '\n6 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'Podróżujący w pojedy

2019-04-05 18:26:03 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-wczasowy-u-sowy.pl.html>
{'hotel': 'Dom Wczasowy u Sowy', 'publish_date': '2017-09-15', 'rev_count': '\n6 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Apartament z prysznicem', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:03 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-wczasowy-u-sowy.pl.html>
{'hotel': 'Dom Wczasowy u Sowy', 'publish_date': '2017-09-02', 'rev_count': '\n6 opinii\n', 'rating': '7.5', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Duży pokój dwuosobowy', '3 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:03 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-wczasowy-u-sowy.pl.html>
{'hotel': 'Dom Wczasowy u Sowy', 'publish_date': '2017-08-18', 'rev_count': '\n27 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', '

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2019-03-18', 'rev_count': '\n17 opinii\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Deluxe', '2 noclegi']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2019-03-11', 'rev_count': '\n1 opinia\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2019-02-28', 'rev_count': '\n11 opinii\n', 'rating': '1

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-10-24', 'rev_count': '\n34 opinie\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy', '3 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-10-23', 'rev_count': '\n14 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-10-22', 'rev_count': '\n10 

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2019-03-14', 'rev_count': '\n1 opinia\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'Podróżujący w pojedynkę', 'Pokój jednoosobowy', '4 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2019-03-05', 'rev_count': '\n2 opinie\n', 'rating': '7.5', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Deluxe', '2 noclegi']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2019-03-04', 'rev_count': '\n4 opinie\n', 'rating': '6.3', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój jedno

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-05-04', 'rev_count': '\n18 opinii\n', 'rating': '4.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-05-04', 'rev_count': '\n2 opinie\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Deluxe', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-05-04', 'rev_co

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-11-16', 'rev_count': '\n2 opinie\n', 'rating': '7.1', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój trzyosobowy', '1 nocleg']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-11-12', 'rev_count': '\n33 opinie\n', 'rating': '7.1', 'tags': ['Wyjazd wakacyjny', 'Grupa', 'Pokój Dwuosobowy typu Deluxe', '2 noclegi']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/quadrille-conference-amp-spa.pl.html>
{'hotel': 'Relais & Châteaux Hotel Quadrille', 'publish_date': '2018-02-25', 'rev_count': '\n25 opinii\n', 'rating': '8.8', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy', '2 noclegi']}
2019-04-05 18:26:

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-09-18', 'rev_count': '\n13 opinii\n', 'rating': '7.9', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój z 2 łóżkami pojedynczymi', '2 noclegi']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-09-15', 'rev_count': '\n2 opinie\n', 'rating': '7.1', 'tags': ['Wyjazd wakacyjny', 'Podróżujący w pojedynkę', 'Pokój jednoosobowy', '3 noclegi']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-09-12', 'rev_count': '\n3 opinie\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój z 2 łóżkami pojedy

2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-07-23', 'rev_count': '\n16 opinii\n', 'rating': '5.4', 'tags': ['Podróżujący w pojedynkę', 'Pokój jednoosobowy', '1 nocleg']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-07-22', 'rev_count': '\n1 opinia\n', 'rating': '7.1', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój z 2 łóżkami pojedynczymi', '3 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:11 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/dom-marynarza.pl.html>
{'hotel': 'Hotel Dom Marynarza', 'publish_date': '2018-07-16', 'rev_count': '\n2 opinie\n', 'rating': '3.3', 'tags': ['Wyjazd wakacyjny', 'Grupa', 'Pokój jednoosobowy', '1 nocleg', 'Wysłana prz

2019-04-05 18:26:13 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/harsz-willa-amber.pl.html>
{'hotel': 'Harsz Willa Amber', 'publish_date': '2017-09-26', 'rev_count': '\n12 opinii\n', 'rating': '9.6', 'tags': ['Wyjazd służbowy', 'Rodzina z małymi dziećmi', 'Apartament z 2 sypialniami', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:13 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/harsz-willa-amber.pl.html>
{'hotel': 'Harsz Willa Amber', 'publish_date': '2017-09-14', 'rev_count': '\n2 opinie\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Apartament z 2 sypialniami', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:13 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/harsz-willa-amber.pl.html>
{'hotel': 'Harsz Willa Amber', 'publish_date': '2017-06-18', 'rev_count': '\n1 opinia\n', 'rating': '10', 't

2019-04-05 18:26:17 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2019-01-29', 'rev_count': '\n18 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard z 1 lub 2 łóżkami', '1 nocleg']}
2019-04-05 18:26:17 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2019-01-24', 'rev_count': '\n33 opinie\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard z 1 lub 2 łóżkami', '3 noclegi']}
2019-04-05 18:26:17 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2019-01-05', 'rev_count': '\n4 opinie\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard z 1

2019-04-05 18:26:18 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2018-10-18', 'rev_count': '\n31 opinii\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard z 1 lub 2 łóżkami', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:18 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2018-10-05', 'rev_count': '\n69 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd służbowy', 'Grupa', 'Pokój Dwuosobowy typu Standard z 1 lub 2 łóżkami', '1 nocleg']}
2019-04-05 18:26:18 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2018-09-21', 'rev_count': '\n4 opinie\n', 'rating': '6.3', 'tags': ['Wyjazd służbowy', 'Podróżujący 

2019-04-05 18:26:18 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2018-06-12', 'rev_count': '\n3 opinie\n', 'rating': '8.8', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój Dwuosobowy typu Standard z 1 lub 2 łóżkami', '1 nocleg']}
2019-04-05 18:26:18 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2018-06-09', 'rev_count': '\n7 opinii\n', 'rating': '7.9', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Standard z 1 lub 2 łóżkami', '1 nocleg']}
2019-04-05 18:26:18 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/blekitny-zagiel.pl.html>
{'hotel': 'Błękitny Żagiel', 'publish_date': '2018-06-09', 'rev_count': '\n3 opinie\n', 'rating': '8.8', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typ

2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2019-01-01', 'rev_count': '\n10 opinii\n', 'rating': '7.9', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy/Pokój typu Twin', '1 nocleg']}
2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2019-01-01', 'rev_count': '\n6 opinii\n', 'rating': '9.6', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy/Pokój typu Twin', '1 nocleg']}
2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-12-30', 'rev_count': '\n11 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy/Pokój typu Twin', '1 nocleg', 'Wysłana przez urządzenie mobilne

2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-08-15', 'rev_count': '\n9 opinii\n', 'rating': '10', 'tags': ['Ze zwierzęciem', 'Rodzina z małymi dziećmi', 'Pokój Dwuosobowy/Pokój typu Twin', '5 noclegów', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-08-13', 'rev_count': '\n20 opinii\n', 'rating': '5.8', 'tags': ['Wyjazd wakacyjny', 'Podróżujący w pojedynkę', 'Pokój Dwuosobowy/Pokój typu Twin', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-07-25', 'rev_count': '\n1 opinia\n', 'rating': '10', 'tags': ['Ze zwier

2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-02-19', 'rev_count': '\n14 opinii\n', 'rating': '8.8', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy/Pokój typu Twin', '1 nocleg']}
2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-02-15', 'rev_count': '\n19 opinii\n', 'rating': '9', 'tags': ['Podróżujący w pojedynkę', 'Pokój Dwuosobowy/Pokój typu Twin', '1 nocleg']}
2019-04-05 18:26:21 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/morski-gdynia.pl.html>
{'hotel': 'Hotel Morski', 'publish_date': '2018-02-05', 'rev_count': '\n46 opinii\n', 'rating': '6.7', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy/Pokój typu Twin', '2 noclegi']}
2019-04-05 18:26:21 [scrapy.core.scr

2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2019-02-09', 'rev_count': '\n11 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój Dwuosobowy typu Economy', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2019-02-05', 'rev_count': '\n14 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'Grupa', '2 pokoje', '3 noclegi']}
2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2019-01-26', 'rev_count': '\n23 opinie\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy typu Economy', '3 noclegi']}
2019-04-

2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2018-08-18', 'rev_count': '\n2 opinie\n', 'rating': '6.7', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój dwuosobowy na poddaszu', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2018-08-13', 'rev_count': '\n5 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'Grupa', 'Pokój Dwuosobowy', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2018-08-08', 'rev_count': '\n13 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój Jednoo

2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2018-03-25', 'rev_count': '\n56 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój Dwuosobowy', '1 nocleg']}
2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2018-02-17', 'rev_count': '\n1 opinia\n', 'rating': '8.8', 'tags': ['Wyjazd służbowy', 'Podróżujący w pojedynkę', 'Pokój Dwuosobowy typu Economy', '1 nocleg']}
2019-04-05 18:26:28 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/grand-tulipan.pl.html>
{'hotel': 'Grand Tulipan', 'publish_date': '2018-02-05', 'rev_count': '\n8 opinii\n', 'rating': '5.4', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój Dwuosobowy typu Economy', '2 noclegi']}
2019-

2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2019-02-21', 'rev_count': '\n6 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy z 1 lub 2 łóżkami', '1 nocleg']}
2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2019-02-21', 'rev_count': '\n9 opinii\n', 'rating': '9.6', 'tags': ['Podróżujący w pojedynkę', 'Pokój Dwuosobowy z 1 lub 2 łóżkami', '1 nocleg', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2019-02-17', 'rev_count': '\n7 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'Grupa', 'Pokój Dwuosobowy z 1 lub 2

2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2018-10-25', 'rev_count': '\n7 opinii\n', 'rating': '10', 'tags': ['Wyjazd służbowy', 'Grupa', 'Pokój Dwuosobowy z 1 lub 2 łóżkami', '1 nocleg']}
2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2018-10-24', 'rev_count': '\n5 opinii\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy z 1 lub 2 łóżkami', '2 noclegi']}
2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2018-10-09', 'rev_count': '\n11 opinii\n', 'rating': '9.2', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Apartament', '4 noclegi']}
2019-04-05 18:26:32 [scrapy.co

2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2018-07-30', 'rev_count': '\n1 opinia\n', 'rating': '10', 'tags': ['Wyjazd wakacyjny', 'Rodzina z małymi dziećmi', 'Pokój Dwuosobowy z 1 lub 2 łóżkami', '2 noclegi', 'Wysłana przez urządzenie mobilne']}
2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2018-07-25', 'rev_count': '\n6 opinii\n', 'rating': '7.5', 'tags': ['Wyjazd wakacyjny', 'W parze', 'Pokój Dwuosobowy z 1 lub 2 łóżkami i widokiem na morze', '4 noclegi']}
2019-04-05 18:26:32 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.booking.com/reviews/pl/hotel/rozany-gaj-gdynia.pl.html>
{'hotel': 'Hotel Różany Gaj', 'publish_date': '2018-07-20', 'rev_count': '\n10 opinii\n', 'rating': '10', 'tags': ['Wyjazd waka

2019-04-05 18:26:35 [scrapy.core.engine] INFO: Spider closed (closespider_itemcount)


In [22]:
logging.getLogger().setLevel(logging.INFO)

In [23]:
import pandas as pd

In [24]:
df = pd.read_json(json_file)

In [25]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 787 entries, 0 to 786
Data columns (total 5 columns):
hotel           787 non-null object
publish_date    787 non-null object
rating          787 non-null float64
rev_count       787 non-null object
tags            787 non-null object
dtypes: float64(1), object(4)
memory usage: 30.8+ KB


In [26]:
df['rev_count'].str.strip()

0       8 opinii
1       7 opinii
2       7 opinii
3      12 opinii
4       2 opinie
5       1 opinia
6       3 opinie
7       2 opinie
8       3 opinie
9      36 opinii
10      3 opinie
11     34 opinie
12     13 opinii
13      2 opinie
14      1 opinia
15      4 opinie
16      5 opinii
17     28 opinii
18      4 opinie
19      6 opinii
20      1 opinia
21      1 opinia
22     29 opinii
23      5 opinii
24      1 opinia
25     22 opinie
26      2 opinie
27      5 opinii
28      1 opinia
29     24 opinie
         ...    
757     4 opinie
758     4 opinie
759     1 opinia
760     2 opinie
761     7 opinii
762    11 opinii
763    42 opinie
764    11 opinii
765     5 opinii
766    24 opinie
767     1 opinia
768     6 opinii
769    10 opinii
770     9 opinii
771    43 opinie
772     8 opinii
773    19 opinii
774     5 opinii
775     3 opinie
776     2 opinie
777    15 opinii
778     1 opinia
779    32 opinie
780     1 opinia
781     5 opinii
782     8 opinii
783     7 opinii
784     1 opin

In [21]:
#df['rev_count'] = df['rev_count'].str.strip('opinii') #usuwanie slow
#df

In [28]:
#df['rev_count'].astype(int) #powinno zmieniac na int64 ale cos nie bangla XD (bo nie bangla usuwanie slow XDD)

In [30]:
subdf = df[['rating', 'tags']]

In [31]:
subdf

Unnamed: 0,rating,tags
0,7.9,"[W parze, Pokój trzyosobowy typu Standard, 1 n..."
1,8.8,"[Wyjazd wakacyjny, W parze, Pokój Dwuosobowy t..."
2,7.1,"[Rodzina z małymi dziećmi, Pokój rodzinny typu..."
3,9.2,"[Wyjazd wakacyjny, W parze, Pokój Dwuosobowy t..."
4,9.2,"[W parze, Pokój Dwuosobowy typu Deluxe z balko..."
5,7.9,"[Wyjazd wakacyjny, W parze, Pokój Dwuosobowy t..."
6,10.0,"[Ze zwierzęciem, Wyjazd służbowy, Podróżujący ..."
7,6.7,"[Wyjazd wakacyjny, W parze, Duży pokój z 2 łóż..."
8,9.2,"[W parze, Pokój Dwuosobowy typu Standard, 1 no..."
9,8.3,"[Wyjazd wakacyjny, W parze, Pokój Dwuosobowy t..."


In [32]:
subdf['tags'].map(lambda tags: '|'.join(tags))

0       W parze|Pokój trzyosobowy typu Standard|1 nocleg
1      Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
2      Rodzina z małymi dziećmi|Pokój rodzinny typu S...
3      Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
4      W parze|Pokój Dwuosobowy typu Deluxe z balkone...
5      Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
6      Ze zwierzęciem|Wyjazd służbowy|Podróżujący w p...
7      Wyjazd wakacyjny|W parze|Duży pokój z 2 łóżkam...
8        W parze|Pokój Dwuosobowy typu Standard|1 nocleg
9      Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
10     Wyjazd służbowy|Podróżujący w pojedynkę|Pokój ...
11     Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
12     Wyjazd służbowy|Podróżujący w pojedynkę|Pokój ...
13     Wyjazd wakacyjny|Podróżujący w pojedynkę|Pokój...
14     Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
15     Wyjazd wakacyjny|Podróżujący w pojedynkę|Pokój...
16     Wyjazd wakacyjny|W parze|Pokój Dwuosobowy typu...
17     Wyjazd służbowy|Podróżuj

In [33]:
subdf['tags'].map(lambda tags: '|'.join(tags)).str.get_dummies()

Unnamed: 0,1 nocleg,10 noclegów,12 noclegów,2 noclegi,2 pokoje,3 noclegi,4 noclegi,5 noclegów,6 noclegów,7 noclegów,...,Pokój trzyosobowy,Pokój trzyosobowy typu Standard,Pokój typu Deluxe z 2 łóżkami pojedynczymi,Pokój z 2 łóżkami pojedynczymi,Rodzina z małymi dziećmi,W parze,Wyjazd służbowy,Wyjazd wakacyjny,Wysłana przez urządzenie mobilne,Ze zwierzęciem
0,1,0,0,0,0,0,0,0,0,0,...,0,1,0,0,0,1,0,0,0,0
1,0,0,0,1,0,0,0,0,0,0,...,0,0,0,0,0,1,0,1,0,0
2,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,1,0,0,0,1,0
3,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,1,0,1,1,0
4,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,1,0,0,1,0
5,0,0,0,1,0,0,0,0,0,0,...,0,0,0,0,0,1,0,1,0,0
6,0,0,0,1,0,0,0,0,0,0,...,0,0,0,0,0,0,1,0,0,1
7,0,0,0,0,0,1,0,0,0,0,...,0,0,0,0,0,1,0,1,1,0
8,1,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,1,0,0,0,0
9,0,0,0,1,0,0,0,0,0,0,...,0,0,0,0,0,1,0,1,0,0


In [34]:
dum = subdf['tags'].map(lambda tags: '|'.join(tags)).str.get_dummies()

In [35]:
pd.concat([subdf['rating'], dum], axis = 1)

Unnamed: 0,rating,1 nocleg,10 noclegów,12 noclegów,2 noclegi,2 pokoje,3 noclegi,4 noclegi,5 noclegów,6 noclegów,...,Pokój trzyosobowy,Pokój trzyosobowy typu Standard,Pokój typu Deluxe z 2 łóżkami pojedynczymi,Pokój z 2 łóżkami pojedynczymi,Rodzina z małymi dziećmi,W parze,Wyjazd służbowy,Wyjazd wakacyjny,Wysłana przez urządzenie mobilne,Ze zwierzęciem
0,7.9,1,0,0,0,0,0,0,0,0,...,0,1,0,0,0,1,0,0,0,0
1,8.8,0,0,0,1,0,0,0,0,0,...,0,0,0,0,0,1,0,1,0,0
2,7.1,1,0,0,0,0,0,0,0,0,...,0,0,0,0,1,0,0,0,1,0
3,9.2,1,0,0,0,0,0,0,0,0,...,0,0,0,0,0,1,0,1,1,0
4,9.2,1,0,0,0,0,0,0,0,0,...,0,0,0,0,0,1,0,0,1,0
5,7.9,0,0,0,1,0,0,0,0,0,...,0,0,0,0,0,1,0,1,0,0
6,10.0,0,0,0,1,0,0,0,0,0,...,0,0,0,0,0,0,1,0,0,1
7,6.7,0,0,0,0,0,1,0,0,0,...,0,0,0,0,0,1,0,1,1,0
8,9.2,1,0,0,0,0,0,0,0,0,...,0,0,0,0,0,1,0,0,0,0
9,8.3,0,0,0,1,0,0,0,0,0,...,0,0,0,0,0,1,0,1,0,0


In [36]:
indicators = pd.concat([subdf['rating'], dum], axis = 1)

In [37]:
pd.melt(indicators) #przyklad zlego meltu

Unnamed: 0,variable,value
0,rating,7.9
1,rating,8.8
2,rating,7.1
3,rating,9.2
4,rating,9.2
5,rating,7.9
6,rating,10.0
7,rating,6.7
8,rating,9.2
9,rating,8.3


In [38]:
pd.melt(indicators, id_vars=['rating']) #uwzglednia rating

Unnamed: 0,rating,variable,value
0,7.9,1 nocleg,1
1,8.8,1 nocleg,0
2,7.1,1 nocleg,1
3,9.2,1 nocleg,1
4,9.2,1 nocleg,1
5,7.9,1 nocleg,0
6,10.0,1 nocleg,0
7,6.7,1 nocleg,0
8,9.2,1 nocleg,1
9,8.3,1 nocleg,0


In [39]:
melted = pd.melt(indicators, id_vars=['rating'])

In [42]:
positive = melted['value'] == 1 #selekcja wedlug kryteriow

In [43]:
melted[positive] #dostajemy tylko te ktore mialy true

Unnamed: 0,rating,variable,value
0,7.9,1 nocleg,1
2,7.1,1 nocleg,1
3,9.2,1 nocleg,1
4,9.2,1 nocleg,1
8,9.2,1 nocleg,1
11,8.3,1 nocleg,1
12,9.2,1 nocleg,1
14,9.6,1 nocleg,1
16,10.0,1 nocleg,1
18,10.0,1 nocleg,1


In [44]:
selected = melted[positive]

In [48]:
selected.groupby(['variable'])['rating'].agg(['mean', 'count']) #samo groupby nic konkretnego nie daje

Unnamed: 0_level_0,mean,count
variable,Unnamed: 1_level_1,Unnamed: 2_level_1
1 nocleg,8.575726,379
10 noclegów,9.2,1
12 noclegów,4.2,1
2 noclegi,8.477982,218
2 pokoje,7.216667,6
3 noclegi,8.491209,91
4 noclegi,8.423529,51
5 noclegów,8.2625,16
6 noclegów,9.208333,12
7 noclegów,8.072727,11


In [49]:
aggregated = selected.groupby(['variable'])['rating'].agg(['mean', 'count'])

In [54]:
aggregated.sort_values(by=['mean']) #rosnaco wedlug wartosci mean

Unnamed: 0_level_0,mean,count
variable,Unnamed: 1_level_1,Unnamed: 2_level_1
12 noclegów,4.2,1
Pokój rodzinny typu Superior,6.966667,3
Pokój czteroosobowy,7.016667,6
Pokój jednoosobowy,7.086957,23
2 pokoje,7.216667,6
Pokój typu Deluxe z 2 łóżkami pojedynczymi,7.233333,3
Pokój trzyosobowy,7.476471,17
Pokój jednoosobowy z łazienką,7.633333,6
Pokój Dwuosobowy/Pokój typu Twin,7.678261,69
Pokój Dwuosobowy typu Economy,7.729412,17


In [56]:
aggregated.sort_values(by=['count']).tail(10) #fragment

Unnamed: 0_level_0,mean,count
variable,Unnamed: 1_level_1,Unnamed: 2_level_1
3 noclegi,8.491209,91
Rodzina z małymi dziećmi,8.310169,118
Pokój Dwuosobowy,8.647619,147
Wyjazd służbowy,8.445876,194
Podróżujący w pojedynkę,8.646411,209
2 noclegi,8.477982,218
Wysłana przez urządzenie mobilne,8.470679,324
W parze,8.590085,353
1 nocleg,8.575726,379
Wyjazd wakacyjny,8.538077,520
