# Warsztaty Python w Data Science

---
## Zaawansowane scrapowanie - Web Scraping - część 2 z 3
- ### Praktyczny parser
- ### Iteratory, Generatory i `yield` 
- ### Zaawansowane scrapowanie przy użyciu biblioteki `Scrapy`
 - #### _"Grzeczne"_ pająki w Scrapy
 - #### Rozbudowany pająk do pobierania wielu stron
---

### art. 8 ustawy z dnia 27 lipca 2001 r. o ochronie baz danych (Dz.U. Nr 28, poz. 1402 ze zm.) 

- #### 1. Wolno korzystać z istotnej, co do jakości lub ilości, części rozpowszechnionej bazy danych:

  - 2)   w charakterze ilustracji, w celach _**dydaktycznych lub badawczych**_ ze wskazaniem źródła, jeżeli takie korzystanie jest uzasadnione niekomercyjnym celem, dla którego wykorzystano bazę,
  

# Praktyczny parser
## Wyciągamy z ogłoszenia cenę mieszkania

In [12]:
# Jeśli logi Ci przeskadzają, odkomentuj to poniżej:

# import logging
# logger = logging.getLogger()
# logger.setLevel(logging.CRITICAL)

https://www.morizon.pl/

In [13]:
import requests
from bs4 import BeautifulSoup


url='https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-mokotow-rozana-123m2-mzn2040844519'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')

2023-04-04 18:09:58 [urllib3.connectionpool] DEBUG: Starting new HTTPS connection (1): www.morizon.pl:443
2023-04-04 18:09:59 [urllib3.connectionpool] DEBUG: https://www.morizon.pl:443 "GET /oferta/sprzedaz-mieszkanie-warszawa-mokotow-rozana-123m2-mzn2040844519 HTTP/1.1" 200 28029


In [14]:
values = [flat.em.text for flat in soup.find_all('li', class_ = "paramIconPrice")] 

In [15]:
values

['2 650 000\xa0zł']

In [6]:
price = float(''.join(c for c in values[0] if c.isdigit()))
price

2650000.0

---
## Wyciągamy z ogłoszenia cenę ZA METR


In [7]:
values = [flat.em.text for flat in soup.find_all('li', class_ = "paramIconLivingArea")] 
values

['123,00\xa0m²']

In [8]:
area = float(''.join(c for c in values[0].split(',')[0] if c.isdigit()))
area

123.0

In [9]:
price_per_meter = price / area
int(price_per_meter)

21544

In [10]:
card = soup.find_all('div', class_ = "mz-card__item")[1]

str(card)[:500]

'<div class="mz-card__item">\n<section class="propertyDetails">\n<section class="propertyParams">\n<section class="params clearfix">\n<h3>Informacje szczegółowe</h3>\n<table>\n<!-- --> <tr>\n<th>\nPowierzchnia użytkowa: </th>\n<td>\n123 m² </td>\n</tr>\n<tr>\n<th>\nWysokość wnętrza: </th>\n<td>\n300 cm </td>\n</tr>\n<tr>\n<th>\nPiętro: </th>\n<td>\n3 / 4 </td>\n</tr>\n<tr>\n<th>\nLiczba pięter: </th>\n<td>\n4 </td>\n</tr>\n<tr>\n<th>\nLiczba poziomów mieszkania: </th>\n<td>\n2 </td>\n</tr>\n<tr>\n<th>\nTyp kuchni: </th>\n<td>\notwarta '

In [11]:
table = card.find_all('table')[0]
description = { row.th.text.strip():row.td.text.strip() for row in table.find_all('tr')  }
description

{'Powierzchnia użytkowa:': '123 m²',
 'Wysokość wnętrza:': '300 cm',
 'Piętro:': '3 / 4',
 'Liczba pięter:': '4',
 'Liczba poziomów mieszkania:': '2',
 'Typ kuchni:': 'otwarta',
 'Liczba łazienek:': '2',
 'Powierzchnia łazienki:': '12 m²',
 'Czy łazienka z WC:': 'razem',
 'Balkon:': 'Tak',
 'Powierzchnia balkonu:': '9 m²',
 'Taras:': 'Nie',
 'Rynek:': 'wtórny',
 'Dostępne od:': '2023-03-31',
 'Forma własności:': 'własność',
 'Na biuro:': 'Tak',
 'Rodzaj umowy:': 'na wyłączność',
 'Kredyt:': 'sprawdź ratę',
 'Numer oferty:': 'morizon-8',
 'Zaktualizowano:': 'dzisiaj',
 'Opublikowano:': '9 sierpnia 2022',
 '': ''}

In [15]:
table.find_all('tr')[0]

<tr>
<th>
Powierzchnia użytkowa: </th>
<td>
123 m² </td>
</tr>

In [18]:
description = { row.th.text.strip()[:-1]:row.td.text.strip() for row in table.find_all('tr')  }
description

{'Powierzchnia użytkowa': '123 m²',
 'Wysokość wnętrza': '300 cm',
 'Piętro': '3 / 4',
 'Liczba pięter': '4',
 'Liczba poziomów mieszkania': '2',
 'Typ kuchni': 'otwarta',
 'Liczba łazienek': '2',
 'Powierzchnia łazienki': '12 m²',
 'Czy łazienka z WC': 'razem',
 'Balkon': 'Tak',
 'Powierzchnia balkonu': '9 m²',
 'Taras': 'Nie',
 'Rynek': 'wtórny',
 'Dostępne od': '2023-03-31',
 'Forma własności': 'własność',
 'Na biuro': 'Tak',
 'Rodzaj umowy': 'na wyłączność',
 'Kredyt': 'sprawdź ratę',
 'Numer oferty': 'morizon-8',
 'Zaktualizowano': 'dzisiaj',
 'Opublikowano': '9 sierpnia 2022',
 '': ''}

---
## Iteratory, Generatory i `yield` 

In [None]:
print (range(5))

In [None]:
for i in range(5):
    print (i)

In [None]:
mystr = "banana"
myit = iter(mystr)

print(next(myit))
print(next(myit))
print(next(myit))
print(next(myit))
print(next(myit))
print(next(myit))

In [None]:
print(next(myit)) # error

In [None]:
class Counter:
    def __init__(self, low, high):
        self.current = low - 1
        self.high = high

    def __iter__(self):
        return self

    def __next__(self): # Python 2: def next(self)
        self.current += 1
        if self.current < self.high:
            return self.current
        raise StopIteration


for c in Counter(3, 9):
    print(c)

### *Generatory* są mechanizmem
* tworzenia iteratorów
* Zwraca dane przez *yield*
* Każde wywołanie _next()_ zaczyna od miejsca gdzie skończył poprzedni krok
* _next()_ tworzona jest automatycznie


In [None]:
def reverse(data):
    for index in range(len(data)-1, -1, -1):
        print(index)
        yield data[index]

In [None]:
for c in reverse('Python'):
    print (c)
    print()

# Generatory, Yield

In [None]:
mylist = [0, 1, 4]
for i in mylist:
    print(i)

In [None]:
mylist = [x*x for x in range(3)]
for i in mylist:
    print(i)

In [None]:
mylist = (x*x for x in range(3))
for i in mylist:
    print(i)

In [None]:
def create_generator():
    mylist = range(3)
    for i in mylist:
        yield i*i
        
for i in create_generator():
    print(i)

In [None]:
def fib(n):
    if n == 0 or n == 1:
        return n
    else:
        return fib(n-1) + fib(n-2)

In [None]:
for i in range(36):
    print ("n=%d => %d" % (i, fib(i)))

In [None]:
def fib(n):
    a, b = 0, 1
    i=0
    while i < n:
        yield (i, a)
        a, b = b, a + b
        i += 1

In [None]:
for i, f in fib(36):
    print ("n=%d => %d" % (i, f))

---
# Zaawansowane scrapowanie przy użyciu biblioteki `Scrapy`

https://scrapy.org/

## _"Grzeczne"_ pająki w Scrapy


- 1. Po pierwsze - nie szkodzić! Nie obciążaj niepotrzebnie strony scrapowanej
- 2. Przestrzegaj `robots.txt` i warunków korzystania z usługi
- 5. Nie ukrywaj się

#### Z dokumentacji:
- Scrapy doesn’t wait a fixed amount of time between requests, but uses a random interval between `0.5 * DOWNLOAD_DELAY` and `1.5 * DOWNLOAD_DELAY`.
- `AUTOTHROTTLE_ENABLED` - download delay for next requests is set to the average of previous download delay and the target download delay;

### `FAIL2BAN` - typowe zabezpieczenia

Przykład z dokumentacji:

*As you can see in my example, I have set up 300 maxretry and 300 for findtime, so, we need to have 300 GETs from the same IP in a time window of 300 seconds to have the originating IP blocked.*


In [None]:
import scrapy
import scrapy.crawler as crawler
from bs4 import BeautifulSoup

from scrapy.crawler import CrawlerProcess

class MySpider(scrapy.Spider):
    name = 'my_morizon_spider'
    start_urls = [
        'https://www.morizon.pl/mieszkania/warszawa/'
        ]
    
    item_urls2 = ['https://www.morizon.pl/mieszkania/warszawa/?page=2']    
           
    custom_settings = {
        'DOWNLOAD_DELAY': '2.0',
        'ROBOTSTXT_OBEY': True,
        'AUTOTHROTTLE_ENABLED': True,
        'USER_AGENT': 'My Morizon Demo Bot (michal.korzycki@email.com)'
    }

    top_url = 'https://www.morizon.pl/'
    
    
    def parse(self, response):
        self.logger.info('1. Got successful response from {}'.format(response.url))

        for item_url in self.item_urls2:
                yield scrapy.Request(item_url, self.parse)





In [None]:
process = CrawlerProcess()
process.crawl(MySpider)
process.start()

In [1]:
import scrapy
import scrapy.crawler as crawler
from bs4 import BeautifulSoup

from scrapy.crawler import CrawlerProcess

class MySpider(scrapy.Spider):
    name = 'my_morizon_spider'
    start_urls = [
        'https://www.morizon.pl/mieszkania/warszawa/'
        ]
    
    custom_settings = {
        'DOWNLOAD_DELAY': '1.0',
        'ROBOTSTXT_OBEY': True,
        'AUTOTHROTTLE_ENABLED': True,
        'USER_AGENT': 'My Morizon Demo Bot (michal.korzycki@email.com)'
    }

    
    def parse(self, response):
        self.logger.info('Got successful response from {}'.format(response.url))
        soup = BeautifulSoup(response.body, 'lxml')

        links = [link.get('href')
                for link in soup.find_all('a', class_ ="property_link property-url")]

        links= links[:10]
        print(links)
        
        for item_url in links:
            yield scrapy.Request(item_url, self.parse_item)
        
    def parse_item(self, response): #item_url - odwiedzanie strony, #self.parse_item - przetworzenie przy pomocy funkcji
        self.logger.info('Got successful response from {}'.format(response.url))

In [2]:
process = CrawlerProcess()
process.crawl(MySpider)
process.start()

2023-04-04 15:49:24 [scrapy.utils.log] INFO: Scrapy 2.6.1 started (bot: scrapybot)
2023-04-04 15:49:24 [scrapy.utils.log] INFO: Versions: lxml 4.8.0.0, libxml2 2.9.12, cssselect 1.1.0, parsel 1.6.0, w3lib 1.22.0, Twisted 22.2.0, Python 3.9.1 (default, Dec 11 2020, 09:29:25) [MSC v.1916 64 bit (AMD64)], pyOpenSSL 20.0.0 (OpenSSL 1.1.1l  24 Aug 2021), cryptography 3.3.1, Platform Windows-10-10.0.19041-SP0
2023-04-04 15:49:24 [scrapy.crawler] INFO: Overridden settings:
{'AUTOTHROTTLE_ENABLED': True,
 'DOWNLOAD_DELAY': '2.0',
 'ROBOTSTXT_OBEY': True,
 'USER_AGENT': 'My Morizon Demo Bot (michal.korzycki@email.com)'}
2023-04-04 15:49:24 [scrapy.utils.log] DEBUG: Using reactor: twisted.internet.selectreactor.SelectReactor
2023-04-04 15:49:24 [scrapy.extensions.telnet] INFO: Telnet Password: a98c831faa56160e
2023-04-04 15:49:24 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.logstats.LogStats

['https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-ursus-ryzowa-62-44m2-mzn2041715790?from=top_normal_listing', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-mokotow-rozana-123m2-mzn2040844519', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-ochota-bialobrzeska-54m2-mzn2041366714', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-mokotow-gorska-70m2-mzn2041751694', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-zoliborz-ludwika-rydygiera-100m2-mzn2041531952', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-bemowo-dywizjonu-303-59m2-mzn2041608503', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-wedrowcow-102m2-mzn2041386273', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-ochota-jozefa-siemienskiego-36m2-mzn2041608139', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-mokotow-41m2-mzn2041583018', 'https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-ursynow-polki-58m2-mzn2

2023-04-04 15:49:32 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-ursus-ryzowa-62-44m2-mzn2041715790?from=top_normal_listing> (referer: https://www.morizon.pl/mieszkania/warszawa/)
2023-04-04 15:49:32 [my_morizon_spider] INFO: Got successful response from https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-ursus-ryzowa-62-44m2-mzn2041715790?from=top_normal_listing
2023-04-04 15:49:33 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-praga-poludnie-brazylijska-29m2-mzn2041239444> (referer: https://www.morizon.pl/mieszkania/warszawa/)
2023-04-04 15:49:33 [my_morizon_spider] INFO: Got successful response from https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-praga-poludnie-brazylijska-29m2-mzn2041239444
2023-04-04 15:49:36 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.morizon.pl/oferta/sprzedaz-mieszkanie-warszawa-bielany-heroldow-71m2-mzn2041325

In [5]:
import IPython

IPython.Application.instance().kernel.do_shutdown(True)

{'status': 'ok', 'restart': True}

In [None]:
import scrapy
import scrapy.crawler as crawler
from bs4 import BeautifulSoup
from datetime import datetime 
from scrapy.crawler import CrawlerProcess

result = []

class MySpider(scrapy.Spider):
    name = 'my_morizon_spider'
    start_urls = [
        'https://www.morizon.pl/mieszkania/warszawa/?page=%d' %i  for i in range(1,2)
        ]
   
    custom_settings = {
        'DOWNLOAD_DELAY': '0.8',
        'ROBOTSTXT_OBEY': True,
        'AUTOTHROTTLE_ENABLED': True,
        'USER_AGENT': 'My Bot (email@myemail.com)'
    }

    def parse(self, response):
        self.logger.info('Got successful response from {}'.format(response.url))
        soup = BeautifulSoup(response.body, 'lxml')

        links = [link.get('href')
                for link in soup.find_all('a', class_ ="property_link property-url")]
        
        for item_url in links:
            yield scrapy.Request(item_url, self.parse_item)
        
    def parse_item(self, response): #item_url - odwiedzanie strony, #self.parse_item - przetworzenie przy pomocy funkcji
        self.logger.info('Got successful response from {}'.format(response.url))
        soup = BeautifulSoup(response.body, 'lxml')
        card = soup.find_all('div', class_ = "mz-card__item")[1]
        table = card.find_all('table')[0]
        description = { row.th.text.strip()[:-1]:row.td.text.strip() for row in table.find_all('tr')  }
        description["title"] = soup.title.text
        description["url"] = response.url
        result.append(description)
        
    def spider_closed(self, spider):
        try:
            spider.logger.info('Spider closed: %s', spider.name)
            now = datetime.now().strftime("%Y-%m-%d")
            spider.logger.info('Spider closed: %s', spider.name)
            df = pd.Dataframe(result)
            fname = f"data/morizon-{now}.csv"
            print(fname)
            spider.logger.info('Spider writing to: %s', fname)
            df.to_csv(fname)
        except Exception as e:
            print(e)

In [2]:
process = CrawlerProcess()
process.crawl(MySpider)
process.start()

2023-04-04 18:06:31 [scrapy.utils.log] INFO: Scrapy 2.6.1 started (bot: scrapybot)
2023-04-04 18:06:31 [scrapy.utils.log] INFO: Versions: lxml 4.8.0.0, libxml2 2.9.12, cssselect 1.1.0, parsel 1.6.0, w3lib 1.22.0, Twisted 22.2.0, Python 3.9.1 (default, Dec 11 2020, 09:29:25) [MSC v.1916 64 bit (AMD64)], pyOpenSSL 20.0.0 (OpenSSL 1.1.1l  24 Aug 2021), cryptography 3.3.1, Platform Windows-10-10.0.19041-SP0
2023-04-04 18:06:31 [scrapy.crawler] INFO: Overridden settings:
{'AUTOTHROTTLE_ENABLED': True,
 'DOWNLOAD_DELAY': '0.8',
 'ROBOTSTXT_OBEY': True,
 'USER_AGENT': 'My Bot (email@myemail.com)'}
2023-04-04 18:06:31 [scrapy.utils.log] DEBUG: Using reactor: twisted.internet.selectreactor.SelectReactor
2023-04-04 18:06:31 [scrapy.extensions.telnet] INFO: Telnet Password: 811ee948d5b5dad7
2023-04-04 18:06:31 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.logstats.LogStats',
 'scrapy.extension

In [5]:
import pandas as pd

df = pd.DataFrame(result)

2023-04-04 18:09:20 [numexpr.utils] INFO: Note: NumExpr detected 12 cores but "NUMEXPR_MAX_THREADS" not set, so enforcing safe limit of 8.
2023-04-04 18:09:20 [numexpr.utils] INFO: NumExpr defaulting to 8 threads.


In [6]:
df

Unnamed: 0,Deweloper,Inwestycja,Powierzchnia użytkowa,Piętro,Typ kuchni,Powierzchnia loggii,Rynek,Kredyt,Numer oferty,Zaktualizowano,...,Dostępne od,Na biuro,Liczba poziomów mieszkania,Powierzchnia łazienki,Powierzchnia balkonu,Taras,Liczba sypialni,Stolarka okienna,Dodatkowe koszty,Loggia
0,Dom Development S.A.,Osiedle Wilno,"55,28 m²",2,aneks,"4,55 m²",pierwotny,sprawdź ratę,morizon-f-90001,dzisiaj,...,,,,,,,,,,
1,,,71 m²,1 / 5,Z OKNEM,,wtórny,sprawdź ratę,morizon-267/12861/OMS,31 marca 2023,...,,,,,,,,,,
2,,,53 m²,6 / 7,OTWARTA,,wtórny,sprawdź ratę,morizon-306/12861/OMS,8 marca 2023,...,,,,,,,,,,
3,,,"59,75 m²",1 / 4,zamknięta,,wtórny,sprawdź ratę,morizon-15013291,25 lutego 2023,...,,,,,,,,,,
4,,,"49,56 m²",parter / 3,OTWARTA,,wtórny,sprawdź ratę,morizon-309/12861/OMS,31 marca 2023,...,,,,,,,,,,
5,,,"63,5 m²",3 / 4,ODDZIELNA,,wtórny,sprawdź ratę,morizon-308/12861/OMS,30 marca 2023,...,,,,,,,,,,
6,,,"77,66 m²",3 / 5,otwarta,,wtórny,sprawdź ratę,morizon-15053256,22 marca 2023,...,,,,,,,,,,
7,,,"97,18 m²",2 / 4,ODDZIELNA,,wtórny,sprawdź ratę,morizon-355/12861/OMS,wczoraj,...,,,,,,,,,,
8,Cordia Polska,Fantazja na Bemowie,"42,49 m²",1 / 5,,,pierwotny,sprawdź ratę,morizon-B/09,13 marca 2023,...,,,,,,,,,,
9,,,51 m²,6 / 10,widna,,wtórny,sprawdź ratę,morizon-7048,27 marca 2023,...,2022-06-01,Tak,,,,,,,,


In [7]:
df.columns

Index(['Deweloper', 'Inwestycja', 'Powierzchnia użytkowa', 'Piętro',
       'Typ kuchni', 'Powierzchnia loggii', 'Rynek', 'Kredyt', 'Numer oferty',
       'Zaktualizowano', 'Opublikowano', '', 'title', 'url',
       'Stan nieruchomości', 'Liczba pięter', 'Liczba łazienek', 'Balkon',
       'Forma własności', 'Wysokość wnętrza', 'Rodzaj umowy',
       'Czy łazienka z WC', 'Dostępne od', 'Na biuro',
       'Liczba poziomów mieszkania', 'Powierzchnia łazienki',
       'Powierzchnia balkonu', 'Taras', 'Liczba sypialni', 'Stolarka okienna',
       'Dodatkowe koszty', 'Loggia'],
      dtype='object')

In [8]:
df.sample(15)

Unnamed: 0,Deweloper,Inwestycja,Powierzchnia użytkowa,Piętro,Typ kuchni,Powierzchnia loggii,Rynek,Kredyt,Numer oferty,Zaktualizowano,...,Dostępne od,Na biuro,Liczba poziomów mieszkania,Powierzchnia łazienki,Powierzchnia balkonu,Taras,Liczba sypialni,Stolarka okienna,Dodatkowe koszty,Loggia
1,,,71 m²,1 / 5,Z OKNEM,,wtórny,sprawdź ratę,morizon-267/12861/OMS,31 marca 2023,...,,,,,,,,,,
17,Dom Development S.A.,Osiedle Urbino,"34,2 m²",5,aneks,,pierwotny,sprawdź ratę,morizon-f-89439,dzisiaj,...,,,,,"2,62 m²",,,,,
14,Dom Development S.A.,Osiedle Urbino,"37,38 m²",1,aneks,"4,93 m²",pierwotny,sprawdź ratę,morizon-f-89491,dzisiaj,...,,,,,,,,,,
3,,,"59,75 m²",1 / 4,zamknięta,,wtórny,sprawdź ratę,morizon-15013291,25 lutego 2023,...,,,,,,,,,,
6,,,"77,66 m²",3 / 5,otwarta,,wtórny,sprawdź ratę,morizon-15053256,22 marca 2023,...,,,,,,,,,,
24,,,"47,1 m²",3 / 3,aneks,,wtórny,sprawdź ratę,morizon-15085937,dzisiaj,...,,,,,,,,,,
16,Dom Development S.A.,Osiedle Wilno,"59,29 m²",2,aneks,"7,82 m²",pierwotny,sprawdź ratę,morizon-f-98569,dzisiaj,...,,,,,"5,45 m²",,,,,
30,,,,1 / 2,aneks,,wtórny,sprawdź ratę,morizon-gratka-28865177,25 marca 2023,...,2022-12-15,,,,,,,,,Tak
12,Dom Development S.A.,Apartamenty Białej Koniczyny,"37,23 m²",2,aneks,,pierwotny,sprawdź ratę,morizon-f-85350,dzisiaj,...,,,,,"4,95 m²",,,,,
13,,,76 m²,6 / 7,osobna,,wtórny,sprawdź ratę,morizon-553,dzisiaj,...,,,1.0,"3,7 m²","2,5 m²",,,,,


In [9]:
pd.DataFrame(df.iloc[13])

Unnamed: 0,13
Deweloper,
Inwestycja,
Powierzchnia użytkowa,76 m²
Piętro,6 / 7
Typ kuchni,osobna
Powierzchnia loggii,
Rynek,wtórny
Kredyt,sprawdź ratę
Numer oferty,morizon-553
Zaktualizowano,dzisiaj


In [10]:
from datetime import datetime
now = datetime.now().strftime("%Y-%m-%d")
fname = f"data/morizon-{now}.csv"
fname

'data/morizon-2023-04-04.csv'

In [11]:
df.to_csv(fname)