In [1]:
import sys

In [2]:
from selenium import webdriver

In [3]:
def main():
    """
    メインの処理
    """
    
    driver = webdriver.PhantomJS()  # PhantomJSのWebDriverオブジェクトを作成する。
    driver.set_window_size(800, 600)  # ウィンドウサイズを設定する。
    
    navigate(driver)  # noteのトップページに遷移する。
    posts = scrape_posts(driver)  # 文章コンテンツのリストを取得する。
    
    # コンテンツの情報を表示する。
    for post in posts:
        print(post)

In [4]:
def navigate(driver):
    """
    目的のページに遷移する。
    """
    print('Navigating...', file=sys.stderr)
    driver.get('https://note.mu/')  # noteのトップページを開く。
    assert 'note' in driver.title  # タイトルに'note'が含まれていることを確認する。

In [7]:
def scrape_posts(driver):
    """
    文章コンテンツのURL、タイトル、概要を含むdictのリストを取得する。
    """
    
    posts = []
    
    # 全ての文章コンテンツを表すa要素について反復する。
    for a in driver.find_elements_by_css_selector('a.p-post--basic'):
        # URL,タイトル、概要を取得して、dictとしてリストに追加する。
        posts.append({
            'url':a.get_attribute('href'),
            'title':a.find_element_by_css_selector('h4').text,
            'description':a.find_element_by_css_selector('.c-post__description').text,
        })
        
    return posts

In [8]:
if __name__=='__main__':
    main()

Navigating...


{'url': 'https://note.mu/ume_nanminchamp/n/n1c25c652a617', 'title': '父母会の会長をやって、いろいろスリム化してみたよ。', 'description': '4月。\n\nみなさん進級進学おめでとうございます。この季節、親的にめんどくさいのが、PTAや父母会の役員決め。やりたかないけど、イヤだイヤだと逃げるのも角が立つ。\n...'}
{'url': 'https://data.thebase.in/n/n8f9ecc5a3281', 'title': '日時によっては3.2倍の売上も？ ネットショップで商品が一番売れる日時を調べてみた。', 'description': 'こんにちは、BASEデータストラテジー（Data Strategy）チームです。\n\nBASEデータストラテジーでは、ネットショップ作成サービス「BASE」において日々増加していく各種データを活用する...'}
{'url': 'https://note.mu/ekakinonakagawa/n/n3f0722862164', 'title': '1冊の絵本が出来るまで', 'description': '一昨年に初めての絵本を出版して去年2冊。今年も新しい絵本を2冊作っています。\nイラストの仕事を10年以上やって来たんですが\n同じ絵を描くのでも絵本はまた全然違いますね。\nまったく違う種類の面白さがあります。...'}
{'url': 'https://note.mu/5696/n/n024bf44567fe', 'title': '「Crème au citron」', 'description': '「レモンクリーム」や「レモンカード」と呼ばれる、スコーンやパンにつけるクリームです。まだ、春の黄色い国産レモンがあると思います。少量でもいいように濃厚なクリームにするのもいいですし、たっぷりつけられるように軽い仕上がりにするのもいい。どんなものにどのように使うかで好みになるように配合でき...'}
{'url': 'https://note.mu/cyzo/n/n69f3897aaa88', 'title': '日本だけが取り残されている？――アジアン・ラッパーを世界に輩出！\u3000動画チャンネル「88rising」