In [18]:
from bs4 import BeautifulSoup
import pandas as pd
import requests
from tqdm import tqdm
import itertools
import datetime
import requests_cache
from IPython.display import HTML

In [7]:
def get_premiere_df():
    url_list = [f"https://i-amabile.com/premier?pageID={i+1}" for i in range(40)]
    response_list = [requests.get(url) for url in tqdm(url_list)]
    soup_list = [BeautifulSoup(response.text) for response in tqdm(response_list)]
    table_list = list(
        itertools.chain.from_iterable(
            soup.select(".single table") for soup in tqdm(soup_list)
        )
    )
    df = pd.DataFrame(dict(table=table_list))
    df["date"] = df.table.apply(
        lambda x: datetime.datetime.strptime(
            x.select("td")[1].text.split("(")[0], "%Y年%m月%d日"
        )
    )
    df["title"] = df.table.apply(lambda x: x.select_one("a").text.lstrip("●"))
    df["link"] = df.table.apply(lambda x: x.select_one("a")["href"])
    df["text"] = df.table.apply(lambda x: x.text)
    df["orchestra"] = df.title.apply(lambda x: x.split("第")[0])
    orchestra_df = df.orchestra.value_counts().to_frame().reset_index().reset_index()
    orchestra_df.columns = ["orchestra_id", "orchestra", "orchestra_count"]
    df = pd.merge(df, orchestra_df)
    df = df.sort_values("date", ascending=False)[
        [
            "orchestra_id",
            "orchestra",
            "orchestra_count",
            "date",
            "title",
            "text",
            "link",
        ]
    ].reset_index(drop=True)
    return df

In [8]:
requests_cache.install_cache('amabile_cache')

In [9]:
df = get_premiere_df()

100%|██████████| 40/40 [00:00<00:00, 817.93it/s]
100%|██████████| 40/40 [00:00<00:00, 121.94it/s]
100%|██████████| 40/40 [00:00<00:00, 487.32it/s]


In [10]:
df.to_csv("amabile_premiere.csv", index=False)

In [16]:
df["link_anchor"] = df.link.apply(lambda url: f'<a href="{url}">link</a>')

In [22]:
HTML(df[["orchestra_id", "orchestra", "orchestra_count", "date", "title", "link_anchor"]].to_html(escape=False))

Unnamed: 0,orchestra_id,orchestra,orchestra_count,date,title,link_anchor
0,134,セルビア日本音楽交流推進の会 3人のピアニストが奏でる音の輪,1,2019-11-04,セルビア日本音楽交流推進の会 3人のピアニストが奏でる音の輪,link
1,237,梨本宮里ピアノデュオ Contemporary Piano Duo Concert「響鳴」,1,2019-11-02,梨本宮里ピアノデュオ Contemporary Piano Duo Concert「響鳴」,link
2,161,浦和フィルハーモニー管弦楽団,1,2019-10-27,浦和フィルハーモニー管弦楽団 第６７回定期演奏会,link
3,284,筑波研究学園都市吹奏楽団,1,2019-10-27,筑波研究学園都市吹奏楽団 第33回定期演奏会,link
4,270,Otodémie / オトデミー 吹奏楽×Art音楽会『波紋... かさなり、交差する。』,1,2019-10-27,Otodémie / オトデミー 吹奏楽×Art音楽会『波紋... かさなり、交差する。』,link
5,178,ジュンス(p)×高瀬啓伍 TOUR 2019 of From BOOGIE to The FUTURE -FINAL-,1,2019-10-19,ジュンス(p)×高瀬啓伍 TOUR 2019 of From BOOGIE to The FUTURE -FINAL-,link
6,108,ハンガリーフェア実行委員会 ÁDÁM GYÖRGY Piano Recital 2019 Final,1,2019-10-15,ハンガリーフェア実行委員会 ÁDÁM GYÖRGY Piano Recital 2019 Final,link
7,150,あんさんぶるおとまつコンサート２０１９,1,2019-10-06,あんさんぶるおとまつコンサート２０１９,link
8,141,トリオ・ラディアンス ファーストコンサート,1,2019-10-06,トリオ・ラディアンス ファーストコンサート,link
9,247,川口交響吹奏楽団,1,2019-09-29,川口交響吹奏楽団 第２３回定期演奏会,link
