# 複数のニュース記事の取得

## tinysegmenterのインストール

In [1]:
import newspaper

In [2]:
# csvモジュールのインポート
import csv

In [3]:
# datetimeライブラリのインポート（日付の取得に必要）
import datetime

In [4]:
# csvのファイル名につける日付を格納
# 今日の日付: datetime.datetime.today()
# 日付を文字列に変換: 日付.strftime(%Y;西暦4桁の10進表記、%m;月2桁の10進表記、%d;日にちの0埋めした10進表記)
csv_date = datetime.datetime.today().strftime('%Y%m%d')

In [5]:
# csvファイル名の作成
csv_file_name = 'bloomberg_' + csv_date + '.csv'

## csvファイルへの書き込み

In [6]:
# 空のcsvファイルを開く: open(ディレクトリ+ディレクトリ名, 'w';書込み, encoding='utf8';日本語, errors='ignore';エラーは無視)
f = open(csv_file_name, 'w', encoding='utf8', errors='ignore')

In [7]:
# 書き込み処理の記述: csv.writer(ファイルオブジェクト, lineterminator='\n';1行書き終わった後に出力する文字)
writer = csv.writer(f, lineterminator='\n')
csv_header = ['記事番号', 'タイトル', 'URL', 'サマリー']
# csvファイルに1行書き込む: .writerow(リスト)
writer.writerow(csv_header)

19

In [8]:
# 変数URLに、サイトのURLを格納
URL = 'https://www.bloomberg.co.jp'

In [9]:
# サイトのトップページから複数のページをまとめて取得: newspaper.build(URL)
website = newspaper.build(URL)

In [10]:
# website.articlesに複数の記事が格納されている
i = 0
for article in website.articles:
    csvlist = []       # csv書き込み用の空リスト
    article.download() # 単一記事の取得
    article.parse()    # 記事の解析
    article.nlp()      # 自然言語処理
    print('記事', str(i), ':', article.title)
    print(article.url)
    print(article.summary, end='\n\n') # タイトル, URL, 要約, 改行の表示
    csvlist.append(str(i))
    csvlist.append(article.title)
    csvlist.append(article.url)
    csvlist.append(article.summary)
    writer.writerow(csvlist)
    
    if i > 9: # 記事を10個取得したら止める
        break
    i = i + 1
f.close() # openしたcsvファイルは閉じなければならない

記事 0 : 日本株反発、米インフラ計画や短観設備投資を好感－半導体などけん引
https://www.bloomberg.co.jp/news/articles/2021-03-31/QQURQ4DWRGG501?srnd=cojp-v2
ＴＯＰＩＸの午前終値は前日比12.09ポイント（0.6％）高の1966.09日経平均株価は334円79銭（1.2％）高の２万9513円59銭東証33業種では保険や精密機器、電機、情報・通信、化学、機械が上昇－空運や鉄鋼、輸送用機器、卸売は下落

記事 1 : 製造業景況感はコロナ前水準回復､大企業６期ぶりプラス-日銀短観
https://www.bloomberg.co.jp/news/articles/2021-04-01/QQPTSOT0G1L001?srnd=cojp-v2
日本銀行が四半期ごとに実施している企業短期経済観測調査（短観）の３月調査で、製造業の景況感は大企業、中堅企業、中小企業がいずれも新型コロナウイルス感染症が拡大する前の水準を回復した。製造業は大企業の業況判断指数（ＤＩ）がプラス５（改善幅15ポイント）と2019年９月調査以来の水準まで改善。中堅企業はマイナス２（同15ポイント）、中小企業はマイナス13（同14ポイント）と19年12月以来の水準に戻った。大企業の改善は３期連続で、プラス圏になるのは６四半期ぶり。業種別では自動車や鉄鋼、非鉄金属、電気機械などで改善基調が続いた。一方、非製造業はマイナス１と、改善幅は４ポイントにとどまった。新型コロナの影響が続く宿泊・飲食サービス、娯楽業などを含む対個人サービスなどが悪化した。キーポイント 景気が「良い」と答えた企業の割合から「悪い」と答えた割合を引いたＤＩは大企業・製造業がプラス５、前回調査から15ポイント改善ーブルームバーグ調査の予想はマイナス１非製造業はマイナス１、４ポイント改善－予想はマイナス４先行きは製造業がプラス４へ悪化、非製造業はマイナス１と横ばいを見込む2021年度の為替想定は１ドル＝106円07銭、１ユーロ＝123円10銭エコノミストの見方農林中金総合研究所の南武志主席研究員：調査時点ではまだまだ世界的に需要が強く、大規模な米財政政策や中国の予想外の堅調さも手伝っていると思う大企業・製造業では先行き多少慎重な側面も出ているが、引き続きプラスと