# housekeeping

In [1]:
import re
from selenium import webdriver # webdriver 操作一般用
from selenium.webdriver.chrome import service as fs # Chrome を driver として設定する用
from selenium.webdriver.chrome.options import Options # headless モードで作業する用
from selenium.webdriver.common.by import By # find_element() で参照したい位置を特定する用
from bs4 import BeautifulSoup 

# 基本設定

In [2]:
# chrome driver の PATH 
DRIVER_PATH = '/Users/domolm/.pyenv/versions/3.10.8/lib/python3.10/site-packages/selenium/chromedriver'
service = fs.Service(executable_path=DRIVER_PATH)

# headless モードで取得する
options = Options()
options.add_argument('--headless')

# 起動

In [3]:
# 起動
driver = webdriver.Chrome(options=options, service=service)

# 作業したい url を指定し、開く
base_url = 'https://www3.nhk.or.jp/news/html/20221119/k10013897051000.html'
driver.get(base_url)

# html データとして取得

In [4]:
# utf-8 に変換する
html = driver.page_source.encode('utf-8')

driver.quit()

# Beautiful Soup 用にパースする

In [5]:
soup = BeautifulSoup(html, 'html.parser')

# '続きを読む' と文中タイトルを削除

In [6]:
for n in soup(['nav']):
    n.decompose()

for t in soup(['h2']):
    t.decompose()

# 文章を抽出

In [7]:
article_raw = soup.select_one('#main > article.module.module--detail--v3 > section > section').text
article_raw

'\n\n養殖魚の餌に使われる魚粉の代わりに害虫のアブの一種を育てて餌として使うプロジェクトが進められ、19日、養殖した魚の試食が行われました。魚の餌となる魚粉は世界的に需要が拡大していて、昆虫で置き換えられれば、水産資源利用の効率化や将来の食料の確保にもつながると期待されています。\n\n\n魚の養殖の際に餌として使われる魚粉は世界的な養殖業の拡大で需要が急激に伸びている一方、魚の資源の減少もあって価格が高騰しています。\n\n\n\n\nお茶の水女子大学の由良敬教授などのグループは、魚粉に代わる新たな餌として昆虫に注目し、害虫のアブの一種「アメリカミズアブ」を餌にするため安定的に育てる技術の研究を進めてきました。\n\n\n\n\n\n19日は東京都内で未来の食を考えるシンポジウムが開かれ、由良教授が、餌の魚粉の半分を「アメリカミズアブ」に置き換えて魚を養殖しても、成長に差はなかったと報告しました。\n\n\n\n\n\n続いて、実際にアブを混ぜた餌で育てたニジマスの刺身の試食が行われ、参加した研究者などは、風味や脂の乗りなどを従来の餌で育てたニジマスと比べて食べながら「言われないと気付かないくらいの差で、おいしかったです」などと話していました。由良教授は「昆虫の活用方法を広げて食料の確保に不安がない未来を目指したい」と話していました。\n\n\n\n昆虫の利用はたんぱく質不足を補い食料問題の解決にもつながると考えられていて、魚の餌としての利用についても国や自治体の研究所や大学が連携して研究が進められています。農研機構＝農業・食品産業技術総合研究機構のグループは、体長2センチほどの北アメリカ原産のアブ「アメリカミズアブ」を魚の餌として安定的に大量に供給するための研究を進めています。「アメリカミズアブ」は、卵から、餌として活用できる大きさの幼虫になるまで3週間程度と成長が速いうえ野菜や果物など食品の残りかすを食べて育つということで、ごみの削減や食品ロスの問題の解決にもつながる可能性があるとしています。研究グループは温度や餌の種類、卵の集め方など最も効率的にアブを育てて利用するための条件を探る実験を進めていて、昆虫利用技術研究領域の安田哲也研究領域長は「家畜のように人の手で飼い慣らし安定的に供給できるようにすることで、食品ロスとたんぱく源の確保の問題を同時に解決した

# 余計な文字を削除する

In [9]:
article = re.sub('\n', '', article_raw)
article = re.split('(?<=。)', article)
article = [s for s in article if s != '']
article

['養殖魚の餌に使われる魚粉の代わりに害虫のアブの一種を育てて餌として使うプロジェクトが進められ、19日、養殖した魚の試食が行われました。',
 '魚の餌となる魚粉は世界的に需要が拡大していて、昆虫で置き換えられれば、水産資源利用の効率化や将来の食料の確保にもつながると期待されています。',
 '魚の養殖の際に餌として使われる魚粉は世界的な養殖業の拡大で需要が急激に伸びている一方、魚の資源の減少もあって価格が高騰しています。',
 'お茶の水女子大学の由良敬教授などのグループは、魚粉に代わる新たな餌として昆虫に注目し、害虫のアブの一種「アメリカミズアブ」を餌にするため安定的に育てる技術の研究を進めてきました。',
 '19日は東京都内で未来の食を考えるシンポジウムが開かれ、由良教授が、餌の魚粉の半分を「アメリカミズアブ」に置き換えて魚を養殖しても、成長に差はなかったと報告しました。',
 '続いて、実際にアブを混ぜた餌で育てたニジマスの刺身の試食が行われ、参加した研究者などは、風味や脂の乗りなどを従来の餌で育てたニジマスと比べて食べながら「言われないと気付かないくらいの差で、おいしかったです」などと話していました。',
 '由良教授は「昆虫の活用方法を広げて食料の確保に不安がない未来を目指したい」と話していました。',
 '昆虫の利用はたんぱく質不足を補い食料問題の解決にもつながると考えられていて、魚の餌としての利用についても国や自治体の研究所や大学が連携して研究が進められています。',
 '農研機構＝農業・食品産業技術総合研究機構のグループは、体長2センチほどの北アメリカ原産のアブ「アメリカミズアブ」を魚の餌として安定的に大量に供給するための研究を進めています。',
 '「アメリカミズアブ」は、卵から、餌として活用できる大きさの幼虫になるまで3週間程度と成長が速いうえ野菜や果物など食品の残りかすを食べて育つということで、ごみの削減や食品ロスの問題の解決にもつながる可能性があるとしています。',
 '研究グループは温度や餌の種類、卵の集め方など最も効率的にアブを育てて利用するための条件を探る実験を進めていて、昆虫利用技術研究領域の安田哲也研究領域長は「家畜のように人の手で飼い慣らし安定的に供給できるようにすることで、食品ロスとたんぱく源の確保の問題を同時に解決したい