In [3]:
import requests
from bs4 import BeautifulSoup

# ニュース一覧ページのURL
url = "https://www.kiramex.com/news/"
#url = "https://news.yahoo.co.jp/"

# ページのHTMLを取得
response = requests.get(url)
response.encoding = response.apparent_encoding  # 文字コードを自動判別して設定

# HTMLをBeautifulSoupでパース
soup = BeautifulSoup(response.text, "html.parser")

# ニュース一覧の情報を抽出
news_list = soup.find_all("li", class_="news-block")

# ニュース情報の取得
for news in news_list:
    # ニュースの日付を取得
    date = news.find("p", class_="date").get_text(strip=True) if news.find("p", class_="date") else "N/A"
    
    # ニュースのタイトルを取得
    title = news.find("a", class_="title").get_text(strip=True)
    
    # ニュースのリンクを取得
    link = news.find("a", class_="title")["href"]

    print(f"Date: {date}")
    print(f"Title: {title}")
    print(f"Link: {link}")
    print("-" * 40)

Date: 2025年04月01日お知らせ
Title: コーポレートサイトリニューアルお知らせ
Link: https://www.kiramex.com/news-20250401/
----------------------------------------
Date: 2025年02月06日メディア掲載
Title: LiProにテックアカデミーが紹介されました
Link: https://www.kiramex.com/news-20250206/
----------------------------------------
Date: 2025年01月14日プレスリリース
Title: リスキリングプログラム「LINEヤフーテックアカデミー」、2週間でChatGPTの基礎や使い方を学べる「はじめてのChatGPTコース」など4種の新コースを開設
Link: https://www.kiramex.com/news-20250114/
----------------------------------------
Date: 2024年12月01日お知らせ
Title: 年末年始（2024年〜2025年）の休暇・営業に関するお知らせ
Link: https://www.kiramex.com/news-20241201/
----------------------------------------
Date: 2024年10月09日プレスリリース
Title: キラメックスとLINEヤフー、山形県の産学官連携コンソーシアム「やまがたAI部」と、県内企業におけるAI人材育成に関する協定を締結
Link: https://www.kiramex.com/news-20241009/
----------------------------------------
Date: 2024年09月09日プレスリリース
Title: テックアカデミー、学びに夢中になれる「イマーシブラーニング」を取り入れたコースの提供を開始　〜副業をスタートした受講者が3倍に増加した実証実験の実績〜
Link: https://www.kiramex.com/news-20240909/
----------------------------------------
D

In [4]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv
from openai import OpenAI

# 環境変数の取得
load_dotenv("../.env")

# OpenAI APIクライアントを生成
client = OpenAI(api_key=os.environ['API_KEY'])

# モデル名
MODEL_NAME = "gpt-4o-mini"


In [7]:
# ニュース一覧ページのURL
# url = "https://www.kiramex.com/news/"
url = "https://www.lycorp.co.jp/ja/news/"

# ページのHTMLを取得
response = requests.get(url)
response.encoding = response.apparent_encoding  # 文字コードを自動判別して設定

# HTMLをBeautifulSoupでパースし、body部分を取り出す
soup = BeautifulSoup(response.text, "html.parser")
body_html = str(soup.body)  # body部分のHTMLを文字列として取得
print(body_html) # 結果を表示して確認

<body>
<!-- Google Tag Manager (noscript) -->
<noscript><iframe height="0" src="https://www.googletagmanager.com/ns.html?id=GTM-NJPSPSD5" style="display:none;visibility:hidden" width="0"></iframe></noscript>
<!-- End Google Tag Manager (noscript) -->
<script src="/ja/ja_header.js"></script>
<div class="global-container">
<div class="breadcrumbs">
<ul>
<li><a href="/ja/"><img alt="トップページ" height="14" src="/assets/images/icon_home.svg" width="14"/></a></li>
<li>ニュース</li>
</ul>
</div>
<div class="page-heading-lv2">
<div class="inner">
<h1>ニュース</h1>
<p>News</p>
</div>
<picture>
<source media="(max-width: 767px)" srcset="/assets/images/news/sp/LY_siteKV_news.jpg"/>
<img alt="" src="/assets/images/news/LY_siteKV_news.jpg"/>
</picture>
</div>
<div class="body-container no-top-padding">
<div class="body-inner search-target">
<div class="c-search-header" id="news-search">
<h2 id="press-release">プレスリリース</h2>
<button class="c-search-open" type="button">絞り込み検索</button>
</div>
<ul class="c-col-set-

In [8]:
# LLMにニュース一覧を抽出させるプロンプトを作成
prompt = f"""
以下のHTMLから最新のニュースを抽出し、「日付、タイトル、リンク」の形式で一覧を出力してください。一覧以外は出力しないでください。

# 出力様式：
Date: 日付
Title: タイトル
Link: リンク
--------------------

#HTML:
{body_html[:5000]}
"""

# APIへリクエスト
response = client.chat.completions.create(
    model=MODEL_NAME,
    messages=[
        {"role": "user", "content": prompt},
    ],
    max_tokens=500,
    temperature=0.3
)

# LLMからの回答を表示
print(response.choices[0].message.content.strip())

```
Date: 2025年5月15日
Title: PayPay銀行、すべての個人のお客さまが「LINE連携サービス」を利用可能に
Link: https://www.lycorp.co.jp/ja/news/release/017729/
--------------------
Date: 2025年5月14日
Title: Yahoo!クイックマート、専用アプリの提供を開始
Link: https://www.lycorp.co.jp/ja/news/release/017726/
--------------------
Date: 2025年5月8日
Title: Yahoo!トラベル、人気宿泊施設の航空券付きプランがお得になる大型セール企画「ヤフーパック ウルトラセール」を5月8日から開催
Link: https://www.lycorp.co.jp/ja/news/release/017646/
--------------------
Date: 2025年5月1日
Title: Yahoo!ショッピング、食品や日用品がおトクな生活応援セール  「ヤフービッグボーナス」を本日より開催
Link: https://www.lycorp.co.jp/ja/news/release/017598/
--------------------
Date: 2025年4月30日
Title: LINEスタンプメーカー、アプリ内画像からシームレスにLINEスタンプを作成する機能の提供を開始
Link: https://www.lycorp.co.jp/ja/news/release/017587/
--------------------
Date: 2025年4月25日
Title: Yahoo!検索、宿泊施設のクチコミを生成AIが要約し、検索結果上に表示する機能を提供開始
Link: https://www.lycorp.co.jp/ja/news/release/017538/
--------------------
Date: 2025年4月24日
Title: LINEヤフーとブリューアス、昨年に続き香川県と連携し、県内におけるデータ・AI人材の育成を支援
Link: https://www.lycorp.co.jp/ja/news/release