In [1]:
import requests
from bs4 import BeautifulSoup

# ニュース一覧ページのURL
url = "https://www.kiramex.com/news/"

# ページのHTMLを取得
response = requests.get(url)
response.encoding = response.apparent_encoding  # 文字コードを自動判別して設定

# HTMLをBeautifulSoupでパース
soup = BeautifulSoup(response.text, "html.parser")

# ニュース一覧の情報を抽出
news_list = soup.find_all("li", class_="news-block")

# ニュース情報の取得
for news in news_list:
    # ニュースの日付を取得
    date = news.find("p", class_="date").get_text(strip=True) if news.find("p", class_="date") else "N/A"
    
    # ニュースのタイトルを取得
    title = news.find("a", class_="title").get_text(strip=True)
    
    # ニュースのリンクを取得
    link = news.find("a", class_="title")["href"]

    print(f"Date: {date}")
    print(f"Title: {title}")
    print(f"Link: {link}")
    print("-" * 40)

Date: 2025年04月01日お知らせ
Title: コーポレートサイトリニューアルお知らせ
Link: https://www.kiramex.com/news-20250401/
----------------------------------------
Date: 2025年02月06日メディア掲載
Title: LiProにテックアカデミーが紹介されました
Link: https://www.kiramex.com/news-20250206/
----------------------------------------
Date: 2025年01月14日プレスリリース
Title: リスキリングプログラム「LINEヤフーテックアカデミー」、2週間でChatGPTの基礎や使い方を学べる「はじめてのChatGPTコース」など4種の新コースを開設
Link: https://www.kiramex.com/news-20250114/
----------------------------------------
Date: 2024年12月01日お知らせ
Title: 年末年始（2024年〜2025年）の休暇・営業に関するお知らせ
Link: https://www.kiramex.com/news-20241201/
----------------------------------------
Date: 2024年10月09日プレスリリース
Title: キラメックスとLINEヤフー、山形県の産学官連携コンソーシアム「やまがたAI部」と、県内企業におけるAI人材育成に関する協定を締結
Link: https://www.kiramex.com/news-20241009/
----------------------------------------
Date: 2024年09月09日プレスリリース
Title: テックアカデミー、学びに夢中になれる「イマーシブラーニング」を取り入れたコースの提供を開始　〜副業をスタートした受講者が3倍に増加した実証実験の実績〜
Link: https://www.kiramex.com/news-20240909/
----------------------------------------
D

In [2]:
# 必要なモジュールをインポート
import os
from dotenv import load_dotenv
from openai import OpenAI

# 環境変数の取得
load_dotenv("../.env")

# OpenAI APIクライアントを生成
client = OpenAI(api_key=os.environ['API_KEY'])

# モデル名
MODEL_NAME = "gpt-4o-mini"

In [3]:
# ニュース一覧ページのURL
url = "https://www.kiramex.com/news/"

# ページのHTMLを取得
response = requests.get(url)
response.encoding = response.apparent_encoding  # 文字コードを自動判別して設定

# HTMLをBeautifulSoupでパースし、body部分を取り出す
soup = BeautifulSoup(response.text, "html.parser")
body_html = str(soup.body)  # body部分のHTMLを文字列として取得
print(body_html) # 結果を表示して確認

<body id="top">
<header>
<div class="inner">
<div class="logo"><a href="/"><img alt="キラメックス株式会社" src="https://www.kiramex.com/wp-content/themes/kiramex/images/logo.png"/></a></div>
<nav class="navbar navbar-default" role="navigation">
<div class="container-fluid">
<div class="navbar-header"><button class="navbar-toggle" data-target="#header-menu" data-toggle="collapse" type="button"><span class="sr-only">Toggle navigation</span><span class="icon-bar"></span><span class="icon-bar"></span><span class="icon-bar"></span></button></div>
<div class="collapse navbar-collapse" id="header-menu">
<ul class="nav navbar-nav">
<li><a class="" href="/company/">会社情報</a></li>
<li><a class="" href="/service/">事業情報</a></li>
<li><a class="" href="/news/">ニュース</a></li>
<li><a class="" href="/contact/">お問い合わせ</a></li>
<li class="recruit"><a class="" href="/recruit/">採用情報</a></li>
</ul>
</div>
</div>
</nav>
</div>
</header><div class="cover-news" id="cover">
<div class="inner">
<h1>ニュース</h1>
</div>
</div>
<

In [4]:
# LLMにニュース一覧を抽出させるプロンプトを作成
prompt = f"""
以下のHTMLから最新のニュースを抽出し、「日付、タイトル、リンク」の形式で一覧を出力してください。一覧以外は出力しないでください。

# 出力様式：
Date: 日付
Title: タイトル
Link: リンク
--------------------

#HTML:
{body_html[:5000]}
"""

# APIへリクエスト
response = client.chat.completions.create(
    model=MODEL_NAME,
    messages=[
        {"role": "user", "content": prompt},
    ],
    max_tokens=500,
    temperature=0.3
)

# LLMからの回答を表示
print(response.choices[0].message.content.strip())

```
Date: 2025年04月01日
Title: コーポレートサイトリニューアルお知らせ
Link: https://www.kiramex.com/news-20250401/
--------------------
Date: 2025年02月06日
Title: LiProにテックアカデミーが紹介されました
Link: https://www.kiramex.com/news-20250206/
--------------------
Date: 2025年01月14日
Title: リスキリングプログラム「LINEヤフーテックアカデミー」、2週間でChatGPTの基礎や使い方を学べる「はじめてのChatGPTコース」など4種の新コースを開設
Link: https://www.kiramex.com/news-20250114/
--------------------
```
