In [55]:
import os
import requests
from bs4 import BeautifulSoup
import google.generativeai as gen
from kaggle_secrets import UserSecretsClient

# 1) Kaggle Secrets ржерзЗржХрзЗ GOOGLE_API_KEY ржЖржиржЫрж┐
user_secrets = UserSecretsClient()
GOOGLE_API_KEY = user_secrets.get_secret("GOOGLE_API_KEY")
os.environ["GOOGLE_API_KEY"] = GOOGLE_API_KEY

if not GOOGLE_API_KEY:
    raise RuntimeError("GOOGLE_API_KEY secret set ржХрж░рж╛ ржирж╛ржЗ тАУ Kaggle Secrets ржП add ржХрж░рзЗ ржирж╛ржУред")

# 2) Gemini configure
gen.configure(api_key=GOOGLE_API_KEY)

# 3) **ржПржЦрж╛ржирзЗ model hardcode ржХрж░рж▓рж╛ржо** тАУ ржЖрж░ auto select ржирзЯ
MODEL_NAME = "gemini-2.5-flash"      # lite ржмрзНржпржмрж╣рж╛рж░ ржХрж░рждрзЗ ржЪрж╛ржЗрж▓рзЗ: "gemini-2.5-flash-lite"
model = gen.GenerativeModel(MODEL_NAME)

print("ЁЯдЦ Using Gemini model:", MODEL_NAME)


ЁЯдЦ Using Gemini model: gemini-2.5-flash


In [56]:
def fetch_article_from_url(url: str):
    """Simple scraper: рж╕ржм <p> ржЯрзНржпрж╛ржЧ join ржХрж░рзЗ article ржмрж╛ржирж╛ржЪрзНржЫрж┐."""
    resp = requests.get(url, timeout=20)
    resp.raise_for_status()

    soup = BeautifulSoup(resp.text, "html.parser")

    title = soup.title.string.strip() if soup.title else "Unknown Title"

    paragraphs = []
    for p in soup.find_all("p"):
        text = p.get_text(" ", strip=True)
        if len(text) > 40:   # ржЦрзБржм ржЫрзЛржЯ noise ржмрж╛ржж
            paragraphs.append(text)

    article_text = "\n".join(paragraphs)
    return title, article_text


In [57]:
def summarize_with_gemini(article_text: str, url: str = None, language: str = "bn") -> str:
    if not article_text or len(article_text.strip()) < 200:
        return "Article text is too short or could not be extracted."

    # input token ржХржо рж░рж╛ржЦрж╛рж░ ржЬржирзНржп ржкрзНрж░рж╛рзЯ ~4000 character ржП ржХрзЗржЯрзЗ ржирж┐ржЪрзНржЫрж┐
    max_chars = 4000
    if len(article_text) > max_chars:
        article_text = article_text[:max_chars]

    if language == "bn":
        instruction = (
            "рждрзБржорж┐ ржПржХржЬржи AI News Summarizer ржПржЬрзЗржирзНржЯред "
            "ржирж┐ржЪрзЗрж░ ржирж┐ржЙржЬ ржЖрж░рзНржЯрж┐ржХрзЗрж▓ржЯрж┐ ржкрзЬрзЗ рзлтАУрзнржЯрж┐ ржкрзЯрзЗржирзНржЯрзЗ рж╕рж╣ржЬ ржнрж╛рж╖рж╛рзЯ ржмрж╛ржВрж▓рж╛ рж╕рж╛рж░рж╛ржВрж╢ рж▓рж┐ржЦрзЛред "
            "ржорзВрж▓ ржШржЯржирж╛, рж╕ржорзЯ, рж╕рзНржерж╛ржи, ржХрж╛рж░ржг ржЖрж░ ржкрзНрж░ржнрж╛ржм ржпрзЗржи ржкрж░рж┐рж╖рзНржХрж╛рж░ ржерж╛ржХрзЗред"
        )
    else:
        instruction = (
            "You are an AI news summarization agent. "
            "Read the article and summarize it in 5тАУ7 clear bullet points in English, "
            "covering who, what, when, where, why, and key outcomes."
        )

    prompt = f"""{instruction}

URL: {url or "N/A"}

Article:
\"\"\"
{article_text}
\"\"\""""

    try:
        response = model.generate_content(prompt)
        return response.text
    except Exception as e:
        return f"Gemini error: {e}"


In [58]:
def summarize_news_url(url: str, language: str = "bn"):
    print("ЁЯМР Fetching article...")
    title, article_text = fetch_article_from_url(url)
    print("ЁЯУЭ Extracted article length:", len(article_text))

    print("ЁЯдЦ Sending to Gemini 2.5-flash...")
    summary = summarize_with_gemini(article_text, url=url, language=language)

    return title, summary


In [59]:
url = "https://www.bbc.com/news/articles/c891jp9j79do"  # ржПржЦрж╛ржирзЗ ржпрзЗржХрзЛржирзЛ news link ржжрж╛ржУ

title, summary = summarize_news_url(url, language="bn")  # "en" ржжрж┐рж▓рзЗ English summary

print("\n===== ЁЯУ░ ARTICLE TITLE =====")
print(title)

print("\n===== тЬи GENERATED SUMMARY =====\n")
print(summary)


ЁЯМР Fetching article...
ЁЯУЭ Extracted article length: 4722
ЁЯдЦ Sending to Gemini 2.5-flash...

===== ЁЯУ░ ARTICLE TITLE =====
Trump says he will sue BBC for at least $1bn over Panorama edit

===== тЬи GENERATED SUMMARY =====

ржПржХржЬржи AI News Summarizer ржПржЬрзЗржирзНржЯ рж╣рж┐рж╕рзЗржмрзЗ, ржмрж┐ржмрж┐рж╕рж┐ ржирж┐ржЙржЬ ржЖрж░рзНржЯрж┐ржХрзЗрж▓ржЯрж┐рж░ рж╕рж╛рж░рж╕ржВржХрзНрж╖рзЗржк ржирж┐ржЪрзЗ рзлтАУрзнржЯрж┐ ржкржпрж╝рзЗржирзНржЯрзЗ рж╕рж╣ржЬ ржмрж╛ржВрж▓рж╛ржпрж╝ ржжрзЗржУржпрж╝рж╛ рж╣рж▓рзЛ:

*   **рзз. ржорзВрж▓ ржШржЯржирж╛ ржУ рж╕ржоржпрж╝:** ржорж╛рж░рзНржХрж┐ржи ржпрзБржХрзНрждрж░рж╛рж╖рзНржЯрзНрж░рзЗрж░ рж╕рж╛ржмрзЗржХ ржкрзНрж░рзЗрж╕рж┐ржбрзЗржирзНржЯ ржбрзЛржирж╛рж▓рзНржб ржЯрзНрж░рж╛ржорзНржк ржмрж┐ржмрж┐рж╕рж┐-рж░ ржмрж┐рж░рзБржжрзНржзрзЗ рзз ржерзЗржХрзЗ рзл ржмрж┐рж▓рж┐ржпрж╝ржи ржбрж▓рж╛рж░ ржХрзНрж╖рждрж┐ржкрзВрж░ржгрзЗрж░ ржорж╛ржорж▓рж╛ ржХрж░рж╛рж░ ржШрзЛрж╖ржгрж╛ ржжрж┐ржпрж╝рзЗржЫрзЗржиред ржмрж┐ржмрж┐рж╕рж┐ рждрж╛ржжрзЗрж░ 'ржкрзНржпрж╛ржирзЛрж░рж╛рж

In [60]:
from urllib.parse import urlparse

def validate_url(url: str):
    url = (url or "").strip()
    if not url:
        return False, "URL ржлрж╛ржБржХрж╛ ржжрзЗржУрзЯрж╛ рж╣рзЯрзЗржЫрзЗред"

    if not (url.startswith("http://") or url.startswith("https://")):
        return False, "URL ржЕржмрж╢рзНржпржЗ http:// ржЕржержмрж╛ https:// ржжрж┐рзЯрзЗ рж╢рзБрж░рзБ рж╣рждрзЗ рж╣ржмрзЗред"

    parsed = urlparse(url)
    if not parsed.netloc or "." not in parsed.netloc:
        return False, "URL-ржПрж░ ржбрзЛржорзЗржЗржи ржЕржВрж╢ржЯрж┐ рж╕ржарж┐ржХ ржоржирзЗ рж╣ржЪрзНржЫрзЗ ржирж╛ред"

    # ржЪрж╛ржЗрж▓рзЗ ржЕрждрж┐рж░рж┐ржХрзНржд ржЪрзЗржХ ржжрж┐рждрзЗ ржкрж╛рж░рзЛ (ржпрзЗржоржи news site ржХрж┐ржирж╛ ржЗрждрзНржпрж╛ржжрж┐)
    return True, ""


In [64]:
def run_news_summarizer(language: str = "bn"):
    # 1) User input the URL
    url = input("ЁЯУЭ ржПржХржЯрж┐ news URL ржжрж┐ржи: ").strip()

    # 2) Validate the URL
    is_ok, msg = validate_url(url)
    if not is_ok:
        print("тЭМ Invalid URL:", msg)
        return

    # 3) Try summarizing
    try:
        title, summary = summarize_news_url(url, language=language)

        print("\n===== ЁЯУ░ ARTICLE TITLE =====")
        print(title)

        print("\n===== тЬи GENERATED SUMMARY =====\n")
        print(summary)
    except Exception as e:
        print("тЪая╕П ржХрзЛржирзЛ ржПржХржЯрж╛ рж╕ржорж╕рзНржпрж╛ рж╣рзЯрзЗржЫрзЗ:", e)

# ржПржЦржи рж╢рзБржзрзБ ржПржЗ рж▓рж╛ржЗржиржЯрж╛ ржЪрж╛рж▓рж╛рж▓рзЗржЗ рж╣ржмрзЗ:
run_news_summarizer(language="bn")   # English summary ржЪрж╛ржЗрж▓рзЗ language="en"


ЁЯУЭ ржПржХржЯрж┐ news URL ржжрж┐ржи:  https://news.mit.edu/2025/study-suggests-40hz-sensory-stimulation-may-benefit-some-alzheimers-patients-1114


ЁЯМР Fetching article...
ЁЯУЭ Extracted article length: 7201
ЁЯдЦ Sending to Gemini 2.5-flash...

===== ЁЯУ░ ARTICLE TITLE =====
Study suggests 40Hz sensory stimulation may benefit some AlzheimerтАЩs patients for years | MIT News | Massachusetts Institute of Technology

===== тЬи GENERATED SUMMARY =====

ржПржХржЬржи AI News Summarizer рж╣рж┐рж╕рзЗржмрзЗ, ржирж┐ржЪрзЗ ржжрзЗржУрзЯрж╛ ржЖрж░рзНржЯрж┐ржХрзЗрж▓ржЯрж┐рж░ рзл-рзнржЯрж┐ ржкрзЯрзЗржирзНржЯрзЗ ржПржХржЯрж┐ рж╕рж╣ржЬ ржмрж╛ржВрж▓рж╛ рж╕рж╛рж░рж╛ржВрж╢ ржжрзЗржУрзЯрж╛ рж╣рж▓рзЛ:

**ржорзВрж▓ ржШржЯржирж╛:** ржПржоржЖржЗржЯрж┐ (MIT)-ржПрж░ ржЧржмрзЗрж╖ржХрж░рж╛ ржЖрж▓ржЭрзЗржЗржорж╛рж░рзНрж╕ рж░рзЛржЧрзЗрж░ ржЪрж┐ржХрж┐рзОрж╕рж╛рзЯ рзкрзж рж╣рж╛рж░рзНржЯржЬ (Hz) ржЖрж▓рзЛ ржУ рж╢ржмрзНржж ржЙржжрзНржжрзАржкржирж╛рж░ ржжрзАрж░рзНржШржорзЗрзЯрж╛ржжрзА ржкрзНрж░ржнрж╛ржм ржирж┐рзЯрзЗ ржПржХржЯрж┐ ржирждрзБржи ржЧржмрзЗрж╖ржгрж╛ ржкрзНрж░ржХрж╛рж╢ ржХрж░рзЗржЫрзЗржиред

**рж╕рж╛рж░рж╛ржВрж╢:**

рзз.  **ржЧржмрзЗрж╖ржгрж╛рж░ ржмрж┐рж╖