<a href="https://colab.research.google.com/github/inforahman1/Java-Networking/blob/master/Copy_of_Sentiment_analysis_by_NLP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install requests BeautifulSoup4 nltk transformers



In [None]:
import requests
from bs4 import BeautifulSoup
import nltk
from transformers import pipeline
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
import string

Download NLTK stopwords

In [None]:
nltk.download('stopwords')

[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


True

Scrape the article text from the given URL

In [None]:
def scrape_article_text(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')

    paragraphs = soup.find_all('p')
    article_text = ' '.join([p.get_text() for p in paragraphs])

    return article_text

Preprocess the text

In [None]:
def preprocess_text(text):
  text = text.lower() #Convert to lowercase
  text = text.translate(str.maketrans('', '', string.punctuation)) #Remove punctuation
  words = word_tokenize(text) # Tokenize words
  words = [word for word in words if word not in stopwords.words('english')] #Remove stopwords
  return ' '.join(words)

Perform Summarization using HuggingFace transformers

In [None]:
def summarize_text(text):
    summarizer = pipeline("summarization")
    summary = summarizer(text, max_length=150, min_length=30, do_sample=False)
    return summary[0]['summary_text']

Perform Sentiment Analysis using HuggingFace transformers

In [None]:
def sentiment_analysis(text):
    sentiment_analysis = pipeline("sentiment-analysis")
    sentiment = sentiment_analysis(text[:512])
    return sentiment

Main Code

In [None]:
url = 'https://www.prothomalo.com/world/india/nw6cj71eah'

Step 1 : Scrape the article from the website

In [None]:
article_text = scrape_article_text(url)
print("Original Article Text:\n", article_text)

Original Article Text:
 বাংলাদেশ ও শ্রীলঙ্কার সঙ্গে ভারতের সম্পর্ক ‘ইতিবাচক ও গঠনমূলকই’ থাকবে। এই সম্পর্ক নিয়ে আগে থেকে কিছু ভেবে নেওয়া ঠিক হবে না। তেমন ভাবনা কারও ভাবা উচিত নয় বলে মন্তব্য করেছেন ভারতের পররাষ্ট্রমন্ত্রী এস জয়শঙ্কর। নিউইয়র্কে স্থানীয় সময় গতকাল মঙ্গলবার এক অনুষ্ঠানের পর সাংবাদিকদের সঙ্গে কথা আলাপচারিতায় এই অভিমত ব্যক্ত করেন জয়শঙ্কর। তিনি বলেন, ‘সম্পর্ক নিয়ে আগাম কোনো ধারণায় উপনীত না হওয়ার অনুরোধ আমি সবাইকে করব। বিষয়টা এমন নয় যে ভারত তার সব প্রতিবেশী দেশের রাজনীতি নিয়ন্ত্রণ করতে চাইছে। এভাবে চলেও না। এমনটা হয়ও না। এটা শুধু আমাদের (ভারত) নয়, সবার জন্য সমান সত্য।’ এশিয়াটিক সোসাইটি ও নিউইয়র্কের এশিয়া সোসাইটি পলিসি ইনস্টিটিউট গতকাল ‘ইন্ডিয়া, এশিয়া অ্যান্ড দ্য ওয়ার্ল্ড’ নামে এক আলোচনা সভার আয়োজন করে। সেখানে অংশ নেন এস জয়শঙ্কর। ভারতীয় সংবাদমাধ্যম পিটিআইয়ের তথ্য অনুযায়ী, জয়শঙ্কর সাংবাদিকদের সঙ্গে কথাও বলেন সেখানেই। জয়শঙ্করকে একজন বলেন, বাংলাদেশ ও শ্রীলঙ্কাকে ভারত শর্তহীন সাহায্য করেছে। ঋণ দিয়েছে। কিন্তু সেখানকার নতুন পরিবর্তিত সরকার মনে হচ্ছে ভারতবিরোধী। এর জবাবে ভারতের পররাষ্ট্

Step 2: Preprocess the text

In [None]:
preprocessed_text = preprocess_text(article_text)
print("\nPreprocessed Article Text:\n", preprocessed_text)


Preprocessed Article Text:
 বাংলাদেশ ও শ্রীলঙ্কার সঙ্গে ভারতের সম্পর্ক ‘ ইতিবাচক ও গঠনমূলকই ’ থাকবে। এই সম্পর্ক নিয়ে আগে থেকে কিছু ভেবে নেওয়া ঠিক হবে না। তেমন ভাবনা কারও ভাবা উচিত নয় বলে মন্তব্য করেছেন ভারতের পররাষ্ট্রমন্ত্রী এস জয়শঙ্কর। নিউইয়র্কে স্থানীয় সময় গতকাল মঙ্গলবার এক অনুষ্ঠানের পর সাংবাদিকদের সঙ্গে কথা আলাপচারিতায় এই অভিমত ব্যক্ত করেন জয়শঙ্কর। তিনি বলেন ‘ সম্পর্ক নিয়ে আগাম কোনো ধারণায় উপনীত না হওয়ার অনুরোধ আমি সবাইকে করব। বিষয়টা এমন নয় যে ভারত তার সব প্রতিবেশী দেশের রাজনীতি নিয়ন্ত্রণ করতে চাইছে। এভাবে চলেও না। এমনটা হয়ও না। এটা শুধু আমাদের ভারত নয় সবার জন্য সমান সত্য। ’ এশিয়াটিক সোসাইটি ও নিউইয়র্কের এশিয়া সোসাইটি পলিসি ইনস্টিটিউট গতকাল ‘ ইন্ডিয়া এশিয়া অ্যান্ড দ্য ওয়ার্ল্ড ’ নামে এক আলোচনা সভার আয়োজন করে। সেখানে অংশ নেন এস জয়শঙ্কর। ভারতীয় সংবাদমাধ্যম পিটিআইয়ের তথ্য অনুযায়ী জয়শঙ্কর সাংবাদিকদের সঙ্গে কথাও বলেন সেখানেই। জয়শঙ্করকে একজন বলেন বাংলাদেশ ও শ্রীলঙ্কাকে ভারত শর্তহীন সাহায্য করেছে। ঋণ দিয়েছে। কিন্তু সেখানকার নতুন পরিবর্তিত সরকার মনে হচ্ছে ভারতবিরোধী। এর জবাবে ভারতের পররা

Step 3: Summarize the text

In [None]:
summary = summarize_text(preprocessed_text)
print("\nSummarized Text:\n", summary)

NameError: name 'summarize_text' is not defined

Step 4: Preform sentiment analysis

In [None]:
sentiment = sentiment_analysis(preprocessed_text)
print("\nSentiment Analysis:\n", sentiment)

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]




Sentiment Analysis:
 [{'label': 'NEGATIVE', 'score': 0.7676938772201538}]
